本书源自作者在斯坦福大学教授多年的“web挖掘”课程材料,主要关注大数据环境下数据挖掘的实际算法。书中分析了海量数据集数据挖掘常用的算法,介绍了目前web应用的许多重要话题。主要内容包括:
□ 分布式文件系统以及map-reduce工具;
□ 相似性搜索;
□ 数据流处理以及针对易丢失数据等特殊情况的专用处理算法;
□ 搜索引擎技术,如谷歌的pagerank;
□ 频繁项集挖掘;
□ 大规模高维数据集的聚类算法;
□ web应用中的关键问题:广告管理和推荐系统。
本书配套网http://infolab.stanford.edu/~ullman/mmds.html上提供英文版初稿以及一些课件和项目作业。
大数据时代的及时雨全球著名数据库技术专家*新力作理论与实际算法实现并重
AnandRajaraman数据库和Web技术领域权威,创业投资基金Cambrian联合创始人,斯坦福大学计算机科学系助理教授。Rajaraman职业生涯非常成功:1996年创办Junglee公司,两年后该公司被亚马逊以2.5亿美元收购,Rajaraman被聘为亚马逊技术总监,推动亚马逊从一个零售商转型为零售平台;2000年与人合创Cambrian,孵化出几个后来被谷歌收购的公司;2005年创办Kosmix公司并任CEO,该公司2011年被沃尔玛集团收购。Rajaraman生于印度,在斯坦福大学获得计算机科学硕士和博士学位。求学期间与人合著的一篇论文荣列近20年来被引用次数最多的论文之一。博客地址http://anand.typepad.com/datawocky/。
JeffreyDavidUllman美国国家工程院院士,计算机科学家,斯坦福大学教授。Ullman早年在贝尔实验室工作,之后任教于普林斯顿大学,十年后加入斯坦福大学直至退休,一生的科研、著书和育人成果卓著。他是ACM会员,曾获SIGMOD贡献奖、Knuth奖等多项科研大奖;他是“龙书”《编译原理》、数据库领域权威指南《数据库系统实现》的合著者;麾下多名学生成为了数据库领域的专家,其中最有名的当属谷歌创始人SergeyBrin;本书第一作者也是他的得意弟子。Ullman目前任Gradiance公司CEO。
《Java 8函数式编程》内容简介:多年以来,函数式编程被认为是少数人的游戏,不适合推广给普罗大众。写作此书的目的就是为了挑战这
《基于理解的学校教育》内容简介:本书从人类社会的发展与教育的发展出发,提出了21世纪基础教育的特征是“基于理解的教育”,并从
FloTHERM软件基础与应用实例-(第二版) 本书特色 本书分为软件基础入门与应用实例两大部分,全书共计17章节。1~11章节为软件基础入门,其内容以热仿真工...
《穿透心智:企业战略定位实践方法》内容简介:当前,世界经济下行、商业环境发生巨变,从工厂时代到市场时代,再到过剩经济的时代
本书主要介绍当前在高速公路通信工程中广泛使用的几类现代通信系统,如程控交换系统、光纤通信系统、移动通信系统等,对数据通信
《破茧成蝶2——以产品为中心的设计革命》内容简介:互联网下半场来袭,从业者需要做出怎样的变化,以应对风云突变的大环境呢?本书
本書は、オープンソースのツールキット「Arduino」を使った新しいものづくりの実践を目的とした書籍です。その中心は「距離を測る
AninteractiveandfunwaytolearnC++,oneofthemostpopularhigh-levelprogramminglanguag...
《点茶之书:一盏宋茶的技艺与美学》内容简介:中国的茶文化“兴于唐,盛于宋”,两宋时期由于文人士大夫积极推广、参与,茶文化得
《狐狸踏雪的三种可能》内容简介:诗要抵达真实,诗要抵达纯粹,诗更要抵达大众。本书主打独立诗歌品牌“诗100”,收录的100首诗歌
AdvancedLinuxProgrammingisdividedintotwoparts.ThefirstcoversgenericUNIXsystemser...
《与共和国共成长:中国人民大学校友口述史(第二辑)》内容简介:2019年,我们将迎来中华人民共和国70周年华诞。自1937年成立以来
《互联网商业的下半场》内容简介:随着人工智能和IT技术的发展,以科技为圆心、以资本为半径的互联网商业的上半场已离我们远去,以
《ADS应用详解:射频电路设计与仿真》介绍使用ADS进行射频电路设计和仿真的基础知识和方法。《ADS应用详解:射频电路设计与仿真》内
《闪魂FLASH8网站建设实录》旨在提供以Flash(Flash8.0为创作工具)为技术核心的整套互动网站的开发思路,其中包括了网站策划、平面
《陶渊明(中华先贤人物故事汇)【中宣部2022年主题出版重点出版物】》内容简介:本书是陶渊明我国文学史上的著名诗人,也是思想文
《游戏动漫人体结构与动态:实例训练手册(常用动作)》内容简介:本书针对人体插画初学者在入门时遇到的难题而编写。本书是一本具
人工智能 本书特色 本书是“OHM大学理工系列”之一。书中简明扼要地介绍了基于搜索的问题求解、知识表示和推理、机器学习、模糊理论-精神网络-遗传算法、模糊识别,...
《DTPWORLD》隶属于日本WorksCorporationInc.。这是一家以研究和推广计算机应用与数位媒体印刷设计的专业出版社,旗下包括《CGWo
Focusingonthreeprincipalsystems-GPS,GALILEO,andGLONAS-thispracticalresourceprovi...