本书源自作者在斯坦福大学教授多年的“web挖掘”课程材料,主要关注大数据环境下数据挖掘的实际算法。书中分析了海量数据集数据挖掘常用的算法,介绍了目前web应用的许多重要话题。主要内容包括:
□ 分布式文件系统以及map-reduce工具;
□ 相似性搜索;
□ 数据流处理以及针对易丢失数据等特殊情况的专用处理算法;
□ 搜索引擎技术,如谷歌的pagerank;
□ 频繁项集挖掘;
□ 大规模高维数据集的聚类算法;
□ web应用中的关键问题:广告管理和推荐系统。
本书配套网http://infolab.stanford.edu/~ullman/mmds.html上提供英文版初稿以及一些课件和项目作业。
大数据时代的及时雨全球著名数据库技术专家*新力作理论与实际算法实现并重
AnandRajaraman数据库和Web技术领域权威,创业投资基金Cambrian联合创始人,斯坦福大学计算机科学系助理教授。Rajaraman职业生涯非常成功:1996年创办Junglee公司,两年后该公司被亚马逊以2.5亿美元收购,Rajaraman被聘为亚马逊技术总监,推动亚马逊从一个零售商转型为零售平台;2000年与人合创Cambrian,孵化出几个后来被谷歌收购的公司;2005年创办Kosmix公司并任CEO,该公司2011年被沃尔玛集团收购。Rajaraman生于印度,在斯坦福大学获得计算机科学硕士和博士学位。求学期间与人合著的一篇论文荣列近20年来被引用次数最多的论文之一。博客地址http://anand.typepad.com/datawocky/。
JeffreyDavidUllman美国国家工程院院士,计算机科学家,斯坦福大学教授。Ullman早年在贝尔实验室工作,之后任教于普林斯顿大学,十年后加入斯坦福大学直至退休,一生的科研、著书和育人成果卓著。他是ACM会员,曾获SIGMOD贡献奖、Knuth奖等多项科研大奖;他是“龙书”《编译原理》、数据库领域权威指南《数据库系统实现》的合著者;麾下多名学生成为了数据库领域的专家,其中最有名的当属谷歌创始人SergeyBrin;本书第一作者也是他的得意弟子。Ullman目前任Gradiance公司CEO。
如果你对万事万物的运行方式充满好奇,这本有趣的《R和Ruby数据分析之旅》会帮你找到日常生活中某些问题的真正答案。借助基本的数
《别让心态毁了你》内容简介:保持什么样的心态就会有什么样的行为方式,而行为方式决定着一个人的生人走向。心态能够成就一个人,
《商业地产5.0》内容简介:中国目前的商业地产处在一个爆发阶段,也是市场高度活跃期。截至2014年底,全国约有4 000家购物中心,累
Thisfast-movingguideintroduceswebapplicationdevelopmentwithHaskellandYesod,apote...
Windows 7使用详解 本书特色 《Windows 7 使用详解》由众多Windows技术专家倾力推荐。Windows 7使用详解 内容简介 本书由微软*有...
《UNIX编程艺术》内容简介:本书主要介绍了Unix系统领域中的设计和开发哲学、思想文化体系、原则与经验,由公认的Unix编程大师、开
《平衡掌控者》内容简介:本书由真正从事游戏行业工作的一线人员所著,书中的全部案例来自真实的游戏设计案例。全书共7章,第1章介
字体对于很多刚开始接触学习的人来说,是一条很难跨越的鸿沟,虽然国内外也有相关方面的书籍(以国外作品为主),但终究还是不适
LearnhowtobemoreproductivewithScala,anewmulti-paradigmlanguagefortheJavaVirtualM...
约翰•佐雷尔出生于伦敦,在弘赛艺术学院(HornseyCollegeofArt)学习艺术与设计。他十九岁就开始了其设计事业。在他四十余年的设
《战后在华日本侨俘遣返研究》内容简介:抗战胜利后,中国政府遣返滞留中国的约370万名日本侨俘,即使在解放战争期间遣返工作也未停
《组织合伙人:寻找增长新曲线》内容简介:企业增长的底层逻辑是什么?企业组织架构的痛点是什么?如何找到企业的增长新曲线?如何
本书深入浅出介绍了人机交互系统的原理与应用,内容涉及电子原理基础、设备选型、建立集成电路、微处理编程、计算机通信、转换和
《儿童歌曲演唱教程 少儿版》内容简介:《儿童歌曲演唱教程(少儿版)》适合幼儿园和小学音乐教学使用。作者:尤静波、高歌作品目录
《Offer来了》内容简介:《Offer来了:Java面试核心知识点精讲(原理篇)》是对Java程序员面试必备知识点的总结,详细讲解了JVM原理
JavaScript是近年来非常受瞩目的一门编程语言,它既支持面向对象编程,也支持函数式编程。本书专门介绍JavaScript函数式编程的特
《RPA智能机器人》内容简介:这是一部为企业应用RPA智能机器人提供实施方法论和解决方案的著作。作者团队RPA技术、产品和实践方面有
《物联网项目实战》内容简介:《物联网项目实战基于Android Things系统》介绍如何使用Android Things完成实际的物联网项目,主要内
《神经网络权值直接确定法》提出了一种神经网络权值直接确定的方法。不同于传统的神经网络迭代学习思想,新方法可以一步直接计算
《矛与盾:黑客攻防命令大曝光》内容简介:《矛与盾:黑客攻防命令大曝光》紧紧围绕黑客命令与实际应用展开,在剖析黑客入侵中用户