本书源自作者在斯坦福大学教授多年的“web挖掘”课程材料,主要关注大数据环境下数据挖掘的实际算法。书中分析了海量数据集数据挖掘常用的算法,介绍了目前web应用的许多重要话题。主要内容包括:
□ 分布式文件系统以及map-reduce工具;
□ 相似性搜索;
□ 数据流处理以及针对易丢失数据等特殊情况的专用处理算法;
□ 搜索引擎技术,如谷歌的pagerank;
□ 频繁项集挖掘;
□ 大规模高维数据集的聚类算法;
□ web应用中的关键问题:广告管理和推荐系统。
本书配套网http://infolab.stanford.edu/~ullman/mmds.html上提供英文版初稿以及一些课件和项目作业。
大数据时代的及时雨全球著名数据库技术专家*新力作理论与实际算法实现并重
AnandRajaraman数据库和Web技术领域权威,创业投资基金Cambrian联合创始人,斯坦福大学计算机科学系助理教授。Rajaraman职业生涯非常成功:1996年创办Junglee公司,两年后该公司被亚马逊以2.5亿美元收购,Rajaraman被聘为亚马逊技术总监,推动亚马逊从一个零售商转型为零售平台;2000年与人合创Cambrian,孵化出几个后来被谷歌收购的公司;2005年创办Kosmix公司并任CEO,该公司2011年被沃尔玛集团收购。Rajaraman生于印度,在斯坦福大学获得计算机科学硕士和博士学位。求学期间与人合著的一篇论文荣列近20年来被引用次数最多的论文之一。博客地址http://anand.typepad.com/datawocky/。
JeffreyDavidUllman美国国家工程院院士,计算机科学家,斯坦福大学教授。Ullman早年在贝尔实验室工作,之后任教于普林斯顿大学,十年后加入斯坦福大学直至退休,一生的科研、著书和育人成果卓著。他是ACM会员,曾获SIGMOD贡献奖、Knuth奖等多项科研大奖;他是“龙书”《编译原理》、数据库领域权威指南《数据库系统实现》的合著者;麾下多名学生成为了数据库领域的专家,其中最有名的当属谷歌创始人SergeyBrin;本书第一作者也是他的得意弟子。Ullman目前任Gradiance公司CEO。
《ROS机器人编程实践》内容简介:ROS工程师经常面临使用机器人操作系统(ROS)基础设施并将物理机器人连接到机器人仿真系统的挑战。
《国家主导型发展模式研究》内容简介:本书从发展型国家理论中提取分析框架,旨在剖析转型时期中国国家形态在政治经济关系上呈现的
《3G技术问答》从3G空中接口的四个主流标准(TD-SCDMA、WCDMA、cdma2000和WiMAX)的内容中精选了五百多个问题,以“知识问答”的形
《基于深度学习的自然语言处理》内容简介:将深度学习方法应用于各种自然语言处理任务,可以让你的算法在速度和准确性方面提升到一
《深入浅出HTML5编程(影印版)(英文)》就是你的特快车票,它可以带你学习如何使用今天的标准同时也会是明日的最佳实践来搭建Web应
Withover100,000iPhoneapplicationsand125,000registerediPhonedevelopers,isitstillp...
Websitedesignanddevelopmentcontinuestobecomemoresophisticated.Animportantpartoft...
《未来的企业:中国企业高质量发展之道》内容简介:市场主体是国民经济的细胞,是整个国民经济体系的基础环节。“黑天鹅”也好,“
《独立游戏开发》内容简介:本书第1篇适合所有想要了解独立游戏开发的读者阅读,第2、3篇则适合有一定C#或Java编程语言基础的游戏开
iPad的流行为App的开发设计带来了革命性的挑战。《为iPad而设计:打造畅销App》向读者展示了如何充分利用iPad的新特性,让开发者
Photoshop CS4平面广告设计经典108例-含2DVD 内容简介 本书是一本Photoshop CS4的平面设计案例教程,也是一本Photoshop商业...
《渲染王3ds Max/VRay建筑表现全模型渲染技术精粹》内容简介:这是一本全面讲解建筑表现项目案例的技术书籍,以“全模型制作”为技
《古文观止:新注插图本》内容简介:新版《古文观止》收录全本二百二十二篇,以中华书局简体校本为底本,参考广益书局重订言文对照
《曹操传》内容简介:曹操是个历史评价非常复杂的人物,他战黄巾,讨董卓,剿灭吕布、袁术、公孙瓒,击败袁绍,收降刘琮、张绣等,
《汇编语言程序设计》讲述每种高级语言程序在连接为可执行程序之前,都必须被编译为汇编语言程序,因此对于高级语言程序设计者来
本书以全新的ASP.NET2.0内容设计为出发点,循序渐进地以图文步骤及观念讲解新的ASP.NET2.0技术精要。内容涵盖VisualStudio20
SarahAllen目前领导着BlazingCloud,这是一家位于旧金山的咨询公司,主要开发高级的移动和Web应用程序。她也是Mightyverse的共同
ASP.NET电子商务入门经典-(第2版) 内容简介 本书全面详细地介绍了如何构建电子商务Web站点,并通过大量的代码和示例逐步教会您设计和构建站点的具体过程。...
图像目标分割方法 本书特色 陆玲、王蕾编*的《图像目标分割方法》主要介绍图像中目标分割的几种方法及相应方法的VC6.0 程序设计,以应用实例为主线进行展开。主要...
《用“芯”探核:龙芯派开发实战》内容简介:这是一本带领读者快速熟悉、掌握龙芯派开发的专著。本书基于龙芯派二代开发板,首先由