本书源自作者在斯坦福大学教授多年的“web挖掘”课程材料,主要关注大数据环境下数据挖掘的实际算法。书中分析了海量数据集数据挖掘常用的算法,介绍了目前web应用的许多重要话题。主要内容包括:
□ 分布式文件系统以及map-reduce工具;
□ 相似性搜索;
□ 数据流处理以及针对易丢失数据等特殊情况的专用处理算法;
□ 搜索引擎技术,如谷歌的pagerank;
□ 频繁项集挖掘;
□ 大规模高维数据集的聚类算法;
□ web应用中的关键问题:广告管理和推荐系统。
本书配套网http://infolab.stanford.edu/~ullman/mmds.html上提供英文版初稿以及一些课件和项目作业。
大数据时代的及时雨全球著名数据库技术专家*新力作理论与实际算法实现并重
AnandRajaraman数据库和Web技术领域权威,创业投资基金Cambrian联合创始人,斯坦福大学计算机科学系助理教授。Rajaraman职业生涯非常成功:1996年创办Junglee公司,两年后该公司被亚马逊以2.5亿美元收购,Rajaraman被聘为亚马逊技术总监,推动亚马逊从一个零售商转型为零售平台;2000年与人合创Cambrian,孵化出几个后来被谷歌收购的公司;2005年创办Kosmix公司并任CEO,该公司2011年被沃尔玛集团收购。Rajaraman生于印度,在斯坦福大学获得计算机科学硕士和博士学位。求学期间与人合著的一篇论文荣列近20年来被引用次数最多的论文之一。博客地址http://anand.typepad.com/datawocky/。
JeffreyDavidUllman美国国家工程院院士,计算机科学家,斯坦福大学教授。Ullman早年在贝尔实验室工作,之后任教于普林斯顿大学,十年后加入斯坦福大学直至退休,一生的科研、著书和育人成果卓著。他是ACM会员,曾获SIGMOD贡献奖、Knuth奖等多项科研大奖;他是“龙书”《编译原理》、数据库领域权威指南《数据库系统实现》的合著者;麾下多名学生成为了数据库领域的专家,其中最有名的当属谷歌创始人SergeyBrin;本书第一作者也是他的得意弟子。Ullman目前任Gradiance公司CEO。
《游戏架构:核心技术与面试精粹》内容简介:本书从架构与封装、艺术资源、底层核心、自定义扩展和独立游戏五个方向组织内容,每一
ThisisanupdatedrevisionofTennisons"BeginningXSLT",updatedforthenewrevisionoftheX...
《银行业知识管理实战精析》内容简介:本书从国际通用的知识管理体系出发,引入55个银行业知识管理案例,案例类型覆盖大型商业银行
.NETFramework3.5开发技术详解 本书特色 许多技术人员在面对.NET Framework 3.0/3.5大量的新知识、新技术的时候感到彷徨,对自己...
《汽车标识符号全知道》内容简介:《汽车标识符号全知道》按品牌标识、车身上标识、驾驶操作标识的顺序,以图解的方式对汽车上常见
《深入浅出设计模式》(影印版)的编写运用许多最新的研究,包括神经生物学、认知科学以及学习理论,这使得《深入浅出设计模式》(影
《数据科学之编程技术》内容简介:本书围绕使用R进行数据科学编程所需的实际步骤展开。全书着眼于该主题,介绍了有关该主题的工具和
《简约之美:软件设计之道》将软件设计作为一门严谨的科学,阐述了开发出优雅简洁的代码所应该遵循的基本原则。作者从为什么以前软
《油画棒宝典:路正先油画棒手绘完全自学教程》内容简介:本书是油画棒绘画的零基础完全自学教程,全书共分4章。第1章是油画棒绘画
Overthepasttwodecades,nofieldofscientificinquiryhashadamorestrikingimpactacrossa...
《温柔的西部》内容简介:本书是作者吴景娅对中国西部山川与风土人情的描写、歌颂;也是作者以西部人的视觉对外在世界的观察与思考
机器智能人脸工程 本书特色 人脸工程学的研究内容主要包括人脸识别、表情识别和人脸合成三个部分。本书分别介绍了人脸识别、表情识别和人脸合成研究中用到的相关理论和算...
电脑常见故障排除实用技巧800招-(含1DVD) 本书特色 精选电脑常见故障,提供完美解决方案;涵盖主流软硬件产品,关注新技术的应用;提供有声视频文件,重点、难...
《Vue.js应用测试》内容简介:Vue.js创始人尤雨溪(Evan You)鼎力推荐!Vue官方测试工具作者亲笔撰写。本书是一本为Vue应用程序开
《八仙的传说·吕洞宾的故事》内容简介:吕洞宾成仙后,闲来无事来到洛阳,看到了变成凡人的菩萨,还戏弄了菩萨。这下可好,任务来
《心智社会》内容简介:人类思维是一个复杂的过程。“为什么人类下雨不想被淋湿,却愿意在卫生间沐浴”这种3岁小孩都知道的问题,计
《Python人脸识别:从入门到工程实践》内容简介:本书讲解了人脸识别模型的实现原理和特点,更重要的是强调了工程上的实践能力,对
《人机交互:以用户为中心的设计和评估(第6版)》内容简介:本书计算机系统、互联网、移动终端,带动了人类生活全面的数字化、信息
Fanswillgetbentoutofshapeiftheymissthefirstbooktocovercircuit-bending-bending,fo...
本书结合我国移动业务的发展历程和新应用趋势,对2G、2.5G及3G移动通信系统中的移动新业务、业务提供技术及其在实际中的应用进行