本书源自作者在斯坦福大学教授多年的“web挖掘”课程材料,主要关注大数据环境下数据挖掘的实际算法。书中分析了海量数据集数据挖掘常用的算法,介绍了目前web应用的许多重要话题。主要内容包括:
□ 分布式文件系统以及map-reduce工具;
□ 相似性搜索;
□ 数据流处理以及针对易丢失数据等特殊情况的专用处理算法;
□ 搜索引擎技术,如谷歌的pagerank;
□ 频繁项集挖掘;
□ 大规模高维数据集的聚类算法;
□ web应用中的关键问题:广告管理和推荐系统。
本书配套网http://infolab.stanford.edu/~ullman/mmds.html上提供英文版初稿以及一些课件和项目作业。
大数据时代的及时雨全球著名数据库技术专家*新力作理论与实际算法实现并重
AnandRajaraman数据库和Web技术领域权威,创业投资基金Cambrian联合创始人,斯坦福大学计算机科学系助理教授。Rajaraman职业生涯非常成功:1996年创办Junglee公司,两年后该公司被亚马逊以2.5亿美元收购,Rajaraman被聘为亚马逊技术总监,推动亚马逊从一个零售商转型为零售平台;2000年与人合创Cambrian,孵化出几个后来被谷歌收购的公司;2005年创办Kosmix公司并任CEO,该公司2011年被沃尔玛集团收购。Rajaraman生于印度,在斯坦福大学获得计算机科学硕士和博士学位。求学期间与人合著的一篇论文荣列近20年来被引用次数最多的论文之一。博客地址http://anand.typepad.com/datawocky/。
JeffreyDavidUllman美国国家工程院院士,计算机科学家,斯坦福大学教授。Ullman早年在贝尔实验室工作,之后任教于普林斯顿大学,十年后加入斯坦福大学直至退休,一生的科研、著书和育人成果卓著。他是ACM会员,曾获SIGMOD贡献奖、Knuth奖等多项科研大奖;他是“龙书”《编译原理》、数据库领域权威指南《数据库系统实现》的合著者;麾下多名学生成为了数据库领域的专家,其中最有名的当属谷歌创始人SergeyBrin;本书第一作者也是他的得意弟子。Ullman目前任Gradiance公司CEO。
《玩转Django 2.0》内容简介:本书是一本Python Web的技术总结,主要以Python 3和Django 2.0版本实现。通过本书的学习,读者能够透
《插画教室》内容简介:本书是专业插画设计基础教程。插画创作离不开植物、动物、人物、静物这些元素,本书便从这些元素入手,以几
《理财中的经济学》内容简介:每个人的生活都离不开金钱,管理金钱即理财。掌握好理财的技能,对于提高个人与家庭的生活质量大有帮
《Python网络爬虫实战》内容简介:本书从Python的安装开始,详细讲解了Python从简单程序延伸到Python网络爬虫的全过程。本书从实战
《QQ营销》内容简介:本书对互联网营销中普遍采用的矩阵式营销加以归纳和总结,给出了矩阵式营销的概念和一般方法,并使用矩阵式营
《第四次革命》内容简介:随着线上线下大融合以及人工智能的极大发展,人类已经进入超历史时代。在这一时代中,人类终于迎来了继哥
《中国云南与东南亚、南亚高等教育国际化研究》内容简介:本书是全面研究中国云南省与东南亚、南亚等区域高等教育国际合作与交流的
Visual Basic电子商务项目方案精解 内容简介 Visral Basic是数据开发的有用工具,在企业信息管理系统开发中具有广泛的使用。本书以几个典型实例...
《南唐二主词汇笺》内容简介:南唐二主,尤其是后主李煜,在词史上有显著地位,也是词学大师唐圭璋先生做过专题研究的重要词人。《
《神神鬼鬼》内容简介:《神神鬼鬼》堪称名人谈鬼神的合集,由陈平原选编而成。节录了现当代文学史上如茅盾、周作人、梁实秋、老舍
《抖音运营变现手册》内容简介:《抖音运营变现手册》以运营团队的视角,介绍了抖音短视频账号运营、快速涨粉的实战技巧。首先,把
《工作一年拉开差距:逻辑思考》内容简介:刚工作一年,总是感觉思路混乱? 刚接手新的业务压力很大,对新项目的思考总觉得不够深入
《C语言学习指南:从规范编程到专业级开发》内容简介:本书分为五部分,通过大量简明易懂的范例由浅入深地演示C语言中的概念和编程
http://www.amazon.com/exec/obidos/tg/detail/-/1590598164/BookDescriptionPractica...
《色铅笔绘画实用教程——虫的世界》内容简介:可恶的蚊子、可怕的蟑螂、善于飞行的蜻蜓、有“大力士”之称的蚂蚁、辛勤的蜜蜂、闪
《jQuery实战》全面介绍jQuery知识,展示如何遍历HTML文档、处理事件、执行动画以及给网页添加Ajax。书中紧紧地围绕“用实际的示
《神经网络设计与实现》内容简介:本书是一本神经网络实践进阶指南,适合对AI和深度学习感兴趣并且想进一步提高技能的读者阅读。本
《好玩的生物学:陪中学生一起阅读生命》内容简介:本书是一本适合全学段中学生进行严肃阅读的生物学科普读物。全书以“系统”“适
“泛娱乐战略”是指打造“围绕明星IP、开发多种文化创意产品体验”的创新业态。“泛娱乐战略”最早被腾讯公司确定为公司级战略。
《深度学习与围棋》内容简介:这是一本深入浅出且极富趣味的深度学习入门书。本书选取深度学习近年来最重大的突破之一AlphaGo,将其