本书源自作者在斯坦福大学教授多年的“web挖掘”课程材料,主要关注大数据环境下数据挖掘的实际算法。书中分析了海量数据集数据挖掘常用的算法,介绍了目前web应用的许多重要话题。主要内容包括:
□ 分布式文件系统以及map-reduce工具;
□ 相似性搜索;
□ 数据流处理以及针对易丢失数据等特殊情况的专用处理算法;
□ 搜索引擎技术,如谷歌的pagerank;
□ 频繁项集挖掘;
□ 大规模高维数据集的聚类算法;
□ web应用中的关键问题:广告管理和推荐系统。
本书配套网http://infolab.stanford.edu/~ullman/mmds.html上提供英文版初稿以及一些课件和项目作业。
大数据时代的及时雨全球著名数据库技术专家*新力作理论与实际算法实现并重
AnandRajaraman数据库和Web技术领域权威,创业投资基金Cambrian联合创始人,斯坦福大学计算机科学系助理教授。Rajaraman职业生涯非常成功:1996年创办Junglee公司,两年后该公司被亚马逊以2.5亿美元收购,Rajaraman被聘为亚马逊技术总监,推动亚马逊从一个零售商转型为零售平台;2000年与人合创Cambrian,孵化出几个后来被谷歌收购的公司;2005年创办Kosmix公司并任CEO,该公司2011年被沃尔玛集团收购。Rajaraman生于印度,在斯坦福大学获得计算机科学硕士和博士学位。求学期间与人合著的一篇论文荣列近20年来被引用次数最多的论文之一。博客地址http://anand.typepad.com/datawocky/。
JeffreyDavidUllman美国国家工程院院士,计算机科学家,斯坦福大学教授。Ullman早年在贝尔实验室工作,之后任教于普林斯顿大学,十年后加入斯坦福大学直至退休,一生的科研、著书和育人成果卓著。他是ACM会员,曾获SIGMOD贡献奖、Knuth奖等多项科研大奖;他是“龙书”《编译原理》、数据库领域权威指南《数据库系统实现》的合著者;麾下多名学生成为了数据库领域的专家,其中最有名的当属谷歌创始人SergeyBrin;本书第一作者也是他的得意弟子。Ullman目前任Gradiance公司CEO。
数据库技术基础及应用第2版 内容简介 本书主要介绍数据库技术的基础及应用。全书共分14章,内容由浅入深、循序渐进,逻辑性强。在理论基础方面,本书从数据管理与数据...
你以前玩过一些触摸屏游戏,关于游戏,你肯定有过自己的点子吧!接下来怎么做?把这个想法变为现实吧!这本《触摸屏游戏设计》里
手游与社交游戏是一个生机勃勃、令人兴奋的产业,飞速发展的互联网与相关技术,成就了一个又一个广为流传、收益丰厚的游戏产品。
《幼儿心理学》内容简介:本书分为12章,包括绪论、幼儿心理发展概述、幼儿注意的发展、幼儿感觉和知觉的发展、幼儿记忆的发展、幼
全国计算机等级考试一级教程-计算机基础及MS Office应用上机指导-(2016年版) 本书特色本书根据教育部考试中心*新颁布的考试大纲编写,是全国计算机等级...
Stata统计分析与应用-赢在职场-第2版-(附光盘) 本书特色 本书主要讲解数据的基本处理、图形的绘制、统计分析、回归与建模分析、编程等方面的内容,讲解力求细...
《XilinxISEDesignSuite10.xFPGA开发指南:逻辑设计篇》以XilinxFPGA逻辑开发流程为主线,以浅入深出、图文并茂的方式,全面、详细
本书是一本关于雷电科学的入门书,涵盖了对雷电现象的解读、思考以及雷害防范对策等内容。本书在阐释雷电现象的发生、原理、变化
神经元(神经细胞)是构成神经系统的基石,对神经元各个方面的深入、彻底的理解对于我们从各个层次对神经系统进行分析都是十分必
1、我们这个时代最清醒的思考者之一尼古拉斯·卡尔继《浅薄》《玻璃笼子》之后又一重磅力作。2、在这部跨越历史、经济和技术领域
《TensorFlow自然语言处理》内容简介:本书首先介绍NLP和TensorFlow基础知识,然后介绍如何使用Word2vec(包括高级扩展)创建单词嵌
火星,我们地球的近邻,也是太空时代人类最早定位的探测目标。人类对这一曾有过与地球相似环境的星球进行了一次又一次的探测,以
《你见过我的妈妈吗?:穿山甲松果的故事》内容简介:本书为国际爱护动物基金会(FAW)“希望的家园系列”从书之一,从中华穿山甲“
文明以止,人文也。硅谷的成功,不完全在人或钱,也不在科技,而在整体的生态。硅谷创投家郑志凯先生带领你领略硅谷的精髓。本书以
《完美统计图》内容简介:统计图是数据可视化的主角之一,本书讲述如何制作规范的统计图。全书共分4篇,用鲜活的实例,分别讲述数据
《西湖梦寻注评》内容简介:《西湖梦寻》记杭州历史掌故、绘西湖风俗画卷,是晚明小品圣手张岱代表作之一。本书作者对张岱《西湖梦
Semi-supervisedlearningisalearningparadigmconcernedwiththestudyofhowcomputersand...
《百年新路》内容简介:近年来,世界经济持续不景气,反全球化、民粹主义势力抬头,现有的国际政治经济秩序已难以为继,美国等西方
书中用了大量来自世界顶级创意获奖机构的灵感实例为新晋设计师提供了必要的指导,例如AKQA公司,英国BBC,美国EA公司(全球最大的
《自然语言处理实战:预训练模型应用及其产品化》内容简介:本书分为三部分。第1部分聚焦于自然语言处理的高层次概述,包括自然语言