作者:《Dataintensive Text Processing With Mapreduce》书籍
出版社:Morgan and Claypool Publishers
出版年:2010-4-30
评分:8.9
ISBN:9781608453429
所属分类:网络科技
Our world is being revolutionized by data-driven methods: access to large amounts of data has generated new insights and opened exciting new opportunities in commerce, science, and computing applications. Processing the enormous quantities of data necessary for these advances requires large clusters, making distributed computing paradigms more crucial than ever. MapReduce is a programming model for expressing distributed computations on massive datasets and an execution framework for large-scale data processing on clusters of commodity servers. The programming model provides an easy-to-understand abstraction for designing scalable algorithms, while the execution framework transparently handles many system-level details, ranging from scheduling to synchronization to fault tolerance. This book focuses on MapReduce algorithm design, with an emphasis on text processing algorithms common in natural language processing, information retrieval, and machine learning. We introduce the notion of MapReduce design patterns, which represent general reusable solutions to commonly occurring problems across a variety of problem domains. This book not only intends to help the reader "think in MapReduce", but also discusses limitations of the programming model as well.
1.Introduction
2.MapReduce Basics
3.MapReduce Algorithm Design
4. Inverted Indexing for Text Retrieval
5.Graph Algorithms
6.EM Algorithms for Text Processing
7.Closing Remarks
……美术编辑要读懂书的内容,把握书的性格,这是设计的前提。范用热爱简洁、大方、韵味深远的设计,他力避繁复,深知“减法”之
《网店运营与管理实务》内容简介:本书以就业为导向,以能力为本位,采用项目任务驱动的体例,每个项目以具体任务为主线展开,每个
forewordbyRichardSaulWurmanInformationdesignisthenewestofthedesigndisciplines.As...
《内向高敏者》内容简介:这是一份针对内向型高敏感者的幸福生活指南。作为兼具内向性格和高敏感特质的人,你善于分析、小心谨慎、
《设计元素》是一本供学生和设计者学习的参考书。作为一本设计的启蒙读物,它包含了制作各种简单形体及创造复杂方法去解决困难的
InDecember2009,Googlebegancustomizingitssearchresultsforeachuser.Insteadofgiving...
郑纬民男,1946年生,浙江宁波人。1970年毕业于清华大学自动控制系并留校任教。1982年在清华大学计算机系获硕士学位。现为清华大
《APP营销实战:抢占移动互联网第一入口》内容简介:在移动互联网时代,谁先占领用户的手机桌面,谁就是“明日霸主”。可以说,APP
《高情商养育》内容简介:0-6岁,黏人、打人、不好好吃饭、拖拖拉拉、不听话、爱发脾气等。6-12岁,不认真听讲、搞小动作、学习不积
《别让心态毁了你》内容简介:保持什么样的心态就会有什么样的行为方式,而行为方式决定着一个人的生人走向。心态能够成就一个人,
《方向感》内容简介:本书分为六大篇:确立产业边界的三大原则、确立商业形态的三大维度、确立竞争地位的三大要点、理论指导实践的
《诗词中国(第九期)》内容简介:《诗词中国》由中华书局、中华诗词研究院共同主办,面向全社会公开出版发行。旨在“搜集当代最动
用户界面设计:有效的人机交互策略(第五版),ISBN:9787121128929,作者:(美)施耐德曼,(美)普莱萨特著,张国印等译目录
Duringthepastdecadetherehasbeenanexplosionincomputationandinformationtechnology....
ThisbookwillshowJavadevelopershowtousetheGoogleWebToolkit(GWT)torapidlycreateric...
Java Web从入门到精通(配光盘)(软件开发视频大讲堂) 本书特色 “软件开发视频大讲堂”丛书系清华社“视频大讲堂”重点大系之一。该大系包括多个子系列,每个...
这本书主要分为五个部分来写,引论、策划、易用度设计、交互网站设计和图形图像的建立。而主要部分为交互网站设计和易用度设计,
WhatdoAmazonsproductreviews,eBaysfeedbackscoresystem,SlashdotsKarmaSystem,andXbo...
Flash8网络广告设计全程实录 内容简介 Flash 是Macromedia公司推出的矢量动画编辑软件,使用Flash制作的广告、网站、短片等几乎无处不在,而...
jaybryant:横跨两个不同的领域:写作和编程。在过去的20年中,他一直致力于帮助ge(通用电气)、motorola(摩托罗拉)、dell(戴