作者:《Dataintensive Text Processing With Mapreduce》书籍
出版社:Morgan and Claypool Publishers
出版年:2010-4-30
评分:8.9
ISBN:9781608453429
所属分类:网络科技
Our world is being revolutionized by data-driven methods: access to large amounts of data has generated new insights and opened exciting new opportunities in commerce, science, and computing applications. Processing the enormous quantities of data necessary for these advances requires large clusters, making distributed computing paradigms more crucial than ever. MapReduce is a programming model for expressing distributed computations on massive datasets and an execution framework for large-scale data processing on clusters of commodity servers. The programming model provides an easy-to-understand abstraction for designing scalable algorithms, while the execution framework transparently handles many system-level details, ranging from scheduling to synchronization to fault tolerance. This book focuses on MapReduce algorithm design, with an emphasis on text processing algorithms common in natural language processing, information retrieval, and machine learning. We introduce the notion of MapReduce design patterns, which represent general reusable solutions to commonly occurring problems across a variety of problem domains. This book not only intends to help the reader "think in MapReduce", but also discusses limitations of the programming model as well.
1.Introduction
2.MapReduce Basics
3.MapReduce Algorithm Design
4. Inverted Indexing for Text Retrieval
5.Graph Algorithms
6.EM Algorithms for Text Processing
7.Closing Remarks
很多事物中都存在组成(成分、构成)问题。作者创立的组成论为此提供统一的认识模型、分析工具、计算方法和原理。它通过广义集合
《但问旗民:清代的法律与社会(精)》内容简介:《但问旗民:清代的法律与社会》是赖惠敏研究员继《乾隆皇帝的荷包》之后关于清史
单片机实验与实践教程-(二)(第2版) 内容简介 本书为《单片机系列教程》之一,较之第1版,增删了部分内容。保留了第1版中循序渐进、汇编语言与高级语言并重、串并...
Fullofwriting,reports,andrecommendations,TheMonocleGuidetoBetterlivingisoriginal...
《深入理解Android:卷2》是“深入理解Android”系列的第2本,第1本书上市后获得广大读者高度评价,在Android开发者社群内口口相传
计算机操作系统原理与应用 : 高等学校计算机专业教材精选·计算机原理 本书特色 《计算机操作系统原理与应用》是我们参考了国内外有关OS的论著和技术资料,并结合多...
《音乐评论的视域》内容简介:阐述音乐评论的概念与理论,并以田可文大约20多篇音乐评论文章来作为范例,来叙述音乐评论的路径。20
《海蒂》内容简介:《海蒂》是瑞士儿童文学作家给翰娜·斯比丽的代表作,被视为世界儿童文学经典作品之一。分为《海蒂的学习和生活
《扶贫志》内容简介:本书为反映决战脱贫攻坚重大主题的长篇报告文学,作品以精准扶贫首倡地花垣县为切入点,辐射具有典型意义的扶
《知青变形记》内容简介:知青罗晓飞为争取回城,积极表现,却遭到诬陷入狱。阴差阳错之下,罗晓飞变身为村民范为国,开始了他看似
王映民编著的《TD-LTE-Advanced移动通信系统设计》是一本专门介绍TD-LTE-Advanced系统与技术的图书,主要内容包括:背景与概述、
在你体验Minecraft冒险的同时,学习宝贵的编程技能!如果你很喜欢玩Minecraft,却被游戏中的建造耗费大量时间而困扰,并且你想要
自Django创建以来,各种各样的开源社区已经构建了很多Web框架,比如JavaScript社区创建的Angular.js、Ember.js和Backbone....
《企业品牌管理案例》内容简介:本教材将通过解剖案例的方式,阐述企业品牌管理中的诸多知识点,涉及品牌的概念与要素、品牌战略定
《嫦娥奔月》内容简介:传说嫦娥本是后羿之妻,后羿射下9个太阳后西王母赐其不老仙药。后羿门徒蓬蒙欺骗后羿,后羿受骗欺负嫦娥,嫦
《生死课》内容简介:《生死课》是袁凌的短篇记录合集,记录了各色生存地面上辗转的小人物,或是历史地层中叠压的无名氏。这些人物
《新农人看农村》内容简介:随着“大众创业、万众创新”时代的到来,越来越多的大学生村官凭借多年所学和灵活的创新意识、丰富的互
ANationalBestseller,aNewYorkTimesNotableBook,andanEntertainmentWeeklyBestBookoft...
网络技术-全国计算机等级考试三级教程-(2015年版) 本书特色 本书根据教育部考试中心制订的《全国计算机等级考试三级网络技术考试大纲(2013年版)》编写而成...
《解密·带状疱疹神经痛》内容简介:带状疱疹是临床常见疾病之一,它常见和棘手的并发症是带状疱疹神经痛和带状疱疹后神经痛,它们