作者:《Dataintensive Text Processing With Mapreduce》书籍
出版社:Morgan and Claypool Publishers
出版年:2010-4-30
评分:8.9
ISBN:9781608453429
所属分类:网络科技
Our world is being revolutionized by data-driven methods: access to large amounts of data has generated new insights and opened exciting new opportunities in commerce, science, and computing applications. Processing the enormous quantities of data necessary for these advances requires large clusters, making distributed computing paradigms more crucial than ever. MapReduce is a programming model for expressing distributed computations on massive datasets and an execution framework for large-scale data processing on clusters of commodity servers. The programming model provides an easy-to-understand abstraction for designing scalable algorithms, while the execution framework transparently handles many system-level details, ranging from scheduling to synchronization to fault tolerance. This book focuses on MapReduce algorithm design, with an emphasis on text processing algorithms common in natural language processing, information retrieval, and machine learning. We introduce the notion of MapReduce design patterns, which represent general reusable solutions to commonly occurring problems across a variety of problem domains. This book not only intends to help the reader "think in MapReduce", but also discusses limitations of the programming model as well.
1.Introduction
2.MapReduce Basics
3.MapReduce Algorithm Design
4. Inverted Indexing for Text Retrieval
5.Graph Algorithms
6.EM Algorithms for Text Processing
7.Closing Remarks
《盛开·第十五届全国新概念获奖者作文范本(B卷)》内容简介:本书为203年春节期间举办的第十五届全国新概念大赛获奖者作品集,作
十载演进,C#日渐强大,新增了泛型、函数式编程概念,以及对静态类型和动态类型的支持,而大量新兴编程习惯背后,却是种种具有迷
《王道与霸道:涩泽荣一对华态度与交往研究》内容简介:作为日本近代资本主义发展史上最为重要的人物之一,涩泽荣一与中国近代史的
一本预示着Web4.0网络大时代来临的开创性读物在这个重视营销宣传的社会,只要利用好互联网,就能让你商业上的竞争对手抓狂。大脑
《图解电子学入门》内容简介:本套丛书系引进欧姆社版权翻译出版的中文版图书。它基本涵盖了有关电子学方面的全部知识。内容简洁
《深入理解计算机网络》是计算机网络领域的扛鼎之作,由有20余年从业经验的优秀网络技术工程师兼全国网管技能水平开始认证专家王
《如何研读经济学文献:从ABC范式出发》内容简介:如何从浩瀚如烟且层出不穷的经济学文献中高效获取有价值的信息困扰着很多经济学人
《基于神经网络的优化设计及应用》所提出的基于神经网络的立体正交优化设计方法是在多学科知识融合的基础上进行了创新,将试验技
《中华书局的企业制度(1912-1949)》内容简介:中华书局作为一家有着百余年历史的现代出版机构,拥有丰厚的底蕴与光荣的传统。本书
《亚细亚生产方式与东方社会发展道路》内容简介:对马克思的亚细亚生产方式的讨论和争论,不仅关系到对这一理论本身的评价和东方社
《机器学习观止:核心原理与实践》内容简介:本书在写作伊始,就把读者设想为一位虽然没有任何AI基础,但对技术本身抱有浓厚兴趣、
TheroleofUXmanagerisofvitalimportance--itmeansleadingaproductiveteam,influencing...
《自己动手制作软体机器人》内容简介:软体机器人技术是一个新兴的领域,它以新的方式接近机器人,使机器人能够在非结构化或不稳定
为进一步深入贯彻实施《中华人民共和国行政诉讼法》,最高人民法院发布了《关于行政诉讼证据若干问题的规定》。本书即是对《行政
本书深刻且通俗地揭示JavaWeb开发内幕,使您由内而外地明白使用Java进行Web应用开发的全过程——从XML基础知识到HTTP详述及相关体
Thisbookintroducesdesignthinking,thecollaborativeprocessbywhichthedesigner’ssens...
《多肉时光》内容简介:本书以多肉作为题材,结合想象绘制插画,每一幅画都有一个故事,画面丰富,且具有想象力,每一个案例都很好
禅是一种生活态度和生活方式。程序员是一份特别辛苦的职业,也是一个承受各种压力的群体。在物欲横流的今天,禅对于程序员有着特
史蒂芬.羅森鮑姆創業家、製片人兼數位策展人。他製作過MTV音樂頻道一個由觀眾提供影片的開創性節目《MTVUnfiltered》,此外,他
《分布式系统与一致性》内容简介:一致性是非常重要的分布式技术。众所周知,分布式系统有很多特性,如可用性、可靠性等,这些特性