作者:《Dataintensive Text Processing With Mapreduce》书籍
出版社:Morgan and Claypool Publishers
出版年:2010-4-30
评分:8.9
ISBN:9781608453429
所属分类:网络科技
Our world is being revolutionized by data-driven methods: access to large amounts of data has generated new insights and opened exciting new opportunities in commerce, science, and computing applications. Processing the enormous quantities of data necessary for these advances requires large clusters, making distributed computing paradigms more crucial than ever. MapReduce is a programming model for expressing distributed computations on massive datasets and an execution framework for large-scale data processing on clusters of commodity servers. The programming model provides an easy-to-understand abstraction for designing scalable algorithms, while the execution framework transparently handles many system-level details, ranging from scheduling to synchronization to fault tolerance. This book focuses on MapReduce algorithm design, with an emphasis on text processing algorithms common in natural language processing, information retrieval, and machine learning. We introduce the notion of MapReduce design patterns, which represent general reusable solutions to commonly occurring problems across a variety of problem domains. This book not only intends to help the reader "think in MapReduce", but also discusses limitations of the programming model as well.
1.Introduction
2.MapReduce Basics
3.MapReduce Algorithm Design
4. Inverted Indexing for Text Retrieval
5.Graph Algorithms
6.EM Algorithms for Text Processing
7.Closing Remarks
《把孩子交给爸爸》内容简介:在当下家庭教育中,普遍存在父亲教育缺失或不足的现象,本书作者作为一个相当称职的爸爸,给千万个家
《计算机图形学》与大多数传统的计算机图形学教材不同,它仅简要介绍交互式计算机图形学方面的基本知识,主要侧重于介绍计算机图
《PhotoshopCC移动UI界面设计与实践(含DVD光盘1张)》一共包含三部分,共14个Part的内容。第1部分基础篇(Part1~Part3):介绍移动
陆中浪:一位从零创业,没有打过一天工,也未领过一天工资,仅仅用了5年时间就拥有二十余项投资产业、三十多家公司,涉及服装、餐
Y染色体由于其单倍体特性和群体特异性分布,成为分子人类学研究最有力的工具。利用Y染色体可以很好地解析种族的起源、民族的分化
市面上有很多介绍C语言的书,但这是第一本将C语言以简洁而实用的方式介绍给读者的书籍。用C语言进行编程不仅仅是在程序中使用正确
吴国斌博士,PMP,微软亚洲研究院学术合作经理,负责中国高校及科研机构KinectforWindows学术合作计划及微软精英大挑战Kinect主题
《日语教师课堂教学与自我发展研究》内容简介:日语教育是指,面向非日语母语者的日语教育。日语教育将日语视为交流的手段。日本日
图像目标分割方法 本书特色 陆玲、王蕾编*的《图像目标分割方法》主要介绍图像中目标分割的几种方法及相应方法的VC6.0 程序设计,以应用实例为主线进行展开。主要...
《女性择偶倾向》内容简介:择偶作为一种复杂的社会、文化和心理现象,近年来已成为社会学与心理学炙手可热的研究课题。西方*早展开
全书用5章来介绍Axure软件的使用方法,包括Axure的介绍及安装、Axure的窗口及常用部件、交互事件及动作,以及实战交互案和整站案
《一叶知心——茶相茶味》内容简介:1.了解茶叶史:茶是如何从直接煮饮过渡到饼茶、点茶再到今天的散茶;茶名谓的变化以及最终的确
《15分钟画漫画:马克笔画人物超简单》内容简介:用色彩鲜艳的马克笔画出自己喜欢的漫画形象,一定是喜欢画漫画的你很想去做的事情
《素描初步——静物绘制基础教程》内容简介:静物画是学习素描中重要的一部分,初学者在学习时会遇到造型不准确、画不准结构、比例
Java程序设计与实践教程 本书特色 张诚洁、梁海丽编著的《Java程序设计与实践教程》是一本Java程序设计语言的入门教程,使用JDK 6.0作为开发工具,主...
《婚恋清醒指南》内容简介:◆给所有女生的婚恋清醒指南,手把手教你看清亲密关系的底层逻辑,别在该动脑子的时候动感情。拒绝“恋
《简笔画5000例,一本就够(男生卷)》内容简介:简笔画几乎是每个人孩提时代绘画生涯的开始。简单的线条,可爱的形状,总能释放你
《Internet与WWW程序设计教程》(第3版)以大量生动、实用的示例讲述了如何编写多层的、客户/服务器的、数据密集的、基于Web的应用
《应用组合数学(第5版)》讲解了离散数学问题求解中组合推理和组合建模的方法、思维和运用。主要涉及图论基本概念、覆盖和图着色、
《EPON/GPON技术问答》全面介绍了无源光网络(PON)技术,主要包括.EPON和GPON的相关知识。全书共分6章。第1章基础篇,概要介绍了