从超大规模的事件流中发现模式可能很困难,但是学习如何发现这些模式却不见得很难。这本实战指南告诉我们如何利用apache hadoop,使用简单、有趣、精致的工具,解决大规模数据处理中的模式发现以及很多其他问题。通过处理真实数据、解决现实问题,你将对大数据有一个实用的、可操作的认识。本书非常适合hadoop新手,也很适合那些想要提升技能的有经验的实践家。其中,*部分解释了hadoop和mapreduce的工作原理,第二部分讲述了很多数据处理用到的分析模式。通过一些练习,你还将学会如何使用apache pig进行数据处理。■ 学习使用hadoop的必要原理,包括数据和计算在集群中的移动行为■ 深入理解mapreduce机制,用python创建你的*个mapreduce作业■ 理解如何以pig脚本的形式运行mapreduce作业链■ 全书使用真实数据集,即棒球统计数据集■ 提供分析模式的示例,并学习何时何地使用这些分析模式
本书以实用的、可操作的视角解释了大数据——采用黑猩猩和大象的隐喻,基于棒球统计数据集,使用apache hadoop和pig等工具展示了如何处理大规模数据。此外,通过处理真实数据、解决现实问题,作者还以实例的形式总结了一些实践分析模式,为有创造力的分析人员提供了*强大、*有价值的方法。本书特别适合那些需要大数据工具箱来解决实际问题的人们。
Philip Kromer是云大数据平台领先者Infochimps的创始人和CTO,以及Vigilante的联合创始人。他的其中一个项目WuKong,是Hadoop Ruby流处理最常使用的框架之一。__eol__Russell Jurney是全球经济市场地图创业公司Relato的创始人和CEO。他曾任LinkedIn产品分析数据科学家,还是一个Hadoop传道士。唐李洋,女,博士,中国电子科技集团公司第三十八研究所,工程师,目前从事公共安全等领域相关的大数据分析与数据挖掘工作。译有《高可用MySQL》(第1和第2版)、《R语言高性能编程》等书。
《AI+医疗健康:智能化医疗健康的应用与未来》内容简介:随着新一轮科技革命的到来,人工智能、大数据等技术对医疗健康领域产生了巨
ThisbookpresentsguidelinesforprofessionalWebdevelopment,includingcommunicatingwi...
从貌似天书的汇编代码中,一探Windows底层的核心实现。.在开发中出现的问题,能从Windows自身找到答案!...本书从基本的Windows程
CrossSiteScriptingAttacksstartsbydefiningthetermsandlayingoutthegroundwork.Itass...
BuildingResponsiveWebApplicationswithAJAXandPHPisthemostpracticalandefficientres...
《庇护所》含金量极高,文字简明深刻,图片精美贴切,信息量之大、覆盖面之全、趣味性之佳让人叹为观止。书中将人类历史上出现过
本书全面介绍了家具设计的基础知识、设计原理以及设计方法,包括对功能、材料、制作过程和持续性方面等进行了介绍。书中所选案例
这是一本剖析Linux常用目录及文件的专著,它打破以往图书偏重介绍命令语句的惯性思维,以系统目录架构为主体,并设计查询功能,以
《博客园开发者征途·你必须知道的.NET》来自于微软MVP的最新技术心得和感悟,将技术问题以生动易懂的语言展开,层层深入,以例说
Thegapbetweenwhodesignersanddevelopersimaginetheirusersare,andwhothoseusersreall...
微机原理与接口技术 内容简介 本书是省精品课程教材,依据电子信息科学与电气信息类平台课程教学基本要求编写,以80x86为主,介绍微机原理的基本理论与技术应用。主...
IDAPro(交互式反汇编器专业版)是应用最广泛的静态反汇编工具,在IT领域有着举足轻重的地位,但其文档资料一直都不够完善,在ID
APDL参数化有限元分析技术及其应用实例 本书特色 本书主要适合于已掌握基本操作的ANSYS初级用户和部分中、高级用户,是一本学习APDL的技术资料,也是灵活掌...
《阅读理解高分6法:线索法》内容简介:阅读理解想要拿高分,文章读不透,学习再多答题技巧也是事倍功半!本书聚焦“文章如何读”“
《郁达夫游记》内容简介:本书汇编郁达夫的游记、风景散文近四十篇。这些作品,写山水名胜、描景色风物,既有丰富的地理、历史、自
众所周知,视觉营销从业者在零售业界正发挥着日益重要的影响力。无论是对商家在产品销售及陈列展示上的辅助与指导,还是在推进当
天亮了一只鸟落在船上蝴蝶从水面飞过湖畔边的蜘蛛网里,一只蜘蛛正在和天牛扭打野鸭悠然自得地从水面游走傍晚了月亮倒映在湖面上
作者简介:AriLerner是一位全栈工程师,拥有多年AngularJS经验,自办并运营AngularJS电子报ng-newsletter.com,在著名硅谷工...
本书分为两大部分。第一部分结合精心挑选的实例,系统地讨论了黑客代码分析技术,包括调试器于反汇编器等典型分析工具的使用、代码
《PWA实战:面向下一代的Progressive Web APP》内容简介:Progressive Web App(PWA)是由谷歌提出的一整套技术解决方案,它...