的Jim Gray基准排序,只用了209秒,而到了2009年4月,在一个1400节点的集群上对500GB数据进行排序,只用了59秒,这显示了Hadoop强大的计算能力。2008年开始,Hadoop迈向主流,开始
狭义的Hadoop核心只包括Hadoop Common、Hadoop HDFS和Hadoop MapReduce三个子项目
类似于其他序列化机制,Avro可以将数据结构或者对象转换成便于存储和传输的格式,其设计目标是用于支持数据密集型应用,适合大规模数据的存储与交换。
ZooKeeper作为一个分布式的服务框架,解决了分布式计算中的一致性问题。
布尔变量quietmode,用来设置加载配置的模式。如果quietmode为true(默认值),则在加载解析配置文件的过程中,不输出日志信息。quietmode只是一个方便开发人员调试的变量。
通过XInclude机制,把配置文件conf4performance.xml嵌入到当前配置文件,这种方法更有利于对配置文件进行模块化管理,同时就不需要再使用Configuration.addResource()方法加载资源conf4performance.xml了
Java序列化机制中,反序列化过程会不断地创建新的对象,但在Hadoop的序列化机制的反序列化过程中,用户可以复用对象
bzip2格式压缩文件中,块与块间提供了一个48位的同步标记,因此,bzip2支持数据分割。
java. lang.reflect.Proxy中的另一个关键字是reflect(反射),反射提供了一个非常丰富而精心设计的工具集,以便编写能够动态操纵Java代码的程序。
加载文件系统操作,就是将某个文件系统“嫁接”到另一个文件系统的目录层次中
群体智能是近年来发展迅速的人工智能学科领域.通过研究分散,自组织的动物群体和人类社会的智能行为,学者们提出了许多迥异于传统思
《神奇的烧脑思维游戏书》内容简介:这是一本全面提升孩子学习兴趣、阅读技巧、文学知识、科学素养、审美情趣的诚意之作。本书细分
《社区发展与家庭教育(修订版)》内容简介:社区发展与家庭教育是教育专业学生专业课程的重要组成部分,本书主要内容包括社区及社
《科学大王·植物大观》内容简介:开启神奇的植物王国之旅,从藤萝缠绕、花繁叶茂的热带雨林,到奇特的花、草、树、木、水果、蔬菜
内容简介Spring3.0是Spring在积蓄了3年之久后,隆重推出的一个重大升级版本,进一步加强了Spring作为Java领域第一开源平台的翘楚
《豹迹:与记忆有关》内容简介:他是国际知名的美术史家,在艺术研究领域举足轻重,同时他也是当代重要的艺术评论者,从西方艺术、
一间麻省理工的旧实验室一群至情至性的雷达先锋一则可歌可泣的惊世传奇一段令人叹惋的豪情历史雷达的发明是扭转二次大战战局的关
《庆历四年秋》内容简介:“庆历四年春”,这是范仲淹千古经典《岳阳楼记》起首句所定格的不朽时间。宋仁宗庆历四年,这段貌似短暂
《光之美学》内容简介:光帮助我们感知一切事物,有光便有影。在绘画中,光影一直是一个重要的课题,可以借用明暗关系来表达,也可
本书并不具体地描述某一技术的细节,而是尽量从宏观上、从历史的角度来描述通信产业的发展和变迁,描述在一个通信基础设施中使用
《桥村有道》内容简介:本书基于丰富的田野材料,对湖南省一个汉族村落的历史及村民生命史予以详细的叙述和分析。作者认为,与梁漱
《诗词中国(第九期)》内容简介:《诗词中国》由中华书局、中华诗词研究院共同主办,面向全社会公开出版发行。旨在“搜集当代最动
《未来的企业:中国企业高质量发展之道》内容简介:市场主体是国民经济的细胞,是整个国民经济体系的基础环节。“黑天鹅”也好,“
《U形曲线:高质量发展的底层逻辑》内容简介:本书提出了何为最优产品、最优服务、最优企业的问题,运用大量的案例系统介绍如何提高
《Excel VBA应用与技巧大全》内容简介:Excel是应用最广泛的办公软件之一,它大大提高了办公人员的工作效率。但是各行各业的办公需
《出版理论与实务研究(2022)》内容简介:《出版理论与实务研究2022》全书分为“出版工作”“选题策划”“书稿审读”“市场营销”
高级软件测试技术 本书特色 杜庆峰编著的《高级软件测试技术》的特点是测试技术介绍全面,不但阐述了所有基本的软件测试技术,而且介绍了许多高级主题和专门应用...
《港澳发展研究》内容简介:《港澳发展研究》是清华大学港澳研究中心首批立项项目的集结展示,分为“一带一路”与港澳研究、法律政
《不教一日闲过:回忆齐白石》内容简介:齐白石是融诗、书、画、印为一体的艺术大师,是二十世纪唯一被选为世界文化名人的中国艺术
本书用丰富的图示,从最小二乘法出发,对基于最小二乘法实现的各种机器学习算法进行了详细的介绍。第Ⅰ部分介绍了机器学习领域的