当今各行业,尤其是互联网,数据规模越来越大,要从中有效地发现模式来提高生产力,用传统的方式已经几乎不可能,只能借助计算机来完成诸多使命。因此,机器学习这一新兴的学科变得越来越重要,它已经在搜索、推荐、数据挖掘等多个领域闪耀光芒。机器学习是一门交叉学科,内容涉及概率论、统计学、高等数学、计算机科学等多门学科。该学科致力于设计一种让计算机具有“学习”能力的算法,通过发现经验数据中隐藏的模式,实现对未知数据的预测。大数据时代是机器学习*美好的时代,因为数据不再是问题,各类问题都可以收集到海量的数据。但是,对于很多人来说,这一门交叉学科本身却神秘而陌生,对于没有系统学习过相关基础学科的人来说尤其感到“高不可攀”。如今已出版的机器学习相关书籍中,很多都有这个特点:公式多,晦涩难懂。这让很多程序员出身的人望而却步。然而,在**次读到本书的英文版时,译者就彻底相信:机器学习完全可以讲解得通俗易懂,让知识的传递实现“润物细无声”。本书秉承的原则是:实践出真知,只要多动手,没有攻克不了的技术难题。因此作者预期的阅读对象是如电脑黑客般的人,要求对技术有发自内心的求知欲和好奇心,愿意自己动手而非纸上谈兵。全书精心选择了12个机器学习案例,由浅入深,面面俱到,既有基础知识(如数据分析),也有当前热门的社交网站推荐案例。书中的每一个案例都由作者娓娓道来,逐一剖析关键算法的代码,没有丝毫学究气息,触动每个机器学习初学者的内心*深处。书中所有算法都采用r语言实现。r语言是一门用于统计学的开源脚本语言,基于它的开源性,有来自世界各地的开源拥护者贡献的各种统计学相关的程序包,稳定且方便,尤其是它对数据可视化的支持,更是一柄利器,既轻巧又实用。书中所有源代码和数据在原书的官方网站上都可以免费下载。在阅读过程中,犹如作者亲至身侧,为你讲解代码和思路,为你排除错误和优化效果。全书案例既有分类问题,也有回归问题;既包含监督学习,也涵盖无监督学习。所选择的案例妙趣横生,如分析ufo目击记录、破译密码、预测股票、分析美国参议员“结党”的情况,等等,这里就不“剧透”了,大家自己去享受学习的乐趣吧。书中12个案例之间的依赖关系不是特别强(除r语言基础知识外,其余某几章仅有个别知识点之间存在依赖性),可以像连续剧一样,逐一播放,也可以像一个个小品一般,挑感兴趣的内容分别播放。学习完这些案例之后,相信你会窥见机器学习的一斑,然后再根据自己的实际情况更深入地学习。本书翻译工作由三位来自互联网世界的工程师通力协作完成,其中,来自新浪微博的陈开江负责完成前言及第1~4章的翻译;来自阿里b2b的刘逸哲负责完成第5、8、9和11章的翻译;来自阿里一淘的孟晓楠负责完成第6、7、10和12章的翻译;同时,全书审校工作由来自北京理工大学的罗森林教授义务承担。本书能够得以出版,首先要感谢机械工业出版社的吴怡编辑,是她给了我们三位工程师这个学习知识并传递知识的机会,她经验丰富,在翻译过程中给予了我们许多建设性的指导意见。其次,要感谢罗森林教授,他在百忙之中为我们担任全书的审校工作,从而让国内的机器学习者能感受到这本书应有的魅力。*后,我们要感谢互联网,因为译者与本书的缘分始于互联网,从看到原书、报名翻译、组成翻译团队、翻译过程中的讨论,所有这样都是通过互联网完成的。虽然经过罗森林教授认真审校并且给我们提出了宝贵意见,但是由于译者本身水平有限,书中译文势必还存在不妥甚至错误之处,恳请机器学习界的广大前辈、同仁们不吝赐教,促使我们继续为大家更好地传递先进技术,让更多机器学习爱好者成为机器学习的黑客。我们坚信集体智慧是再高的个人智慧都无法企及的,因此真诚希望大家一起来贡献自己的智慧。三位译者的微博分别为:http://weibo.com/kaijiangidan(陈开江,@刑无刀)、http://weibo.com/liuyizhe10(刘逸哲,@刘逸哲)、http://weibo.com/u/1911115643(孟晓楠,@xiaonanmeng)。无论是对翻译本身有任何意见或建议,还是对机器学习方面有心得,都欢迎大家到我们的微博上交流、切磋,我们一起贡献自己的智慧,在集体智慧中互相学习,共同进步。
《机器学习:实用案例解析》是机器学习和数据挖掘领域的经典图书,基础理论与实践完美的结合,是一部逻辑紧密、内容详实,适合所有相关技术人员的参考书。《机器学习:实用案例解析》两名作者都具有丰富的数据分析、处理工作经验,是机器学习实践技术方面的积极实践者。“O'Reilly Radar博客有口皆碑。”——Wired“O'Reilly凭借一系列(真希望当初我也想到了)非凡想法建立了数百万美元的业务。”——Business 2.0“O'Reilly Conference是聚集关键思想领袖的绝对典范。”——CRN“一本O'Reilly的书就代表一个有用、有前途、需要学习的主题。”——Irish Times“Tim是位特立独行的商人,他不光放眼于长远、广阔的视野并且切实地按照Yogi Berra的建议去做了:'如果你在路上遇到岔路口,走小路(岔路)。'回顾过去Tim似乎每一次都选择了小路,而且有几次都是一闪即逝的机会,尽管大路也不错。”——Linux Journal
“易学易懂,用处很大。”—alexandre alves,oracle cep的架构师“精心织构的代码完美地诠释出机器学习的核心要义。”—patrick toohey,mettler-toledo hi-speed软件工程师“实例很棒!可用于任何领域!”—john griffin,hibernate search in action一书的合作者“叙述循序渐进,巧妙地阐述了算法之间的差异。”—stephen mckamey,isomer innovations技术实践总监
Drew Conway,机器学习专家,拥有丰富的数据分析、处理工作经验。目前主要利用数学、统计学和计算机技术研究国际关系、冲突和恐怖主义等。他曾作为研究员在美国情报和国防部门供职数年。他拥有纽约大学政治系博士学位,曾为多种杂志撰写文章,是机器学习领域的著名学者。 John Myles White,机器学习专家,拥有丰富的数据分析、处理工作经验。目前主要从理论和实验的角度来研究人类如何做出决定,同时还是几个流行的R语言程序包的主要维护者,包括ProjectTemplate和log4r。他拥有普林斯顿大学哲学系博士学位,曾为多家技术杂志撰稿,发表过许多关于机器学习的论文,并在众多国际会议上发表演讲。 罗森林,博士,教授,博导。现任北京理工大学信息系统及安全对抗实验中心主任、专业责任教授。国防科技工业局科学技术委员会成员;《中国医学影像技术杂志》、《中国介入影像与治疗学》编委会委员;全国大学生信息安全技术专题邀请赛专家组副组长;中国人工智能学会智能信息安全专业委员会委员等。主要研究方向为信息安全、数据挖掘、媒体计算、中文信息处理等。负责或参加完成国家自然科学基金、国家科技支撑计划、863计划、国家242计划等省部级以上项目40余项。已发表学术论文90余篇,出版著作8部,出版译著1部,获授权专利3项。 陈开江,新浪微博搜索部研发工程师,曾独立负责微博内容反垃圾系统、微博精选内容挖掘算法、自助客服系统(包括自动回复、主动挖掘、舆情监测)等项目,目前主要从事社交挖掘、推荐算法研究、机器学习、自然语言处理相关工作,研究兴趣是社交网络的个性化推荐。 刘逸哲,阿里巴巴,CBU基础平台部搜索与推荐团队核心技术与query分析方向负责人,机器学习技术领域及圈子负责人。曾任中国雅虎相关性团队、自然语言处理团队算法工程师;AvePoint.inc开发工程师,从事企业级搜索引擎开发。研究兴趣是机器学习、自然语言处理及个性化推荐等算法在大规模数据上的应用。 孟晓楠,一淘广告技术,阿里非搜索广告算法负责人,负责用户行为分析、建模与细分,RTB竞价算法,展示广告CTR预估与SEM优化。曾工作于网易杭州研究院,参与过分布式全文检索系统和网易博客产品的数据挖掘算法开发。研究兴趣是计算广告技术、机器学习、大数据技术、信息检索等。
《我也有过小时候》内容简介:在中国,任溶溶先生是一个无论大人还是孩子都喜欢的作者,他的许多作品包括译作滋养了几代人,任老先
《JavaScript悟道》内容简介:本书结合当前JavaScript语言现状,深入剖析了JavaScript语言的运行原理、应该如何演进、怎样才能将其
◆迄今为止最好的互联网思维专著◆作者是国内最早、最深入研究互联网思维的专业人士!◆本书历时三年,条分缕析,深入浅出,字字
征服Ajax+Lucene构建搜索引擎 内容简介 本书分Ajax和Lucene两部分,内容涵盖了JavaScript的基础、层叠样式表CSS、DOM与JavaS...
《诸子百家普及丛书(套装10册)》内容简介:本丛书以王志民教授主持承担的山东省齐文化传承创新示范区建设重大工程项目为基础。丛
《包装设计:品牌的塑造:从概念构思到货架展示》的基本宗旨就是为生产商、营销商、设计事务所(包装、品牌咨询、广告、平面设计及工
《企业私有云建设指南》内容简介:全书一共10章: 第1章总结性地介绍了云计算的参考架构、典型解决方案架构和涉及的关键技术。第2章
《目标跟踪中的群智能优化方法》内容简介:全书内容分为9章,系统地介绍了群智能优化方法的发展及其在目标跟踪中的应用,包括基于标
《生活之美》内容简介:《生活之美》中国社会科学院研究员、知名美学专家刘悦笛对中国生活美学的赏析解读。“生活美学”中蕴含着华
书以简洁、准确的语言配合精心设计的、引人入胜的插图生动地揭示了计算机――这一神奇技术隐藏的奥秘。作者RonWhite是美国著名的
《调阴阳就是养命》内容简介:一个人健康与否,有没有活力,都跟身体中的阴阳有着千丝万缕的关系。阴就是身体中具有流动性的一些物
《爱情牛奶糖》内容简介:299道恋爱自测题,让你看清爱情的真相,为迷途羔羊指点爱情迷津,为分手达人洞悉性感内幕,告别剩女频繁的
感性工程学是什么,能干什么,如何使用,走向何方,这是《感性工程学》所要回答的4个关键问题,同时,也构成了感性工程学整个理论
SOLIDWORKS零件与装配体教程-2016版 本书特色 《solidworks零件与装配体教程》(2016版)是根据ds solidworks公司发布的...
《去台北》内容简介:一本极具实用性、权威性、审美性和文化性的台北旅游导览。一本令人充分领略台北文艺之美、美食之美、茶道之美
C和C++程序设计教程 本书特色 反映当前教学内容,突出理论知识的应用和实践技能的培养。注重社会发展和就业需求,培养适应职业岗位的综合能力,强化学生的应用技能。...
《战后在华日本侨俘遣返研究》内容简介:抗战胜利后,中国政府遣返滞留中国的约370万名日本侨俘,即使在解放战争期间遣返工作也未停
中文版AutoCAD2004经典实例158例 内容简介 Autocad2004是美国Autodesk公司开发的通用计算机辅助绘图与设计系列软件,是当今工程设计领...
《经略滇西》内容简介:本书以明代永昌地区军政设置变化为线索,挖掘正史、实录、地方志、文集、碑刻、家谱等资料,围绕永昌地区与
《绘画高手这样画·素描静物》内容简介:书中分为3个部分,第1章节为基础知识章节;第二章节为物体质感的绘制章节;第三章节绘画高