本书是最全面的机器学习教材之一。书中首先介绍了机器学习的构成要素(任务、模型、特征)和机器学习任务,接着详细分析了逻辑模型(树模型、规则模型)、几何模型(线性模型和基于距离的模型)和概率模型,然后讨论了特征、模型的集成,以及被机器学习研究者称为“实验”的方法。作者不仅使用了已有术语,还引入了一些新的概念,同时提供了大量精选的示例和插图解说。
绪论 机器学习概述1
第1章 机器学习的构成要素9
1.1 任务:可通过机器学习解决的问题9
1.1.1 探寻结构11
1.1.2 性能评价13
1.2 模型:机器学习的输出14
1.2.1 几何模型14
1.2.2 概率模型17
1.2.3 逻辑模型22
1.2.4 分组模型与评分模型26
1.3 特征:机器学习的马达26
1.3.1 特征的两种用法28
1.3.2 特征的构造与变换29
1.3.3 特征之间的交互32
1.4 总结与展望33
第2章 两类分类及相关任务37
2.1 分类39
2.1.1 分类性能的评价40
2.1.2 分类性能的可视化43
2.2 评分与排序46
2.2.1 排序性能的评价及可视化48
2.2.2 将排序器转化为分类器52
2.3 类概率估计54
2.3.1 类概率估计量55
2.3.2 将排序器转化为概率估计子57
2.4 小结与延伸阅读59
第3章 超越两类分类61
3.1 处理多类问题61
3.1.1 多类分类61
3.1.2 多类得分及概率65
3.2 回归68
3.3 无监督学习及描述性学习70
3.3.1 预测性聚类与描述性聚类71
3.2.2 其他描述性模型74
3.4 小结与延伸阅读76
第4章 概念学习77
4.1 假设空间78
4.1.1 最小一般性79
4.1.2 内部析取82
4.2 通过假设空间的路径84
4.2.1 最一般相容假设86
4.2.2 封闭概念87
4.3 超越合取概念88
4.4 可学习性92
4.5 小结与延伸阅读94
第5章 树模型97
5.1 决策树100
5.2 排序与概率估计树103
5.3 作为减小方差的树学习方法110
5.3.1 回归树110
5.3.2 聚类树113
5.4 小结与延伸阅读115
第6章 规则模型117
6.1 学习有序规则列表117
6.2 学习无序规则集124
6.2.1 用于排序和概率估计的规则集128
6.2.2 深入探究规则重叠130
6.3 描述性规则学习131
6.3.1 用于子群发现的规则学习131
6.3.2 关联规则挖掘135
6.4 一阶规则学习139
6.5 小结与延伸阅读143
第7章 线性模型145
7.1 最小二乘法146
7.1.1 多元线性回归150
7.1.2 正则化回归153
7.1.3 利用最小二乘回归实现分类153
7.2 感知机155
7.3 支持向量机158
7.4 从线性分类器导出概率164
7.5 超越线性的核方法168
7.6 小结与延伸阅读170
第8章 基于距离的模型173
8.1 距离测度的多样性173
8.2 近邻与范例178
8.3 最近邻分类器182
8.4 基于距离的聚类184
8.4.1 K均值算法186
8.4.2 K中心点聚类187
8.4.3 silhouette188
8.5 层次聚类190
8.6 从核函数到距离194
8.7 小结与延伸阅读195
第9章 概率模型197
9.1 正态分布及其几何意义200
9.2 属性数据的概率模型205
9.2.1 利用朴素贝叶斯模型实现分类206
9.2.2 训练朴素贝叶斯模型209
9.3 通过优化条件似然实现鉴别式学习211
9.4 含隐变量的概率模型214
9.4.1 期望最大化算法215
9.4.2 高斯混合模型216
9.5 基于压缩的模型218
9.6 小结与延伸阅读220
第10章 特征223
10.1 特征的类型223
10.1.1 特征上的计算223
10.1.2 属性特征、有序特征及数量特征227
10.1.3 结构化特征228
10.2 特征变换229
10.2.1 阈值化与离散化229
10.2.2 归一化与标定234
10.2.3 特征缺失239
10.3 特征的构造与选择240
10.4 小结与延伸阅读243
第11章 模型的集成245
11.1 Bagging与随机森林246
11.2 Boosting247
11.3 集成学习进阶250
11.3.1 偏差、方差及裕量250
11.3.2 其他集成方法251
11.3.3 元学习252
11.4 小结与延伸阅读252
第12章 机器学习的实验255
12.1 度量指标的选择256
12.2 量指标的获取258
12.3 如何解释度量指标260
12.4 小结与延伸阅读264
后记 路在何方267
记忆要点269
参考文献271
本书为美国业余无线电转播联盟(ARRL)出版、里奇·阿兰德(K7SZ)编写的LowPowerCommunication第3版中的中文译本。QRP在Q简语里意为
《网络是怎样连接的》内容简介:本书以探索之旅的形式,从在浏览器中输入网址开始,一路追踪了到显示出网页内容为止的整个过程,以
《一本书读懂经济新常态》内容简介:无论局势如何变幻莫测,经济形势都备受各界关注,经济工作依然是党的当前所有工作的重心,发展
先进PID控制MATLAB仿真-(第4版) 本书特色 全书共分17章,包括基本的pid控制、pid控制器的整定、时滞系统pid控制、基于微分器的pid控制、基于...
网上开店装饰秘技 本书特色 王红卫等编著的《网上开店装饰秘技(附光盘)》以*新版的photoshopcs6中文版为工具,详细讲解了photoshop在网上店铺装...
《“文学”概念史》内容简介:“文学”是什么?自19世纪初近代意义的“文学”在西方兴起,中外学术界就不断有学者对这些问题给出自
Visual Basic 6.0基础与实践教程 内容简介 本书由浅入深,针对Visual Basic,系统地讲解从基本的语言元素知识点到构建一个具体完整的实用系...
《Windows Server 2012网络操作系统企业应用案例详解》内容简介:本书以Windows Server 2012 R2为核心平台,采用教、学、做相结...
《清华法治论衡(第27辑)》内容简介:马克斯·韦伯是19世纪到20世纪最杰出的社会学家与法学家,其研究涉及法学、社会学、政治学、
《盛开·第十五届全国新概念获奖者作文范本(B卷)》内容简介:本书为203年春节期间举办的第十五届全国新概念大赛获奖者作品集,作
《中国礼宾与公务接待》内容简介:作者依据党和国家关于党政机关公务礼宾接待的最新精神,结合国内公务礼宾接待工作发展现状,重点
EXCEL2007函数与公式实战技巧精粹 本书特色推荐购买套装: excel 2007办公金典套装:excel 2007数据透视表应用大全+excel 2007...
Visual C++程序设计基础实训教程 内容简介 VisualC是当前计算机领域较流行的一种进行面向对象与可视化程序设计的工具,VisualC程序设计也是计算...
《整体养育》内容简介:孩子胆小、没有安全感,怎么办?孩子爱发脾气,怎么办?孩子注意力不集中,怎么办?……我该如何养育我的孩
你有可能随时都能找到你想要找的,但这也意味着你随时会被想找你的人找到—用起来很爽却又有一点危险,位置服务就是如此。而绝大多
《Webbots、Spiders和ScreenScrapers:技术解析与应用实践(原书第2版)》共31章,分为4个部分:第一部分(1~7章),系统全面地介绍
我们大部分的经验都来自视觉,我们活得的几乎所有信息和知识也都来自视觉,我们所作出的判断和决定也所由视觉决定的,我们的娱乐
《ROS机器人项目开发11例(原书第2版)》内容简介:本书涵盖新的ROS发行版中的项目——ROS Melodic Morenia with Ubuntu Bio...
《次世代游戏机械及场景制作》内容简介:次世代游戏曾经是高端游戏的代名词,只出现在街机和高端电视游戏主机上,而随着游戏环境软
《走向学习中心》内容简介:未来30年,教育将会发生怎样的变化?如何培养下一代,才能使他们适应竞争更为激烈的社会?资源如此之多