本书是最全面的机器学习教材之一。书中首先介绍了机器学习的构成要素(任务、模型、特征)和机器学习任务,接着详细分析了逻辑模型(树模型、规则模型)、几何模型(线性模型和基于距离的模型)和概率模型,然后讨论了特征、模型的集成,以及被机器学习研究者称为“实验”的方法。作者不仅使用了已有术语,还引入了一些新的概念,同时提供了大量精选的示例和插图解说。
绪论 机器学习概述1
第1章 机器学习的构成要素9
1.1 任务:可通过机器学习解决的问题9
1.1.1 探寻结构11
1.1.2 性能评价13
1.2 模型:机器学习的输出14
1.2.1 几何模型14
1.2.2 概率模型17
1.2.3 逻辑模型22
1.2.4 分组模型与评分模型26
1.3 特征:机器学习的马达26
1.3.1 特征的两种用法28
1.3.2 特征的构造与变换29
1.3.3 特征之间的交互32
1.4 总结与展望33
第2章 两类分类及相关任务37
2.1 分类39
2.1.1 分类性能的评价40
2.1.2 分类性能的可视化43
2.2 评分与排序46
2.2.1 排序性能的评价及可视化48
2.2.2 将排序器转化为分类器52
2.3 类概率估计54
2.3.1 类概率估计量55
2.3.2 将排序器转化为概率估计子57
2.4 小结与延伸阅读59
第3章 超越两类分类61
3.1 处理多类问题61
3.1.1 多类分类61
3.1.2 多类得分及概率65
3.2 回归68
3.3 无监督学习及描述性学习70
3.3.1 预测性聚类与描述性聚类71
3.2.2 其他描述性模型74
3.4 小结与延伸阅读76
第4章 概念学习77
4.1 假设空间78
4.1.1 最小一般性79
4.1.2 内部析取82
4.2 通过假设空间的路径84
4.2.1 最一般相容假设86
4.2.2 封闭概念87
4.3 超越合取概念88
4.4 可学习性92
4.5 小结与延伸阅读94
第5章 树模型97
5.1 决策树100
5.2 排序与概率估计树103
5.3 作为减小方差的树学习方法110
5.3.1 回归树110
5.3.2 聚类树113
5.4 小结与延伸阅读115
第6章 规则模型117
6.1 学习有序规则列表117
6.2 学习无序规则集124
6.2.1 用于排序和概率估计的规则集128
6.2.2 深入探究规则重叠130
6.3 描述性规则学习131
6.3.1 用于子群发现的规则学习131
6.3.2 关联规则挖掘135
6.4 一阶规则学习139
6.5 小结与延伸阅读143
第7章 线性模型145
7.1 最小二乘法146
7.1.1 多元线性回归150
7.1.2 正则化回归153
7.1.3 利用最小二乘回归实现分类153
7.2 感知机155
7.3 支持向量机158
7.4 从线性分类器导出概率164
7.5 超越线性的核方法168
7.6 小结与延伸阅读170
第8章 基于距离的模型173
8.1 距离测度的多样性173
8.2 近邻与范例178
8.3 最近邻分类器182
8.4 基于距离的聚类184
8.4.1 K均值算法186
8.4.2 K中心点聚类187
8.4.3 silhouette188
8.5 层次聚类190
8.6 从核函数到距离194
8.7 小结与延伸阅读195
第9章 概率模型197
9.1 正态分布及其几何意义200
9.2 属性数据的概率模型205
9.2.1 利用朴素贝叶斯模型实现分类206
9.2.2 训练朴素贝叶斯模型209
9.3 通过优化条件似然实现鉴别式学习211
9.4 含隐变量的概率模型214
9.4.1 期望最大化算法215
9.4.2 高斯混合模型216
9.5 基于压缩的模型218
9.6 小结与延伸阅读220
第10章 特征223
10.1 特征的类型223
10.1.1 特征上的计算223
10.1.2 属性特征、有序特征及数量特征227
10.1.3 结构化特征228
10.2 特征变换229
10.2.1 阈值化与离散化229
10.2.2 归一化与标定234
10.2.3 特征缺失239
10.3 特征的构造与选择240
10.4 小结与延伸阅读243
第11章 模型的集成245
11.1 Bagging与随机森林246
11.2 Boosting247
11.3 集成学习进阶250
11.3.1 偏差、方差及裕量250
11.3.2 其他集成方法251
11.3.3 元学习252
11.4 小结与延伸阅读252
第12章 机器学习的实验255
12.1 度量指标的选择256
12.2 量指标的获取258
12.3 如何解释度量指标260
12.4 小结与延伸阅读264
后记 路在何方267
记忆要点269
参考文献271
《免疫力是最好的医生》内容简介:为什么常年慢性病等基础性疾病人群容易感染疫病等各种疾病,因为免疫力差。好好调理呼吸道疾病、
《2021年法律硕士(非法学)联考考试大纲配套练习》内容简介:全书各章节的基本结构为:大纲要点、考试重点、配套练习和配套练习答
Nowinitsfifthedition,thebestsellingbookonUMTShasbeenupdatedtocover3GPPWCDMAandHi...
《汉英科技辞典(精装)》是一部综合性工业技术词典,共收入词汇约20万条。《汉英科技辞典(精装)》以通用技术词汇、机械、冶金、电
JeffreyZeldman是世界上最知名的网站设计师之一。他的个人站点(www.zeldman.com)受到1600万访问者的欢迎,每天都有来自Web设计
《素手调水——茶艺茶道》内容简介:1.从茶品出发,逐渐展开了茶艺、茶道的描述。茶品中包含了茶树的生长环境和茶叶的分类以及加工
《中国人的情商口才圣经》内容简介:《中国人的情商口才圣经》共10个板块49章,以“情商养成养育”为纲,“智商水平、情智倾听、成
本书是日本著名生活家居品牌无印良品推出的“无印良品的生活方式”系列概念书之一。本书的关键词为“要素”——一个围绕居家生活
《二战经典战役系列丛书:鏖兵瓜岛(图文版)》内容简介:瓜岛战役是日本继中途岛战役后的又一次大败,此次战役后,日本战略优势不
《世界3:海外中国艺术史研究》内容简介:20世纪后期以来,中国艺术史研究状况发生了显著的变化。那是西方新艺术史集中影响中国艺术
本书主要分为四部分,第一部分:网站界面设计原则。第二部分:网站交互设计。第三部分:视觉呈现设计。第四部分:网络广告设计。
《新零售进化论》内容简介:本书主要介绍了新零售的进化现象和规律,提出了新零售的第一性原理是物理数据二重性,即在新零售时代,
大多数记载个人电脑产业发展史的作品将个人电脑视为一种技术或者商业行为。但本书处处笔酣墨饱,深入探讨了催生第一台个人电脑的
Python机器学习 本书特色 机器学习与预测分析正在改变企业和其他组织的运作方式,本书将带领读者进入预测分析的世界。全书共13章,除了简要介绍机器学习及Pyt...
本书由上、下两篇组成。上篇为UNIX版本6的源代码,下篇是莱昂先生对UNIX操作系统版本6源代码的详细分析。本书语言简洁、透彻,曾
书名:完全手册:PHP网络开发详解作者:孙鹏程等编著来源:电子工业出版社出版时间:2007年07月ISBN:9787121046483定价:89元第1
《医学专业课程思政优秀案例集(基础医学分册)》内容简介:本书精选了上海交通大学医学院众位教师近三年课程思政成果,在基础医学
《锋利的SQL》内容简介:本书从基础、开发、性能调整和实战4方面介绍了SQL技术及其应用,包括数据库与架构、表管理、索引管理、基本
MATLAB图像与视频处理实用案例详解 本书特色 《matlab图像与视频处理实用案例详解》详细讲解了25个matlab图像与视频处理实用案例(含可运行程序),...
《中等职业学校电子与信息技术专业课程标准汇编(上)》内容简介:本书是根据《教育部人力资源和社会保障部财政部关于实施国家中等