本书是一本机器学习入门教程,包含了数学和统计学的核心技术,用于帮助理解一些常用的机器学习算法。书中展示的算法涵盖了机器学习的各个重要领域:分类、聚类和投影。本书对一小部分算法进行了详细描述和推导,而不是简单地将大量算法罗列出来。
本书通过大量的MATLAB/Octave脚本将算法和概念由抽象的等式转化为解决实际问题的工具,利用它们读者可以重新绘制书中的插图,并研究如何改变模型说明和参数取值。
本书特色
介绍机器学习技术及应用的主要算法和思想。
为读者进一步探索机器学习领域中的特定方向提供起点。
不需要太多的数学知识,穿插在文中的注解框提供相应的数学解释。
每章末均包含练习。
出版者的话
译者序
前言
第1章 线性建模:最小二乘法1
1.1 线性建模1
1.1.1 定义模型2
1.1.2 模型假设2
1.1.3 定义什么是好的模型3
1.1.4 最小二乘解:一个有效的例子4
1.1.5 有效的例子7
1.1.6 奥运会数据的最小二乘拟合8
1.1.7 小结9
1.2 预测9
1.2.1 第二个奥运会数据集10
1.2.2 小结12
1.3 向量/矩阵符号12
1.3.1 例子17
1.3.2 数值的例子18
1.3.3 预测19
1.3.4 小结19
1.4 线性模型的非线性响应19
1.5 泛化与过拟合22
1.5.1 验证数据22
1.5.2 交叉验证23
1.5.3 K折交叉验证的计算缩放25
1.6 正则化最小二乘法25
1.7 练习27
其他阅读材料28
第2章 线性建模:最大似然方法29
2.1 误差作为噪声29
2.2 随机变量和概率30
2.2.1 随机变量30
2.2.2 概率和概率分布31
2.2.3 概率的加法32
2.2.4 条件概率32
2.2.5 联合概率33
2.2.6 边缘化34
2.2.7 贝叶斯规则介绍36
2.2.8 期望值37
2.3 常见的离散分布39
2.3.1 伯努利分布39
2.3.2 二项分布39
2.3.3 多项分布40
2.4 连续型随机变量——概率密度函数40
2.5 常见的连续概率密度函数42
2.5.1 均匀密度函数42
2.5.2 β密度函数43
2.5.3 高斯密度函数44
2.5.4 多元高斯44
2.5.5 小结46
2.6 产生式的考虑(续)46
2.7 似然估计47
2.7.1 数据集的似然值48
2.7.2 最大似然49
2.7.3 最大似然解的特点50
2.7.4 最大似然法适用于复杂模型52
2.8 偏差方差平衡问题53
2.9 噪声对参数估计的影响53
2.9.1 参数估计的不确定性54
2.9.2 与实验数据比较57
2.9.3 模型参数的变异性——奥运会数据58
2.10 预测值的变异性59
2.10.1 预测值的变异性——一个例子59
2.10.2 估计值的期望值61
2.10.3 小结63
2.11 练习63
其他阅读材料64
第3章 机器学习的贝叶斯方法66
3.1 硬币游戏66
3.1.1 计算正面朝上的次数67
3.1.2 贝叶斯方法67
3.2 精确的后验70
3.3 三个场景71
3.3.1 没有先验知识71
3.3.2 公平的投币76
3.3.3 有偏的投币78
3.3.4 三个场景——总结80
3.3.5 增加更多的数据80
3.4 边缘似然估计80
3.5 超参数82
3.6 图模型83
3.7 奥运会100米数据的贝叶斯处理实例84
3.7.1 模型84
3.7.2 似然估计85
3.7.3 先验概率85
3.7.4 后验概率85
3.7.5 1阶多项式87
3.7.6 预测89
3.8 边缘似然估计用于多项式模型阶的选择90
3.9 小结91
3.10 练习91
其他阅读材料92
第4章 贝叶斯推理94
4.1 非共轭模型94
4.2 二值响应94
4.3 点估计:最大后验估计方案96
4.4 拉普拉斯近似100
4.4.1 拉普拉斯近似实例:近似γ密度101
4.4.2 二值响应模型的拉普拉斯近似102
4.5 抽样技术103
4.5.1 玩飞镖游戏104
4.5.2 Metropolis-Hastings算法105
4.5.3 抽样的艺术110
4.6 小结111
4.7 练习111
其他阅读材料111
第5章 分类113
5.1 一般问题113
5.2 概率分类器113
5.2.1 贝叶斯分类器114
5.2.2 逻辑回归121
5.3 非概率分类器123
5.3.1 K近邻算法123
5.3.2 支持向量机和其他核方法…125
5.3.3 小结132
5.4 评价分类器的性能133
5.4.1 准确率——0/1损失133
5.4.2 敏感性和特异性133
5.4.3 ROC曲线下的区域134
5.4.4 混淆矩阵135
5.5 判别式和产生式分类器136
5.6 小结136
5.7 练习136
其他阅读材料137
第6章 聚类分析138
6.1 一般问题138
6.2 K均值聚类139
6.2.1 聚类数目的选择141
6.2.2 K均值的不足之处141
6.2.3 核化K均值141
6.2.4 小结144
6.3 混合模型144
6.3.1 生成过程144
6.3.2 混合模型似然函数146
6.3.3 EM算法146
6.3.4 例子151
6.3.5 EM寻找局部最优153
6.3.6 组分数目的选择153
6.3.7 混合组分的其他形式154
6.3.8 用EM估计MAP156
6.3.9 贝叶斯混合模型157
6.4 小结157
6.5 练习157
其他阅读材料158
第7章 主成分分析与隐变量模型159
7.1 一般问题159
7.2 主成分分析161
7.2.1 选择D164
7.2.2 PCA的局限性165
7.3 隐变量模型165
7.3.1 隐变量模型中的混合模型165
7.3.2 小结166
7.4 变分贝叶斯166
7.4.1 选择Q(θ)167
7.4.2 优化边界168
7.5 PCA的概率模型168
7.5.1 Qτ(τ)169
7.5.2 Qxn(xn)170
7.5.3 Qwn(wm)171
7.5.4 期望值要求171
7.5.5 算法172
7.5.6 例子173
7.6 缺失值174
7.6.1 缺失值作为隐变量176
7.6.2 预测缺失值176
7.7 非实值数据177
7.7.1 概率PPCA177
7.7.2 议会数据可视化180
7.8 小结184
7.9 练习184
其他阅读材料184
词汇表185
索引188
《如厕书》内容简介:31个发生在厕所的神奇小故事,一部充满想象力的短篇小说集! 家庭主妇销毁偷吃证据,职员被困马桶尴尬时刻,甚
内容简介本书面向智能控制学科前沿,从工程应用的角度出发,比较全面地介绍了智能控制的基本概念、理论和系统设计方法及微机实现
Visual Basic程序设计基础 节选 《高等学校计算机程序设计课程系列教材·Visual Basic程序设计基础》根据教育部高等学校计算机基础课程教学指导...
《Scala编程(第5版)》内容简介:本书由直接参与Scala开发的一线人员编写,深入介绍Scala这门结合面向对象和函数式的编程语言的核
尼可拉斯.卡爾(NicholasG.Carr)知名作家兼思想家,專研商業策略、資訊科技及兩者的交叉點,在《哈佛商業評論》寫過包括〈IT沒有
《天文学简史(中文版)》内容简介:史前的农夫利用天上的星辰判断季节的更替;古希腊天文学与古巴比伦天文学合流;17世纪,牛顿提
《人工神经网络理论.设计及应用》系统地论述了人工神经网络的主要理论和设计基础,给出了大量应用实例,旨在使读者了解神经网络的
DonBox是微软公司的架构师,主要研究方向为下一代Web服务协议和程序设计模型。Don是软件集成技术方面的权威。在上世纪90年代,他
机器学习及其应用2011 本书特色 《机器学习及其应用2011》由周志华、杨强主编,是清华大学出版社邀请第七届和第八届“机器学习及其应用研讨会”的部分专家将其报...
《中国工程船研发史》内容简介:本书是中国船舶研发史丛书之一。工程船是专门用于各种水上、水下工程建设的船舶。本书从工程船定义
《智能学习的未来》内容简介:人工智能发展迅猛,与之相比,我们人类到底还有没有优势?我们会被取代吗? 想要在这场人机大战中取胜
自1993年COM首次发布以来,COM本身经历了重大的变化,但是它的基本思想和结构一直保持相对稳定,这也正说明了COM思想的魅力所在。
基于人工神经网络的机器翻译 本书特色 本论文研究的是机器翻译,而且探索摆脱基于符号系统的机器翻译和基于语料库统计的机器翻译模式,在机器翻译中应用人工神经网络的技...
前言鸣谢简介1.用闪电书写——塞穆尔·莫尔斯与电磁电报创造发明家通讯的需要电的选择莫尔斯的第一个电报其他科学家:惠斯登电报
◎聯合推薦金蝶獎美術設計類得主/黃子欽、鄭宇斌、楊啟巽、聶永真、林銀玲松果、鳟魚和人體,究竟有什麼共同點?目前最夯的設計
本书共分10章,除了第1章的通信系统概论之外,余下的章节主要介绍通信的信息理论和传输理论,内容包括:通信的信息理论基础、通信
《精通CSS+DIV网页样式与布局》从零开始,细致介绍CSS的语法规则,透彻讲解CSS应用于各种网页元素的步骤和技巧深入剖析,CSS+DIV
《一本书读懂经济新常态》内容简介:无论局势如何变幻莫测,经济形势都备受各界关注,经济工作依然是党的当前所有工作的重心,发展
Excel2007表格制作图解步步通 本书特色 以全程图解方式介绍excel 2007软件的基础功能与典型应用。以步骤演示的方式引导读者完成表格制作、数据处理和...
PaulRandwasoneoftheworldsleadinggraphicdesigners.Herehedescribeshisworkwiththesa...