本书是机器学习原理和算法编码实现的基础性读物,内容分为两大主线:单个算法的原理讲解和机器学习理论的发展变迁。算法除包含传统的分类、聚类、预测等常用算法之外,还新增了深度学习、贝叶斯网、隐马尔科夫模型等内容。对于每个算法,均包括提出问题、解决策略、数学推导、编码实现、结果评估几部分。数学推导力图做到由浅入深,深入浅出。结构上数学原理与程序代码一一对照,有助于降低学习门槛,加深公式的理解,起到推广和扩大机器学习的作用。
第1章 机器学习的基础 1
1.1 编程语言与开发环境 2
1.1.1 搭建Python开发环境 2
1.1.2 安装Python算法库 4
1.1.3 IDE配置及其安装测试 5
1.2 对象、矩阵与矢量化编程 8
1.2.1 对象与维度 8
1.2.2 初识矩阵 10
1.2.3 矢量化编程与GPU运算 13
1.2.4 理解数学公式与NumPy矩阵运算 14
1.2.5 Linalg线性代数库 18
1.3 机器学习的数学基础 20
1.3.1 相似性的度量 21
1.3.2 各类距离的意义与Python实现 22
1.3.3 理解随机性 29
1.3.4 回顾概率论 30
1.3.5 多元统计基础 32
1.3.6 特征间的相关性 33
1.3.7 再谈矩阵——空间的变换 35
1.3.8 数据归一化 40
1.4 数据处理与可视化 42
1.4.1 数据的导入和内存管理 42
1.4.2 表与线性结构的可视化 45
1.4.3 树与分类结构的可视化 46
1.4.4 图与网络结构的可视化 47
1.5 Linux操作系统下部署Python机器学习开发环境 48
1.5.1 Linux发行版的选择 48
1.5.2 CentOS部署多版本Python实例 49
1.5.3 安装NumPy、SciPy、Matplotlib开发包 52
1.5.4 安装Scikit-Learn开发包 54
1.6 结语 55
第2章 中文文本分类 56
2.1 文本挖掘与文本分类的概念 56
2.2 文本分类项目 58
2.2.1 文本预处理 58
2.2.2 中文分词介绍 61
2.2.3 Scikit-Learn库简介 66
2.2.4 向量空间模型 70
2.2.5 权重策略:TF-IDF方法 71
2.2.6 使用朴素贝叶斯分类模块 74
2.2.7 分类结果评估 76
2.3 分类算法:朴素贝叶斯 78
2.3.1 贝叶斯公式推导 78
2.3.2 朴素贝叶斯算法实现 79
2.3.3 算法的改进 82
2.3.4 评估分类结果 82
2.4 分类算法:kNN 83
2.4.1 kNN算法原理 83
2.4.2 kNN算法的Python实现 86
2.4.3 评估分类结果 88
2.5 结语 88
第3章 决策树的发展 89
3.1 决策树的基本思想 89
3.1.1 从一个实例开始 90
3.1.2 决策树的算法框架 95
3.1.3 信息熵测度 96
3.2 ID3决策树 98
3.2.1 ID3算法 98
3.2.2 ID3的实现 101
3.2.3 决策树主方法 101
3.2.4 训练决策树 103
3.2.5 持久化决策树 104
3.2.6 决策树分类 105
3.2.7 算法评估 106
3.3 C4.5算法 106
3.3.1 信息增益率 106
3.3.2 C4.5的实现 108
3.3.3 训练决策树 108
3.3.4 分类数据 109
3.4 Scikit-Learn与回归树 110
3.4.1 回归算法原理 110
3.4.2 最小剩余方差法 111
3.4.3 模型树 113
3.4.4 剪枝策略 113
3.4.5 Scikit-Learn实现 115
3.5 结语 117
第4章 推荐系统原理 118
4.1 推荐系统概述 119
4.1.1 从亚马逊网站认识推荐系统 119
4.1.2 推荐系统的架构 122
4.1.3 开源推荐系统 125
4.2 协同过滤及其算法 126
4.2.1 协同过滤 126
4.2.2 数据预处理 127
4.2.3 使用Scikit-Learn的KMeans聚类 127
4.2.4 User CF原理 129
4.2.5 Item CF原理 131
4.2.6 SVD原理与计算 132
4.3 KMeans算法详解 135
4.3.1 KMeans算法流程 135
4.3.2 辅助函数 136
4.3.3 聚类主函数 137
4.3.4 评估分类结果 139
4.4 聚类的改进:二分KMeans算法 141
4.4.1 二分聚类主函数 141
4.4.2 评估分类结果 142
4.5 SVD算法详解 143
4.5.1 SVD算法回顾 143
4.5.2 常用距离函数 146
4.5.3 SVD数据集 146
4.5.4 SVD算法主函数 147
4.5.5 评估结果 147
4.6 结语 148
第5章 梯度寻优 149
5.1 最优化与计算复杂性 149
5.1.1 最优化理论 149
5.1.2 最优化的数学描述 150
5.1.3 凸集与分离定理 151
5.1.4 凸函数及其性质 153
5.1.5 局部最优与全局最优 155
5.1.6 计算复杂性与NP问题 156
5.1.7 逐次逼近法 159
5.2 Logistic梯度下降法 163
5.2.1 梯度下降法 164
5.2.2 线性分类器 166
5.2.3 Logistic函数——世界不是非黑即白 169
5.2.4 算法流程 171
5.2.5 对测试集进行分类 175
5.3 算法分析 175
5.3.1 超平面的变化趋势 176
5.3.2 超平面的收敛评估 177
5.3.3 权重向量的收敛评估 179
5.3.4 算法总体评价 180
5.4 随机梯度下降法:算法改进与评估 180
5.4.1 主函数 181
5.4.2 程序输出 182
5.4.3 步长变化率 183
5.4.4 权重收敛评估 184
5.4.5 权重分量的变化趋势 185
5.4.6 算法总体评价 187
5.5 结语 187
第6章 神经网络初步 189
6.1 神经网络简史 189
6.1.1 起源与早期发展 189
6.1.2 中期发展 190
6.1.3 当前的发展与反思 192
6.2 BP神经网络理论 192
6.2.1 线性不可分问题 192
6.2.2 BP网络构成 193
6.2.3 BP网络的训练过程 196
6.3 BP网络的实现和评估 199
6.3.1 BP网络类与主要方法 199
6.3.2 设计BP网络 199
6.3.3 辅助函数 202
6.3.4 主函数 203
6.3.5 分类器 204
6.3.6 执行分类并输出结果 205
6.3.7 BP网络评估 207
6.4 自组织特征映射神经网络 208
6.4.1 SOM网络框架 208
6.4.2 SOM类 211
6.4.3 功能函数 212
6.4.4 SOM网络的实现 212
6.4.5 聚类结果 213
6.5 Boltzmann机算法 215
6.5.1 问题的提出 215
6.5.2 模拟退火原理 216
6.5.3 Boltzmann分布与退火过程 217
6.5.4 Boltzmann机类与功能函数 219
6.5.5 最短路径的实现 222
6.5.6 执行算法 223
6.5.7 评估结果 224
6.6 结语 225
第7章 预测的技术与哲学 226
7.1 线性系统的预测 226
7.1.1 回归与现代预测学 226
7.1.2 最小二乘法 227
7.1.3 代码实现 229
7.1.4 正规方程组法 231
7.1.5 正规方程组的代码实现 232
7.1.6 算法评估 232
7.2 径向基网络 233
7.2.1 RBF网络 233
7.2.2 辅助函数 236
7.2.3 使用RBF预测 236
7.2.4 评估预测结果 238
7.3 岭回归 238
7.3.1 验证多重共线性 239
7.3.2 岭回归理论 240
7.3.3 岭际分析 240
7.3.4 k值的判定 242
7.3.5 辅助函数 243
7.3.6 岭回归的实现与k值计算 243
7.3.7 算法评估 244
7.4 预测的哲学 245
7.4.1 从《周易》谈起 246
7.4.2 两仪生四象 249
7.4.3 周期三与混沌 251
7.4.4 Logistic中的吸引子 254
7.4.5 三生万物 258
7.4.6 八卦图及其推演 261
7.5 结语 263
第8章 万能分类器——支持向量机 265
8.1 支持向量机的理论基础 266
8.1.1 经验风险最优 266
8.1.2 关键定理与VC维 267
8.1.3 结构风险最优 270
8.2 SVM的数学推导 272
8.2.1 最大间隔超平面 272
8.2.2 拉格朗日乘子法 275
8.2.3 KKT条件与对偶变换 276
8.2.4 分类器函数 277
8.2.5 映射到高维空间 278
8.2.6 核函数法 280
8.2.7 离群点的松弛变量 281
8.3 SMO算法 284
8.3.1 SMO求解SVM 284
8.3.2 构造SMO类 288
8.3.3 主函数 290
8.3.4 训练数据 291
8.3.5 分类并评估算法 293
8.4 SVM中文文本分类 293
8.4.1 回顾中文文本分类 294
8.4.2 Scikit-Learn SVM分类 294
8.4.3 评估结果 295
8.5 结语 296
第9章 人脸识别中的机器学习 297
9.1 模式识别概述 297
9.1.1 认知与模式 297
9.1.2 机器视觉与OpenCV 300
9.1.3 OpenCV的文件与基本操作 301
9.2 人脸检测 305
9.2.1 人脸识别的历史与架构 305
9.2.2 人脸识别系统 307
9.2.3 人脸检测原理与Haar级联检测 308
9.2.4 人脸检测特征文件 311
9.2.5 Haar cascade的实现 314
9.2.6 LBP cascade的实现 315
9.3 AdaBoost算法概述 316
9.3.1 算法原理与步骤 316
9.3.2 辅助函数 317
9.3.3 AdaBoost分类器 318
9.3.4 单层决策树分类子算法 319
9.3.5 训练数据集 321
9.3.6 执行分类 322
9.4 人脸识别 323
9.4.1 人脸数据库 324
9.4.2 PCA原理 325
9.4.3 特征脸识别类 327
9.4.4 生成特征脸 328
9.4.5 执行人脸识别 330
9.5 结语 330
第10章 认知计算与深度学习 332
10.1 认知计算 332
10.1.1 认知层次论 333
10.1.2 从具体到抽象 336
10.1.3 Theano库与基本操作 338
10.2 多层感知器 343
10.2.1 MNIST数据集 343
10.2.2 Softmax回归类 345
10.2.3 正则化方法 347
10.2.4 执行SoftMax学习 350
10.2.5 多层感知器 353
10.2.6 多层感知器的实现 355
10.2.7 MLP的训练过程 358
10.3 卷积神经网络 358
10.3.1 理论基础 358
10.3.2 卷积类 363
10.3.3 LeNet5函数 364
10.3.4 CNN的训练过程 369
10.4 Theano安装与GPU运算 370
10.4.1 Anaconda安装 370
10.4.2 实现CPU运算 372
10.4.3 安装VS2013 374
10.4.4 安装CUDA 375
10.4.5 实现支持GPU运算 378
10.5 结语 378
第11章 概率图模型与词性标注 380
11.1 马尔科夫过程 381
11.1.1 随机过程与状态图 381
11.1.2 马尔科夫链及其概念 382
11.1.3 马尔科夫链的实现 384
11.2 概率图模型和贝叶斯网 385
11.2.1 概述 385
11.2.2 条件独立性 386
11.2.3 贝叶斯网简介 390
11.2.4 贝叶斯网的构造 392
11.2.5 贝叶斯网的推理简介 394
11.3 隐马尔科夫模型 396
11.3.1 概述 396
11.3.2 HMM推理与前向算法 399
11.3.3 Vertibi算法原理 403
11.3.4 Vertibi算法实现 405
11.3.5 执行并输出结果 406
11.4 词性标注系统 406
11.4.1 语料库与词性资源 407
11.4.2 手工计算 409
11.4.3 结果验证 413
11.5 结语 414
本报告是中国科学院发布的年度系列报告《科学发展报告》的第十七本,旨在综述2013年度世界科学前沿进展,展望重要科学领域发展趋
以實踐「NoBrand」精神的無印良品,崛起於1980年,一路走來始終貫徹站在使用者立場來製作商品的堅持,深受消費者的支持與肯定,更
《读文心雕龙手记》内容简介:本书收入十三篇札记和两篇附录,写于不同时期,是作者二十多年精研《文心雕龙》的会心之作。《文心雕
《卡塔尔经贸文化》内容简介:本书采取厚今薄古的写作方式,全方位介绍卡塔尔的国情、经贸、文化、中阿交流及其习俗礼仪等,突出科
《设计人生:罗启妍自传》内容简介:本书是出身香港、名扬世界的珠宝设计师、跨文化学者罗启妍的自传。罗启妍出生于富裕之家,家道
《VC++.NET入门》提供了学习VisualC++工具的循序渐进的指导和创建应用程序的向导。你将学习设计应用程序窗口、使用控件、显示图形
《党政机关公文标准与格式应用指南》内容简介:本书以新版《党政机关公文格式》国家标准和《党政机关公文处理工作条例》为理论基础
网络工程师-全国计算机等级考试四级教程-2011年版 本书特色 《全国计算机等级考试四级教程:网络工程师(2011年版)》是由高等教育出版社出版的。网络工程师-...
《有英气:兵器传说图典》内容简介:我们一直看到的金箍棒的形象,竟然是错的?传说中秦始皇改变地貌,是怎么做到的?哪吒是三头六
《威柄在御》内容简介:“大礼议”之争、追尊生父并为之立庙,是嘉靖帝“天性至情、君亲大义”,还是“醉翁之意不在酒”?李福达狱
《儿童歌曲演唱教程 少儿版》内容简介:《儿童歌曲演唱教程(少儿版)》适合幼儿园和小学音乐教学使用。作者:尤静波、高歌作品目录
《“笨办法”学Python 3》内容简介:本书是一本Python入门书,适合对计算机了解不多,没有学过编程,但对编程感兴趣的读者学习使用
单片机原理及接口技术(2版) 内容简介 书中系统地介绍了80c51系列单片机的原理及接口技术,较好地体现了应用型人才的培养要求,其特点为:着力片上资源、强化编程...
EDIUS视音频制作标准教程-(第2版)-(含2DVD价格) 本书特色 本书全面讲解edius*新核心技术,精选多个行业实用案例,帮助读者在*短的时间内从“零基...
《邓小平讲话实录:演讲卷》内容简介:《邓小平讲话实录》记述了邓小平从革命战争年代到社会主义建设中发挥的重要作用,他的历次讲
《体育赛事信息化与网络安全》内容简介:大型综合性体育赛事的信息系统与通信网络的安全,与其他活动有许多不同之处。体育赛事信息
本书精选了100例在近三十年来对美国科技与经济发展有重要影响的专利。本书以简单通俗的方式对每一例专利从法律、科技和经济的角度
《程序员面试攻略》介绍程序员在求职过程所面临的求职沟通和程序设计技能两个方面的问题。在程序设计技能方面,《程序员面试攻略
Ifyouveeverreadabookonane-reader,unleashedyourinnerrockstarplayingGuitarHero,bui...
《Spark Streaming实时流式大数据处理实战》内容简介:本书以透彻的原理分析和充实的实例代码详解,全面阐述了Spark Streaming流式