郑泽宇,现为才云科技(Caicloud.io)联合创始人、首席大数据科学家。针对分布式TensorFlow上手难、管理难、监控难、上线难等问题,他带领团队成功开发了国内首个成熟的分布式TensorFlow深度学习平台(TensorFlow as a Service)。基于此平台,才云大数据团队为安防、电商、金融、物流等多个行业提供有针对性的人工智能解决方案。归国创业之前,郑泽宇曾任美国谷歌高级工程师。从2013 年加入谷歌,郑泽宇作为主要技术人员参与并领导了多个大数据项目。由他提出并主导的产品聚类项目用于衔接谷歌购物和谷歌知识图谱(knowledge graph)数据,使得知识卡片形式的广告逐步取代传统的产品列表广告,开启了谷歌购物广告在搜索页面投递的新纪元。郑泽宇于2011年5月获得北京大学计算机学士学位,并荣获北京大学信息科学技术学院十佳优秀毕业论文、北京大学优秀毕业生。2013年5月获得美国 Carnegie Mellon University(CMU)大学计算机硕士学位,并获得西贝尔奖学金 (Siebel Scholarship)。郑泽宇在机器学习、人工智能领域有多年研究经验,并在SIGIR、SIGKDD、ACL、ICDM、ICWSM等顶级国际会议上发表多篇学术论文。
第1章 深度学习简介 1
1.1 人工智能、机器学习与深度学习 2
1.2 深度学习的发展历程 7
1.3 深度学习的应用 10
1.3.1 计算机视觉 10
1.3.2 语音识别 14
1.3.3 自然语言处理 15
1.3.4 人机博弈 18
1.4 深度学习工具介绍和对比 19
小结 23
第2章 TensorFlow环境搭建 25
2.1 TensorFlow的主要依赖包 25
2.1.1 Protocol Buffer 25
2.1.2 Bazel 27
2.2 TensorFlow安装 29
2.2.1 使用Docker安装 30
2.2.2 使用pip安装 32
2.2.3 从源代码编译安装 33
2.3 TensorFlow测试样例 37
小结 38
第3章 TensorFlow入门 40
3.1 TensorFlow计算模型——计算图 40
3.1.1 计算图的概念 40
3.1.2 计算图的使用 41
3.2 TensorFlow数据模型——张量 43
3.2.1 张量的概念 43
3.2.2 张量的使用 45
3.3 TensorFlow运行模型——会话 46
3.4 TensorFlow实现神经网络 48
3.4.1 TensorFlow游乐场及神经网络简介 48
3.4.2 前向传播算法简介 51
3.4.3 神经网络参数与TensorFlow变量 54
3.4.4 通过TensorFlow训练神经网络模型 58
3.4.5 完整神经网络样例程序 62
小结 65
第4章 深层神经网络 66
4.1 深度学习与深层神经网络 66
4.1.1 线性模型的局限性 67
4.1.2 激活函数实现去线性化 70
4.1.3 多层网络解决异或运算 73
4.2 损失函数定义 74
4.2.1 经典损失函数 75
4.2.2 自定义损失函数 79
4.3 神经网络优化算法 81
4.4 神经网络进一步优化 84
4.4.1 学习率的设置 85
4.4.2 过拟合问题 87
4.4.3 滑动平均模型 90
小结 92
第5章 MNIST数字识别问题 94
5.1 MNIST数据处理 94
5.2 神经网络模型训练及不同模型结果对比 97
5.2.1 TensorFlow训练神经网络 97
5.2.2 使用验证数据集判断模型效果 102
5.2.3 不同模型效果比较 103
5.3 变量管理 107
5.4 TensorFlow模型持久化 112
5.4.1 持久化代码实现 112
5.4.2 持久化原理及数据格式 117
5.5 TensorFlow最佳实践样例程序 126
小结 132
第6章 图像识别与卷积神经网络 134
6.1 图像识别问题简介及经典数据集 135
6.2 卷积神经网络简介 139
6.3 卷积神经网络常用结构 142
6.3.1 卷积层 142
6.3.2 池化层 147
6.4 经典卷积网络模型 149
6.4.1 LeNet-5模型 150
6.4.2 Inception-v3模型 156
6.5 卷积神经网络迁移学习 160
6.5.1 迁移学习介绍 160
6.5.2 TensorFlow实现迁移学习 161
小结 169
第7章 图像数据处理 170
7.1 TFRecord输入数据格式 170
7.1.1 TFRecord格式介绍 171
7.1.2 TFRecord样例程序 171
7.2 图像数据处理 173
7.2.1 TensorFlow图像处理函数 174
7.2.2 图像预处理完整样例 183
7.3 多线程输入数据处理框架 185
7.3.1 队列与多线程 186
7.3.2 输入文件队列 190
7.3.3 组合训练数据(batching) 193
7.3.4 输入数据处理框架 196
小结 198
第8章 循环神经网络 200
8.1 循环神经网络简介 200
8.2 长短时记忆网络(LTSM)结构 206
8.3 循环神经网络的变种 212
8.3.1 双向循环神经网络和深层循环神经网络 212
8.3.2 循环神经网络的dropout 214
8.4 循环神经网络样例应用 215
8.4.1 自然语言建模 216
8.4.2 时间序列预测 225
小结 230
第9章 TensorBoard可视化 232
9.1 TensorBoard简介 232
9.2 TensorFlow计算图可视化 234
9.2.1 命名空间与TensorBoard图上节点 234
9.2.2 节点信息 241
9.3 监控指标可视化 246
小结 252
第10章 TensorFlow计算加速 253
10.1 TensorFlow使用GPU 253
10.2 深度学习训练并行模式 258
10.3 多GPU并行 261
10.4 分布式TensorFlow 268
10.4.1 分布式TensorFlow原理 269
10.4.2 分布式TensorFlow模型训练 272
10.4.3 使用Caicloud运行分布式TensorFlow 282
小结 287
《UML基础与Rose建模教程》全面,详细地介绍了UML的基础知识和RationalRose的使用方法,并通过4个综合性的案例,展示了使用UML和R
《短视频,你玩得起吗》内容简介:本书从专业角度教你零基础制作短视频。首先,让你从各个角度深度了解短视频,只有足够了解才能够
ThebookcoverstheforthcomingPylons0.9.7releaseandisavailbleforfreetoreadhereonlin...
Access活用范例大辞典-全新版-(附赠光盘) 本书特色 本书侧重于access的基础应用技巧,共11章,分为四大部分:**部分为第1~4章,着重介绍acce...
《Word/Excel/PPT 2019完全自学教程(视频讲解版)》内容简介:全书共17章,可分为4个部分。第1部分介绍Office 2019的操作环境和通
结构弹塑性分析程序OpenSEES原理与实例 本书特色opensees是一个开源的弹塑性分析程序,它有很多未商业化仍在研究阶段的算法、单元及材料本构。opens...
《中国数字营销十年风云录》内容简介:十年之间,光阴流转,技术跃迁,媒介演变,数字营销的玩法越来越多样。平台更加细分化,技术
《用户运营方法论:入门、实战与进阶》内容简介:这是一部以产品和运营双重视角,从9个维度讲解用户运营思维、方法、技巧的著作。它
《微机原理及应用》是教育科学“十五”国家规划课题研究成果。全书共13章,包括:基础知识,微型计算机概论,8086/8088指令系统与
Thistutorialanelementaryintroductiontoteachnon-programmershowtocustomizetheirwor...
《数字媒体艺术史》是《数字媒体艺术概论》的姊妹篇,是一本通过全新视角论述当代数字媒体艺术发展史的教材,也是一本引导学生理
《唤醒孩子学习天赋》内容简介:1800000粉丝的育儿账号“科学小子钦”主理人 赵邈 力作 在陪伴中总结心得,在实践中改良方法 发掘孩
诠释价值万亿的商业生活新事实顺势重构既有的造富大趋势★“一带一路”、亚投行、丝路基金等重磅战略无一例外地指向中国西边,全
MATLAB图像函数查询使用手册 本书特色 MATLAB图像处理工具箱是目前*流行的图像处理工具之一,其函数能有效地实现各种图像算法。本书从实用角度出发,详细介...
《SEM长尾搜索营销策略解密》内容简介:长尾并不是互联网的产物,其实它很早就产生了。只是随着互联网的普及和高速发展,我们越来越
《风景园林快题设计方法与案例评析》内容简介:《风景园林快题设计方法与案例评析》由一线考研辅导老师撰写,融汇了作者多年的教学
在内容上,本书结合使用情景,全面、深入、细致地分析Android系统的源代码,涉及到Linux内核层、硬件抽象层(HAL)、运行时库层(
网络伴随我们的时间不算很长,然而因特网的流行和商业化的普及速度却是惊人的,这促使人类活动和社会的每个领域都发生了改变。我
《人人都是网站分析师》内容简介:这是一本真正能让网站分析的数据结果产生商业价值的著作。很多人都知道网站分析中的指标,但很少
《水色斑斓Ⅲ》内容简介:总有一些回忆无法用言语表达,总有一些情绪无法用文字记录...... 在song丹青老师的水彩笔下,流淌着的是斑