郑泽宇,现为才云科技(Caicloud.io)联合创始人、首席大数据科学家。针对分布式TensorFlow上手难、管理难、监控难、上线难等问题,他带领团队成功开发了国内首个成熟的分布式TensorFlow深度学习平台(TensorFlow as a Service)。基于此平台,才云大数据团队为安防、电商、金融、物流等多个行业提供有针对性的人工智能解决方案。归国创业之前,郑泽宇曾任美国谷歌高级工程师。从2013 年加入谷歌,郑泽宇作为主要技术人员参与并领导了多个大数据项目。由他提出并主导的产品聚类项目用于衔接谷歌购物和谷歌知识图谱(knowledge graph)数据,使得知识卡片形式的广告逐步取代传统的产品列表广告,开启了谷歌购物广告在搜索页面投递的新纪元。郑泽宇于2011年5月获得北京大学计算机学士学位,并荣获北京大学信息科学技术学院十佳优秀毕业论文、北京大学优秀毕业生。2013年5月获得美国 Carnegie Mellon University(CMU)大学计算机硕士学位,并获得西贝尔奖学金 (Siebel Scholarship)。郑泽宇在机器学习、人工智能领域有多年研究经验,并在SIGIR、SIGKDD、ACL、ICDM、ICWSM等顶级国际会议上发表多篇学术论文。
第1章 深度学习简介 1
1.1 人工智能、机器学习与深度学习 2
1.2 深度学习的发展历程 7
1.3 深度学习的应用 10
1.3.1 计算机视觉 10
1.3.2 语音识别 14
1.3.3 自然语言处理 15
1.3.4 人机博弈 18
1.4 深度学习工具介绍和对比 19
小结 23
第2章 TensorFlow环境搭建 25
2.1 TensorFlow的主要依赖包 25
2.1.1 Protocol Buffer 25
2.1.2 Bazel 27
2.2 TensorFlow安装 29
2.2.1 使用Docker安装 30
2.2.2 使用pip安装 32
2.2.3 从源代码编译安装 33
2.3 TensorFlow测试样例 37
小结 38
第3章 TensorFlow入门 40
3.1 TensorFlow计算模型——计算图 40
3.1.1 计算图的概念 40
3.1.2 计算图的使用 41
3.2 TensorFlow数据模型——张量 43
3.2.1 张量的概念 43
3.2.2 张量的使用 45
3.3 TensorFlow运行模型——会话 46
3.4 TensorFlow实现神经网络 48
3.4.1 TensorFlow游乐场及神经网络简介 48
3.4.2 前向传播算法简介 51
3.4.3 神经网络参数与TensorFlow变量 54
3.4.4 通过TensorFlow训练神经网络模型 58
3.4.5 完整神经网络样例程序 62
小结 65
第4章 深层神经网络 66
4.1 深度学习与深层神经网络 66
4.1.1 线性模型的局限性 67
4.1.2 激活函数实现去线性化 70
4.1.3 多层网络解决异或运算 73
4.2 损失函数定义 74
4.2.1 经典损失函数 75
4.2.2 自定义损失函数 79
4.3 神经网络优化算法 81
4.4 神经网络进一步优化 84
4.4.1 学习率的设置 85
4.4.2 过拟合问题 87
4.4.3 滑动平均模型 90
小结 92
第5章 MNIST数字识别问题 94
5.1 MNIST数据处理 94
5.2 神经网络模型训练及不同模型结果对比 97
5.2.1 TensorFlow训练神经网络 97
5.2.2 使用验证数据集判断模型效果 102
5.2.3 不同模型效果比较 103
5.3 变量管理 107
5.4 TensorFlow模型持久化 112
5.4.1 持久化代码实现 112
5.4.2 持久化原理及数据格式 117
5.5 TensorFlow最佳实践样例程序 126
小结 132
第6章 图像识别与卷积神经网络 134
6.1 图像识别问题简介及经典数据集 135
6.2 卷积神经网络简介 139
6.3 卷积神经网络常用结构 142
6.3.1 卷积层 142
6.3.2 池化层 147
6.4 经典卷积网络模型 149
6.4.1 LeNet-5模型 150
6.4.2 Inception-v3模型 156
6.5 卷积神经网络迁移学习 160
6.5.1 迁移学习介绍 160
6.5.2 TensorFlow实现迁移学习 161
小结 169
第7章 图像数据处理 170
7.1 TFRecord输入数据格式 170
7.1.1 TFRecord格式介绍 171
7.1.2 TFRecord样例程序 171
7.2 图像数据处理 173
7.2.1 TensorFlow图像处理函数 174
7.2.2 图像预处理完整样例 183
7.3 多线程输入数据处理框架 185
7.3.1 队列与多线程 186
7.3.2 输入文件队列 190
7.3.3 组合训练数据(batching) 193
7.3.4 输入数据处理框架 196
小结 198
第8章 循环神经网络 200
8.1 循环神经网络简介 200
8.2 长短时记忆网络(LTSM)结构 206
8.3 循环神经网络的变种 212
8.3.1 双向循环神经网络和深层循环神经网络 212
8.3.2 循环神经网络的dropout 214
8.4 循环神经网络样例应用 215
8.4.1 自然语言建模 216
8.4.2 时间序列预测 225
小结 230
第9章 TensorBoard可视化 232
9.1 TensorBoard简介 232
9.2 TensorFlow计算图可视化 234
9.2.1 命名空间与TensorBoard图上节点 234
9.2.2 节点信息 241
9.3 监控指标可视化 246
小结 252
第10章 TensorFlow计算加速 253
10.1 TensorFlow使用GPU 253
10.2 深度学习训练并行模式 258
10.3 多GPU并行 261
10.4 分布式TensorFlow 268
10.4.1 分布式TensorFlow原理 269
10.4.2 分布式TensorFlow模型训练 272
10.4.3 使用Caicloud运行分布式TensorFlow 282
小结 287
ApracticalguidetounderstandingLLVMwiththehelpofsourcecodereferencesandsnippets,i...
EDIUS 6视频处理实用教程 本书特色 《EDIUS6视频处理实用教程(高等学校十二五计算机规划教材)》由马建党编著,共分7个章节。第1章是对EDIUS软件的...
《张一南北大国文课》内容简介:本书源自作者在北京大学教授的“大学国文”通识课讲义,解读了先秦、六朝、唐宋三个时期具有代表性
《海上文脉》内容简介:浓密的梧桐树叶,掩映着一幢幢历史优秀建筑;激昂的交响乐曲,演奏出一曲曲华彩乐章;宁静的藏书楼,珍藏着
SteveJobshasturnedhispersonalitytraitsintoabusinessphilosophy.Here’showhedoesit....
WithcontributionsbyMichaelAshikhmin,MichaelGleicher,NatyHoffman,GarrettJohnson,T...
《5G波形设计》内容简介:《5G新波形设计》从5G系统对波形设计的需求出发,分别分析了增强移动宽带业务(eMBB)、低时延高可靠(UR
《五凉史》内容简介:◆“十六国史新编”之一,著名历史学家赵向群代表作全新修订。◆汇集传世史料与出土文献,还原魏晋南北朝大分
《完美统计图》内容简介:统计图是数据可视化的主角之一,本书讲述如何制作规范的统计图。全书共分4篇,用鲜活的实例,分别讲述数据
《江南古典私家园林》内容简介:中国江南,自然山水秀美,物产丰饶,自魏晋以来一直是一方富庶的乐土。明清以降,更是文人巨贾会聚
《现代示波器高级应用》内容简介:本书深入剖析了现代示波器的架构,并通过近百个经典案例及精美插图,展示了现代示波器在实战中的
ThismanualprovidesacompletetutorialintroductiontotheGNUCandC++compilers,gccandg+...
《心智社会》内容简介:人类思维是一个复杂的过程。“为什么人类下雨不想被淋湿,却愿意在卫生间沐浴”这种3岁小孩都知道的问题,计
《围观考古现场》内容简介:翻开这本书之前,请你思考一个问题:考古学究竟是一门怎样的学问?是挖坟掘墓找古董?是翻山越岭看岩壁
SOLIDWORKS零件与装配体教程-2016版 本书特色 《solidworks零件与装配体教程》(2016版)是根据ds solidworks公司发布的...
《职人不足道》内容简介:当大家都在谈论“职人”时,职人本人在谈什么? 近几年,在媒体的神化渲染下,匠人、职人等词处处为用,然
《冯唐成事心法》内容简介:他是热爱文艺的管理专家,是精通麦肯锡与曾国藩成事学的商业领袖,是医学博士出身的投资人。10年麦肯锡
《CleanCode(评注版)》提出一种观念:代码质量与其整洁度成正比。干净的代码,既在质量上较为可靠,也为后期维护、升级奠定了良好
《锦笺记》内容简介:笺纸是古代文人用于书写的小幅花色纸张,其起源可以追溯到南北朝时期。历经唐宋之发展,至明代,笺纸追求精致
《沃顿管理精要:顾客中心化》内容简介:并非所有的顾客都是上帝,更不可一视同仁。虽然,我们常常会说顾客是上帝,但是并不是所有