UDA是一种专门为提高并行程序开发效率而设计的计算架构。在构建高性能应用程序时,CUDA架构能充分发挥GPU的强大计算功能。《GPU高性能编程CUDA实战》首先介绍了CUDA架构的应用背景,并给出了如何配置CUDA C的开发环境。然后通过矢量求和运算、矢量点积运算、光线跟踪、热传导模拟等示例详细介绍了CUDA C的基本语法和使用模式。通过学习本书,读者可以清楚了解CUDA C中每个功能的适用场合,并编写出高性能的CUDA软件。
《GPU高性能编程CUDA实战》适合具备C或者C++知识的应用程序开发人员、数值计算库开发人员等,也可以作为学习并行计算的学生和教师的教辅。
译者序
序
前言
致谢
作者简介
第1章 为什么需要CUDA 1
1.1 本章目标 2
1.2 并行处理的历史 2
1.3 GPU计算的崛起 3
1.4 CUDA 5
1.5 CUDA的应用 6
1.6 本章小结 8
第2章 入门 9
2.1 本章目标 10
2.2 开发环境 10
2.3 本章小结 14
第3章 CUDA C简介 15
3.1 本章目标 16
3.2 第一个程序 16
3.3 查询设备 20
3.4 设备属性的使用 23
3.5 本章小结 24
第4章 CUDA C并行编程 26
4.1 本章目标 27
4.2 CUDA并行编程 27
4.3 本章小结 41
第5章 线程协作 42
5.1 本章目标 43
5.2 并行线程块的分解 43
5.3 共享内存和同步 54
5.4 本章小结 68
第6章 常量内存与事件 69
6.1 本章目标 70
6.2 常量内存 70
6.3 使用事件来测量性能 78
6.4 本章小结 83
第7章 纹理内存 84
7.1 本章目标 85
7.2 纹理内存简介 85
7.3 热传导模拟 86
7.4 本章小结 101
第8章 图形互操作性 102
8.1 本章目标 103
8.2 图形互操作 103
8.3 基于图形互操作性的GPU波纹示例 108
8.4 基于图形互操作性的热传导 113
8.5 DirectX互操作性 118
8.6 本章小结 118
第9章 原子性 119
9.1 本章目标 120
9.2 计算功能集 120
9.3 原子操作简介 122
9.4 计算直方图 124
9.5 本章小结 133
第10章 流 134
10.1 本章目标 135
10.2 页锁定主机内存 135
10.3 CUDA流 139
10.4 使用单个CUDA流 140
10.5 使用多个CUDA流 144
10.6 GPU的工作调度机制 149
10.7 高效地使用多个CUDA流 151
10.8 本章小结 152
第11章 多GPU系统上的CUDA C 154
11.1 本章目标 155
11.2 零拷贝主机内存 155
11.3 使用多个GPU 162
11.4 可移动的固定内存 166
11.5 本章小结 170
第12章 后记 171
12.1 本章目标 172
12.2 CUDA工具 172
12.3 参考资料 176
12.4 代码资源 178
12.5 本章小结 179
附录 高级原子操作 180
《历史的面孔》内容简介:中国近代历史是一段苦难史,也是一段中国人民不断探索的历史。“求新求变”贯穿着整个时空,这里面涌现了
沈括是我国古代历史上一位伟大的科学家。他留下的《梦溪笔谈》一书,成为我国古代科学技术成果的资料库,长期以来,一直受到人们
《人人都是产品经理(创新版)》内容简介:每一个岗位都是公司为了解决阶段性业务问题而设置的解决方案。随着行业的发展和大环境的
《敏捷软件开发(珍藏版)》内容简介:本书作为敏捷软件开发的里程碑之作,重点介绍了敏捷软件开发的原则、模式和实践。全书共6部分
本书按历史顺序,以丝绸品种和纹样的演变为主线,系统地考证与阐述我国丝绸从起源到公元20世纪这七千年间丝绸织绣艺术和工艺科技
本书是国内第一本“面向原因式”(Why-OrientedBook)、全面系统介绍FlashActionScript3的书籍。全书共分为5个部分。第一部分:A
《当你自信独立,才能无所畏惧》内容简介:你有没有在某一刻认真的问过自己:到底想成为一个什么样的姑娘?自己内心真正想要的是什
《中华书局的企业制度(1912-1949)》内容简介:中华书局作为一家有着百余年历史的现代出版机构,拥有丰厚的底蕴与光荣的传统。本书
《华尔街最受欢迎的投资课》内容简介:100多年来,华尔街诞生了数不清的投资大师,如沃伦?巴菲特、彼得?林奇、乔治?索罗斯、本杰明
《R语言游戏数据分析与挖掘》内容简介:随着大数据的概念越来越流行,越来越多的企业开始重视数据,期待从数据中寻找有价值的结论,
《软件项目成功之道》的作者JaredR.Richardson以精炼、风趣的语言揭开了项目管理过程的神秘面纱。所涵盖的内容涉及工具、使用项目
GPS导航原理与应用 本书特色 本书阐述了GPS导航及其应用的基本原理,全书共分为十章。前三章介绍了全球定位系统(GPS)的发展概况、系统的构成、导航定位的时空...
《5000天后的世界》内容简介:在互联网商业化的5000天后,社交媒体(SNS)开始蓬勃兴起, 现在距SNS兴起又过了近5000天,接下来的5
《Premiere Pro CC 视频编辑案例课堂》内容简介:Adobe Premiere Pro CC是Adobe公司推出的一款非常优秀的视频编辑软件,它以其...
《基于神经网络的优化设计及应用》所提出的基于神经网络的立体正交优化设计方法是在多学科知识融合的基础上进行了创新,将试验技
《吃食和文学》内容简介:本书收录了汪曾祺关于美食的经典散文集,包括家乡的食物、地方风味、家常小菜、民间特色美食等内容,无论
《可解释机器学习:黑盒模型可解释性理解指南》内容简介:机器学习虽然对改进产品性能和推进研究有很大的潜力,但无法对它们的预测
细说AJAX与jQuery 本书特色 本书主要学习JavaScript中两个**的知识点:*个为AJAX,它是客户端JavaScript与后端服务器进行交流的一...
《元好问传论——中国诗学研究专刊 (精)》内容简介:本书是安徽师范大学诗学研究中心“中国诗学研究专刊”丛书之一种,围绕宋金时
《江村经济》内容简介:《江村经济》原稿出自费孝通1938年向英国伦敦经济学院人类学系提交的博士论文,1939年由Routhledge出版社列