UDA是一种专门为提高并行程序开发效率而设计的计算架构。在构建高性能应用程序时,CUDA架构能充分发挥GPU的强大计算功能。《GPU高性能编程CUDA实战》首先介绍了CUDA架构的应用背景,并给出了如何配置CUDA C的开发环境。然后通过矢量求和运算、矢量点积运算、光线跟踪、热传导模拟等示例详细介绍了CUDA C的基本语法和使用模式。通过学习本书,读者可以清楚了解CUDA C中每个功能的适用场合,并编写出高性能的CUDA软件。
《GPU高性能编程CUDA实战》适合具备C或者C++知识的应用程序开发人员、数值计算库开发人员等,也可以作为学习并行计算的学生和教师的教辅。
译者序
序
前言
致谢
作者简介
第1章 为什么需要CUDA 1
1.1 本章目标 2
1.2 并行处理的历史 2
1.3 GPU计算的崛起 3
1.4 CUDA 5
1.5 CUDA的应用 6
1.6 本章小结 8
第2章 入门 9
2.1 本章目标 10
2.2 开发环境 10
2.3 本章小结 14
第3章 CUDA C简介 15
3.1 本章目标 16
3.2 第一个程序 16
3.3 查询设备 20
3.4 设备属性的使用 23
3.5 本章小结 24
第4章 CUDA C并行编程 26
4.1 本章目标 27
4.2 CUDA并行编程 27
4.3 本章小结 41
第5章 线程协作 42
5.1 本章目标 43
5.2 并行线程块的分解 43
5.3 共享内存和同步 54
5.4 本章小结 68
第6章 常量内存与事件 69
6.1 本章目标 70
6.2 常量内存 70
6.3 使用事件来测量性能 78
6.4 本章小结 83
第7章 纹理内存 84
7.1 本章目标 85
7.2 纹理内存简介 85
7.3 热传导模拟 86
7.4 本章小结 101
第8章 图形互操作性 102
8.1 本章目标 103
8.2 图形互操作 103
8.3 基于图形互操作性的GPU波纹示例 108
8.4 基于图形互操作性的热传导 113
8.5 DirectX互操作性 118
8.6 本章小结 118
第9章 原子性 119
9.1 本章目标 120
9.2 计算功能集 120
9.3 原子操作简介 122
9.4 计算直方图 124
9.5 本章小结 133
第10章 流 134
10.1 本章目标 135
10.2 页锁定主机内存 135
10.3 CUDA流 139
10.4 使用单个CUDA流 140
10.5 使用多个CUDA流 144
10.6 GPU的工作调度机制 149
10.7 高效地使用多个CUDA流 151
10.8 本章小结 152
第11章 多GPU系统上的CUDA C 154
11.1 本章目标 155
11.2 零拷贝主机内存 155
11.3 使用多个GPU 162
11.4 可移动的固定内存 166
11.5 本章小结 170
第12章 后记 171
12.1 本章目标 172
12.2 CUDA工具 172
12.3 参考资料 176
12.4 代码资源 178
12.5 本章小结 179
附录 高级原子操作 180
KaiHwang(黄铠)拥有加州大学伯克利分校博士学位。现为美国南加州大学电子工程与计算机科学终身教授,并先后担任清华大学计算机
《Three.js开发指南(原书第3版)》内容简介:本书将介绍如何直接在浏览器中创建漂亮的3D场景和动画,并且充分发挥WebGL和现代浏览
《机器学习算法(原书第2版)》内容简介:本书介绍了数据科学领域常用的所有重要机器学习算法以及TensorFlow和特征工程等相关内容。
苹果热门产品“i”系列的创意鼻祖乔布斯御用17年的广告狂人一旦做到了简洁,你将无所不能。——史蒂夫·乔布斯对史蒂夫·乔布斯来
《护肤品全解码:100款超人气护肤品成分大检阅》内容简介:现在美容杂志、美容书籍琳琅满目。一些书籍和杂志的介绍过于简单和笼统,
计算机网络教程-(第3版) 本书特色 参考计算机专业考研大纲,体现了作者多年的教学经验,吸收了多种国外著名教材的优点,强调基本原理,概念准确、深入浅出、理论适中...
《王阳明的智慧》内容简介:王阳明是中国历史上极为重要的思想家,他的“心即理”“知行合一”“致良知”“万物一体”等主张,不仅
Thisremarkablebookpresentsarichandup–to–dateviewofevolutionthatexploresthefar–re...
《三四越界》内容简介:我所有小说、诗歌和白日梦的出处索隐。近年来屡获小说大奖的青年作家文珍首部散文力作 手绘三十四幅温暖回甘
《Hadoop技术内幕》内容简介:本书由腾讯数据平台的资深Hadoop专家、X-RIME的作者亲自执笔,对Common和HDFS的源代码进行了分析,旨
本书重点论述数字通信的技术基础和最新应用。全书共分15章,详细阐述了数字通信系统的基本信号变换、信号处理步骤、基带信号及高
本书是一位计算机专家与一位人类学家思想碰撞的结晶,针对那些无法通过传统方法解决的系统问题,为我们介绍了分析与理解这类问题
《实用软件架构》内容简介:本书由IBM杰出工程师、首席技术官Tilak Mitra亲笔撰写,Amazon全五星评价。全书通过一整套实用的案例研
《Java EE 框架整合开发入门到实战:Spring+Spring MVC+MyBatis(微课版)》内容简介:Java EE框架整合开发入门到实战:Spri...
客觀的結構式臨床測驗(ObjectiveStructuredClinicalExamination,OSCE)是評估臨床能力的方式,藉由模擬臨床情境配合臨床檢驗...
《白鹭在冰面上站着》内容简介:无论被叫作香格里拉,还是勐巴拉西,云南都是“人间天堂”的意思。在雷平阳眼里,云南是他的文学诞
有很多原因需要网站能够支持动态内容,包括:提供在线购物网站、创建个性化页面、管理来自数据库的大量信息等。只要拥有基础的ht
《金融计算与建模:理论、算法与SAS程序》全书分为4大模块:1-9章为金融学基础指标计算模块;10-12章为股票定价模块;13-18章为风
各位程序员一定希望自己编写的代码是能让老板赞赏、满意的代码;是能让客户乐意掏钱购买的代码;是能让使用者顺利使用的代码;是
《计算复杂性导论》可用作计算机专业、计算数学专业的计算机理论课程的教材,也是有关研究人员不可或缺的参考书。计算复杂性理论