本书是全国**本全面介绍CUDA软硬件体系架构的书籍。全面介绍使用CUDA进行通用计算所需要的语法、硬件架构、程序优化技巧等知识,是进行GPU通用计算程序开发的入门教材和参考书。
本书共分5章。第1章介绍GPU通用计算的发展历程,介绍并行计算的历史、现状以及面临的问题;第2章介绍CUDA的使用方法,帮助读者理解CUDA的编程模型、存储器模型和执行模型,掌握CUDA程序的编写方法;第3章探讨CUDA硬件架构,深入分析Tesla GPU架构与CUDA通用计算的相互作用:第4章总结CUDA的高级优化方法,对任务划分、存储器访问、指令流效率等课题进行探讨;第5章以丰富的实例展示如何使用CUDA的强大性能解决实际问题。
本书可作为CUDA的学习入门和编程参考书,主要面向从事高性能计算的程序员与工程师,使用GPU加速专业领域计算的科研人员,以及对GPU通用计算感兴趣的程序员。开设相关课程的高等院校与科研机构也可选用本书作为教材。
精选典型实用例程,详解CUDA使用细节,重视理论结合实际,介绍并行程序设计方法,深入分析硬件架构,揭示模型与底层映射关系,精心总结优化经验,解析高性能编程技巧。
第1章 GPU通用计算
目前,主流计算机中的处理器主要是中央处理器CPU和图形处理器GPU。传统上,GPU只负责图形渲染,而大部分的处理都交给了CPU。
21世纪人类所面临的重要科技问题,如卫星成像数据的处理、基因工程、全球气候准确预报、核爆炸模拟等,数据规模已经达到TB甚至PB量级,没有万亿次以上的计算能力是无法解决的。与此同时,我们在日常应用中(如游戏、高清视频播放)面临的图形和数据计算也越来越复杂,对计算速度提出了严峻挑战。
GPU在处理能力和存储器带宽上相对CPU有明显优势,在成本和功耗上也不需要付出太大代价,从而为这些问题提供了新的解决方案。由于图形渲染的高度并行性,使得GPU可以通过增加并行处理单元和存储器控制单元的方式提高处理能力和存储器带宽。GPU设计者将更多的晶体管用作执行单元,而不是像CPU那样用作复杂的控制单元和缓存并以此来提高少量执行单元的执行效率。图1—1对CPU与GPU中晶体管的数量以及用途进行了比较。
……
张舒,电子科技大学信息与通信工程专业硕士,现任NvIDIA深圳有限公司系统设计验证工程师,CUDA技术顾问。曾实现基于CUDA的神经网络、聚类分析、主分量分析等模式识别算法,以及信号仿真、密码破解、字符串匹配等应用。
《天才与算法:人脑与AI的数学思维》内容简介:本书为我们展现了人工智能是如何逐步变得强大,怎样支持我们人类的创造力,以及它们
《嵌入式系统开发之道:菜鸟成长日志与项目经理的私房菜》用平易朴实的语言,以一个完整的嵌入式系统的开发流程为架构,通过一位“
《水样的春愁:郁达夫精读》内容简介:本书是郁达夫散文和小说的代表作合集,收录了他的名作《故都的秋》《北平的四季》《沉沦》《
《理念·制度·人》内容简介:20多年超近距离观察华为与任正非,8年研究积淀解析华为快速崛起的底层逻辑。在本书中,华为公司顾问田
ThepresentbookisbasedontheauthorsdiplomathesiswrittenattheInstituteofMediaandPho...
本书是《响应式Web设计:HTML5和CSS3实战》作者BenFrain的又一力作。作者通过丰富、完整的案例,循序渐进地展示了Sass和Compass的
BookDescriptionThemodernWebisawashwithdataandservicesjustwaitingtobeused,buthowd...
網路提供一個讓我們負責自己生活的機會,也讓我們得以重新定義我們在全球社會和在地社群中的雙重公民角色。此外,網路交給我們責
电子战是一个十分广袤的领域,从事的是从直流到可见光的电磁频谱的战斗。这就意味着电子战建模与仿真领域也是一样的广袤。为了把
《零基础学单片机C语言程序设计》内容简介:《零基础学单片机C语言程序设计》由浅入深,循序渐进地讲解了C51语言的方方面面。奉书知
《浦东史诗》内容简介:由著名报告文学作家、中国作家协会副主席何建明精心创作的《浦东史诗》,首次以长篇报告文学形式,从经济、
《粘土手办基础教程》内容简介:有没有想过把绘画书中的经典人物形象做成一个栩栩如生的人物模型收藏起来?其实一点也不难!翻开这
这不仅仅是一本图书!还有多媒体光盘、网站……将带你进入全新的世界!本书采用最先进的方法和技术讲述计算机基础知识,涉及面之
《操盘:千股涨停》内容简介:2015年上万亿资金逐鹿A股市场,各路私募基金迅速扩张,大量的场内场外杠杆交易大行其道。青山投资异军
《旅行人信札》内容简介:这些是1981年旅行时寄给北京亲友的信。我哥哥嘉曜极喜欢这些信,说要发表。他不是出版家,说说罢了。1993
《信号与系统》采用先时域后变换域的顺序,以对偶和类比的方式逐章逐节、完全并行地讲述连续时间和离散时间信号与系统的一系列基
《酷科技》是一本有趣的书,有点像一本“武林秘笈”,在书中,你会探索在宇宙和外空间的飞行器是如何工作的,原理是怎么样的?建
《神经网络气象预报建模理论方法与应用》主要介绍了神经网络主要模型的基本理论和方法、神经网络的各种短期气候预测模型、时间序
本书提供了关于iPhoneSDK以及iPhone开发的全面信息,对iPhoneSDK中的各种组件做了深入浅出的介绍,包括iPhone3.0SDK的所有新增特
《和秋叶一起学Word(第3版)》内容简介:Word、PPT、Excel,哪一个值得你花精力去学习? 我认为是Word,因为Word软件的使用频率高