现代体系结构的优化编译器,ISBN:9787111141228,作者:(美)Randy Allen,(美)Ken Kennedy著;张兆庆等译;张兆庆译
第1章 高性能体系结构对编译器的挑战
1.1 概述和目标
1.2 流水线
1.2.1 流水线指令部件
1.2.2 流水线执行部件
1.2.3 并行功能部件
1.2.4 标量流水线编译
1.3 向量指令
1.3.1 向量硬件概述
1.3.2 向量流水线编译
1.4 超标量处理器和VLIW处理器
1.4.1 多发射指令部件
1.4.2 多发射处理器的编译
1.5 处理器并行性
1.5.1 处理器并行性概述
1.5.2 异步并行性的编译
1.6 存储层次结构
1.6.1 存储系统概述
1.6.2 存储层次结构的编译
1.7 实例研究:矩阵乘法
1.8 先进编译技术
1.8.1 依赖
1.8.2 变换
1.9 小结
1.10 实例研究
1.11 历史评述与参考文献
习题
第2章 依赖:理论与实践
2.1 引言
2.2 依赖及其性质
2.2.1 存-取分类
2.2.2 循环内的依赖
2.2.3 依赖和变换
2.2.4 距离向量和方向向量
2.2.5 循环携带依赖和循环无关依赖
2.3 简单的依赖测试
2.4 并行化和向量化
2.4.1 并行化
2.4.2 向量化
2.4.3 一个先进的向量化算法
2.5 小结
2.6 实例研究
2.7 历史评述与参考文献
习题
第3章 依赖测试
3.1 引言
3.2 依赖测试概述
3.2.1 下标划分
3.2.2 合并方向向量
3.3 单下标依赖测试
3.3.1 ZIV测试
3.3.2 SIV测试
3.3.3 多归纳变量测试
3.4 耦合组中的测试
3.4.1 Delta测试
3.4.2 更强有力的多下标测试
3.5 实验研究
3.6 各种测试的集成
3.7 小结
3.8 实例研究
3.9 历史评述与参考文献
习题
第4章 初等变换
4.1 引言
4.2 信息需求
4.3 循环正规化
4.4 数据流分析
4.4.1 定义-使用链
4.4.2 死代码消除
4.4.3 常数传播
4.4.4 静态单赋值形式
4.5 归纳变量暴露
4.5.1 前向表达式替换
4.5.2 归纳变量替换
4.5.3 驱动替换过程
4.6 小结
4.7 实例研究
4.8 历史评述与参考文献
习题
第5章 提高细粒度并行性
5.1 引言
5.2 循环交换
5.2.1 循环交换的安全性
5.2.2 循环交换的有利性
5.2.3 循环交换和向量化
5.3 标量扩展
5.4 标量和数组重命名
5.5 节点分裂
5.6 归约识别
5.7 索引集分裂
5.7.1 阈值分析
5.7.2 循环剥离
5.7.3 基于区域的分裂
5.8 运行时符号解析
5.9 循环倾斜
5.10 各种变换的集成
5.11 实际机器的复杂性
5.12 小结
5.13 实例研究
5.13.1 PFC
5.13.2 Ardent Titan编译器
5.13.3 向量化的性能
5.14 历史评述与参考文献
习题
第6章 开发粗粒度并行性
6.1 引言
6.2 单循环的处理方法
6.2.1 私有化
6.2.2 循环分布
6.2.3 对齐
6.2.4 代码复制
6.2.5 循环合并
6.3 紧嵌循环
6.3.1 为并行化的循环交换
6.3.2 循环选择
6.3.3 循环反转
6.3.4 为并行化的循环倾斜
6.3.5 幺模变换
6.3.6 基于有利性的并行化方法
6.4 非紧嵌循环套
6.4.1 多层循环合并
6.4.2 一个并行代码生成算法
6.5 一个扩充的例子
6.6 并行性的封装
6.6.1 循环分段
6.6.2 流水线并行性
6.6.3 调度并行任务
6.6.4 制导的自调度
6.7 小结
6.8 实例研究
6.8.1 PFC和ParaScope
6.8.2 Ardent Titan编译器
6.9 历史评述与参考文献
习题
第7章 处理控制流
7.1 引言
7.2 if转换
7.2.1 定义
7.2.2 分支的分类
7.2.3 前向分支
7.2.4 出口分支
7.2.5 后向分支
7.2.6 完全前向分支消除
7.2.7 化简
7.2.8 迭代依赖
7.2.9 if重构
7.3 控制依赖
7.3.1 构造控制依赖
7.3.2 循环中的控制依赖
7.3.3 控制依赖的一个执行模型
7.3.4 控制依赖在并行化中的应用
7.4 小结
7.5 实例研究
7.6 历史评述与参考文献
习题
第8章 改进寄存器的使用
8.1 引言
8.2 标量寄存器分配
8.2.1 面向寄存器重用的数据依赖
8.2.2 循环携带和循环无关的重用
8.2.3 寄存器分配的例子
8.3 标量替换
8.3.1 依赖图剪枝
8.3.2 简单替换
8.3.3 处理循环携带依赖
8.3.4 跨越多个迭代的依赖
8.3.5 删除标量拷贝
8.3.6 缓解寄存器压力
8.3.7 标量替换算法
8.3.8 实验数据
8.4 展开和压紧
8.4.1 展开和压紧的合法性
8.4.2 展开和压紧算法
8.4.3 展开和压紧的效果
8.5 面向寄存器重用的循环交换
8.5.1 对循环交换的考虑
8.5.2 循环交换算法
8.6 面向寄存器重用的循环合并
8.6.1 面向重用的有利的循环合并
8.6.2 面向合并的循环对齐
8.6.3 合并机制
8.6.4 加权循环合并算法
8.6.5 面向寄存器重用的多层循环合并
8.7 改进寄存器使用的变换综合
8.7.1 决定变换的顺序
8.7.2 例子:矩阵乘法
8.8 复杂的循环嵌套
8.8.1 包含if语句的循环
8.8.2 梯形循环
8.9 小结
8.10 实例研究
8.11 历史评述与参考文献
习题
第9章 管理高速缓存
9.1 引言
9.2 适合于空间局部性的循环交换
9.3 分块
9.3.1 非对齐的数据
9.3.2 分块的合法性
9.3.3 分块的有利性
9.3.4 一个简单的分块算法
9.3.5 带倾斜的分块
9.3.6 循环合并和对齐
9.3.7 结合其他变换的分块
9.3.8 有效性
9.4 复杂循环嵌套中的高速缓存管理
9.4.1 三角形的高速缓存分块
9.4.2 特殊用途的变换
9.5 软件预取
9.5.1 一个软件预取算法
9.5.2 软件预取的有效性
9.6 小结
9.7 实例研究
9.8 历史评述与参考文献
习题
第10章 调度
10.1 引言
10.2 指令调度
10.2.1 机器模型
10.2.2 直线型代码的图调度
10.2.3 表调度
10.2.4 踪迹调度
10.2.5 循环内的调度
10.3 向量部件调度
10.3.1 链接
10.3.2 协处理器
10.4 小结
10.5 实例研究
10.6 历史评述与参考文献
习题
第11章 过程间分析和优化
11.1 引言
11.2 过程间分析
11.2.1 过程间问题
11.2.2 过程间问题分类
11.2.3 流不敏感副作用分析
11.2.4 流不敏感别名分析
11.2.5 常数传播
11.2.6 注销分析
11.2.7 符号化分析
11.2.8 数组区域分析
11.2.9 调用图的构造
11.3 过程间优化
11.3.1 内联替换
11.3.2 过程克隆
11.3.3 混合优化
11.4 管理整个程序的编译
11.5 小结
11.6 实例研究
11.7 历史评述与参考文献
习题
第12章 C语言和硬件设计中的依赖
12.1 引言
12.2 优化C语言
12.2.1 指针
12.2.2 命名和结构
12.2.3 循环
12.2.4 作用域和静态变量
12.2.5 方言
12.2.6 其他问题
12.3 硬件设计
12.3.1 硬件描述语言
12.3.2 优化模拟
12.3.3 综合优化
12.4 小结
12.5 实例研究
12.6 历史评述与参考文献
习题
第13章 编译数组赋值
13.1 引言
13.2 简单的标量化
13.3 标量化变换
13.3.1 循环反转
13.3.2 输入预取
13.3.3 循环分裂
13.4 多维标量化
13.4.1 多维中的简单标量化
13.4.2 外层循环预取
13.4.3 用于标量化的循环交换
13.4.4 通用的多维标量化
13.4.5 一个标量化的例子
13.5 对向量机器的考虑
13.6 标量化后的循环交换和合并
13.7 小结
13.8 实例研究
13.9 历史评述与参考文献
习题
第14章 编译高性能Fortran
14.1 引言
14.2 HPF编译器概览
14.3 基本循环的编译技术
14.3.1 分布信息的传播和分析
14.3.2 迭代的划分
14.3.3 通信生成
14.4 优化
14.4.1 通信向量化
14.4.2 重叠通信和计算
14.4.3 对齐和复制
14.4.4 流水
14.4.5 一般依赖环的识别
14.4.6 存储管理
14.4.7 处理多个维
14.5 HPF的过程间优化
14.6 小结
14.7 实例研究
14.8 历史评述与参考文献
习题
附录 Fortran 90基础
参考文献
索引
《小创客趣玩microbit开发板编程》内容简介:本书定位于“编程入门与实践指南”,适合所有喜爱编程的青少年朋友阅读。书中对micro:
《嵌入式系统软硬件协同设计实战指南》内容简介:本书由浅入深,由基础知识到实战案例向读者系统阐述了如何利用Zynq平台进行嵌入式
这本书分城市广场、邻里公园、小型公园和袖珍公园、大学校园户外空间、老年住宅区户外空间等部分,系统地阐述了城市空间设计的理
《让高管团队更高效》内容简介:企业的命运取决于它的CEO?《让高管团队更高效》的作者们并不这么认为。相反,他们认为,在当今这个
主板常用芯片及电路维修实用手册(含盘) 本书特色 主板是电脑的核心部件,是电脑能够实现各种功能的基础。而主板的核心则是其上面集成的各种电子元器件、各种功能的芯片...
TCP/IP最佳入门-原书第6版 本书特色 《TCP/IP *佳入门:因特网文原理与应用(原书第6版)》:详细说明TCP/IP的基本运作原理;包含协议分析-Et...
《深读矫正:现代监狱制度的理论逻辑》内容简介:关于监狱的批判和批判的监狱未来监狱是怎样的样态?为什么说惩罚是监狱的天然属性
《文化翻译与经典阐释(增订本)》内容简介:本书是作者的一部专题研究文集,分为上中下三编:上编“翻译的文化学反思”,首次在中
电商、O2O、P2P、互联网金融等概念先是被疯狂追捧,在泡沫越吹越大之后便是哀鸿遍野。这本书正是解答泡沫破灭之后怎么办?自从以
本书特别邀请了数位国内知名GUI设计师一起由浅至深地讲解GUI设计案例,详细讲解各个案例中所遇到的问题和软件应用。本书分为以下
《物含妙理总堪寻 (理解科学丛书)》内容简介:本书来源于作者长期以来在北京师范大学开设的一个科普讲座“从爱因斯坦到霍金的宇宙
数据清洗是数据挖掘与分析过程中不可缺少的一个环节,但因为数据类型极其复杂,传统的清洗脏数据工作单调乏味且异常辛苦。如果能
JavaScript是一种脚本语言,已广泛用于Web应用开发。本书就是一本引导读者深入学习JavaScript,并能成为JavaScript专家的书。全书
CascadingStyleSheetsenableyoutorapidlycreatewebdesignsthatcanbesharedbyhundredso...
《民营科技企业的技术创新战略和政策选择》内容分为五个部分,首先分析了目前我国民营科技企业的发展现状和特点,然后从增强我国
《计算机图形学》与大多数传统的计算机图形学教材不同,它仅简要介绍交互式计算机图形学方面的基本知识,主要侧重于介绍计算机图
PPT演示之道-写给非设计人员的幻灯片指南-第2版-畅销书升级版 本书特色 PPT设计好的两个重要原则:一目了然和视觉。由孙小小编著的《PPT演示之道——写给非...
《拜托了,黏土!插画风黏土小物制作》内容简介:手作,充盈了我们的闲适时光。有趣、新鲜的手工小物,给我们的生活增添了多彩的乐
会声会影应用宝典-中文版-随书赠送DVD 本书特色 本书是一本会声会影x7 学习宝典,全书通过310 多个实战案例,以及350 多分钟全程同步语音教学视频,...
精嵌入式Linux编程 本书特色 《精通嵌入式Linux编程:构建自己的GUI环境》是由北京航空航天大学出版社出版的。精嵌入式Linux编程 内容简介 本书针对...