本书系统深入地介绍了各种代码优化编程技术。全书分为4章。第1章集中介绍如何确定程序中消耗CPU时钟最多的热点代码的所谓程序剖析技术以及典型部分工具的实用知识。第2,3章分别全面介绍RAM了系统与高速缓存子系统的代码优化知识。第4章主要介绍了机器代码优化技术。各章在讨论基本原理的同时详细给出了代码实例,并对优化性能进行了定量的分析。
该书特别适合于作为应用程序员及系统程序员的学习与开发之用。同时,本书对在硬件方面的专业人员与技术工作者有一定的参考价值。
第1章 程序剖分
1.1 剖分的目标与目的
1.1.1 总执行时间
1.1.2 执行时间的类型
1.1. 3 处罚信息
1.1.4 调用次数
1.1.5 覆盖层次
1.2 微剖分的基本问题
1.2.1 流水作业或者吞吐量与等待时间
1.2.2 测不准
1.2.3 硬件优化
1.2.4 低分辨率
1.3 宏剖分的基本问题
1.3.1 运行时间的不一致性
1.3.2 度运行问题
1.3.3 负面效应
1.3.4 单台机器的代码优化问题
1.4 最新剖分软件概述
1.4.1 intelvtune
1.4.2 amdcodeanalyst
.1.4.3 microsoft的profile.exe
1.5 开发自己的剖分软件
1.6 vtune实用剖分知识
1.6.1 第一步:删除prinff函数
1.6.2 第二步:将strlen函数体移出循环
1.6.3 第三步:对齐数据
1.6.4 第四步:删除strlen函数
1.6.5 第五步:删除除法操作
1.6.6 第六步:删除性能监测代码
1.6.7 第七步:函数组合
1.6.8 第八步:减少内存访问操作的次数
1.6.9 第九步:把vtune当做私人教练
1.6.10 第十步:下结论
1.6.11 结果与预测
第2章 ram子系统
2.1 ram概述
2.2 ram的层次结构
2.3 随机存取存储器
2.4 ram的设计与工作原理
2.4.1 内核部分
2.4.2 传统dram(页面模式的dram)
2.4.3 dram的发展
2.4.4 快速页面模式的dram(fpmdram)
2.4.5 存储器时序
2.4.6 扩展数据输出dram(edodram)
2.4.7 突发式edodram(bedodram)
2.4.8 同步dram(sdram)
2.4.9 倍速sdram(ddrsdram)或者sdramⅱ
2.4.10 直接rambusdram(直接rdram)
2.4.11 不同存储器类型的比较
2.5 存储器与处理器之间的交互操作
2.5.1 计算全存取时间
2.6 dram物理地址到逻辑地址的映射
2.7 内存优化操作
2.7.1 建议
2.7.2 展开循环
2.7.3 消除数据相关性
2.7.4 数据并行处理
2.7.5 优化引用数据结构
2.7.6 减小数据结构的尺寸
2.7.7 dram板块上的数据分布策略
2.7.8 规划数据流
2.7.9 按字节、双字与四字进行内存处理
2.7.10 数据对齐
2.7.11 内存访问与计算的组合
2.7.12 读写操作的组合
2.7.13 只在必要时才访问内存
2.7.14 内置c内存处理函数的优化
2.7.15 内存处理函数的优化质量
2.7.16 c字符串库函数的优化
2.7.17 字符串处理函数的质量优化
2.7.18 块处理算法的优化
2.7.19 大型数组排序的优化
2.8 ram测试问题
第3章 高速缓存子系统
3.1 sram的工作原理
3.1.1 历史概况
3.1.2 内核
3.1.3 触发器的设计
3.1.4 逻辑非元件(取反器)的设计
3.1.5 sram阵列的设计
3.1.6 封装接口的设计
3.1.7 读写时序图
3.1.8 静态存储器的类型
3.2 高速缓存的工作原理
3.2.1 起源
3.2.2 高速缓存的目标与任务
3.2.3 高速缓存的组织
3.3 高速缓存与存储器存取的优化
3.3.1 处理数据的尺寸对性能的影响
3.3.2 可执行代码的尺寸对性能的影响
3.3.3 数据对齐效率
3.3.4 数据在高速缓存板块上的分布
3.3.5 使用有限联合数目的高速缓存
3.3.6 维数组的处理
3.3.7 写缓冲机制的详细说明
3.3.8 新一代x86处理器的高速缓存管理
3.3.9 预取机制的实际应用
3.3.10 内存拷贝内幕或者pentiumⅲ与pentium4的新命令
第4章 机器优化
4.1 c/c++编译器的比较分析
4.1.1 常量表达式
4.1.2 代数表达式
4.1.3 算术运算
4.1.4 分支语句
4.1.5 switch运算符
4.1.6 循环
4.1.7 函数调用
4.1.8 变量分布
4.1.9 字符串初始化
4.1.10 死码
4.1.11 常量条件
4.1.12 确定优胜者
4.2 汇编器与编译器的对决
4.2.1 历史回顾--汇编语言使春天永驻
4.2.2 评价机器优化质量的指标
4.2.3 评价机器优化质量的方法
4.2.4 对主要编译器进行比较分析
4.2.5 测试结果的讨论
4.2.6 机器优化质量的示例
4.2.7 用汇编语言创建保护代码
4.2.8 用汇编语言编程是一种创造性活动
4.2.9 结束语
4.2.10 源代码
人工智能哲学 本书特色 ◆《人工智能哲学》探讨人工智能会不会问:我是谁,我从哪里来,我要到哪里去? ◆比尔??盖茨、斯蒂芬??霍金、埃隆??马斯克为首的一派认为...
五笔字型汉字速查一本通(双色版) 内容简介 五笔字型输入法是王永民教授发明的一种完全依照汉字字形进行编码的汉字输入方法,五笔字型发展到今天,共经历了三个版本,即...
《唐朝定居指南》内容简介:《唐朝定居指南》是《唐朝穿越指南》的姊妹篇。以浅显风趣的笔调,介绍唐人衣、食、住、行、语言、娱乐
《大脑功能模式(型)理论》内容简介:在主客观事物情境模式不断刺激下,基因遗传决定的大脑生理结构和特性,建构各不相同的生理结
《计算机图形学》与大多数传统的计算机图形学教材不同,它仅简要介绍交互式计算机图形学方面的基本知识,主要侧重于介绍计算机图
《明诗鉴赏》内容简介:《明诗鉴赏》是“新选中国名诗1000首”丛书中的一种,是由首都师范大学教育部长江学者特聘教授左东岭注评。
《中小银行运维架构》内容简介:本书为商业银行构建运维体系和掌握核心运维技术提供了指导。以一家中小型的商业银行为蓝本,讲述商
《狼书(卷1):更了不起的Node.js》内容简介:Node.js开发简单,性能极好,一经发布便成了明星级项目。随着大前端领域的蓬勃发展,
《碳中和时代:未来40年财富大转移》内容简介:碳中和代表一个新时代的开始,在这个时代中,所有人的财富都将通过碳排放这个媒介进
《给孩子的24堂经典阅读课》内容简介:真正的好书,是读者喜欢阅读的;真正的经典,是读者反复阅读的。但是如何让孩子发现经典和好
新手学Photoshop CS5数码照片处理-超值实用版-(含1DVD价格) 本书特色 内容全面选择*实用*常用的知识,让您的学习不做无用功讲解细致完全图解式讲...
《Java 8函数式编程》内容简介:多年以来,函数式编程被认为是少数人的游戏,不适合推广给普罗大众。写作此书的目的就是为了挑战这
关联数据聚类-模型.算法及应用 内容简介 《关联数据聚类——模型、算法及应用》可以作为计算机、通信、信息等相关专业高年级本科生和研究生学习数据挖掘或机器学习专题...
《数据结构》(C语言版)针对采用ANSIC实现数据结构进行了全面的描述和深入的讨论。书中详细讨论了栈、队列、链表以及查找结构、高
《牛虻》内容简介:故事背景设定在19世纪40年代干电地利络治下的意大利,描写了意大利革命党人牛虻为争取民族解放而奋斗的一生。全
《抖音短视频运营全攻略》内容简介:随着移动互联网的快速发展与普及,短视频营销正在成为新的营销模式。本书从短视频营销的基础出
Godinslatestbusinesshandbook(afterSmallIstheNewBigandTheDip)revisitssomeofhismos...
《中华书局的企业制度(1912-1949)》内容简介:中华书局作为一家有着百余年历史的现代出版机构,拥有丰厚的底蕴与光荣的传统。本书
《一本书玩转信息图制作》内容简介:本书是一本全面揭秘信息图制作的大全,从两条线帮助读者精通信息图制作:一条是横向案例线,通
《代码之髓:编程语言核心概念》作者从编程语言设计的角度出发,围绕语言中共通或特有的核心概念,通过语言演变过程中的纵向比较