本书系统深入地介绍了各种代码优化编程技术。全书分为4章。第1章集中介绍如何确定程序中消耗CPU时钟最多的热点代码的所谓程序剖析技术以及典型部分工具的实用知识。第2,3章分别全面介绍RAM了系统与高速缓存子系统的代码优化知识。第4章主要介绍了机器代码优化技术。各章在讨论基本原理的同时详细给出了代码实例,并对优化性能进行了定量的分析。
该书特别适合于作为应用程序员及系统程序员的学习与开发之用。同时,本书对在硬件方面的专业人员与技术工作者有一定的参考价值。
第1章 程序剖分
1.1 剖分的目标与目的
1.1.1 总执行时间
1.1.2 执行时间的类型
1.1. 3 处罚信息
1.1.4 调用次数
1.1.5 覆盖层次
1.2 微剖分的基本问题
1.2.1 流水作业或者吞吐量与等待时间
1.2.2 测不准
1.2.3 硬件优化
1.2.4 低分辨率
1.3 宏剖分的基本问题
1.3.1 运行时间的不一致性
1.3.2 度运行问题
1.3.3 负面效应
1.3.4 单台机器的代码优化问题
1.4 最新剖分软件概述
1.4.1 intelvtune
1.4.2 amdcodeanalyst
.1.4.3 microsoft的profile.exe
1.5 开发自己的剖分软件
1.6 vtune实用剖分知识
1.6.1 第一步:删除prinff函数
1.6.2 第二步:将strlen函数体移出循环
1.6.3 第三步:对齐数据
1.6.4 第四步:删除strlen函数
1.6.5 第五步:删除除法操作
1.6.6 第六步:删除性能监测代码
1.6.7 第七步:函数组合
1.6.8 第八步:减少内存访问操作的次数
1.6.9 第九步:把vtune当做私人教练
1.6.10 第十步:下结论
1.6.11 结果与预测
第2章 ram子系统
2.1 ram概述
2.2 ram的层次结构
2.3 随机存取存储器
2.4 ram的设计与工作原理
2.4.1 内核部分
2.4.2 传统dram(页面模式的dram)
2.4.3 dram的发展
2.4.4 快速页面模式的dram(fpmdram)
2.4.5 存储器时序
2.4.6 扩展数据输出dram(edodram)
2.4.7 突发式edodram(bedodram)
2.4.8 同步dram(sdram)
2.4.9 倍速sdram(ddrsdram)或者sdramⅱ
2.4.10 直接rambusdram(直接rdram)
2.4.11 不同存储器类型的比较
2.5 存储器与处理器之间的交互操作
2.5.1 计算全存取时间
2.6 dram物理地址到逻辑地址的映射
2.7 内存优化操作
2.7.1 建议
2.7.2 展开循环
2.7.3 消除数据相关性
2.7.4 数据并行处理
2.7.5 优化引用数据结构
2.7.6 减小数据结构的尺寸
2.7.7 dram板块上的数据分布策略
2.7.8 规划数据流
2.7.9 按字节、双字与四字进行内存处理
2.7.10 数据对齐
2.7.11 内存访问与计算的组合
2.7.12 读写操作的组合
2.7.13 只在必要时才访问内存
2.7.14 内置c内存处理函数的优化
2.7.15 内存处理函数的优化质量
2.7.16 c字符串库函数的优化
2.7.17 字符串处理函数的质量优化
2.7.18 块处理算法的优化
2.7.19 大型数组排序的优化
2.8 ram测试问题
第3章 高速缓存子系统
3.1 sram的工作原理
3.1.1 历史概况
3.1.2 内核
3.1.3 触发器的设计
3.1.4 逻辑非元件(取反器)的设计
3.1.5 sram阵列的设计
3.1.6 封装接口的设计
3.1.7 读写时序图
3.1.8 静态存储器的类型
3.2 高速缓存的工作原理
3.2.1 起源
3.2.2 高速缓存的目标与任务
3.2.3 高速缓存的组织
3.3 高速缓存与存储器存取的优化
3.3.1 处理数据的尺寸对性能的影响
3.3.2 可执行代码的尺寸对性能的影响
3.3.3 数据对齐效率
3.3.4 数据在高速缓存板块上的分布
3.3.5 使用有限联合数目的高速缓存
3.3.6 维数组的处理
3.3.7 写缓冲机制的详细说明
3.3.8 新一代x86处理器的高速缓存管理
3.3.9 预取机制的实际应用
3.3.10 内存拷贝内幕或者pentiumⅲ与pentium4的新命令
第4章 机器优化
4.1 c/c++编译器的比较分析
4.1.1 常量表达式
4.1.2 代数表达式
4.1.3 算术运算
4.1.4 分支语句
4.1.5 switch运算符
4.1.6 循环
4.1.7 函数调用
4.1.8 变量分布
4.1.9 字符串初始化
4.1.10 死码
4.1.11 常量条件
4.1.12 确定优胜者
4.2 汇编器与编译器的对决
4.2.1 历史回顾--汇编语言使春天永驻
4.2.2 评价机器优化质量的指标
4.2.3 评价机器优化质量的方法
4.2.4 对主要编译器进行比较分析
4.2.5 测试结果的讨论
4.2.6 机器优化质量的示例
4.2.7 用汇编语言创建保护代码
4.2.8 用汇编语言编程是一种创造性活动
4.2.9 结束语
4.2.10 源代码
Thisbookisaninspiringsurveyofstate-of-the-artpublicationsthatareredefiningprintm...
《每天一段话 写出好作文》内容简介:每天一段话,打下写作基本功,用成语、对话、描述、背景、顺序和节奏写出好作文。本书通过小琪
CG进阶-SAI+Photoshop男性动漫角色绘制技法-全彩印刷-含DVD 本书特色 吴博编著的《CG进阶(SAI+Photoshop男性动漫角色绘制技法)》...
《Linux集群之美》内容简介:全书共9章,主要是以作者的项目实践为基础,以CentOS 7.5x86_64为主操作系统、AWS云为平台,介绍Linux
《核技术解读中医药千年奥秘》内容简介:本书为“走进美丽的核科学世界系列”之一,主要内容包括核医学成像、放射性药物、放射性核
《Vim 8文本处理实战》内容简介:作为全面介绍Vim使用方法的教程,本书介绍了各种常用的文本编辑方法和程序设计中的实用操作,深入
分布式算法20多年来一直是倍受关注的主流方向。本书第二版不仅给出了算法的最新进展,还深入探讨了与之相关的理论知识。这本教材
《魔兽世界编程宝典:WorldofWarcraftAddons完全参考手册》可以为以下对象提供帮助:希望学习如何修改已有插件的新手插件用户,希
《四季读诗》内容简介:呈现在您面前的这本《四季读诗》,是一册编排新颖、图文并茂的古诗词读本。从先秦时代的《诗经》,一直到近
Geomagic Studio逆向工程技术及应用-(含光盘) 本书特色 《Geomagic Studio逆向工程技术及应用》是由清华大学出版社出版的。Geoma...
《过瘾湘菜800例》内容简介:湘菜即湖南菜,至今已有2000多年的历史。1974年在长沙马王堆出土的一套西汉随葬竹简菜谱上,已记载了1
中文版After Effects CC影视制作全实例 本书特色 彭超、景洪荣、马小龙、张桂良编著的这本《中 文版after effects cc影视制作全实例(...
广告语英国DK经典作品艺术排行榜冠军姊妹篇独特3D图立体图解析全球最标志建筑!主要卖点•世界建筑史上最著名的50余座全面解析•分
供应链的超级赌注、全球化的中国较量、核发技术争峰、本土渠道抢位资深记者十八个月深入调查、业内专家和咨询公鼎力相助、揭示营
《代码整洁之道:程序员的职业素养》内容简介:本书是编程大师“Bob大叔”40余年编程生涯的心得体会的总结,讲解要成为真正专业的程
《大盘时代:中国泛地产革命》内容简介:1999年,一条从广州南直通番禺的华南快速干线将普通的岭南小镇南村,变成了中国房地产史上
《鲁迅的故家》内容简介:《鲁迅的故家》是周作人晚年回忆鲁迅的重要著作之一,从“百草园”、“园的内外”、“鲁迅在东京”、“补
《历史何其相似》内容简介:《历史何其相似》就是把历史上已经上演过,而今天依然在不断播放的镜头聚集起来,展现在世人的面前。你
《作家榜名著:你一定爱读的中国近代史》内容简介:◆忠实原著:以民国二十七年艺文研究会的初始定版为底本,全新精校典藏。◆精美
《超300款系列:吃不胖的下饭菜》内容简介:发胖并不是源于吃多了,关键在于怎么吃,吃什么。有些可口美味的下饭菜吃了真的不会发胖