本书系统深入地介绍了各种代码优化编程技术。全书分为4章。第1章集中介绍如何确定程序中消耗CPU时钟最多的热点代码的所谓程序剖析技术以及典型部分工具的实用知识。第2,3章分别全面介绍RAM了系统与高速缓存子系统的代码优化知识。第4章主要介绍了机器代码优化技术。各章在讨论基本原理的同时详细给出了代码实例,并对优化性能进行了定量的分析。
该书特别适合于作为应用程序员及系统程序员的学习与开发之用。同时,本书对在硬件方面的专业人员与技术工作者有一定的参考价值。
第1章 程序剖分
1.1 剖分的目标与目的
1.1.1 总执行时间
1.1.2 执行时间的类型
1.1. 3 处罚信息
1.1.4 调用次数
1.1.5 覆盖层次
1.2 微剖分的基本问题
1.2.1 流水作业或者吞吐量与等待时间
1.2.2 测不准
1.2.3 硬件优化
1.2.4 低分辨率
1.3 宏剖分的基本问题
1.3.1 运行时间的不一致性
1.3.2 度运行问题
1.3.3 负面效应
1.3.4 单台机器的代码优化问题
1.4 最新剖分软件概述
1.4.1 intelvtune
1.4.2 amdcodeanalyst
.1.4.3 microsoft的profile.exe
1.5 开发自己的剖分软件
1.6 vtune实用剖分知识
1.6.1 第一步:删除prinff函数
1.6.2 第二步:将strlen函数体移出循环
1.6.3 第三步:对齐数据
1.6.4 第四步:删除strlen函数
1.6.5 第五步:删除除法操作
1.6.6 第六步:删除性能监测代码
1.6.7 第七步:函数组合
1.6.8 第八步:减少内存访问操作的次数
1.6.9 第九步:把vtune当做私人教练
1.6.10 第十步:下结论
1.6.11 结果与预测
第2章 ram子系统
2.1 ram概述
2.2 ram的层次结构
2.3 随机存取存储器
2.4 ram的设计与工作原理
2.4.1 内核部分
2.4.2 传统dram(页面模式的dram)
2.4.3 dram的发展
2.4.4 快速页面模式的dram(fpmdram)
2.4.5 存储器时序
2.4.6 扩展数据输出dram(edodram)
2.4.7 突发式edodram(bedodram)
2.4.8 同步dram(sdram)
2.4.9 倍速sdram(ddrsdram)或者sdramⅱ
2.4.10 直接rambusdram(直接rdram)
2.4.11 不同存储器类型的比较
2.5 存储器与处理器之间的交互操作
2.5.1 计算全存取时间
2.6 dram物理地址到逻辑地址的映射
2.7 内存优化操作
2.7.1 建议
2.7.2 展开循环
2.7.3 消除数据相关性
2.7.4 数据并行处理
2.7.5 优化引用数据结构
2.7.6 减小数据结构的尺寸
2.7.7 dram板块上的数据分布策略
2.7.8 规划数据流
2.7.9 按字节、双字与四字进行内存处理
2.7.10 数据对齐
2.7.11 内存访问与计算的组合
2.7.12 读写操作的组合
2.7.13 只在必要时才访问内存
2.7.14 内置c内存处理函数的优化
2.7.15 内存处理函数的优化质量
2.7.16 c字符串库函数的优化
2.7.17 字符串处理函数的质量优化
2.7.18 块处理算法的优化
2.7.19 大型数组排序的优化
2.8 ram测试问题
第3章 高速缓存子系统
3.1 sram的工作原理
3.1.1 历史概况
3.1.2 内核
3.1.3 触发器的设计
3.1.4 逻辑非元件(取反器)的设计
3.1.5 sram阵列的设计
3.1.6 封装接口的设计
3.1.7 读写时序图
3.1.8 静态存储器的类型
3.2 高速缓存的工作原理
3.2.1 起源
3.2.2 高速缓存的目标与任务
3.2.3 高速缓存的组织
3.3 高速缓存与存储器存取的优化
3.3.1 处理数据的尺寸对性能的影响
3.3.2 可执行代码的尺寸对性能的影响
3.3.3 数据对齐效率
3.3.4 数据在高速缓存板块上的分布
3.3.5 使用有限联合数目的高速缓存
3.3.6 维数组的处理
3.3.7 写缓冲机制的详细说明
3.3.8 新一代x86处理器的高速缓存管理
3.3.9 预取机制的实际应用
3.3.10 内存拷贝内幕或者pentiumⅲ与pentium4的新命令
第4章 机器优化
4.1 c/c++编译器的比较分析
4.1.1 常量表达式
4.1.2 代数表达式
4.1.3 算术运算
4.1.4 分支语句
4.1.5 switch运算符
4.1.6 循环
4.1.7 函数调用
4.1.8 变量分布
4.1.9 字符串初始化
4.1.10 死码
4.1.11 常量条件
4.1.12 确定优胜者
4.2 汇编器与编译器的对决
4.2.1 历史回顾--汇编语言使春天永驻
4.2.2 评价机器优化质量的指标
4.2.3 评价机器优化质量的方法
4.2.4 对主要编译器进行比较分析
4.2.5 测试结果的讨论
4.2.6 机器优化质量的示例
4.2.7 用汇编语言创建保护代码
4.2.8 用汇编语言编程是一种创造性活动
4.2.9 结束语
4.2.10 源代码
《刺客信条:英灵殿·盖尔蒙德之章》内容简介:公元九世纪中叶,来自北欧的维京人正摧残着英格兰诸王国。吕加菲尔克国王约尔的次子
JavaScript的快速演进带来了更新更快的JavaScript虚拟机以及各种框架,不仅使得它在服务器端的Web程序开发中日益普及,同时也推动
云计算概念.技术与架构 本书特色 《云计算:概念、技术与架构》涉及云计算领域的各个方面,涵盖了很多基本概念,共包含五个部分。**部分到第四部分主要涵盖了云计算基...
本书是DSL领域的丰碑之作,由世界级软件开发大师和软件开发“教父”MartinFowler历时多年写作而成,ThoughtWorks中国翻译。全面详
IsyourapplicationorWebsitereadyforprimetime?Amajorrevisionofaclassicreference,"G...
计算机组成原理-学习指导与习题解答 本书特色 本套教材在原国家“九五”规划教材的基础上,按照“计算机学科教学计划2001”进行全面更新,以适应高校计算机专业课程...
《中学摄影》内容简介:本教材为“中小学美术拓展教材”之一,本教材针对中学生学习特点,从摄影图像与思维、观看、呈现和传播等几
《汉英委婉语跨文化比较研究》内容简介:本专著通过跨文化交际的视角对汉英语言在职业委婉语、新闻委婉语、广告委婉语、死亡委婉语
本书特别针对广大Web开发人员,以通俗易懂的方式介绍了GIS(地理信息系统,GeographicInformationSystems)在Web应用中的开发技术
《Web设计技术手册第三版》作为一本完备而简洁的手册,涵盖了在设计Web页面时需要知道的所有知识。为体现受标准推动的Web设计现状
《从展场到展览》内容简介:本书通过分析与解读以上海为代表性的艺术博物馆(上海博物馆、龙美术馆、K11艺术中心、上海当代艺术馆等
《MySQL核心技术与最佳实践》内容简介:作为世界上最受欢迎的开源数据库管理系统,MySQL具有成本低廉、体积小、便于安装、性能优越
PPT设计完全自学教程 本书特色 本书是初学者快速自学powerpoint的经典教程。全书共分为24章,从powerpoint快速入门开始讲起,以循序渐进的方式...
在线阅读本书TheEMAlgorithmandExtensionsremainstheonlysinglesourcetoofferacompleteandun...
玩玩打打学五笔 内容简介 《玩玩打打学五笔》的出现彻底改变了这一切,这是一套原创的、快速掌握五笔字型的新方法,无须背口诀,无须刻苦,更不需要有多大的毅力,只要你...
《MakingIt:設計師一定要懂的產品製造知識》***美國知名設計公司IDEO的總裁TimBrown說:『MakingIt,對於設計師來說,是本無價
Visual Basic程序设计基础 节选 《高等学校计算机程序设计课程系列教材·Visual Basic程序设计基础》根据教育部高等学校计算机基础课程教学指导...
REpresentationalStateTransfer,betterknownasREST,isthearchitecturalstylethatgover...
本书是《计算机网络》的第2版,全面讲述计算机网络的基本原理、技术与应用。从技术内容上,全书共分5个部分。第1部分介绍计算机网
這是一趟有錢也買不到的日本設計之旅!本書直擊博報堂、SAMURAI等目前日本超夯的廣告設計公司,深入設計師們的工作現場,訪問當今