本书系统深入地介绍了各种代码优化编程技术。全书分为4章。第1章集中介绍如何确定程序中消耗CPU时钟最多的热点代码的所谓程序剖析技术以及典型部分工具的实用知识。第2,3章分别全面介绍RAM了系统与高速缓存子系统的代码优化知识。第4章主要介绍了机器代码优化技术。各章在讨论基本原理的同时详细给出了代码实例,并对优化性能进行了定量的分析。
该书特别适合于作为应用程序员及系统程序员的学习与开发之用。同时,本书对在硬件方面的专业人员与技术工作者有一定的参考价值。
第1章 程序剖分
1.1 剖分的目标与目的
1.1.1 总执行时间
1.1.2 执行时间的类型
1.1. 3 处罚信息
1.1.4 调用次数
1.1.5 覆盖层次
1.2 微剖分的基本问题
1.2.1 流水作业或者吞吐量与等待时间
1.2.2 测不准
1.2.3 硬件优化
1.2.4 低分辨率
1.3 宏剖分的基本问题
1.3.1 运行时间的不一致性
1.3.2 度运行问题
1.3.3 负面效应
1.3.4 单台机器的代码优化问题
1.4 最新剖分软件概述
1.4.1 intelvtune
1.4.2 amdcodeanalyst
.1.4.3 microsoft的profile.exe
1.5 开发自己的剖分软件
1.6 vtune实用剖分知识
1.6.1 第一步:删除prinff函数
1.6.2 第二步:将strlen函数体移出循环
1.6.3 第三步:对齐数据
1.6.4 第四步:删除strlen函数
1.6.5 第五步:删除除法操作
1.6.6 第六步:删除性能监测代码
1.6.7 第七步:函数组合
1.6.8 第八步:减少内存访问操作的次数
1.6.9 第九步:把vtune当做私人教练
1.6.10 第十步:下结论
1.6.11 结果与预测
第2章 ram子系统
2.1 ram概述
2.2 ram的层次结构
2.3 随机存取存储器
2.4 ram的设计与工作原理
2.4.1 内核部分
2.4.2 传统dram(页面模式的dram)
2.4.3 dram的发展
2.4.4 快速页面模式的dram(fpmdram)
2.4.5 存储器时序
2.4.6 扩展数据输出dram(edodram)
2.4.7 突发式edodram(bedodram)
2.4.8 同步dram(sdram)
2.4.9 倍速sdram(ddrsdram)或者sdramⅱ
2.4.10 直接rambusdram(直接rdram)
2.4.11 不同存储器类型的比较
2.5 存储器与处理器之间的交互操作
2.5.1 计算全存取时间
2.6 dram物理地址到逻辑地址的映射
2.7 内存优化操作
2.7.1 建议
2.7.2 展开循环
2.7.3 消除数据相关性
2.7.4 数据并行处理
2.7.5 优化引用数据结构
2.7.6 减小数据结构的尺寸
2.7.7 dram板块上的数据分布策略
2.7.8 规划数据流
2.7.9 按字节、双字与四字进行内存处理
2.7.10 数据对齐
2.7.11 内存访问与计算的组合
2.7.12 读写操作的组合
2.7.13 只在必要时才访问内存
2.7.14 内置c内存处理函数的优化
2.7.15 内存处理函数的优化质量
2.7.16 c字符串库函数的优化
2.7.17 字符串处理函数的质量优化
2.7.18 块处理算法的优化
2.7.19 大型数组排序的优化
2.8 ram测试问题
第3章 高速缓存子系统
3.1 sram的工作原理
3.1.1 历史概况
3.1.2 内核
3.1.3 触发器的设计
3.1.4 逻辑非元件(取反器)的设计
3.1.5 sram阵列的设计
3.1.6 封装接口的设计
3.1.7 读写时序图
3.1.8 静态存储器的类型
3.2 高速缓存的工作原理
3.2.1 起源
3.2.2 高速缓存的目标与任务
3.2.3 高速缓存的组织
3.3 高速缓存与存储器存取的优化
3.3.1 处理数据的尺寸对性能的影响
3.3.2 可执行代码的尺寸对性能的影响
3.3.3 数据对齐效率
3.3.4 数据在高速缓存板块上的分布
3.3.5 使用有限联合数目的高速缓存
3.3.6 维数组的处理
3.3.7 写缓冲机制的详细说明
3.3.8 新一代x86处理器的高速缓存管理
3.3.9 预取机制的实际应用
3.3.10 内存拷贝内幕或者pentiumⅲ与pentium4的新命令
第4章 机器优化
4.1 c/c++编译器的比较分析
4.1.1 常量表达式
4.1.2 代数表达式
4.1.3 算术运算
4.1.4 分支语句
4.1.5 switch运算符
4.1.6 循环
4.1.7 函数调用
4.1.8 变量分布
4.1.9 字符串初始化
4.1.10 死码
4.1.11 常量条件
4.1.12 确定优胜者
4.2 汇编器与编译器的对决
4.2.1 历史回顾--汇编语言使春天永驻
4.2.2 评价机器优化质量的指标
4.2.3 评价机器优化质量的方法
4.2.4 对主要编译器进行比较分析
4.2.5 测试结果的讨论
4.2.6 机器优化质量的示例
4.2.7 用汇编语言创建保护代码
4.2.8 用汇编语言编程是一种创造性活动
4.2.9 结束语
4.2.10 源代码
《东线:决战第聂伯河》内容简介:《东线》系列丛书,由有名军事作家朱世巍先生撰写。它全面而详细地讲述了二战中苏德战争的整个过
《JVM G1源码分析和调优》内容简介:G1是目前最成熟的垃圾回收器,已经广泛应用在众多公司的生产环境中。我们知道,CMS作为使用最为
《Webpack+Babel入门与实例详解》内容简介:这是一本针对零基础前端开发者讲解Webpack与Babel使用方法的图书。随着前端工程的不断发
分批优化调试及差分进化算法 本书特色 本书考虑实际生产系统中存在的订单批量性,介绍差分进化算法在分批优化调度问题中的应用,系统介绍基于差分进化算法的并行机、流水...
Y染色体由于其单倍体特性和群体特异性分布,成为分子人类学研究最有力的工具。利用Y染色体可以很好地解析种族的起源、民族的分化
《Boost程序库完全开发指南:深入C++"准"标准库》内容简介:Boost是一个功能强大、构造精巧、跨平台、开源并且完全免费的C++程序库
本书是编程语言先驱者IvorHorton的经典之作,是C语言方面最畅销的图书品种之一。本书集综合性、实用性为一体,是学习C语言的优秀
Thisbestsellingtextoncarryingoutresearchinrealworldsituationshasbeenthoroughlyre...
《长问西东》内容简介:本书为刘东先生对中西文化进行长期比较思考的结晶。书名“长问西东”从清华校歌“无问西东”中来。作者深入
《企业经营沙盘推演》内容简介:本书以作者自主开发的“ERP沙盘辅助教学系统”为基础平台,系统地阐述了如何通过沙盘推演来虚拟仿真
《中国基督教史纲》内容简介:《中国基督教史纲》是我国学者所撰的部也是影响优选的中国基督教通史或全史著作。《中国基督教史纲》
《基于供应链视角的食品质量安全管控体系的研究》内容简介:本书简要介绍食品供应链研究综述、食品质量安全问题研究综述、食品质量
本书系统地阐述了人因工程学的基础理论、设计方法及应用分析。全书共12章,第1章为人因工程学总论,第2章至第5章为人的形态、生理
《西湖梦寻注评》内容简介:《西湖梦寻》记杭州历史掌故、绘西湖风俗画卷,是晚明小品圣手张岱代表作之一。本书作者对张岱《西湖梦
《儿童歌曲器乐演奏启蒙——贝司》内容简介:本书力争选用同一批曲目,使各分册既相对独立,又彼此关联。本书的亮点在于,每首曲目
《让移动设计更简单:Sketch3操作指南与实战详解》以Sketch的基本操作为基础,用一系列生动可行的教学案例,让初学者可以快速掌握
Originallypublishedin1985,NeilPostmansgroundbreakingpolemicaboutthecorrosiveeffe...
本书由畅销书《JavainaNutshell》的作者DavidFlanagan撰写,是公认的权威JavaScript程序员指南和参考手册。JavaScript是...
《漫画诺贝尔科学家:化学奖》内容简介:诺贝尔奖通常被认为是世界上所有颁奖领域内最重要的奖项。诺贝尔奖将人类引向了科学和未来
《网店应该这样推广》内容简介:《网店应该这样推广——淘宝店铺赚钱的秘密(第2版)》是一本系统地讲解关于如何进行网上店铺营销的