网站运维工作,一向以内容繁杂、覆盖面广著称。《网站运维技术与实践》选取日常工作涉及的监测调优、日志分析、集群规划、自动化部署、存储和数据库等方面,力图深入阐述各项工作的技术要点及协议原理,并介绍相关开源产品的实践经验。在技术之外,作者也分享了一些关于高效工作及个人成长方面的心得。
《网站运维技术与实践》适合Linux 系统管理员、中大型网站运维工程师及技术负责人、DevOps 爱好者阅读。同时也适于刚踏上或有兴趣踏上运维岗位的年轻朋友,了解运维职业的工作和发展。
第1章 服务器监测 1
1.1 理解监测的意义 1
1.2 通过命令了解系统的性能概况 2
1.2.1 ifconfig 2
1.2.2 w 3
1.2.3 df 4
1.2.4 ps 6
1.2.5 vmstat 8
1.2.6 netstat 8
1.2.7 iostat 9
1.3 其他常用工具 13
1.3.1 sar 13
1.3.2 dstat 14
1.3.3 mtr 17
1.3.4 IPtraf 18
1.3.5 TcpDump 19
1.3.6 Wireshark 22
1.3.7 strace 23
1.3.8 stap 24
1.4 SmokePing 网络质量监测 34
1.4.1 原理 35
1.4.2 配置说明 37
1.4.3 报警 39
1.4.4 WebUI 40
1.5 Nagios 分布式监测 41
1.5.1 架构原理 42
1.5.2 Plugin 编写 45
1.5.3 SNMP 网络监控 46
1.5.4 Gearman 分布式 50
1.5.5 OMD 介绍 55
第2章 产品访问监测 57
2.1 关注产品比服务器更重要 57
2.2 网站监测的明星指标 58
2.2.1 可用性 58
2.2.2 响应时间 59
2.2.3 首屏响应时间 59
2.3 网页浏览过程简介 60
2.3.1 解析域名 60
2.3.2 连接服务器 61
2.3.3 发送请求 61
2.3.4 等待响应 63
2.3.5 传输响应内容 63
2.3.6 浏览器渲染处理 64
2.3.7 并发请求 64
2.4 浏览器网络监测与分析 65
2.4.1 Firebug 65
2.4.2 Chrome 开发人员工具 65
2.4.3 HttpWatch 66
2.4.4 rvictl 接口监控IOS 设备 67
2.4.5 HAR 格式 68
2.5 第三方监测 72
2.5.1 基调网络 72
2.5.2 监控宝 91
2.6 简单定制JS 监测 92
2.6.1 页面内嵌JS 92
2.6.2 Nginx 日志记录和存储 93
2.6.3 数据展示 96
2.7 Boomerang 96
第3章 数据采集、传输与过滤 100
3.1 采集点的取舍 100
3.1.1 服务器数据 100
3.1.2 访问日志 101
3.1.3 系统日志Syslog 102
3.2 收集传输 107
3.2.1 Rsyslog 107
3.2.2 message queue 115
3.2.3 RPC 118
3.2.4 Gearman 119
3.3 日志收集系统框架 122
3.3.1 Flume-ng 122
3.3.2 logstash 125
第4章 数据分析与报警 136
4.1 时间序列存储 136
4.1.1 RRDtool(Round-Robin Database Tool) 136
4.1.2 Graphite 141
4.1.3 OpenTSDB 143
4.2 全文搜索引擎ElasticSearch 144
4.2.1 简介 144
4.2.2 安装 145
4.2.3 集群 145
4.2.4 基础查询 146
4.2.5 优化 148
4.2.6 时间序列统计示例 152
4.3 数据可视化 156
4.3.1 RRDtool 156
4.3.2 Gnuplot 160
4.3.3 AmCharts 167
4.3.4 其他绘图库 176
4.4 报警 177
4.4.1 SendEmail 177
4.4.2 WebSocket 178
4.4.3 手机推送 182
4.4.4 分级和归并 183
第5章 测试评估 185
5.1 服务器性能测试 185
5.1.1 IOzone 186
5.1.2 Netperf 189
5.1.3 pktgen 193
5.1.4 sysbench 194
5.2 应用性能测试 197
5.2.1 http_load 197
5.2.2 AB 198
5.2.3 weighttp 201
5.3 分布式测试环境 202
5.3.1 AutoBench 202
5.3.2 TCPCopy 205
第6章 集群架构规划 207
6.1 IDC 的规划和选择 207
6.1.1 网站性质决定基础面 207
6.1.2 IDC 厂商服务质量 208
6.1.3 BGP 真伪的验证 209
6.2 CDN 规划 213
6.2.1 CDN 原理 213
6.2.2 DNS 原理 214
6.2.3 DNS 查询结构实现 217
6.2.4 DNS 调度 223
6.2.5 其他调度方法概述 227
6.2.6 动态加速概述 229
6.3 缓存设计 236
6.3.1 HTTP Header 对缓存的影响 236
6.3.2 Squid 的LM-factor 过期算法 239
6.3.3 squid 的ACL 控制 241
6.3.4 Squid 的aufs/coss缓存引擎 243
6.3.5 squidclient 的运用 245
6.3.6 使用SSD 提高性能 250
6.4 本地负载均衡 255
6.4.1 LVS 负载均衡原理 255
6.4.2 keepalived 与VRRP 高可用原理 263
6.4.3 Nginx 的upstream 268
6.4.4 squid 的cache_peer 272
第7章 弹性控制和部署 274
7.1 配置集成的思想 274
7.1.1 抽象的集群管理 274
7.1.2 通用模式设计 275
7.2 操作系统部署KickStart 276
7.2.1 基本原理 277
7.2.2 配置安装 278
7.3 应用部署与配置管理 279
7.3.1 SSH::Batch 279
7.3.2 Puppet 282
7.4 搭建私有软件仓库 312
7.4.1 使用spec 文件构建RPM 包 312
7.4.2 命令行打包工具FPM 322
7.4.3 yum 私有仓库 324
7.5 随时控制成本 324
7.5.1 CGroup 配置简介 324
7.5.2 内存限制 328
7.5.3 CPU 共享限制 330
7.5.4 CPU 绑定限制 331
7.5.5 块设备读写限制 333
7.5.6 配合TC 完成网络限速 335
7.6 关于云计算 337
第8章 分布式文件系统 339
8.1 NFS 339
8.1.1 原理 340
8.1.2 服务器端配置和优缺点 341
8.1.3 客户端参数优化 343
8.1.4 丢包与网络参数优化 346
8.2 简单易用的FUSE 协议 348
8.3 MogileFS 351
8.3.1 GFS 介绍 351
8.3.2 MogileFS 介绍 353
8.3.3 MogileFS 内部原理 356
8.3.4 安装和配置 359
8.3.5 客户端配置和使用 363
第9章 数据库 368
9.1 MySQL 必知必会 368
9.1.1 常见SQL 369
9.1.2 导入导出 370
9.1.3 简单配置调优 371
9.2 慢查询分析工具mysqlsla 372
9.2.1 使用 372
9.2.2 结果分析 373
9.3 Percona 工具集 374
9.3.1 备份恢复工具XtraBackup 374
9.3.2 在线运维工具箱Toolkit 376
9.3.3 监控插件集 379
9.4 监控工具 380
9.4.1 mytop 和innotop 380
9.4.2 orzdba 381
9.5 MySQL 集群 384
9.5.1 MySQL 复制原理 384
9.5.2 MHA 原理 386
9.5.3 MHA 安装使用 388
第10章 备份与同步技术 390
10.1 rsync 390
10.1.1 原理 391
10.1.2 常见运用 393
10.2 inotify 和sersync 工具 396
10.2.1 inotify 概述和示例 396
10.2.2 sersync 介绍 397
10.2.3 sersync 配置用例 398
10.3 Netcat 400
10.3.1 文件传输 400
10.3.2 端口扫描 401
10.3.3 远程控制 401
10.4 P2P 传输网络 402
10.4.1 P2P 协议概述 403
10.4.2 BitTorrent 概述 405
10.4.3 murder 部署和运用 406
第11章 运维制度化与自管理 408
11.1 运维制度化 408
11.1.1 运维为什么要制度化 408
11.1.2 运维如何制度化 409
11.1.3 SLA(Service Level Agreement)协议 409
11.1.4 故障处理的五问法 410
11.1.5 知识库 413
11.1.6 流程跟踪的Tracker系统 425
11.2 自管理 431
11.2.1 时间管理 431
11.2.2 思维导图 433
11.2.3 Git 管理和应用 434
11.2.4 交流与活动 445
《苏青散文》内容简介:本书是民国才女苏青散文精选集。内容分两辑,第一辑收入叙写生活的散文,第二辑是关于家庭、工作、女子道德
《失控的真相》内容简介:在信息泛滥的时代,知识变得无处不在。鼠标轻轻一点,我们就坐拥一座巨型图书馆。然而,我们并没有因此就
《AI 新生》内容简介:从比尔·盖茨、埃隆·马斯克到霍金,众多企业家和科学家都曾表示担心AI对人类生存造成的威胁。真的有一天,人
《现代骨科疾病临床诊治与研究进展》内容简介:本书将目前国内外最新的概念、学说、理论、观点、成果和技术融入其中,系统阐述了骨
《信号与系统辅导与题解(与美国MIT麻省理工本科教材配套)》是奥本海姆教授主编的、电子工业出版社引进出版的《信号与系统》(第2
“设计师能否满足房主的需求,设计出好住有好看的家?”“如何运用家居设计,让日常生活更方便?”“照片里那种好看的家,真的可
数据库云平台理论与实践 本书特色数据库云平台是当今乃至今后一段时期信息化领域普遍关注的一个热点领域。云技术的本质是分布式计算,而数据库云平台揭示的正是分布式计算...
《城乡中国(下)》内容简介:《城乡中国》是著名经济学家周其仁关于中国城镇化这一焦点问题的鼎力之作。周其仁《城乡中国》与费孝
蜜蜂病虫害防治 内容简介 本书由中国农业科学陆军蜜蜂研究所冯峰研究员等编著。内容包括:蜜蜂的种类、形态、发育阶段和生物学特性,蜜蜂疾病的发生、诊断和防治,蜜蜂的...
ArcSWAT 2009用户指南 本书特色 温切尔编著的《ArcSWAT2009用户指南》内容介绍:SWAT作为一个在非点源污染模拟领域的同际性模型已持续30多...
《激光熔覆再制造零件的超声检测》内容简介:本书以激光熔覆再制造零件(包含涂层及毛坯)为对象,对影响其服役性能和服役寿命的缺
《认知设计意味着商机》(英文原名为:Realize:DesignMeansBusiness,以下简称《认知》)是由美国工业设计师协会出版,共收集了
《USB应用分析精粹:从设备硬件、固件到主机端程序设计》内容简介:本书结合实例,从底层电平标准、令牌、事务、传输、请求到应用各
本书以Spring应用程序开发为中心,全面讲解如何运用SpringBoot提高效率,使应用程序的开发和管理更加轻松有趣。作者行文亲切流畅
《国际平面设计基础教程6:PRINT&FINISH印前印后》的每一个章节都主要讨论各种各样的印刷工艺和后期加工工艺。同时,章节中尽可能
监控与数据采集(SCADA)系统及其应用(第2版) 本书特色 SCADA系统的应用领域极其广泛,而不同应用领域的特点和监控要求又导致SCADA系统解决方案的多样...
家庭电脑应用宝典 内容简介 本书由具有丰富教学与实践经验的微软认证专家编写,全面细致地介绍了微软*新操作系统Windows Vista在家庭应用方面的使用方法与...
《销售冠军是如何炼成的》内容简介:销售既是一份充满挑战的工作, 更是一项伟大而光荣的事业! 茫茫人海,你要寻找的精准客户在哪
《网络与科技(全彩)》介绍:网络是一把双刃剑,它不仅给人类的生活带来了诸多便利,而且也给人类带来了各种安全隐患。在这《网络
《基于理解的学校教育》内容简介:本书从人类社会的发展与教育的发展出发,提出了21世纪基础教育的特征是“基于理解的教育”,并从