如今,我们要面对和使用的数据正在变得越来越庞大和复杂。如果说数据是新的石油。那么数据库就是油田、炼油厂、钻井和油泵。作为一名现代的软件开发者,我们需要了解数据管理的新领域,既包括rdbms,也包括nosql。
《七周七数据库》遵循《七周七语言》的写作风格和体例,带领你学习和了解当令最热门的开源数据库。在简单的介绍之后,本书分章介绍了7种数据库。这些数据库分别属于5种不同的数据库风格,但每种数据库都有自己保存数据和看待世界的方式。它们依次是postgresql、riak、apache hbase、mongodb、apache couchdb、neo4j和redis。本书将深入每一种数据库,介绍它们的优势和不足,以及如何选取一种最符合你的应用需求的数据库。
《七周七数据库》适合数据库架构师、数据库管理员,以及想要了解和学习各种nosql数据库技术的程序员阅读。本书将帮助读者了解、选择和应用这些数据库,从而更好地发挥日益增长的大数据的能力。
《七周七数据库》适用于数据库架构师、想要学习nosql数据库技术的程序员、数据库管理员。
第1章 概述 1
1.1 从一个问题开始 1
1.2 风格 2
1.2.1 关系数据库 3
1.2.2 键-值数据库 3
1.2.3 列型数据库 4
1.2.4 文档型数据库 5
1.2.5 图数据库 5
1.2.6 混合使用多种数据库 6
1.3 前进和提升 6
第2章 postgresql 7
2.1 这就是post-gres-q-l 7
2.2 第1天:关系、crud和联接 8
2.2.1 从sql开始 10
2.2.2 使用表 10
2.2.3 使用联接的查询 13
2.2.4 外联接 15
2.2.5 使用索引快速查找 16
2.2.6 第1天总结 18
.2.2.7 第1天作业 18
2.3 第2天:高级查询、代码和规则 19
2.3.1 聚合函数 19
2.3.2 分组 20
2.3.3 窗口函数 21
2.3.4 事务 22
2.3.5 存储过程 24
2.3.6 触发器 26
2.3.7 视图 27
2.3.8 规则是什么 28
2.3.9 联表分析 30
2.3.10 第2天总结 32
2.4 第3天:全文检索和多维查询 32
2.4.1 模糊搜索 34
2.4.2 sql标准的字符串匹配 34
2.4.3 字符串相似比较算法 levenshtein 35
2.4.4 三连词 36
2.4.5 全文检索 37
2.4.6 组合使用字符串匹配方法 42
2.4.7 把电影风格表示成多维超立方体 42
2.4.8 第3天总结 45
2.5 总结 46
2.5.1 postgresql的优点 46
2.5.2 postgresql的缺点 47
2.5.3 结束语 47
第3章 riak 48
3.1 riak喜欢web 48
3.2 第1天:crud、链接和mime 49
3.2.1 rest是最棒的(或用curl时) 51
3.2.2 将值放于桶中 52
3.2.3 链接 54
3.2.4 riak的mime类型 58
3.2.5 第1天总结 58
3.3 第2天:mapreduce和服务器集群 59
3.3.1 填充脚本 59
3.3.2 mapreduce介绍 60
3.3.3 riak中的mapreduce 63
3.3.4 关于一致性和持久性 69
3.3.5 第2天总结 75
3.4 第3天:解决冲突和扩展riak 76
3.4.1 以向量时钟解决冲突 76
3.4.2 扩展riak 83
3.4.3 第3天总结 87
3.5 总结 87
3.5.1 riak的优点 88
3.5.2 riak的缺点 88
3.5.3 riak之于cap 88
3.5.4 结束语 89
第4章 hbase 90
4.1 介绍hbase 91
4.2 第1天:crud和表管理 91
4.2.1 配置hbase 92
4.2.2 hbase的shell 93
4.2.3 创建表 93
4.2.4 插入、更新和读取数据 95
4.2.5 修改表 96
4.2.6 通过编程方式添加数据 99
4.2.7 第1天总结 100
4.3 第2天:处理大数据 101
4.3.1 导入数据,调用脚本 101
4.3.2 流式xml 102
4.3.3 流式维基百科 103
4.3.4 压缩和bloom过滤器 105
4.3.5 开始 106
4.3.6 区域和监控磁盘使用简介 107
4.3.7 区域的问讯 108
4.3.8 扫描一个表来建立另一个表 111
4.3.9 构建扫描程序 112
4.3.10 运行脚本 114
4.3.11 检查输出 114
4.3.12 第2天总结 116
4.4 第3天:放入云端 117
4.4.1 开发thrift协议的hbase应用 117
4.4.2 whirr简介 121
4.4.3 设置ec2 121
4.4.4 准备whirr 122
4.4.5 配置集群 122
4.4.6 启动集群 123
4.4.7 连接集群 124
4.4.8 销毁集群 125
4.4.9 第3天总结 125
4.5 总结 126
4.5.1 hbase的优点 126
4.5.2 hbase的缺点 127
4.5.3 hbase on cap 127
4.5.4 结束语 128
第5章 mongodb 129
5.1 其大无比 129
5.2 第1天:crud和嵌套 130
5.2.1 命令行的乐趣 131
5.2.2 mongo的更多有趣内容 134
5.2.3 深入挖掘 136
5.2.4 更新 140
5.2.5 引用 142
5.2.6 删除 143
5.2.7 用代码来读取 144
5.2.8 第1天总结 145
5.3 第2天:索引、分组和mapreduce 146
5.3.1 索引:如果还不够快 146
5.3.2 聚合查询 150
5.3.3 服务器端命令 152
5.3.4 mapreduce(以及finalize) 155
5.3.5 第2天总结 159
5.4 第3天:副本集、分片、地理空间和gridfs 159
5.4.1 副本集 159
5.4.2 偶数节点的问题 162
5.4.3 分片 163
5.4.4 地理空间查询 165
5.4.5 gridfs 167
5.4.6 第3天总结 168
5.5 总结 168
5.5.1 mongo的优点 168
5.5.2 mongo的缺点 169
5.5.3 结束语 169
第6章 couchdb 170
6.1 在沙发上放松 170
6.2 第1天:crud、futon与curl redux 171
6.2.1 享受futon 171
6.2.2 用curl执行基于rest的crud操作 175
6.2.3 用get读取文档 175
6.2.4 用post新建文档 176
6.2.5 用put更新文档 177
6.2.6 用delete移除文档 178
6.2.7 第1天总结 178
6.3 第2天:创建/查询视图 179
6.3.1 通过视图访问文档 179
6.3.2 编写你的第一个视图 181
6.3.3 将视图另存为“设计文档” 183
6.3.4 由name查找artists 184
6.3.5 由name查找albums 184
6.3.6 查询自定义的artist与album视图 185
6.3.7 使用ruby将数据导入couchdb 187
6.3.8 第2天总结 192
6.4 第3天:进阶视图、changes api以及复制数据 192
6.4.1 用规约器创建进阶视图 193
6.4.2 规约器调用详解 195
6.4.3 监控couchdb的变化 196
6.4.4 连续监控变化 201
6.4.5 在couchdb中复制数据 204
6.4.6 第3天总结 208
6.5 总结 209
6.5.1 couchdb的优点 209
6.5.2 couchdb的缺点 209
6.5.3 结束语 209
第7章 neo4j 211
7.1 neo4j,白板友好的数据库 211
7.2 第1天:图、groovy和crud 212
7.2.1 neo4j之web接口 213
7.2.2 通过gremlin操作neo4j 215
7.2.3 pipe的威力 218
7.2.4 pipeline与顶点 221
7.2.5 无模式的社会性数据 221
7.2.6 垫脚石 223
7.2.7 引入groovy 225
7.2.8 特定领域的步骤 227
7.2.9 更新、删除与完成 229
7.2.10 第1天总结 230
7.3 第2天:rest、索引与算法 230
7.3.1 引入rest 230
7.3.2 用rest新建节点与关系 231
7.3.3 查找路径 232
7.3.4 索引 233
7.3.5 rest与gremlin 235
7.3.6 大数据 235
7.3.7 功能全面的算法 237
7.3.8 第2天总结 242
7.4 第3天:分布式高可用性 243
7.4.1 事务 243
7.4.2 高可用性 244
7.4.3 ha集群 245
7.4.4 备份 250
7.4.5 第3天总结 251
7.5 总结 251
7.5.1 neo4j的优点 251
7.5.2 neo4j的缺点 252
7.5.3 neo4j之于cap 252
7.5.4 结束语 252
第8章 redis 254
8.1 数据结构服务器存储库 254
8.2 第1天:crud与数据类型 255
8.2.1 入门指南 255
8.2.2 事务 257
8.2.3 复杂数据类型 258
8.2.4 到期 265
8.2.5 数据库命名空间 266
8.2.6 更多命令 267
8.3 第2天:高级用法、分布 268
8.3.1 一个简单的接口 268
8.3.2 服务器信息 271
8.3.3 redis配置 272
8.3.4 aof(append only file) 274
8.3.5 主从复制 276
8.3.6 数据转储 277
8.3.7 redis集群 279
8.3.8 bloom过滤器 280
8.3.9 setbit和getbit 282
8.3.10 第2天总结 283
8.4 第3天:与其他数据库合作 284
8.4.1 多持久并存服务 284
8.4.2 数据填充 285
8.4.3 关系存储 291
8.4.4 服务 293
8.4.5 第3天总结 296
8.5 总结 297
8.5.1 redis的优点 297
8.5.2 redis的缺点 297
8.5.3 结束语 298
第9章 结束语 299
9.1 类型终极版 299
9.1.1 关系型 299
9.1.2 键-值存储库 300
9.1.3 列型 301
9.1.4 文档型 301
9.1.5 图 302
9.2 选择 303
9.3 我们将走向哪里 303
附录a 数据库概述表 305
附录b cap定理 307
《无线通信原理与应用(第2版)(英文版)》是无线通信课程的权威教材,面向那些已经熟悉诸如概率论、通信原理和基本电磁学等技术概念
《我国城市化进程中新二元结构问题研究》内容简介:“新二元结构”是在我国城市化进程中城乡二元结构的特殊表现形式。“新二元结构
吴伟定,网名Windear,首届中文搜索引擎优化(SEO)大赛三等奖得主,擅长于品牌操作以及各种网络营销手段。现任中赫技术投资控股有
《WCDMA无线网络规划与优化》围绕WCDMA移动通信系统中的各种网络规划和优化技术和方法,结合作者多年的研究成果,并在参考大量国
《大话社交网络》内容简介:本书是一本关于社交网络的幽默科普读物,它使用大量的漫画、故事、笑话、网络流行语、相声小品台词等生
儿童数码照片处理与设计宝典 本书特色 《儿童数码照片处理与设计宝典》编辑推荐:光盘中素材文件夹收录了24个生肖模板,24个星座模板,44套英文字体,以及25张精...
这本有趣而通俗易懂的著作包括了24篇短文,共分6个主题,每个主题下有4篇文章。这些主题涵盖了一些重要的遗传学话题——每一个都
这本乔布斯唯一授权的官方传记,在2011年上半年由美国出版商西蒙舒斯特对外发布出版消息以来,备受全球媒体和业界瞩目,这本书的
《商业智能原理、技术及应用》内容简介:本书全面、系统地介绍了商业智能的理论、核心技术知识以及应用。全书分3篇,共13章。第1~
《大明帝国》内容简介:本书是一部以《明史》为基础的历史小说,分为上、下两册。全面展现了大明帝国开国后波云诡谲、血雨腥风的历
《你有梦想,就有力量》内容简介:《你有梦想,就有力量——潘石屹给年轻人的十二堂人生经营课》从潘石屹公开发表的演讲和著述中选
中文版Photoshop CC标准教程(视频教学版)(附光盘) 本书特色 本书以实用、够用为原则,按照平面设计工作的实际需求组织内容。全书共17章,其中第1~1...
《PPT演示之道:写给非设计人员的幻灯片指南(全彩)》从设计原则和思路出发,帮助读者掌握制作PPT的精髓,并在其中穿插了实用的功能
WiththisdigitalEarlyReleaseeditionofHeadFirstAndroidDevelopment,yougettheentireb...
《新时代改革方法论研究》内容简介:该书包括以下几个个部分的内容。第一部分主要总结改革开放的重大意义,第二部分回顾改革方法论
ErnestW.Adams是一名美国游戏设计顾问,现定居于英国。除顾问工作外,他还开办游戏设计研讨班,并在各种会议和大学中发表演讲,广
可信计算技术原理与应用 本书特色 在本书中可信计算是指系统提供的计算行为能够满足需求者对计算的期望,并且系统具有能够证明其计算可信性的能力。综合来看,可信计算平...
《一家人的极简生活》内容简介:本书是一本极简主义者分享生活方式的生活类图书。素晴社编辑部将21位Instagram极简生活类博主的日常
《分配正义新论:人道与公平》内容简介:当今的分配正义理论主要是义务论的。这种义务论分配正义理论一方面或多或少受到康德伦理思
《英美学者对中国外交研究的信息源分析》内容简介:“一带一路”战略的推进需要世界各国对中国外交战略信息的充分获取和理解,需要