如今,我们要面对和使用的数据正在变得越来越庞大和复杂。如果说数据是新的石油。那么数据库就是油田、炼油厂、钻井和油泵。作为一名现代的软件开发者,我们需要了解数据管理的新领域,既包括rdbms,也包括nosql。
《七周七数据库》遵循《七周七语言》的写作风格和体例,带领你学习和了解当令最热门的开源数据库。在简单的介绍之后,本书分章介绍了7种数据库。这些数据库分别属于5种不同的数据库风格,但每种数据库都有自己保存数据和看待世界的方式。它们依次是postgresql、riak、apache hbase、mongodb、apache couchdb、neo4j和redis。本书将深入每一种数据库,介绍它们的优势和不足,以及如何选取一种最符合你的应用需求的数据库。
《七周七数据库》适合数据库架构师、数据库管理员,以及想要了解和学习各种nosql数据库技术的程序员阅读。本书将帮助读者了解、选择和应用这些数据库,从而更好地发挥日益增长的大数据的能力。
《七周七数据库》适用于数据库架构师、想要学习nosql数据库技术的程序员、数据库管理员。
第1章 概述 1
1.1 从一个问题开始 1
1.2 风格 2
1.2.1 关系数据库 3
1.2.2 键-值数据库 3
1.2.3 列型数据库 4
1.2.4 文档型数据库 5
1.2.5 图数据库 5
1.2.6 混合使用多种数据库 6
1.3 前进和提升 6
第2章 postgresql 7
2.1 这就是post-gres-q-l 7
2.2 第1天:关系、crud和联接 8
2.2.1 从sql开始 10
2.2.2 使用表 10
2.2.3 使用联接的查询 13
2.2.4 外联接 15
2.2.5 使用索引快速查找 16
2.2.6 第1天总结 18
.2.2.7 第1天作业 18
2.3 第2天:高级查询、代码和规则 19
2.3.1 聚合函数 19
2.3.2 分组 20
2.3.3 窗口函数 21
2.3.4 事务 22
2.3.5 存储过程 24
2.3.6 触发器 26
2.3.7 视图 27
2.3.8 规则是什么 28
2.3.9 联表分析 30
2.3.10 第2天总结 32
2.4 第3天:全文检索和多维查询 32
2.4.1 模糊搜索 34
2.4.2 sql标准的字符串匹配 34
2.4.3 字符串相似比较算法 levenshtein 35
2.4.4 三连词 36
2.4.5 全文检索 37
2.4.6 组合使用字符串匹配方法 42
2.4.7 把电影风格表示成多维超立方体 42
2.4.8 第3天总结 45
2.5 总结 46
2.5.1 postgresql的优点 46
2.5.2 postgresql的缺点 47
2.5.3 结束语 47
第3章 riak 48
3.1 riak喜欢web 48
3.2 第1天:crud、链接和mime 49
3.2.1 rest是最棒的(或用curl时) 51
3.2.2 将值放于桶中 52
3.2.3 链接 54
3.2.4 riak的mime类型 58
3.2.5 第1天总结 58
3.3 第2天:mapreduce和服务器集群 59
3.3.1 填充脚本 59
3.3.2 mapreduce介绍 60
3.3.3 riak中的mapreduce 63
3.3.4 关于一致性和持久性 69
3.3.5 第2天总结 75
3.4 第3天:解决冲突和扩展riak 76
3.4.1 以向量时钟解决冲突 76
3.4.2 扩展riak 83
3.4.3 第3天总结 87
3.5 总结 87
3.5.1 riak的优点 88
3.5.2 riak的缺点 88
3.5.3 riak之于cap 88
3.5.4 结束语 89
第4章 hbase 90
4.1 介绍hbase 91
4.2 第1天:crud和表管理 91
4.2.1 配置hbase 92
4.2.2 hbase的shell 93
4.2.3 创建表 93
4.2.4 插入、更新和读取数据 95
4.2.5 修改表 96
4.2.6 通过编程方式添加数据 99
4.2.7 第1天总结 100
4.3 第2天:处理大数据 101
4.3.1 导入数据,调用脚本 101
4.3.2 流式xml 102
4.3.3 流式维基百科 103
4.3.4 压缩和bloom过滤器 105
4.3.5 开始 106
4.3.6 区域和监控磁盘使用简介 107
4.3.7 区域的问讯 108
4.3.8 扫描一个表来建立另一个表 111
4.3.9 构建扫描程序 112
4.3.10 运行脚本 114
4.3.11 检查输出 114
4.3.12 第2天总结 116
4.4 第3天:放入云端 117
4.4.1 开发thrift协议的hbase应用 117
4.4.2 whirr简介 121
4.4.3 设置ec2 121
4.4.4 准备whirr 122
4.4.5 配置集群 122
4.4.6 启动集群 123
4.4.7 连接集群 124
4.4.8 销毁集群 125
4.4.9 第3天总结 125
4.5 总结 126
4.5.1 hbase的优点 126
4.5.2 hbase的缺点 127
4.5.3 hbase on cap 127
4.5.4 结束语 128
第5章 mongodb 129
5.1 其大无比 129
5.2 第1天:crud和嵌套 130
5.2.1 命令行的乐趣 131
5.2.2 mongo的更多有趣内容 134
5.2.3 深入挖掘 136
5.2.4 更新 140
5.2.5 引用 142
5.2.6 删除 143
5.2.7 用代码来读取 144
5.2.8 第1天总结 145
5.3 第2天:索引、分组和mapreduce 146
5.3.1 索引:如果还不够快 146
5.3.2 聚合查询 150
5.3.3 服务器端命令 152
5.3.4 mapreduce(以及finalize) 155
5.3.5 第2天总结 159
5.4 第3天:副本集、分片、地理空间和gridfs 159
5.4.1 副本集 159
5.4.2 偶数节点的问题 162
5.4.3 分片 163
5.4.4 地理空间查询 165
5.4.5 gridfs 167
5.4.6 第3天总结 168
5.5 总结 168
5.5.1 mongo的优点 168
5.5.2 mongo的缺点 169
5.5.3 结束语 169
第6章 couchdb 170
6.1 在沙发上放松 170
6.2 第1天:crud、futon与curl redux 171
6.2.1 享受futon 171
6.2.2 用curl执行基于rest的crud操作 175
6.2.3 用get读取文档 175
6.2.4 用post新建文档 176
6.2.5 用put更新文档 177
6.2.6 用delete移除文档 178
6.2.7 第1天总结 178
6.3 第2天:创建/查询视图 179
6.3.1 通过视图访问文档 179
6.3.2 编写你的第一个视图 181
6.3.3 将视图另存为“设计文档” 183
6.3.4 由name查找artists 184
6.3.5 由name查找albums 184
6.3.6 查询自定义的artist与album视图 185
6.3.7 使用ruby将数据导入couchdb 187
6.3.8 第2天总结 192
6.4 第3天:进阶视图、changes api以及复制数据 192
6.4.1 用规约器创建进阶视图 193
6.4.2 规约器调用详解 195
6.4.3 监控couchdb的变化 196
6.4.4 连续监控变化 201
6.4.5 在couchdb中复制数据 204
6.4.6 第3天总结 208
6.5 总结 209
6.5.1 couchdb的优点 209
6.5.2 couchdb的缺点 209
6.5.3 结束语 209
第7章 neo4j 211
7.1 neo4j,白板友好的数据库 211
7.2 第1天:图、groovy和crud 212
7.2.1 neo4j之web接口 213
7.2.2 通过gremlin操作neo4j 215
7.2.3 pipe的威力 218
7.2.4 pipeline与顶点 221
7.2.5 无模式的社会性数据 221
7.2.6 垫脚石 223
7.2.7 引入groovy 225
7.2.8 特定领域的步骤 227
7.2.9 更新、删除与完成 229
7.2.10 第1天总结 230
7.3 第2天:rest、索引与算法 230
7.3.1 引入rest 230
7.3.2 用rest新建节点与关系 231
7.3.3 查找路径 232
7.3.4 索引 233
7.3.5 rest与gremlin 235
7.3.6 大数据 235
7.3.7 功能全面的算法 237
7.3.8 第2天总结 242
7.4 第3天:分布式高可用性 243
7.4.1 事务 243
7.4.2 高可用性 244
7.4.3 ha集群 245
7.4.4 备份 250
7.4.5 第3天总结 251
7.5 总结 251
7.5.1 neo4j的优点 251
7.5.2 neo4j的缺点 252
7.5.3 neo4j之于cap 252
7.5.4 结束语 252
第8章 redis 254
8.1 数据结构服务器存储库 254
8.2 第1天:crud与数据类型 255
8.2.1 入门指南 255
8.2.2 事务 257
8.2.3 复杂数据类型 258
8.2.4 到期 265
8.2.5 数据库命名空间 266
8.2.6 更多命令 267
8.3 第2天:高级用法、分布 268
8.3.1 一个简单的接口 268
8.3.2 服务器信息 271
8.3.3 redis配置 272
8.3.4 aof(append only file) 274
8.3.5 主从复制 276
8.3.6 数据转储 277
8.3.7 redis集群 279
8.3.8 bloom过滤器 280
8.3.9 setbit和getbit 282
8.3.10 第2天总结 283
8.4 第3天:与其他数据库合作 284
8.4.1 多持久并存服务 284
8.4.2 数据填充 285
8.4.3 关系存储 291
8.4.4 服务 293
8.4.5 第3天总结 296
8.5 总结 297
8.5.1 redis的优点 297
8.5.2 redis的缺点 297
8.5.3 结束语 298
第9章 结束语 299
9.1 类型终极版 299
9.1.1 关系型 299
9.1.2 键-值存储库 300
9.1.3 列型 301
9.1.4 文档型 301
9.1.5 图 302
9.2 选择 303
9.3 我们将走向哪里 303
附录a 数据库概述表 305
附录b cap定理 307
《RubyonRails电子商务实战》全面讲解了使用RubyonRails创建产品级应用程序的过程。书中通过演示构建网上书店的全过程,先后介绍
佐藤可士和KashiwaSato,艺术指导,创意指导,1965年生于东京。1989年毕业于多摩艺术大学,毕业后进入日本知名广告公司“博报堂”
《国学基础》内容简介:本书所谓“国学”主要是指中华优秀传统文化,所谓“国学基础”主要是指中华优秀传统文化的思想基础,所谓“
《奥运中的科技之光》涉及体育科技的方方面面,包括时间与距离的检测,球的旋转与球在空气中的阻力与轨迹问题,跳水运动与身体旋
《时装设计元素:面料与设计》首先对时装面料史做了简单的介绍,然后描述了织物的设计过程,包括理论上的和一直持续到今天的有关织
《共情:好的亲子关系胜过一切教育》内容简介:近几年青少年心理问题呈现越来越严重的趋势,怎样教育出一个心理健康的孩子,成为每
《精益企业之现场管理实战(图解版)》内容简介:随着工业4.0时代的到来,以及“中国制造2025”行动计划的不断推进,许多企业开始更
《诗词中国(第九期)》内容简介:《诗词中国》由中华书局、中华诗词研究院共同主办,面向全社会公开出版发行。旨在“搜集当代最动
《软件项目估算》内容简介:本书主要讲解如何构建估算模型和验证估算模型的质量。本书分为3个部分,共13章。第一部分(第1~3章)介
MATLAB R2016a完全自学一本通-畅销升级版-附赠近150页超值电子书 本书特色 本书面向MATLAB的初中级读者,在介绍MATLAB R2016a集成...
本书收集了作者在试验心理学这一研究领域发表过的五篇最著名的论文以及其他若干论文。每篇旧论文后面都有作者的后记,回顾该文发
《人心红利2:突破流量瓶颈的增长方法论》内容简介:品牌大爆炸时代,消费品市场的老将们与大批国货新锐同台竞技,对消费者的争夺也
新编中文Flash 8实用教程-(第2版) 本书特色 《新编中文Flash8实用教程(第2版21世纪高等院校计算机基础教育规划教材)》由王环、李安宗编著,主要面...
本书系统地讨论了数字信号处理的基本原理、主要分析方法及相应的实践途径。书中前三章是数字信号处理的基础,其中包括了时间离散
《卫青(中华先贤人物故事汇)【中宣部2022年主题出版重点出版物】》内容简介:在古今中外的军事史上,卫青堪称不世出的天才。本书
《上市公司股价崩盘风险研究》内容简介:“股价崩盘风险”是近年来财务学研究的一个热点问题。资本市场的有效运行关系到一国经济、
大数据挖掘与分析在金融领域中的应用研究 内容简介 《大数据挖掘与分析在金融领域中的应用研究》阐述了大数据技术在金融领域的应用和发展现状,从大数据视角加以思考和探...
《OPNETModeler与网络仿真》旨在帮助读者在阅读软件帮助文件时,更方便快捷地使用OPNETModeler(下文将其简称为OPNET)。全书共分为
《快速开发:纪念版》内容简介:本书进度失控,几乎是每一个软件开发项目挥之不去的噩梦。如何从容赶急,如何通过正确的开发策略和
《VC++深入详解》主要从程序内部运行的机制和MFC程序的组织脉络入手,使读者在学习VC++编程知识时,既能够知其然,又能知其所以然