计算机三级 - 数据库技术 - 第十三章 大规模数据库架构 笔记
第十三章 大规模数据库架构
内容提要:
- 了解分布式数据库技术
- 了解并行数据库技术
- 了解云数据库技术
- 了解XML数据库技术
13.1 分布式数据库
-
分布式数据库的目标:【12个目标】
- 本地自治、非集中式管理、高可用性。(最基本特征)
- 位置独立性、数据分片独立性、数据复制独立性。(分布透明性)
- 分布式查询处理、分布式事务管理。(复杂性)
- 硬件独立性、操作系统独立性、网络独立性。
- 数据库管理系统独立。(总体体现)
-
数据分布策略:
- 数据分片:【对分片结果的操作】【考虑的是怎样从概念模型到逻辑模型的存储策略】
- 水平分片----每个分片是原始关系所有数据行的子集合
- 垂直分片----每个分片是原始关系所有数据列的子集合
- 导出分片----导出水平分片
- 混合分片----以上三种的混合
- 数据分配:【考虑的是怎样从逻辑模型到物理模型的映射】
- 解决数据分配的方法:
- 集中式----所有数据片断安排在一个场地上。
- 分割式----所有全局数据有且只有一份,分割成若干被分配在特定场地上的片断。
- 全复制式----全局数据有多个副本,每个场地上有一个完整的数据副本。
- 混合式----介于分割与全复制式之间。
- 解决数据分配的方法:
- 数据分片:【对分片结果的操作】【考虑的是怎样从概念模型到逻辑模型的存储策略】
-
分布式数据库的参考模式结构:
-
分布透明性:
- 分片透明性
- 位置透明性
- 局部数据模型透明性
-
分布式数据库管理系统:
-
分布式数据库的相关技术:
-
分布式查询:用户与分布式数库系统的接口。
- 分布式查询优化需考虑:
- 操作执行的顺序。
- 操作的执行算法(连接操作和并操作)
- 不同场地间的数据流动的顺序。
- 分布式查询优化需考虑:
-
分布式事务管理
- 主要包括:
- 恢复控制
- 基于两阶段的提交协议。
- 并发控制
- 基于封锁协议。
- 恢复控制
- 主要包括:
-
13. 2 并行数据库
-
并行数据库系统结构
实现并行DBMS的三种硬件结构:
-
共享内存系统
-
共享磁盘系统
-
无共享资源系统
-
层次结构
二. 数据划分与并行算法
- 一维数据划分:将大数据集水平划分到多个磁盘上,可以通过并行读写有效地利用多磁盘的I/O带宽。
- 轮转法
- 散列法----使用特定的哈希函数,作用于选定的属性,将记录划分到不同的处理机。
- 范围划分法
- 多维数据划分
- CMD多维划分法
- BERD多维划分法
- MAGIC多维划分法
- 并行算法:
- 并行排序
- 并行连接
- 划分连接
- 分片--复制连接
- 其他的关系操作:
- 选择
- 消除重复
- 投影
- 聚集
13. 3 云计算数据库架构
云计算的服务类型:
将基础设施作为服务 将平台作为服务 将基础设施作为服务 |
- 云:即云计算提供商的数据中心的软硬件设施
- 云分为:
- 公共云:以即用即付的方式提供给公众。
- 私有云:不对公众开放的云。
- 混合云
- 云数据库与传统数据库比较:
云数据库的缺点:
- 数据安全问题
- 对云的管理问题
- 对因特网的依赖
13. 4 XML数据库
- XML数据库概述:
- XML ----可扩展标识语言。
- XML数据库----支持对XML文档格进行存储和查询等操作的数据库管理系统
- 三种类型的XML数据库:
- XEDB----能处理XML的数据
- NXD----纯XML数据库
- HXD----混合XML数据库
- 与传统数据库比较,XML数据库的优势:
- 能够对半结构化数据进行处理。
- 提供对标签和路径的操作。
- 能清晰地表达数据的层次特征。
其余章节进我主页进行查看