数据库知识总结
数据库知识点总结个人向。
目录
- 第一章 绪论
- 第二章 关系数据库
- 第三章 关系数据库标准语言SQL
- 第四章 数据库安全性
- 第五章 数据库完整性
- 第六章 关系数据理论
- 第七章 数据库设计
- 第十章 数据库恢复技术
- 第十一章 并发控制
第一章 绪论
数据(data): 描述事物的符号记录。
数据库(DataBase,DB): 数据库是长期存储在计算机内、有组织的、可共享的大量数据的集合。
数据库管理系统(DBMS): 数据库管理系统是位于用户与操作系统之间的一层数据管理软件。
数据库系统(DBS): 数据库系统是由数据库
、数据库管理系统(及开发工具)
、应用程序
和数据库管理员(DBA)
组成的存储、管理、处理和维护数据的系统。
数据库发展技术的发展阶段:
- 人工智能阶段
- 文件系统阶段
- 数据库系统阶段
数据库系统的特点:
- 数据结构化。
- 数据的共享性高,冗余度低且易扩充。
- 数据独立性高。
- 数据由数据库管理系统统一管理和控制。
数据模型的组成要素:数据结构、数据操作、数据的完整性约束条件。
- 数据结构:描述系统的静态特性,描述数据库的组成对象以及对象之间的关系。
- 数据操作:描述系统的动态特性,是对数据库中各种对象的实例所允许的操作的集合,其类型有查询和更新(增删改)。
- 数据的完整性约束条件:用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确,有效与相容。完整性约束条件是一组完整性规则的集合。
数据模型: 分为概念模型
,逻辑模型
,和物理模型
。
按照模型应用的不同目的,可以将模型分为两大类。
- 概念模型
- 逻辑模型和物理模型。
逻辑模型:
- 层次模型
- 网状模型
- 关系模型
实体: 客观存在并可相互区别的事物称为实体。
属性: 实体所具有的某一个特性称为实体。
码(key): 唯一标识实体的属性集称为码。
实体集: 同一类型实体的集合称为实体集。
联系: 实体之间的联系通常指的是不同实体集之间的联系。
实体直接的联系有:
- 一对一。
- 一对多。
- 多对多。
数据独立性:包括数据的物理独立性和逻辑独立性。
- 物理独立性:是指用户的应用程序与数据库中数据的物理存储是相互独立的。
- 逻辑独立性:是指用户的应用程序与数据库的逻辑结构是相互独立的。
关系代数的运算: 并、差、交。
数据库系统的三级模式结构
模式: 模式也称逻辑模式,是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。
外模式: 外模式也称子模式或用户模式,它是数据库用户能够看见和使用的局部数据的逻辑结构和特征的描述,是数据库用户的数据视图,是与某一应用有关的数据的逻辑结构。
内模式: 内模式也称存储模式,一个数据库只有一个内模式。它是数据物理结构和存储方式的描述,是数据在数据库内部的组织方式。
数据库的二级映像功能与数据独立性
- 外模式/模式映像:保证了数据的逻辑独立性。
- 模式/内模式映像:保证了数据的物理独立性。
层次模型用树形结构,网状模型用网状结构。
关系模型:
- 关系: 表
- 关系名: 表名
- 关系模式: 表头
- 关系: 二维表
- 元组:记录或行
- 属性: 列
- 属性名: 列名
- 属性值: 列值
- 分量: 一条记录中的一个列值
- 码: 唯一确定一个元组
- 域: 域是一组具有相同数据类型的值的集合
- 非规范关系:表中有表
关系的完整性约束条件:
- 实体完整性
- 参照完整性
- 用户定义的完整性
第二章 关系数据库
关系模式:对关系的描述。
那么什么是关系? 关系是一张表,一张二维表。
关系语言的分类:
- 关系代数语言
- 关系演算语言
- SQL语言
关系代数运算符:
- 集合运算符:
- 并
- 差
- 交
- 笛卡尔积。
- 关系运算符:
- 选择:得到表中指定行。
- 投影:得到表中指定列。
- 连接: 将两个表根据指定条件连接在一起。
- 自然连接
- 悬浮连接
- 外连接
- 左外连接
- 右外连接
- 除
候选码: 某一属性的值可以唯一地标识一个元组,而其子集不能。
主码: 若一个关系有多个候选码则选定其中一个为主码。
第三章 关系数据库标准语言SQL
数据定义语言DDL,数据查询语言DQL,数据操纵语言DML,数据控制语言DCL
SQL语句的特点
- 综合统一。
- 高度非过程化。
- 面向集合的操作方式。
- 以同一种语法结构提供多种使用方式。
- 语言简洁,易学易用。
数据查询:
- SELECT(查询)
数据定义:
- CREATE(创建)
- DROP(删除)
- ALTER(更改)
数据操纵:
- INSERT(增)
- UPDATE(更新)
- DELETE(改)
数据控制:
- GRANT(授予)
- REVOKE(回收)
数据类型:
模式:
- 模式的创建:
CREATE SCHEMA
- 模式的删除:
DROP SCHEMA
定义模式
在SQL中模式定义语句如下:CREATE SCHEMA <模式名> AUTHORIZATION <用户名>
表:
- 表的创建:
CREATE TABLE
- 表的删除:
DROP TABLE
- 表的修改:
ALTER TABLE
视图:
- 视图的创建:
CREATE VIEW
- 视图的删除:
DROP VIEW
索引:
- 索引的创建:
CREATE INDEX
- 索引的删除:
DROP INDEX
- 修稿索引:
ALTER INDEX
常用的比较条件:
=, > ,< ,>= ,<= , !=,<>(不等于) ,!> ,!< ,NOT+上述比较运算符
多重条件:
- AND
- OR
- NOT
常用的范围符:
- BETWEEN AND
- NOT BETWEEN AND
确定集合:
- IN
- NOT IN
字符匹配
LIKE可以用来进行字符串的匹配。
- 一般语法格式如下:
[NOT] LIKE '<匹配字符串>'
- 其含义是查找指定的属性值与<匹配串>相匹配的元组。
- <匹配串>可以是一个完整的字符串,也可以含有通配符%和_。
- %代表任意长度(长度可以为0)的字符串。
例如:a%b,表示以a为开头b结尾的任意长度的字符串。 - _代表任意单个字符。
例如:a_b,表示以a为开头b结尾的长度为3的字符串。
- %代表任意长度(长度可以为0)的字符串。
空值:
- IS NULL
- IS NOT NULL
数据查询
SQL提供了SELECT语句进行数据查询,该语句具有灵活的使用方式和丰富的功能。
其一般格式为:
SELECT [ALL | DISTINCT] <目标列表达式> [,<目标列表达式>]...
FROM <表名或视图名> [,<表名或视图名....>] | (<SELECT语句>) [AS] <别名>
[WHERE <条件表达式>]
[GROUP BY <列名1> [HAVING<条件表达式>]]
[ORDER BY <列名2> [ASC | DESC]];
上述语句的含义是,根据WHERE子句的条件表达式从FROM子句指定的基本表、视图或派生表中找出满足条件的元组,
再按SELECT子句中的目标列表达式选出元组中的属性值形成结果表。
如果有GROUP BY 子句,则将结果按<列名1>的值进行分组,该属性列值相等的元组为一个组。
通常会在每组中作用聚集函数。如果GROUP BY 子句带HAVING 短语,则只有满足指定条件的组才输出。
如果有ORDER BY子句,则结果表还要按<列名2>的值的升序或降序排序。
第四章 数据库安全性
数据库的不安全因素:
- 非授权用户对数据库的恶意存取和破坏。
- 数据库中重要或敏感的数据被泄露。
- 安全环境的脆弱性。
数据库安全性控制:
- 用户身份鉴别
- 弱口令鉴别
- 动态口令鉴别
- 生物特征鉴别
- 智能卡鉴别
- 存取控制
- 自主存取控制方法
为什么要授权:
授权是指授予(GRANT)和收回(REVOKE),是数据库安全性控制中的自主存取控制方法,是为了保护数据库,防止不合法使用所造成的数据泄露,更改或破坏。
如何授权: 授予(GRANT)。
收回授权: 收回(REVOKE)。
第五章 数据库完整性
数据库的完整性是指数据库的正确性和相容性。
- 正确性:符合现实世界语义。
- 相容性:同一对象在不同表中的数据符合逻辑。
维护完整性需要实现的功能:
- 提供定义完整性约束条件的机制。
- 提供完整性检查的方法。
- 进行违约处理。
三大完整性:
- 实体完整性:主码唯一且非空。
- 参照完整性:外码的约束。
- 用户定义的完整性:属性上约束条件的定义。
第六章 关系数据理论
函数依赖:
- 非平凡的函数依赖:X → \rightarrow →Y, Y ∉ Y\notin Y∈/X
- 平凡的函数依赖:X → \rightarrow →Y, Y ∈ Y\in Y∈X
- 完全函数依赖:X → \rightarrow →Y,并且对于X的任意子集X1,都有 X ≠ > X\neq> X=>Y,则称Y完全函数依赖于X,记作X → ( F 在箭头上 ) \rightarrow(F在箭头上) →(F在箭头上)Y
- 部分函数依赖:Y不完全函数依赖于X,记作X → \rightarrow →(P在箭头上)Y,例如A → \rightarrow →C,又有AB → \rightarrow →C,那么C就是部分函数依赖于AB的,这种情况会造成数据冗余。
候选码: 是一个属性组(或者属性),通过该属性组能推出所有的属性,并且该属性组的任意子集都不能再推出所有属性了。即在满足完全函数依赖的前提下,还得是最小的属性组。
超码: 能推出所有属性的属性组的集合,根据概念可知,候选码是极小的超码集,是超码的子集。
主码: 当有多个候选码时,推出一个作为主码简称码。
主属性: 包含在任何一个候选码中的属性。
非主属性: 不包含在任意一个候选码中的属性。
外码: 关系模式R中,若有一个属性或属性组X,它不是R的码,但X是另一个关系模式S中的码,称X是R的外码。
全码: 最极端的情况下,整个属性组都是码,称为全码。
范式:
- 1NF: 所有属性都是不可分割的数据项。
如果某个属性,例如: 学校,还可以继续拆分为高中和大学,就不满足1NF了。
1NF是关系数据中需要满足的最低要求。 - 2NF: 在满足1NF的前提下,不包含非主属性对码的部分函数依赖。(即每一个非主属性都完全函数依赖于码)。
例如在关系R中,码是学号和班级,非主属性是姓名。因为通过学号就能直接推出姓名了,不需要班级,此处姓名就部分依赖于码,不满足2NF。 - 3NF: 在满足2NF的前提下,不包含非主属性对码的传递函数依赖(即码应该直接决定非主属性,不能间接决定)。
传递函数依赖: 传递函数依赖属于关系模式R(U),传递函数依赖在关系模式 R(U)中,设 X,Y,Z 是 U 的不同的属性子集,如果 X 确定 Y、Y 确定 Z,且有 X 不包含 Y,Y 不确定 X,(X∪Y)∩Z=空集合,则称 Z 传递函数依赖于X。 - BCNF: 消除任何属性对候选码的传递依赖,即每一个决定因素都包含码,表现为在函数依赖集当中,左边的都包含候选码(整个属性组)。
- 4NF: 不允许有非平凡且非函数依赖的多值依赖。
第七章 数据库设计
数据库设计的基本步骤:
- 需求分析。
- 概念结构设计。
- 逻辑结构分析。
- 物理结构分析。
- 数据库实施。
- 数据库运行和维护。
第十章 数据库恢复技术
事物的概念:
事物是数据库操作序列,这些操作要么全做,要么全不做,是不可分割的工作单位,一个事物可以是一个sql语句,一组sql语句或者整个程序,一般来说,一个程序包含多个事物。
事物是恢复的基本单位,也是并发控制的基本单位。
事物的4个特性(ACID):原子性,一致性,隔离性,持续性。
- 原子性:一个事物要么全做,要么全不做。
- 一致性:事物执行的结果必须一致,如果一个事物被迫中断,即事物中的一些操作做了,剩下的还没做,且做了的对数据库造成的修改已经存入物理数据库的话,就会造成数据库处于不一致的状态。因此事物要么全做,要么全不做,一致性和原子性是密切相关的。
- 隔离性:一个事物的执行不能被其他事物干扰。
- 持续性(也称永久性):一个事物一旦提交,它对数据库中数据的改变应该是永久性的。
数据库系统的故障种类:事物内部的故障,系统故障,介质故障,计算机病毒。
数据库恢复技术:数据转储,登录日志条件。
第十一章 并发控制
并发控制: 为了保证事物的隔离性和一致性,数据库管理系统需要对并发操作进行正确调度。
并发控制的主要技术有: 封锁、时间戳、乐观控制性、多版本并发控制的能够。
并发控制的基本方法:封锁(X锁,S锁)
- 排他锁/写锁,X锁
- 共享锁/读锁,,S锁。
封锁协议:约定何时申请X锁/S锁,持续时间,何时释放等等。
- 一级封锁协议。
- 二级封锁协议。
- 三级封锁协议。