当前位置: 首页 > article >正文

数据库SQL学习笔记

第 1 章 绪论

1.1 数据库系统概述

1.1.1 四个基本概念

数据库系统(DBS)

定义:是指在计算机系统中引入数据库后的系统构成

构成:数据库,数据库管理系统(及其开发工具),应用系统,数据库管理员

1.1.2 数据管理技术的产生和发展

数据的逻辑结构是用户可见的数据组织方式

1.2 数据模型

1.2.1 两类数据模型

(1) 概念模型(信息模型)

按用户的观点来对数据和信息建模,用于数据库设计

(2) 逻辑模型和物理模型

逻辑结构主要包括网状模型、层次模型、关系模型、面向对象模型等

物理模型是对数据最底层的抽象,描述数据在系统内部的表示方式和存取方法,在磁盘或磁带上的存储方式和存取方法

1.2.2 数据模型的组成要素

数据结构

数据操作

数据的约束条件

1.2.3 概念模型

概念模型

信息世界中的基本概念:实体,属性,码,域,实体型,实体值,实体集,联系

实体型:用实体名及其属性名集合来抽象合刻画同类实体

信息世界中的基本概念

概念模型的表示方法

E-R图(实体-联系方法)

实体型:用矩形表示,矩形框内写明实体名

属性:用椭圆形表示,并用无向边将其与相应实体连接起来

联系:用菱形表示联系本身,菱形框内写明联系名,并用无向边分别与有关实体连接起来,同时在无向边旁标上联系的类型(1:1、1:n 或 m:n),联系本身也是一种实体性,也可以有属性,这些属性也要用无向边与该联系连接起来

 属性下面加下划线表示对应实体的

1.2.4 最常用的数据模型

非关系模型:层次模型、网状模型

关系模型

面向对象模型

对象关系模型

1.2.5 层次模型

树形结构

缺点:多对多联系表示不自然,对插入和删除操作的限制多,查询子女节点必须通过双亲节点

1.2.6 网状模型

允许一个以上的结点无双亲,一个结点可以有多于一个的双亲

层次模型实际上是网状模型的一个特例

缺点:结构比较复杂

1.2.7 关系模型

关系:一个关系对应一张表

元组:表中一行即为一个元组

属性:表中一列即为一个属性

主码:表中某个属性组,可以唯一确定一个元组

域:属性的取值范围

关系模式:关系名(属性1,属性2,…,属性n)

例如:

学生(学号,姓名,年龄,性别,系,年级)

最基本的规范条件:关系的每一个分量必须是一个不可分的数据项

1.3 数据库系统结构

1.3.1 数据库系统模式的概念

型:对某一类数据的结构和属性的说明

例如:

记录型(学号,姓名,性别,系别,年龄,籍贯)

记录值(900201,李明,男,计算机,22,江苏) 

1.3.2 数据库系统的三级模式结构

模式

数据库中全体数据的逻辑结构和特征的描述

一个数据库只有一个模式

外模式

数据库用户能够看见和使用的局部数据的逻辑结构和特征的描述

一个数据库可以有多个外模式,反映了不同用户的应用需求,一个模式对于多个外模式

一个应用程序只能使用一个外模式

内模式

一个数据库只有一个内模式

内模式是数据在数据库内部的表示方式

三模式的关系

模式是内模式的逻辑表示,内模式是模式的物理实现,外模式是模式的部分抽取

模式表示概念级数据库,体现对数据库的总体观

内模式表示物理数据库,体现对数据库的存储观

外模式表示用户数据库,体现对数据库的用户观

采用映像技术的优点:保证数据独立性,方便用户使用数据库,利于数据共享,利于数据的安全与保密

1.3.3 数据库的二级映像功能与数据独立性

为了能够在系统内部实现三个抽象层次的联系和转换,数据库管理系统在这三级模式之间提供了两层映像:外模式 / 模式映像和模式 / 内模式映像。

考点

E-R图

数据独立性,三级模式,二级映像

1.4 数据库系统的组成

1.5 小结

1.6 作业

什么叫数据与程序的物理独立性?

什么叫数据与程序的逻辑独立性?

为什么数据库系统具有数据与程序的独立性?

第 2 章 关系数据库

2.1 关系数据结构及形式化定义

关系模型由关系数据结构、关系操作集合和关系完整性约束三部分组成。

2.1.1 关系

若关系中的某一属性组的值能唯一地标识一个元组,而其子集不能,则称该属性组为候选码

若一个关系有多个候选码,则选定其中一个为主码。主码属于候选码

候选码的诸属性称为主属性。不包含在任何候选码中的属性称为非主属性或非码属性。

在最极端的情况下,关系模式的所有属性是这个关系模式的候选码,称为全码

关系可以有三种类型:基本关系 (通常又称为基本表或基表)、查询表和视图表

基本表是实际存在的表,它是实际存储数据的逻辑表示;

查询表是查询结果对应的表;

视图表是由基本表或其他视图表导出的表,是虚表,不对应实际存储的数据。

2.1.2 关系模式

2.1.3 关系数据库

2.1.4 关系模型的存储结构

2.2 关系操作

2.2.1 基本的关系操作

2.2.2 关系数据语言的分类

2.3 关系的完整性

2.3.1 实体完整性

实体完整性规则:若属性 A 是基本关系 R 的主属性,则属性 A 不能取空值

2.3.2 参照完整性

关系间的引用

例:学生(学号,姓名,性别,专业号,年龄)

专业(专业号,专业名)

学生关系引用了专业关系的主码“专业号”

外码

设 F 是基本关系 R 的一个或一组属性,但不是关系 R 的码,如果 F 与基本关系 S 的主码 K_S 相对应,则称 F 是基本关系 R 的外码

基本关系 R 称为参照关系,基本关系 S 称为被参照关系或目标关系,外码是被参照关系的主码

例:学生关系的“专业号”与专业关系的主码“专业号”相对应

“专业号”属性是学生关系的外码

专业关系是被参照关系,学生关系为参照关系

参照完整性

参照完整性规则:

若属性(或属性组)F 是基本关系 R 的外码,它与基本关系 S 的主码 K_S 相对应(基本关系 R 和 S 不一定是不同的关系),则对于 R 中每个元组在 F 上的值必须为:

或者取空值(F 的每个属性值均为空值)

或者等于 S 中某个元组的主码值,不能取和 S 中主码值都不同的值

例:学生关系中每个元组“专业号”属性只取两类值:

(1)空值,表示尚未给该学生分配专业

(2)非空值,这时该值必须是专业关系中某个元组的“专业号”值,表示该学生不可能分配一个不存在的专业

2.3.3 用户定义的完整性

2.4 关系代数

一种抽象的查询语言

是关系数据操纵语言的一种传统表达方式用对关系的运算来表达查询

关系代数运算的三个要素:

运算对象:关系

运算结果:关系

运算符:集合运算符,专门的关系运算符,算术比较符,逻辑运算符

运算符

含  义

运算符

含义

集合

运算符

-

逻辑

运算符

¬

专 门 的

关系

运 算 符

×

σ

π

\Join

÷

广义笛卡尔积

选    择

投    影

连    接

比较

运算符

>

<

=

大    于

大于等于

小    于

小于等于

等    于

不等于

2.4.1 传统的集合运算

传统的集合运算是二目运算,包括:并、差、交、广义笛卡尔积

设关系 R 和关系 S 具有相同的目 n (即两个关系都有 n 个属性),且相应的属性取自同一个域,则称关系 R 和关系 S 是相容的

2.4.2 专门的关系运算

t[A_i] 表示元组 t 中相应于属性 A_i 的一个分量,属性相当于索引

象集 Z_x:给定一个关系 R(X, Z),X 和 Z 为属性组,当 t[X]=x 时,x 在 R 中的象集为:Z_x=\{t[Z]|t\in R,t[X]=x\},它表示 R 中属性 X 值为 x 的元组在 Z 上分量的集合

例:

A

B

C

a1

b1

c1

a1

b2

c2

a2

b2

c1

a3

b3

c2

a1

b1

c3

a3

b2

c2

 a_1 的象集为 \{(b_1,c_1),(b_2,c_2),(b_1,c_3)\}

关系运算的定义:

选择:在关系 R 中选择满足给定条件的元组,记作 \sigma _F(R)=\{t|t\in R\wedge F(t)=True\}

其中 F:选择条件,是一个逻辑表达式

元组的连接

R 为 n 目关系,S 为 m 目关系,t_r\in R,t_s\in S\widehat{t_rt_s} 称为元组的连接\widehat{t_rt_s} 是一个 n+m 列的元组,前 n 个分量为 R 中的一个 n 元组,后 m 个分量为 S 中的一个 m 元组

连接

从两个关系的笛卡尔积中选取属性间满足一定条件的元组 R \Join_{A\theta B} S=\{\widehat{t_rt_s} | t_r\in R\wedge t_s\in S\wedge t_r [A]\theta t_s[B]\}

\theta:比较运算符

连接运算从 R 和 S 的广义笛卡尔积 R\times S 中选取 (R 关系) 在 A 属性组上的值与 (S 关系) 在 B 属性组上值满足比较关系 \theta 的元组

等值连接:\theta 为 = 的连接运算称为等值连接,从关系 R 与 S 的广义笛卡尔积中选取 A、B 属性值相等的那些元组,即等值连接为:

R\Join_{A=B}S=\{\widehat{t_rt_s}|t_r\in R\wedge t_s\in S\wedge t_r[A]=t_s[B]\}

自然连接:一种特殊的等值连接,两个关系中进行比较的分量必须是相同的属性组,在结果中把重复的属性列去掉,R 和 S 具有相同的属性组 B

R\Join S=\{\widehat{t_r t_s}|t_r\in R\wedge t_s\in S\wedge t_r[B]=t_s[B]\}

一般的连接是从行的角度进行运算,自然连接还需要取消重复列,所以是同时从行和列的角度进行运算

外连接:在自然连接基础上,把舍弃的元组也保存在结果关系中,而在其他属性上填空值

左外连接:只保留左边关系 R 中要舍弃的元组

右外连接:只保留右边关系 S 中要舍弃的元组

例:上述关系 R 和关系 S 的外连接

给定关系 R(X, Y) 和 S(Y, Z),其中 X,Y,Z 为属性组,R 中的 Y 与 S 中的 Y 可以有不同的属性名,但必须出自相同的域集。R 和 S 的除运算得到一个新的关系 P(X),P 是 R 中满足下列条件的元组在 X 属性列上的投影:元组在 X 上分量值为 x 的象集 Y_x 包含 S 在 Y 上投影的集合,记作:

R\div S=\{t_r[X]|t_r\in R\wedge \pi _Y(S)\subseteq Y_x\}

例:设关系 R、S 分别为 (a) 和 (b),R\div S 的结果为图 (c)

在关系 R 中,A 各个值的象集分别为:

a1{(b1, c2),(b2,c3),(b2, c1)}

a2{(b3, c7),(b2, c3)}

a3{(b4, c6)}

a4{(b6, c6)} 

S 在 (B, C) 上的投影为 {(b1, c2),(b2, c3),(b2, c1)}

例:

关系代数的基本运算有五种 U,-,\sigma,\pi,\times

其他运算可由上述 5 种运算导出

A\cap B=A-(A-B)

连接R \Join S=\sigma_{A\ominus B}(R\times S)

自然连接R\Join S=\pi_{[S.B]}(\sigma_{R.B=S.B}(R\times S))

R\div S=\pi_x(R)-\pi_x((\pi_x(R)\times \pi_y(S))-R),假定R(X,Y),S(Y,Z)

*2.5 关系演算

以数理逻辑中的谓词演算为基础

*2.5.1 元组关系演算语言 ALPHA 

*2.5.2 元组关系演算

*2.5.3 域关系演算语言 QBE 

2.6 小结

习题

设有一个 SPJ 数据库,包含 S、P、J 及 SPJ 4 个关系模式

供应情况表 SPJ 由供应商代码 (SNO)、零件代码 (PNO)、工程项目代码 (JNO)、供应数量 (QTY) 组成

用关系代数完成如下查询

(1) 求供应工程 JI 零件的供应商号码 SNO;

\Pi _{SNO}(\sigma_{JNO='J1'}(SPJ))

(2) 求供应工程 J1 零件 P1 的供应商号码 SNO;

\Pi _{SNO}(\sigma_{JNO='J1'\wedge PNO='P1'}(SPJ))

(3) 求供应工程 J1 零件为红色的供应商号码 SNO;

\Pi _{SNO}(\Pi_{SNO,PNO}(\sigma _{JNO='J1'}(SPJ))\Join\Pi_{PNO}(\sigma _{COLOR='red'}(P)))

'red' 应该是 '红',但是显示不了中文

自然连接也可以理解为交集

(4) 求没有使用天津供应商生产的红色零件的工程号 JNO;

\Pi _{JNO}(J)-\Pi _{JNO}(\Pi _{SNO}(\sigma_{CITY='tianjin'}(S))\Join\Pi_{SNO,PNO,JNO}(SPJ)\\ \Join\Pi_{PNO}(\sigma_{COLOR='red'}(P)))

(5) 求至少用了供应商 S1 所供应的全部零件的工程号 JNO。 

\Pi_{JNO,PNO}(SPJ)\div \Pi_{PNO}(\sigma_{SNO='s1'}(SPJ))

一个零部件 JNO 可以有多个供应商

第 3 章 关系数据库标准语言SQL

3.1 SQL 概述

3.1.1 SQL 的产生与发展 

3.1.2 SQL 的特点

其功能包括:数据查询、数据操纵、数据定义、数据控制

综合统一

SQL 可以独立完成数据库生命周期中的全部活动,包括以下一系列操作要求:

• 定义和修改、删除关系模式,定义和删除视图,插入数据,建立数据库。

• 对数据库中的数据进行查询和更新。

• 数据库重构和维护。

• 数据库安全性、完整性控制,以及事务控制。

• 嵌入式 SQL 和动态 SQL 定义。

高度非过程化

非关系数据模型的数据操纵语言“面向过程”,必须指定存储路径

用 SQL 进行数据操作时,只要提出“做什么”,而无须指明“怎么做”, 因此无须了解存取路径。

存取路径的选择以及 SQL 的操作过程由系统自动完成,有利于提高数据独立性。

面向集合的操作方式

非关系数据模型采用的是面向记录的操作方式,操作对象是一条记录。

例如查询所有平均成绩在 80 分以上的学生姓名,用户必须一条一条地把满足条件的学生记录找出来(通常要说明具体处理过程,即按照哪条路径,如何循环等)。

而 SQL 采用集合操作方式,不仅操作对象、查找结果可以是元组的集合,而且一次插入、删除、更新操作的对象也可以是元组的集合。

以同一种语法结构提供多种使用方式

SQL 既是独立的语言,又是嵌入式语言。

作为独立的语言,它能够独立地用于联机交互的使用方式,用户可以在终端键盘上直接键入 SQL 命令对数据库进行操作;

作为嵌入式语言,SQL 语句能够嵌入到高级语言(例如 C、C++、Java)程序中,供程序员设计程序时使用。

语言简洁,易学易用,9个动词

3.1.3 SQL 的基本概念 

SQL 语言支持关系数据库的三级模式体系结构

基本表

本身独立存在的表

SQL 中一个关系就对应一个基本表

一个(或多个)基本表对应一个存储文件

存储文件: 

逻辑结构组成了关系数据库的内模式

物理结构是任意的,对用户透明

视图

从一个或几个基本表导出的表

数据库中只存放视图的定义而不存放视图对应的数据

视图是一个虚表

用户可以在视图上再定义视图

3.2 学生-课程数据库 

3.3 数据定义 

操作对象操作方式
创建删除修改
模式CREATE SCHEMADROP SCHEMA
CREATE TABLEDROP TABLEALTER TABLE
视图CREATE VIEWDROP VIEW
索引CREATE INDEXDROP INDEX

3.3.1 模式的定义与删除 

定义模式

定义模式实际上定义了一个命名空间

在这个空间中可以定义该模式包含的数据库对象,例如基本表、视图、索引等。

CREATE SCHEMA中可以接受CREATE TABLECREATE VIEWGRANT子句。

也就是说用户可以在创建模式的同时在这个模式定义中进一步创建基本表、视图,定义授权。

模式定义语句:

CREATE SCHEMA <模式名> AUTHORIZATION <用户名>[<表定义子句>|<视图定义子句>|<授权定义子句>];

例:定义一个学生-课程模式S-T

CREATE SCHEMA "S-T" AUTHORIZATION WANG;

为用户 WANG 定义了一个模式 S-T

如果没有指定〈模式名〉,那么〈模式名〉默认为〈用户名〉。  

例:

CREATE SCHEMA TEST AUTHORIZATION ZHANG 
    CREATE TABLE TAB1(COL1 SMALLINT,
            COL2 INT,
            COL3 CHAR(20),
            COL4 NUMERIC(10,3),
            COL5 DECIMAL(5,2)
             );

为用户 ZHANG 创建了一个模式 TEST,并在其中定义了一个表 TAB1。

删除模式

DROP SCHEMA <模式名><CASCADE|RESTRICT>;

其中 CASCADE 和 RESTRICT 必选其一。

CASCADE (级联),表示在删除模式的同时把该模式中所有的数据库对象全部删除;

RESTRICT (限制),表示如果该模式中已经定义了下属的数据库对象 (如表、视图等),则拒绝该删除语句的执行。只有当该模式中没有任何下属的对象时才能执行 DROP SCHEMA 语句。 

例:

DROP SCHEMA ZHANG CASCADE;

删除模式 ZHANG,同时该模式中定义的表 TAB1 也被删除 

3.3.2 基本表的定义、删除与修改 

定义基本表

CREATE TABLE <表名>(<列名><数据类型>[列级完整性约束条件]
                    [,<列名><数据类型>[列级完整性约束条件]]
                    ...
                    [,<表级完整性约束条件>]);

完整性规则主要有三种子句:

主键子句(PRIMARY KEY):实体完整性

外键子句(FOREIGN KEY):参照完整性

检查子句(CHECK):用户定义完整性 

完整性约束条件涉及到该表的多个属性,则必须定义在表级上,否则既可以定义在列级也可以定义在表级。

当用户操作表中数据时自动检查该操作是否违背这些完整性约束条件。

例:建立一个学生表Student

学号是主码,姓名取值唯一

CREATE TABLE Student
    (Sno CHAR(9) PRIMARY KEY,     /*列级完整性约束条件,Sno 是主码*/
    Sname CHAR(20) UNIQUE,     /* Sname 取唯一值*/
    Ssex CHAR(2),
    Sage SMALLINT,
    Sdept CHAR(20)
);

例:

CREATE TABLE Course
    ( Cno  CHAR(4) PRIMARY KEY,
      Cname CHAR(40),  
      Cpno  CHAR(4),  /*先修课*/
      Ccredit  SMALLINT,
      FOREIGN KEY (Cpno) REFERENCES Course(Cno) 
            ); 

FOREIGN KEY (Cpno) REFERENCES Course (Cno) 是一个外键约束定义。

FOREIGN KEY (Cpno):表示正在定义一个外键,外键列是名为 Cpno(在当前表中)的列。

REFERENCES Course(Cno):“REFERENCES” 关键字用于指定外键的参照关系。这里表示 Cpno 列参照(引用)了名为 Course 的表中的 Cno 列。

这一约束的目的是维护数据的完整性。它确保在当前表(包含Cpno列的表)中,Cpno列中的每个值要么为NULL,要么是Course表中Cno列已经存在的值。

例如,如果Course表中有课程编号为'C001''C002'等,那么在当前表中,Cpno列的值只能是'C001''C002'或者NULL,不能是其他不存在于CourseCno列中的值。

例:建立一个“学生选课”表SC

CREATE TABLE SC
   (Sno CHAR(9),
    Cno CHAR(4),  
    Grade SMALLINT,
    PRIMARY KEY (Sno,Cno),    
    /* 主码由两个属性构成,必须作为表级完整性进行定义 */
    FOREIGN KEY (Sno) REFERENCES Student(Sno),    
    /* 表级完整性约束条件,Sno是外码,被参照表是Student */
    FOREIGN KEY (Cno) REFERENCES Course(Cno)
    /* 表级完整性约束条件, Cno是外码,被参照表是Course */
		); 

数据类型

定义表的属性时,需要指明其数据类型及长度

模式与表

每一个基本表都属于某一个模式,一个模式包含多个基本表

定义基本表所属模式

方法一:在表名中明显地给出模式名

Create table "S-T".Student (...);    /*模式名为S-T*/

方法二:在创建模式语句中同时创建表

方法三:设置所属的模式 

创建基本表(其他数据对象也一样)时,若没有指定模式,系统根据搜索路径来确定该对象所属的模式,若搜索路径中的模式名都不存在,系统将给出错误

修改基本表

ALTER TABLE <表名>
[ADD [COLUMN] <新列名><数据类型>[完整性约束]
[ADD<表级完整性约束>]
[DROP [COLUMN]<列名>[CASCADE | RESTRICT]]
[DROP CONSTRAINT〈完整性约束名〉[RESTRICT|CASCADE]]
[ALTER COLUMN <列名><数据类型>];

其中〈表名〉是要修改的基本表

ADD 子句用于增加新列、新的列级完整性约束条件和新的表级完整性约束条件。

DROP COLUMN 子句用于删除表中的列,如果指定了 CASCADE 短语,则自动删除引用了该列的其他对象,比如视图;如果指定了 RESTRICT 短语,则如果该列被其他对象引用,RDBMS 将拒绝删除该列。

DROP CONSTRAINT 子句用于删除指定的完整性约束条件。

ALTER COLUMN 子句用于修改原有的列定义,包括修改列名和数据类型。

例:向 Student 表增加“入学时间”列,其数据类型为日期型

ALTER TABLE Student ADD S_entrance DATE;

例:将年龄的数据类型由字符型改为整数

ALTER TABLE Student ALTER COLUMN Sage INT;

 例:增加课程名称必须取唯一的约束条件

ALTER TABLE Course ADD UNIQUE(Cname);

删除基本表 

DROP TABLE<表名>[RESTRICT|CASCADE];

RESTRICT:有限制条件,欲删除的基本表不能被其他表的约束所引用(如 CHECK,FOREIGN KEY 等约束),不能有视图,不能有触发器,不能有存储过程或函数等。如果存在这些依赖该表的对象,则此表不能被删除。

CASCADE:没有限制条件,在删除基本表的同时,相关的依赖对象,例如视图,都将被一起删除。 默认情况是 RESTRICT。 

例:若表上建有视图,选择 RESTRICT 时表不能删除

CREATE VIEW IS_Student AS 
     SELECT Sno, Sname, Sage
	 FROM  Student
     WHERE Sdept='IS';
DROP TABLE Student RESTRICT;   
--ERROR: cannot drop table Student because other objects depend on it

 如果选择 CASCADE 时可以删除表,视图也自动被删除

DROP TABLE Student CASCADE;   
--NOTICE: drop cascades to view IS_Student

3.3.3 索引的建立与删除

建立索引

目的:加快查询速度

CREATE [UNIQUE] [CLUSTER] INDEX <索引名>
ON <表名>(<列名>[<次序>][,<列名>[<次序>]] …);

每个〈列名〉后面还可以用〈次序〉指定索引值的排列次序,可选 ASC (升序) 或 DESC (降序),默认值为 ASC。 

UNIQUE 表明此索引的每一个索引值只对应唯一的数据记录。

CLUSTER 表示要建立的索引是聚簇索引。

例:在 Student 表的 Sname(姓名)列上建立一个聚簇索引

CREATE CLUSTER INDEX Stusname ON Student (Sname);

在最经常查询的列上建立聚簇索引以提高查询效率

一个基本表上最多只能建立一个聚簇索引

经常更新的列不宜建立聚簇索引

例:为学生-课程数据库中的 Student,Course,SC 三个表建立索引

CREATE UNIQUE INDEX Stusno ON Student(Sno);    /*按学号升序(默认)建唯一索引*/
CREATE UNIQUE INDEX  Coucno ON Course(Cno);    /*按课程号升序(默认)建唯一索引*/
CREATE UNIQUE INDEX SCno ON SC(Sno ASC,Cno DESC);    /*按学号升序和课程号降序建唯一索引*/

修改索引 

ALTER INDEX<旧索引名>RENAME TO<新索引名>;

删除索引

DROP INDEX<索引名>;

 例:删除 Student 表的 Stusname 索引

DROP INDEX Stusname;

3.3.4 数据字典

3.4 数据查询 

SELECT [ALL|DISTINCT]<目标列表达式>[,<目标列表达式>]
FROM<表名或视图名>[,<表名或视图名>…] | (<SELECT 语句>)[AS]<别名>
[WHERE<条件表达式>]
[GROUP BY<列名 l> [HAVING<条件表达式>]]
[ORDER BY<列名 2> [ASC | DESC]];

整个 SELECT 语句的含义是:根据 WHERE 子句的条件表达式,从 FROM 子句指定的基本表或视图中找出满足条件的元组,再按 SELECT 子句中的目标列表达式,选出元组中的属性值形成结果表。

如果有 GROUP 子句,则将结果按 <列名1> 的值进行分组,该属性列值相等的元组为一个组,通常会在每组中作用集函数。

如果 GROUP 子句带 HAVING 短语,则只有满足指定条件的组才有输出。

如果有 ORDER 子句,则结果表还要按 <列名2> 的值的升序或降序排序。

关系表达式与SQL语句的对比

关系表达式:\sqcap _{A_1,A_2,\cdots,A_n}(\sigma_F(R1\times \cdots \times Rm))

SQL 语句

SELECT A1,A2,...An
FROM R1 x ... x Rm
WHERE F

3.4.1 单表查询 

选择表中若干列

(1) 查询指定列

例:查询全体学生的学号与姓名

SELECT Sno,Sname
FROM Student;

(2) 查询全部列

例:查询全体学生的详细记录

SELECT *
FROM Student;

等价于

SELECT Sno,Sname,Ssex,Sage,Sdept
FROM Student;

(3) 查询经过计算的值

SELECT 子句的〈目标列表达式〉不仅可以是表中的属性列,也可以是表达式,字符串常量,函数,列别名。

例:查询全体学生的姓名、出生年份和所在的院系,要求用小写字母表示系名。

SELECT Sname,'Year of Birth:',2014-Sage,LOWER(Sdept)
FROM Student;

使用列别名改变查询结果的列标题 

SELECT Sname NAME,'Year of Birth:' BIRTH,2014-Sage BIRTHDAY,LOWER(Sdept) DEPARTMENT
FROM Student;

选择表中的若干元组 

(1) 消除取值重复的行

SELECT DISTINCT Sno
FROM SC;

 (2) 查询满足条件的元组

查询满足指定条件的元组可以通过 WHERE 子句实现。

例:查询计算机科学系全体学生的名单

SELECT Sname
FROM Student
WHERE Sdept='CS';

 例:查询考试成绩不及格的学生的学号

SELECT DISTINCT Sno
FROM SC
WHERE Grade<60;

这里使用了 DISTINCT 短语,当一个学生有多门课程不及格,他的学号也只列一次。 

例:查询年龄不在 20~23 岁之间的学生姓名、系别和年龄。

SELECT Sname,Sdept,Sage
FROM Student
WHERE Sage NOT BETWEEN 20 AND 23;

例:查询计算机科学系(CS)、数学系(MA)和信息系(IS)学生的姓名和性别。

SELECT Sname,Ssex
FROM Student
WHERE Sdept IN('CS','MA','IS');

 谓词 LIKE 可以用来进行字符串的匹配。其一般语法格式如下:

[NOT]LIKE '<匹配串>'[ESCAPE'<换码字符>']

其含义是查找指定的属性列值与〈匹配串〉相匹配的元组。〈匹配串〉可以是一个完整的字符 串,也可以含有通配符%和 _。 其中:

%(百分号)代表任意长度(长度可以为 0)的字符串。

例如 a%b 表示以 a 开头,以 b 结尾的任意长度的字符串。如 acb、addgb、ab 等都满足。

_(下横线)代表任意单个字符。

例如 a_b 表示以 a 开头,以 b 结尾的长度为 3 的任意字符串。如 acb、afb 等都满足。 

例: 查询所有姓刘的学生的姓名、学号和性别。

SELECT Sname,Sno,Ssex
FROM Student
WHERE Sname LIKE'刘%';

例:查询 DB_Design 课程的课程号和学分

SELECT Cno,Ccredit
FROM Course
WHERE Cname LIKE 'DB\_Design' ESCAPE '\';

ESCAPE '\' 表示 “\” 为换码字符。这样匹配串中紧跟在 “\” 后面的字符不再为通配符,转义为普通的字符。

例:某些学生选修课程后没有参加考试,所以有选课记录,但没有考试成绩。查询缺少成绩的学生的学号和相应的课程号。

SELECT Sno,Cno
FROM SC
WHERE Grade IS NULL;     /*分数 Grade 是空值*/
 ORDER BY 子句

ORDER BY 对查询结果按照一个或多个属性列的升序(ASC)或降序(DESC)排列,默认值为升序。

例:查询选修了 3 号课程的学生的学号及其成绩,查询结果按分数的降序排列。

SELECT Sno,Grade
FROM SC
WHERE Cno='3'
ORDER BY Grade DESC;

对于空值,排序时显示的次序由具体系统实现来决定。例如按升序排,含空值的元组最后显示;按降序排,空值的元组则最先显示。即空值视为最大

例:查询全体学生情况,查询结果按所在系的系号升序排列,同一系中的学生 按年龄降序排列。

SELECT *
FROM Student
ORDER BY Sdept,Sage DESC;

因为默认升序,Sdept 后面的 ASC 可以省略 

聚集函数
COUNTS(*)统计元组个数
COUNT([DISTINCT | ALL]<列名>)统计一列中值的个数
SUM([DISTINCT | ALL]<列名>)计算一列值的总和 (此列必须是数值型)
AVG([DISTINCT | ALL]<列名>)计算一列值的平均值 (此列必须是数值型)
MAX([DISTINCT | ALL]<列名>)求一列值中的最大值
MIN([D1STINCT | ALL]<列名>)求一列值中的最小值

例:查询选修了课程的学生人数 

SELECT COUNT(DISTINCT Sno)
FROM SC;

学生每选修一门课,在 SC 中都有一条相应的记录。一个学生要选修多门课程,为避免重复计算学生人数,必须在 COUNT 函数中用 DISTINCT 短语。 

例:计算选修 1 号课程的学生平均成绩

SELECT AVG(Grade)
FROM SC
WHERE Cno='1';

例:查询学生 201215012 选修课程的总学分数。

SELECT SUM(Ccredit)
FROM SC, Course
WHERE Sno='201215012' AND SC.Cno=Course.Cno;

当聚集函数遇到空值时,除 COUNT (*) 外,都跳过空值而只处理非空值。

WHERE 子句中是不能用聚集函数作为条件表达式的。

聚集函数只能用于 SELECT 子句和 GROUP BY 中的 HAVING 子句

GROUP BY 子句

GROUP BY 子句将查询结果按某一列或多列的值分组,值相等的为一组。

对查询结果分组的目的是为了细化聚集函数的作用对象。如果未对查询结果分组,聚集函数将作用于整个查询结果。分组后聚集函数将作用于每一个组,即每一组都有一个函数值。

例:求各个课程号及相应的选课人数

SELECT Cno,COUNT(Sno)
FROM SC
GROUP BY Cno;

该语句对查询结果按 Cno 的值分组,所有具有相同 Cno 值的元组为一组,然后对每一组作用聚集函数 COUNT 进行计算,以求得该组的学生人数。 

如果分组后还要求按一定的条件对这些组进行筛选,最终只输出满足指定条件的组,则可以使用 HAVING 短语指定筛选条件。

例:查询选修了三门以上课程的学生学号

SELECT Sno
FROM SC
GROUP BY Sno
HAVING COUNT(*)>3;

这里先用 GROUP BY 子句按 Sno 进行分组,再用聚集函数 COUNT 对每一组计数;HAVING 短语给出了选择组的条件,只有满足条件 (即元组个数>3,表示此学生选修的课超过 3 门) 的组才会被选出来。

WHERE 与 HAVING 的区别在于作用对象不同。

WHERE 子句作用于基本表或视图,从中选择满足条件的元组。

HAVING 短语作用于组,从中选择满足条件的组。

例:查询平均成绩大于等于 90 分的学生学号和平均成绩

错误示范:

SELECT Sno,AVG(Grade)
FROM SC
WHERE AVG(Grade)>=90
GROUP BY Sno;

因为 WHERE 子句中是不能用聚集函数作为条件表达式的,正确的查询语句应该是:

SELECT Sno,AVG(Grade)
FROM SC
GROUP BY Sno
HAVING AVG(Grade)>=90;

3.4.2 连接查询 

前面的查询都是针对一个表进行的。若一个查询同时涉及两个以上的表,则称之为连接查询

连接查询的 WHERE 子句中用来连接两个表的条件称为连接条件或连接谓词,其一般格式为

[<表名 1>.]<列名 1><比较运算符>[<表名 2>.]<列名 2>

其中比较运算符主要有=、>、=、<=、!= (或<>) 等。  

连接条件中的各连接字段类型必须是可比的,但名字不必是相同的

[<表名 1>.]<列名 1> BETWEEN[<表名 2>.]<列名 2> AND[<表名 2>.]<列名 3>

连接操作的执行过程 

嵌套循环法:首先在表1中找到第一个元组,然后从头开始扫描表2,逐一查找满足连接件的元组,找到后就将表1中的第一个元组与该元组拼接起来,形成结果表中一个元组。表2全部查找完后,再找表1中第二个元组,然后再从头开始扫描表2,以此类推。

排序合并法:常用=连接,首先按连接属性对表1和表2排序,对表1的第一个元组,从头开始扫描表2,顺序查找满足连接条件的元组,找到后就将表1中的第一个元组与该元组拼接起来,形成结果表中一个元组,当遇到表2中第一条大于表1连接字段值的元组时,对表2的查询不再继续。找到表1的第二条元组,然后从刚才的中断点处继续顺序扫描表2,以此类推。

索引连接:对表2按连接字段建立索引,对表1中的每个元组,依次根据其连接字段值查询表2的索引,从中找到满足条件的元组,找到后就将表1中的第一个元组与该元组拼接起来,形成结果表中的一个元组。

等值与非等值连接查询

例:查询每个学生及其选修课程的情况

这两个表之间的联系是通过公共属性 Sno 实现的。

SELECT Student.*,SC.*
FROM Student,SC
WHERE Student.Sno=SC.Sno;     /* 将 Student 与 SC 中同一学生的元组连接起来 */

本例中,SELECT 子句与 WHERE 子句中的属性名前都加上了表名前缀,这是为了避免混淆。如果属性名在参加连接的各表中是唯一的,则可以省略表名前缀。 

例:查询选修 2 号课程且成绩在 90 分以上的所有学生的学号和姓名

SELECT Student.Sno,Sname
FROM Student,SC
WHERE Student.Sno=SC.Sno AND /*连接谓词 */
      SC.Cno='2' AND SC.Grade>90; /*其他限定条件 */
自身连接

一个表与其自己进行连接,需要给表起别名以示区别,由于所有属性名都是同名属性,因此必须使用别名前缀。

例:查询每一门课的间接先修课(即先修课的先修课)

在 Course 表中只有每门课的直接先修课信息,而没有先修课的先修课。要得到这个信息,必须先对一门课找到其先修课,再按此先修课的课程号查找它的先修课程。这就要将 Course 表与其自身连接。

为此,要为 Course 表取两个别名,一个是 FIRST,另一个是 SECOND。

SELECT FIRST.Cno,SECOND.Cpno
FROM Course FIRST,Course SECOND
WHERE FIRST.Cpno=SECOND.Cno;

使用别名时,在 FROM 中要加上原名 (Course FIRST),WHERE 中不需要加原名 

外连接

外连接与普通连接的区别:普通连接操作只输出满足连接条件的元组,外连接操作以指定表为连接主体,将主体表中不满足连接条件的元组一并输出

有时想以 Student 表为主体列出每个学生的基本情况及其选课情况。若某个学生没有选课,仍把 Student 的悬浮元组保存在结果关系中,而在 SC 表的属性上填空值 NULL,这时就需要使用外连接。

SELECT Student.Sno,Sname,Ssex,Sage,Sdept,Cno,Grade
FROM Student LEFT OUTER JOIN SC ON (Student.Sno=SC.Sno);
/*也可以使用 USING 来去掉结果中的重复值:FROM Student LEFT OUTER JOIN SC USING(Sno):*/

左外连接:列出左边关系(如本例Student)中所有的元组

右外连接:列出右边关系中所有的元组 

多表连接

例:查询每个学生的学号、姓名、选修的课程名及成绩。

SELECT Student.Sno,Sname,Cname,Grade
FROM Student,SC,Course
WHERE Student.Sno=SC.Sno AND SC.Cno=Course.Cno;

不是三个一起相等 Student.Sno=SC.Sno=Coures.Cno ,前面是Sno,后面是Cno

3.4.3 嵌套查询

在 SQL 语言中,一个 SELECT-FROM-WHERE 语句称为一个查询块

将一个查询块嵌套在另一个查询块的 WHERE 子句或 HAVING 短语的条件中的查询称为嵌套查询

SELECT Sname     /*外层查询或父查询*/
FROM Student
WHERE Sno IN
        (SELECT Sno     /*内层查询或子查询*/
        FROM SC
        WHERE Cno='2');

SQL 语言允许多层嵌套查询,即一个子查询中还可以嵌套其他子查询。

需要特别指出的是,子查询的 SELECT 语句中不能使用 ORDER BY 子句,ORDER BY 子句只能对最终查询结果排序。 

带有 IN 谓词的子查询

在嵌套查询中,子查询的结果往往是一个集合,所以谓词 IN 是嵌套查询中最经常使用的谓词。

例:查询与“刘晨”在同一个系学习的学生。

先分步查询,再嵌套查询

先确定“刘晨”所在系名

SELECT Sdept
FROM Student
WHERE Sname='刘晨';

再查找这个系的学生

SELECT Sno,Sname,Sdept
FROM Student
WHERE Sdept='CS';

将第一步查询嵌入到第二步查询的条件中,构造嵌套查询如下:

SELECT Sno,Sname,Sdept
FROM Student
WHERE Sdept IN
        (SELECT Sdept
        FROM Student
        WHERE Sname='刘晨');

 本例中,子查询的查询条件不依赖于父查询,称为不相关子查询

一种求解方法是由里向外处理,即先执行子查询,子查询的结果用于建立其父查询的查找条件。

例:查询选修了课程名为“信息系统”的学生学号和姓名

SELECT Sno,Sname
FROM Student
WHERE Sno IN
    (SELECT Sno
    FROM SC
    WHERE Cno IN
        (SELECT Cno
        FROM Course
        WHERE Cname='信息系统'
        )
    );

先在 Course 关系中找出“信息系统”的课程号,再在 SC 关系中找出选修该课程号的学生学号,最后在 Student 关系中取出 Sno 和 Sname 

本查询同样可以用连接查询实现:

SELECT Student.Sno,Sname
FROM Student,SC,Course
WHERE Student.Sno=SC.Sno AND
    SC.Cno=Course.Cno AND
    Course.Cname='信息系统';

如果子查询的查询条件依赖于父查询,这类子查询称为相关子查询,整个查询语句称为相关嵌套查询语句。 

带有比较运算符的子查询

当确切知道内层查询返回的是单个值时,可以用>、<、=、>=、<=、!= 或<>等比较运算符。

与ANY或ALL谓词配合使用

由于一个学生只可能在一个系学习,也就是说内查询的结果是一个值,因此可以用 = 代替 IN:

SELECT Sno,Sname,Sdept 
FROM Student
WHERE Sdept =
    (SELECT Sdept
    FROM Student
    WHERE Sname='刘晨');

子查询一定要在比较符之后

错误示范:

SELECT Sno,Sname,Sdept 
FROM Student
WHERE (SELECT Sdept
    FROM Student
    WHERE Sname='刘晨')
        = Sdept;    /*错误*/

例:找出每个学生超过他自己选修课程平均成绩的课程号

SELECT Sno,Cno
FROM SC x
WHERE Grade>=(SELECT AVG(Grade) /*某学生的平均成绩*/
            FROM SC y
            WHERE y.Sno=x.Sno);

x 是表 SC 的别名,又称为元组变量,可以用来表示 SC 的一个元组。

内层查询是求一个学生所有选修课程平均成绩的,至于是哪个学生的平均成绩要看参数 x.Sno 的值,而该值是与父查询相关的,因此这类查询称为相关子查询

这个语句的一种可能的执行过程采用以下三个步骤。

(1) 从外层查询中取出 SC 的一个元组 x,将元组 x 的 Sno 值 (201215121) 传送给内层查询。

SELECT AVG(Grade)
FROM SC y
WHERE y.Sno='201215121';

(2) 执行内层查询,得到值 88 (近似值),用该值代替内层查询,得到外层查询:

SELECT Sno, Cno
FROM SC x
WHERE Grade>=88;

(3) 执行这个查询,得到

(201215121,1)
(201215121,3)

求解相关子查询不能像求解不相关子查询那样一次将子查询求解出来,然后求解父查询。内层查询由于与外层查询有关,因此必须反复求值。 

带有 ANY(SOME) 或 ALL 谓词的子查询

子查询返回单值时可以用比较运算符,但返回多值时要用 ANY (有的系统用 SOME) 或 ALL 谓词修饰符。而使用 ANY 或 ALL 谓词时则必须同时使用比较运算符。其语义如下所示:

> ANY大于子查询结果中的某个值
> ALL大于子查询结果中的所有值
<  ANY小于子查询结果中的某个值
< ALL小于子查询结果中的所有值
>= ANY大于等于子查询结果中的某个值
>= ALL大于等于子查询结果中的所有值
<= ANY小于等于子查询结果中的某个值
<= ALL小于等于子查询结果中的所有值
= ANY等于子查询结果中的某个值
= ALL等于子查询结果中的所有值 (通常没有实际意义)
!=(或<>) ANY不等于子查询结果中的某个值
!=(或<>) ALL不等于子查询结果中的任何一个值

例:查询非计算机科学系中比计算机科学系任意一个学生年龄小的学生姓名和年龄。 

SELECT Sname,Sage
FROM Student
WHERE Sage<ANY (SELECT Sage
                FROM Student
                WHERE Sdept='CS')
AND Sdept<>'CS';     /* 注意这是父查询块中的条件 */
带有 EXISTS 谓词的子查询

带有 EXISTS 谓词的子查询不返回任何数据,只产生逻辑真值 “true” 或逻辑假值 “false”

例:查询所有选修了 1 号课程的学生姓名

SELECT Sname
FROM Student
WHERE EXISTS
    (SELECT *
    FROM SC
    WHERE Sno=Student.Sno AND Cno='1');

使用存在量词 EXISTS 后,若内层查询结果非空,则外层的 WHERE 子句返回真值,否则返回假值。

使用存在量词 NOT EXISTS 后,若内层查询结果为空,则外层的 WHERE 子句返回真值,否则返回假值。

例:查询选修了全部课程的学生姓名

SQL 中没有全称量词 (forall),但是可以把带有全称量词的谓词转换为等价的带有存在量词的谓词:(\forall x)P\equiv \neg(\exists x(\neg P))

由于没有全称量词,可将题目的意思转换成等价的用存在量词的形式:查询这样的学生,没有一门课程是他不选修的。其 SQL 语句如下:

SELECT Sname
FROM Student
WHERE NOT EXISTS
    (SELECT *
    FROM Course
    WHERE NOT EXISTS
        (SELECT *
        FROM SC
        WHERE Sno=Student.Sno
            AND Cno=Course.Cno));

从而用 EXIST/NOT EXIST 来实现带全称量词的查询 

例:查询至少选修了学生 201215122 选修的全部课程的学生号码

本查询可以用逻辑蕴涵来表达:查询学号为 x 的学生,对所有的课程 y,只要 201215122 学生选修了课程 y,则 x 也选修了 y。形式化表示如下:

用 p 表示谓词“学生 201215122 选修了课程 y”

用 q 表示谓词“学生 x 选修了课程 y”

则上述查询为 (\forall y)p\rightarrow q

SQL 语言中没有蕴涵逻辑运算,但是可以利用谓词演算将一个逻辑蕴涵的谓词等价转换为

p\rightarrow q\equiv \neg p\vee q

该查询可以转换为如下等价形式:

(\forall y)p\rightarrow q\equiv \neg (\exists y(\neg (p\rightarrow q)))\equiv \neg (\exists y(\neg (\neg p\vee q)))=\neg \exists y(p\wedge \neg q)

它所表达的语义为:不存在这样的课程 y,学生 201215122 选修了 y,而学生 x 没有选。

SELECT DISTINCT Sno
FROM SC SCX
WHERE NOT EXISTS
    (SELECT *
    FROM SC SCY
    WHERE SCY.Sno='201215122' AND
        NOT EXISTS
        (SELECT *
        FROM SC SCZ
        WHERE SCZ.Sno=SCX.Sno AND
            SCZ.Cno=SCY.Cno));

3.4.4 集合查询 

SELECT 语句的查询结果是元组的集合,所以多个 SELECT 语句的结果可进行集合操作。

集合操作主要包括并操作 UNION、交操作 INTERSECT 和差操作 EXCEPT。

参加集合操作的各查询结果的列数必须相同;对应项的数据类型也必须相同。

例:查询计算机科学系的学生及年龄不大于 19 岁的学生。

SELECT *
FROM Student
WHERE Sdept='CS'
UNION
SELECT *
FROM Student
WHERE Sage<=19;

本查询实际上是求计算机科学系的所有学生与年龄不大于 19 岁的学生的并集。使用 UNION 将多个查询结果合并起来时,系统会自动去掉重复元组。如果要保留重复元组则用 UNION ALL 操作符。

例: 查询计算机科学系的学生与年龄不大于 19 岁的学生的交集

SELECT *
FROM Student
WHERE Sdept='CS'
INTERSECT
SELECT *
FROM Student
WHERE Sage<=19;

这实际上就是查询计算机科学系中年龄不大于 19 岁的学生。

SELECT *
FROM Student
WHERE Sdept='CS' AND
      Sage<=19;

3.4.5 基于派生表的查询 

子查询不仅可以出现在 WHERE 子句中,还可以出现在 FROM 子句中,这时子查询生成的临时派生表成为主查询的查询对象。

例:找出每个学生超过他自己选修课程平均成绩的课程号

SELECT Sno, Cno
FROM SC, (SELECT Sno, Avg(Grade) 
          FROM SC 
          GROUP BY Sno) AS Avg_sc(avg_sno,avg_grade)
WHERE SC.Sno = Avg_sc.avg_sno and SC.Grade >= Avg_sc.avg_grade

这里 FROM 子句中的子查询将生成一个派生表 Avg_sc。该表由 avg_sno 和 avg_grade 加两个属性组成,记录了每个学生的学号及平均成绩。主查询将 SC 表与 Avg_sc 按学号相等进行连接,选出修课成绩大于其平均成绩的课程号。 

如果子查询中没有聚集函数,派生表可以不指定属性列,子查询 SELECT 子句后面的列名为其默认属性

例:查询所有选修了 1 号课程的学生姓名

SELECT Sname
FROM Student, (SELECT Sno 
               FROM SC 
               WHERE Cno='1') AS SC1
WHERE Student.Sno=SC1.Sno;

通过 FROM 子句生成派生表时,AS 关键字可以省略,但必须为派生关系指定一个别名。 

3.4.6 SELECT 语句的一般格式 

SELECT [ALL | DISTINCT] <目标列表达式>[别名] [,<目标列表达式>[别名]] …
FROM <表名或视图名>[别名][,<表名或视图名>[别名]] … |(<SELECT 语句>) [AS]<别名>
[WHERE<条件表达式>]
[GROUP BY<列名 1> [HAVING <条件表达式>]]
[ORDER BY 列名 2> [ASC|DESC]];

目标列表达式的可选格式

(1) *
(2) <表名>.*
(3) COUNT([DISTINCT | ALL]*)
(4) [<表名>.]<属性列名表达式> [,[<表名>].<属性列名表达式>] …

其中,<属性列名表达式>可以是由属性列、作用于属性列的聚集函数和常量的任意算术运算 (+, -,*,/) 组成的运算公式。 

3.5 数据更新 

3.5.1 插入数据 

SQL 的数据插入语句 INSERT 通常有两种形式,一种是插入一个元组,另一种是插入子查询结果。后者可以一次插入多个元组。

插入元组

INSERT
INTO <表名>[(<属性列 1>[,<属性列 2>]…)]
VALUES(<常量 1>[,<常量 2>] …);

3.5.2 修改数据 

3.5.3 删除数据 

3.6 空值的处理 

3.7 视图 

3.7.1 定义视图 

3.7.2 查询视图 

3.7.3 更新视图 

3.7.4 视图的作用 

3.8 小结

第 4 章 数据库安全性

4.1 计算机安全性概述

4.1.1 计算机系统的三类安全性问题

技术安全类,管理安全类,政策法律类

4.1.2 安全标准简介

TCSEC标准

描述安全性级别划分的指标:安全策略,责任,保证,文档

TCSEC/TDI安全级别划分

各安全级别之间:偏序向下兼容

CC标准

提出国际公认的表述信息技术安全性的结构

把信息产品的安全要求分为:安全功能要求,安全保证要求

CC评估保证级划分

评估保证级

定义

TCSEC安全级别(近似相当)

EAL1

功能测试(functionally tested

EAL2

结构测试(structurally tested

C1

EAL3

系统地测试和检查(methodically tested and checked

C2

EAL4

系统地设计、测试和复查(methodically designedtestedand reviewed

B1

EAL5

半形式化设计和测试(semiformally designed and tested

B2

EAL6

半形式化验证的设计和测试(semiformally verified design and tested)

B3

EAL7

形式化验证的设计和测试(formally verified design and tested

A1

4.2 数据库安全性控制

常用方法:用户标识和鉴定,存取控制,视图,审计,密码存储 

4.2.1 用户身份鉴别 

用户标识与鉴别

系统提供的最外层安全保护措施

口令:系统核对口令以鉴别用户身份

4.2.2 存取控制

存取控制机制组成:定义用户权限,合法权限检查

用户权限定义和合法权检查机制一起组成DBMS的安全子系统

常用存取控制方法:自主存取控制,强制存取控制

4.2.3 自主存取控制方法 

通过SQQL的GRANT语句和REVOKE语句实现

用户权限组成:数据对象,操作类型

4.2.4 授权:授予与收回 

授予GRANT

GRANT语句的一般格式

GRANT <权限>[,<权限>]...
[ON<对象类型><对象名>]
TO<用户>[,<用户>]...
[WITH GRANT OPTION];

语义:将对指定操作对象的指定操作权限授予指定的用户

例:把查询Student表权限授给用户U1

GRANT SELECT
ON TABLE Student
TO U1;

 例:把对Student表和Course表的全部权限授予用户U2和U3

GRANT ALL PRIVILIGES
ON TABLE Student,Course
TO U2,U3;

把对表SC的查询权限授予所有用户

GRANT SELECT
ON TABLE SC
TO PUBLIC;

 例:把查询Student表和修改学生学号的权限授给用户U4

GRANT UPDATE(Sno),SELECT
ON TABLE Student
TO U4;

对属性列的授权时必须明确指出相应属性列名

例:把对表SC的INSERT权限授予U5用户,并允许他再将此权限授予其他用户

GRANT INSERT
ON TABLE SC
TO U5
WITH GRANT OPTION;

U5可以传播此权限给U6,并且允许U6再将此权限授予其他用户

GRANT INSERT 
ON TABLE SC 
TO U6 
WITH GRANT OPTION;

同样U6还可以将此权限授予U7

GRANT INSERT 
ON TABLE SC 
TO U7;

但U7不能再传播此权限

回收REVOKE

授予的权限可以由DBA或其他授权者用REVOKE语句收回

REVOKE <权限>[,<权限>]...
[ON <对象类型> <对象名>]
FROM <用户名>[,<用户>]...;

例:把用户U4修改学生学号的权限收回

REVOKE UPDATE(Sno)
ON TABLE Student
FROM U4;

 例:收回所有用户对表SC的查询权限

REVOKE SELECT
ON TABLE SC
FROM PUBLIC;

例:把用户U5对SC表的INSERT权限收回

REVOKE INSERT
ON TABLE SC
FROM U5 CASCADE;

将用户U5的INSERT权限收回的时候必须级联(CASCADE)收回

系统只收回直接或间接从U5处获得的权限

创建数据库模式的权限

CREATE USER <username>
[WITH] [DBA|RESOURCE|CONNECT]

拥有的权限

可否执行的操作

CREATE USER

CREATE SCHEMA

CREATE TABLE

登录数据库 执行数据查询和操纵

DBA

可以

可以

可以

可以

RESOURCE

不可以

不可以

可以

可以

CONNECT

不可以

不可以

不可以

可以,但必须拥有相应权限

4.2.5 数据库角色 

被命名的一组与数据库操作相关的权限

角色是权限的集合

可以为一组具有相同权限的用户创建一个角色

简化授权的过程

角色的创建

CREATE ROLE <角色名>

给角色授权

GRANT <权限> [,<权限>]...
ON <对象类型>对象名
TO <角色> [,<角色>]...

将一个角色授予其他的角色或用户

GRANT <角色1>[,<角色2>]...
TO <角色3>[,<用户1>]...
[WITH ADMIN OPTION]

角色权限的收回

REVOKE <权限>[,<权限>]...
ON <对象类型><对象名>
FROM <角色>[,<角色>]...

 例:通过角色来实现将一组权限授予一个用户

首先创建一个角色R1

CREATE ROLE R1;

然后使用GRANT语句,使角色R1拥有Studennt表的SELECT、UPDATE、INSERT权限

GRANT SELECT,UPDATE,INSERT
ON TABLE Student
TO R1;

将这个角色授予王平,张明,赵玲,使他们具有角色R1所包含的全部权限

GRANT R1
TO 王平,张明,赵玲;

可以一次性通过回收王平的这3个权限

REVOKE R1
FROM 王平;

 例:角色权限修改

GRANT DELETE
ON TABLE Student
TO R1

REVOKE SELECT
ON TABLE Student
FROM R1;

4.2.6 强制存取控制方法 

4.3 视图机制 

例:建立计算系学生的视图,把对该视图的SELECT权限授予王平,把该视图上的所有操作权限授予张明

先建立计算机系学生的视图CS_Student

CREATE VIEW CS_Student
AS
SELECT *
FROM Student
WHERE Sdept='CS';

在视图上进一步定义存取权限

GRANT SELECT
ON CS_Student
TO 王平;

GRANT ALL PRIVILIGES
ON CS_Student
TO 张明;

4.4 审计 

用户级审计:

针对自己创建的数据库表或视图进行审计

记录所有用户对这些表或视图的一切成功和(或)不成功的访问要求以及各种类型的SQL操作

系统级审计:

DBA设置

监测成功或失败的登录要求

监测GRANT和REVOKE操作以及其他数据库级权限下的操作

AUDIT语句:设置审计功能

NOAUDIT语句:取消审计功能

例:对修改SC表结构或修改SC表数据的操作进行审计

AUDIT ALTER,UPDATE
ON SC;

例:取消对SC表的一切审计

NOAUDIT ALTER,UPDATE
ON SC;

4.5 数据加密 

4.6 其他安全性保护 

4.7 小结

第 5 章 数据库完整性

数据的完整性:防止数据库中存在不正确的数据

数据的安全性:保护数据库防止恶意的破坏和非法的存取

5.1 实体完整性 

5.1.1 定义实体完整性 

例:将Student表中的Sno属性定义为码

在列级定义主码

CREATE TABLE Student
  (Sno CHAR(9) PRIMARY KEY,
   Sname CHAR(20) NOT NULL,
   Sage SMALLINT,
   Sdept CHAR(20));

在表级定义主码

CREATE TABLE Student
  (Sno CHAR(9),
   Sname CHAR(20) NOT NULL,
   Sage SMALLINT,
   Sdept CHAR(20),
   PRIMARY KEY(Sno)
);

例:将SC表中Sno,Cno属性组定义为码

CREATE TABLE SC
 (Sno CHAR(9) NOT NULL,
  Cno CHAR(4) NOT NULL,
  Grade SMALLINT,
  PRIMARY KEY(Sno,Cno)    /*只能在表级定义主码*/
);

 有两个及以上的主码时只能在表级定义

5.1.2 实体完整性检查和违约处理 

5.2 参照完整性

5.2.1 定义参照完整性

在CREATE TABLE中用FOREIGN KEY短语定义哪些列为主码

用REFERENCES短语指明这些外码参照哪些表的主码

例:关系SC中一个元组表示一个学生选修的某门课程的成绩,(Sno, Cno)是主码,Sno,Cno分别参照引用Student表的主码和Course表的主码

CREATE TABLE SC
    (Sno CHAR(9) NOT NULL,
     Cno CHAR(4) NOT NULL,  
     Grade SMALLINT,
     PRIMARY KEY (Sno, Cno),   /*在表级定义实体完整性*/
     FOREIGN KEY (Sno) REFERENCES Student(Sno),    /*在表级定义参照完整性*/
     FOREIGN KEY (Cno) REFERENCES Course(Cno)     /*在表级定义参照完整性*/
);

5.2.2 参照完整性检查和违约处理

例:显式说明参照完整性的违约处理示例

CREATE TABLE SC
    (Sno   CHAR(9)  NOT NULL,
     Cno   CHAR(4)  NOT NULL,
     Grade  SMALLINT,
     PRIMARY KEY(Sno, Cno),			
     FOREIGN KEY (Sno) REFERENCES Student(Sno) 
	 ON DELETE CASCADE     /*级联删除SC表中相应的元组*/
     ON UPDATE CASCADE,    /*级联更新SC表中相应的元组*/
     FOREIGN KEY (Cno) REFERENCES Course(Cno) 	                    
         ON DELETE NO ACTION 	
         /*当删除course 表中的元组造成了与SC表不一致时拒绝删除*/
         ON UPDATE CASCADE
         /*当更新course表中的cno时,级联更新SC表中相应的元组*/
);

5.3 用户定义的完整性

5.3.1 属性上的约束条件

CREATE TABLE时定义

列值非空NOT NULL

列值唯一UNIQUE

检查列值是否满足一个布尔表达式CHECK

例:建立部门表DEPT,要求部门名称Dname列取值唯一,部门编号Deptno列为主码

CREATE TABLE DEPT
   (Deptno NUMERIC(2),
    Dname CHAR(9) UNIQUE,    /*要求Dname列值唯一*/
    Location CHAR(10),
    PRIMARY KEY (Deptno)
);

例:Student表的Ssex只允许取“男”或“女”

CREATE TABLE Student
   (Sno  CHAR(9) PRIMARY KEY,
    Sname CHAR(8) NOT NULL,                     
    Ssex  CHAR(2) CHECK (Ssex IN (‘男’,‘女’)),    /*性别属性Ssex只允许取'男'或'女'*/
    Sage SMALLINT,
    Sdept CHAR(20)
);

5.3.2 元组上的约束条件

例:当学生的性别是男时,其名字不能以Ms.打头

CREATE TABLE Student
   (Sno CHAR(9),
    Sname CHAR(8) NOT NULL,
    Ssex CHAR(2),
    Sage SMALLINT,
    Sdept CHAR(20),
    PRIMARY KEY (Sno),
    CHECK (Ssex='女' OR Sname NOT LIKE 'Ms.%')
    /*定义了元组中Sname和Ssex两个属性值之间的约束条件*/
);

5.4 完整性约束命名子句 

CONSTRAINT 约束

CONSTRAINT <完整性约束条件名> [PRIMARY KEY短语 | FOREIGN KEY短语 | CHECK短语]

例:建立学生登记表Student,要求学号在90000~99999之间,姓名不能取空值,年龄小于30,性别只能是“男”或“女”

CREATE TABLE Student
   (Sno NUMERIC(6)
    CONSTRAINT C1 CHECK (Sno BETWEEN 90000 AND 99999),
    Sname  CHAR(20)  
    CONSTRAINT C2 NOT NULL,
    Sage  NUMERIC(3)
    CONSTRAINT C3 CHECK (Sage < 30),
    Ssex CHAR(2)
    CONSTRAINT C4 CHECK (Ssex IN ('男','女')),
    CONSTRAINT StudentKey PRIMARY KEY(Sno)
);

*5.5 域中的完整性限制 

5.6 断言 

5.7 触发器 

5.7.1 定义触发器 

CREATE TRIGGER <触发器名>  
       {BEFORE | AFTER} <触发事件> ON <表名>
        FOR EACH  {ROW | STATEMENT}
       [WHEN <触发条件>]
        <触发动作体>

例:假设在TEACHER表上创建了一个AFTER UPDATE触发器,如果表TEACHER有1000行,执行如下语句:

UPDATE TEACHER SET Deptno=5;

如果该触发器为语句级触发器,那么执行完该语句后,触发器只发生一次

如果是行级触发器,触发动作将执行1000次

例:定义一个BEFORE行级触发器,为教师表TEACHER定义完整性规则“教授的工资不得低于4000元,如果低于4000元,自动改为4000元”

CREATE TRIGGER Insert_Or_Update_Sal 
  BEFORE INSERT OR UPDATE ON Teacher  
  /*触发事件是插入或更新操作*/
  FOR EACH ROW    /*行级触发器*/
  AS BEGIN    /*定义触发动作体,是PL/SQL过程块*/
    IF (new.Job='教授') AND (new.Sal < 4000) THEN   
    new.Sal :=4000;                
    END IF;
END;                               

例:定义AFTER行级触发器,当教师表TEACHER的工资发生变化后就自动在工资变化表Sal_log中增加一条相应记录

首先建立工资变化表Sal_log

CREATE TABLE Sal_log
  (Eno  NUMERIC(4)  references teacher(eno),
   Sal  NUMERIC(7,2),
   Username  char(10),
   Date  TIMESTAMP
);
CREATE TRIGGER Insert_Sal               	
  AFTER INSERT ON Teacher      	/*触发事件是INSERT*/
  FOR EACH ROW
  AS BEGIN
    INSERT INTO Sal_log VALUES(
      new.Eno,new.Sal,CURRENT_USER,CURRENT_TIMESTAMP);
END;
CREATE TRIGGER Update_Sal            	
   AFTER UPDATE ON Teacher    /*触发事件是UPDATE */
   FOR EACH ROW
   AS BEGIN 
     IF (new.Sal <> old.Sal) THEN INSERT INTO Sal_log VALUES(
          new.Eno,new.Sal,CURRENT_USER,CURRENT_TIMESTAMP);
     END IF;
END;

5.7.2 激活触发器 

例:执行修改某个教师工资的SQL语句,激活上述定义的触发器

UPDATE Teacher SET Sal=800 WHERE Ename='陈平';

  执行顺序:

执行触发器Insert_Or_Update_Sal

执行SQL语句"UPDATE Teacher SET Sal=800 WHERE Ename='陈平';"

执行触发器Insert_Sal;

执行触发器Update_Sal

5.7.3 删除触发器 

DROP TRIGGER <触发器名> ON <表名>;

例:删除教师表Teacher上的触发器Insert_Sal

DROP TRIGGER Insert_Sal ON Teacher;

5.8 小结

第 6 章 关系数据理论数据库设计

6.1 问题的提出

6.2 规范化 

6.2.1 函数依赖 

6.2.2 码 

6.2.3 范式 

6.2.4 2NF 

6.2.5 3NF 

6.2.6 BCNF 

6.2.7 多值依赖 

6.2.8 4NF 

6.2.9 规范化小结

6.3 数据依赖的公理系统

*6.4 模式的分解 

6.4.1 模式分解的三个定义 

6.4.2 分解的无损连接性和保持 函数依赖性 

6.4.3 模式分解的算法 

6.5 小结

第 7 章 数据库设计

7.1 数据库设计概述 

7.1.1 数据库设计的特点 

7.1.2 数据库设计方法 

7.1.3 数据库设计的基本步骤 

7.1.4 数据库设计过程中的各级模式

7.2 需求分析 

7.2.1 需求分析的任务 

7.2.2 需求分析的方法

7.2.3 数据字典 

7.3 概念结构设计 

7.3.1 概念模型 

7.3.2 E-R 模型 

*7.3.3 扩展的 E-R 模型 

*7.3.4 UML 223

7.3.5 概念结构设计 

7.4 逻辑结构设计 

7.4.1 E-R 图向关系模型的转换 

7.4.2 数据模型的优化 

7.4.3 设计用户子模式 

7.5 物理结构设计 

7.5.1 数据库物理设计的内容和方法

7.5.2 关系模式存取方法选择 

7.5.3 确定数据库的存储结构 

7.5.4 评价物理结构 

7.6 数据库的实施和维护

7.6.1 数据的载入和应用程序的调试

7.6.2 数据库的试运行 

7.6.3 数据库的运行和维护 

7.7 小结

7.8 作业

学校中有若干系,每个系有若干班级和教研室,每个教研室有若干教员,其中有的教授和副教授每人各带若干研究生,每个班有若干学生,每个学生选修若干课程,每门课可由若干学生选修。请用 E-R 图画出此学校的概念模型。

某工厂生产若干产品,每种产品由不同的零件组成,有的零件可用在不同的产品上。这些零件由不同的原材料制成,不同零件所用的材料可以相同。这些零件按所属的不同产品分别放在仓库中,原材料按照类别放在若干仓库中。请用 E-R 图画出此工厂产品、零件、材料、仓库的概念模型。

第 8 章 数据库编程

8.1 嵌入式 SQL 

8.1.1 嵌入式 SQL 的处理过程 

8.1.2 嵌入式 SQL 语句与主语言之间的通信

8.1.3 不用游标的 SQL 语句 

8.1.4 使用游标的 SQL 语句 

8.1.5 动态 SQL 

8.2 过程化 SQL 

8.2.1 过程化 SQL 的块结构 

8.2.2 变量和常量的定义 

8.2.3 流程控制 

8.3 存储过程和函数 

8.3.1 存储过程 

8.3.2 函数 

*8.3.3 过程化 SQL 中的游标

8.4 ODBC 编程 

8.4.1 ODBC 概述

8.4.2 ODBC 工作原理概述 

8.4.3 ODBC API 基础 

8.4.4 ODBC 的工作流程

*8.5 OLE DB 

*8.6 JDBC 编程

8.7 小结

第 9 章 关系查询处理和查询优化

9.1 关系数据库系统的查询处理 

9.1.1 查询处理步骤 

9.1.2 实现查询操作的算法示例

9.2 关系数据库系统的查询优化 

9.2.1 查询优化概述 

9.2.2 一个实例 

9.3 代数优化

9.3.1 关系代数表达式等价变换规则

9.3.2 查询树的启发式优化 

9.4 物理优化 

9.4.1 基于启发式规则的存取路径 

9.4.2 基于代价估算的优化

*9.5 查询计划的执行

9.6 小结

第 10 章 数据库恢复技术

10.1 事务的基本概念 

10.2 数据库恢复概述 

10.3 故障的种类

10.4 恢复的实现技术 

10.4.1 数据转储

10.4.2 登记日志文件 

10.5 恢复策略

10.5.1 事务故障的恢复

10.5.2 系统故障的恢复

10.5.3 介质故障的恢复 

10.6 具有检查点的恢复技术 

10.7 数据库镜像

10.8 小结

第 11 章 并发控制

11.1 并发控制概述

11.2 封锁 

11.3 封锁协议

11.4 活锁和死锁 

11.4.1 活锁 

11.4.2 死锁 

11.5 并发调度的可串行性

11.5.1 可串行化调度

11.5.2 冲突可串行化调度

11.6 两段锁协议 

11.7 封锁的粒度

11.7.1 多粒度封锁 

11.7.2 意向锁 

*11.8 其他并发控制机制 

11.8.1 多版本并发控制 

11.8.2 改进的多版本并发控制 

11.9 小结

第 12 章 数据库技术发展概述

12.1 数据库管理系统的基本功能

12.2 数据库管理系统的系统结构

12.2.1 数据库管理系统的层次结构 

12.2.2 关系数据库管理系统的运行

12.3 语言处理层 

12.3.1 语言处理层的任务和工作步骤 

12.3.2 解释方法 

12.3.3 预编译方法 

12.4 数据存取层 

12.4.1 数据存取层的系统结构 

12.4.2 数据存取层的功能子系统 

12.5 缓冲区管理 

12.6 数据库的物理组织 

12.7 小结

第 13 章 大数据管理

13.1 数据库技术发展历史回顾 

13.2 数据库发展的三个阶段 

13.2.1 第一代数据库系统 

13.2.2 第二代数据库系统 

13.2.3 新一代数据库系统 

13.3 数据库系统发展的特点 

13.3.1 数据模型的发展 

13.3.2 数据库技术与相关技术相结合

13.3.3 面向应用领域的数据库新技术

13.4 数据管理技术的发展趋势 

13.4.1 数据管理技术面临的挑战 

13.4.2 数据管理技术的发展与展望

13.5 小结

第 14 章 数据仓库与数据挖掘

14.1 大数据概述

14.1.1 什么是大数据

14.1.2 大数据的特征

14.2 大数据的应用

14.2.1 感知现在 预测未来——互联网文本大数据管理与挖掘

14.2.2 数据服务 实时推荐一基于大数据分析的用户建模

14.3 大数据管理系统

14.3.1 NoSQL 数据管理系统 

14.3.2 NewSQL 数据库系统 

14.3.3 MapReduce 技术 

14.3.4 大数据管理系统的新格局 

14.4 小结

第 15 章 内存数据库系统

15.1 概述

15.2 内存数据库的发展历程

15.3 内存数据库的特性

15.4 内存数据库的关键技术

15.4.1 数据存储

15.4.2 查询处理及优化

15.4.3 并发与恢复

15.5 小结

第 16 章 数据仓库与联机分析处理技术

16.1 数据仓库技术 

16.2 联机分析处理技术 

16.3 数据挖掘技术 

16.4 大数据时代的新型数据仓库 

16.5 小结

附录

大厂数据库及SQL面试题

数据库系统与文件系统的主要区别是文件系统不能解决数据冗余和数据独立性问题,而数据库系统可以解决

找到相似用户

找到未买的但相似用户买过的商品


http://www.kler.cn/a/382619.html

相关文章:

  • C++ std::optional用法介绍
  • 08LangChain实战课 - 输出解析器深入与Pydantic解析器实战
  • PostgreSQL JOIN 操作深入解析
  • Windows、Linux系统上进行CPU和内存压力测试
  • 网络安全从入门到精通(特别篇II):应急响应之DDOS处置流程
  • QT创建按钮篇
  • OpenCV C++ 计算两幅图像之间的多尺度结构相似性(MSSIM)
  • 前端八股文(三)JS、ES6 持续更新中。。。
  • pycharm小游戏贪吃蛇及pygame模块学习()
  • ORB-SLAM2源码学习:ORBextractor.cc:ComputePyramid构建图像金字塔①
  • 【C/C++】模拟实现strcat
  • Pr 视频过渡:沉浸式视频 - VR 光线
  • git 提交管理
  • ArcGIS006:ArcMap常用操作151-200例动图演示
  • Go构造函数的实现
  • 如何设置内网IP的端口映射到公网
  • Java+Swing可视化图像处理软件
  • 720VR全景的未来发展趋势与行业前景
  • C++面向对象高级开发B
  • ansible进阶功能
  • 鸿蒙应用App测试-通用测试
  • 什么是 ASP.NET Core?与 ASP.NET MVC 有什么区别?
  • 怎麼解決IP地址衝突的問題?
  • 结对编程 --- 软件工程
  • Java学习路线:Maven(二)scope、optional和exclusions
  • Late Chunking×Milvus:如何提高RAG准确率