系统架构设计师考点—数据库技术基础
一、备考指南
数据库技术基础主要考查的是数据库的三级模式两级映像、数据库设计、关系运算、规范反规范化、事务处理、分布式数据库等相关知识,同时也是重点考点,在上午试题和案例分析文中都可能出现。上午试题会占3~5分。
二、三级模式两级映像
1、内模式:管理如何存储物理的数据,对数据的存储方式、优化、存放等。
2、模式:又称为概念模式,就是通常使用的表这个级别,根据应用、需求将物理数据划分成一张张表。
3、外模式:对应数据库中的视图这个级别,将表进行一定的处理后再提供给用户使用。例如,将用户表中的用户名和密码组成视图提供给登录模块使用,而用户表中的其他列则不对该模块开放,增加了安全性。
4、外模式--模式映像: 是表和视图之间的映像,存在于概念级和外部级之间,若表中数据发生了修改,只需要修改此映像,而无须修改应用程序。
5、模式--内模式映像: 是表和数据的物理存储之间的映像,存在于概念级和内部级之间,若修改了数据存储方式,只需要修改此映像,而不需要去修改应用程序。
三、数据库的设计
1、数据库设计的阶段
(1)需求分析
即分析数据存储的要求,产出物有数据流图、数据字典、需求说明书。获得用户对系统的三个要求:信息要求、处理要求、系统要求。
(2)概念结构设计。
就是设计E-R图,也即实体-联系图,与物理实现无关,就是说明有哪些实体,实体有哪些属性。工作步骤包括:选择局部应用、逐一设计分E-R图、E-R图合并。
分E-R图进行合并时,它们之间存在的冲突主要有以下三类。
①属性冲突。同一属性可能会存在于不同的分E-R图中,由于设计人员不同或是出发点不同,属性的类型、取值范围、数据单位等可能会不一致。
②命名冲突。相同意义的属性,在不同的分E-R 图上有着不同的命名,或是名称相同的属性在不同的分E-R图中代表着不同的意义。
③结构冲突。包医实体在不的分E一R图中有不同的属性,同一对象在某一分ER图中被抽象为实体,而在另一分E-R图文被抽象为属性。(21年11月考了选择题)
(3)逻辑结构设计。
将E-R图转换成关系模式,也即转换成实际的表和表中的列属性,这里要考虑很多规范化的东西。工作步骤包括:确定数据模型、将E-R图转换成指定的数据模型、确定完整性约束和确定用户视图。
(4)物理设计。
根据生成的表等概念,生成物理数据库。工作步骤包括确定数据分布、存储结构和访问方式。
(5)数据库实施阶段。
数据库设计人员根据逻辑设计和物理设计阶段的结果建立数据库,编制与调试应用程序,组织数据入库,并进行试运行。
(6)数据库运行和维护阶段。
数据库应用系统经过试运行即可投入运行,但该阶段需要不断地对系统进行评价、调整与修改。
四、E-R模型
1、数据模型的三要素:数据结构、数据操作、数据的约束条件。
在E-R (Entity-Relationships)模型中,使用椭圆表示属性(一般没有)、长方形表示实体、菱形表示联系,联系的两端要填写联系类型。
2、联系类型:一对一(1:1)、一对多(1:N)、多对多(M:N)。
3、属性分类:简单属性和复合属性(属性是否可以分割)、单值属性和多值属性(属性有多个取值)、NULL属性(无意义)、派生属性(可由其他属性生成)。
4、E-R模型转换为关系模型,实际就是转换为多少张表。
(1)每个实体都对应一个关系模式。
(2)三种联系类型:1:1联系中,联系可以放到任意的两端实体中,作为一个属性(要保证1:1的两端关联);1:N联系中,联系可以单独作为一个关系模式,也可以在N端中加入1端实体的主键;M:N的联系中,联系必须作为一个单独的关系模式,其主键是M和N端的联合主键。
五、关系代数运算
1、并:结果是两张表中所有记录数合并,相同记录只显示一次。
2、交:结果是两张表中相同的记录。
3、差:S1-S2,结果是S1表中有而S2表中没有的那些记录。设有S1和S2,其关系及并、交、差结果如图4-4所示。
4、 笛卡儿积:S1×S2,产生的结果包括S1和S2的所有属性列,并且S1中每条记录依次和S2中所有记录组条记录,最终属性列为S1+S2属性列,记录数为S1×S2记录数。(保存S1和S2的所有列)(24年11月考了选择题)
5、投影:实际是按条件选择某关系模式中的某列,列也可以用数字表示。
6、选择:实际是按条件选择某关系模式中的某条记录。
7、自然连接:结果显示全部的属性列,但是相同属性列只显示一次,显示两个关系模式中属性相同且值相同的记录。