数据库原理复习资料
98001 98001 98005
数据库 数据结构 微积分
62 73 80
学生
学生.学号 姓名 年龄
选课
所在系 课名 成绩
98001 98001 98005
张三 张三 李四
20 20 21
计算机系 计算机系 数学系
数据库 数据结构 微积分
62 73 80
【例4-5】给出选课、选修课和必修课3个关系,它们的关系模式 为: 选课(学号,课号,成绩);选修课(课号,课名);必修课(课 号,课名). 结果集 像集 结果集
数据库(DB):按数据结构来存储和管理数据的计算机软件系统。
(1)数据的物理独立性(Physical Data Independence)
应用程序对数据存储结构(也称物理结构)的依赖程度。数
据物理独立性高是指当数据的物理结构发生变化时,应用程序 不需要修改也可以正常工作。 (2) 数据的逻辑独立性(Logical Data Independence)
19
20 19 20 19 20 19 20 19 20
目相加 基相乘 改属性
李丽 李丽 李丽 张晓刚 张晓刚 张晓刚 张晓刚
4. 数据库中基本关系的性质 1) 同一属性的数据具有同质性。 2) 同一关系的属性名具有不能重复性。 a. 不同的关系可以有相同的属性名; b.类似属性间可以不同质。 3) 关系中的列位置具有顺序无关性。 4)关系中的元组位置具有顺序无关性。 5)关系具有元组无冗余性。 6) 关系中每一个分量都必须是不可分的数据项。 关系操作的基本内容 关系操作包括数据查询、数据维护和数据控制三大功能。 关系操作的数据查询和数据维护功能使用关系代数中的选择、投 影、连接、除、并、交、差、广义笛卡儿积8种操作。 前四种操作:专门的关系运算 后四中操作:传统的集合运算 关系代数的五种基本运算:并、差、选择、投影和乘积
S1
S4 S5
B
A B
选课÷必修课 学号 S3 成绩 B
2.2.2 概念模型的表示方法
概念模型是对信息世界的管理对象、属性及联系等信息的描述 形式。概念模型不依赖计算机及DBMS,它是现实世界的真实全 面反映。 1) 用长方形表示实体集,长方形内写明实体集名。 2) 用椭圆形表示实体集的属性,并用线段将其与相应的实体集连 接起来。 3) 用菱形表示实体集间的联系,菱形内写上联系名,用线段分别 与有关实体集连接起来,在线段旁标出联系的类型。如果联系 具有属性,则该属性仍用椭圆框表示,仍需要用线段将属性与 其联系连接起来。
RS A
a1
B
b1 b1 b1
C
c1 c1 c1
A
a1 a1 a2
B
b2 b3 b2
C
c2 c2 c1
RS A a1 a2 R-S A a1
B
b2 b2
C
c2 c1
a1 a1
a1
a1 a1
b2
b2 b2 b2 b2 b2
c2
c2 c2 c1 c1 c1
a1
a1 a2 a1 a1 a2
b2
b3 b2 b2 b3 b2
产品号
产品名
(2) 1:n联系的转换方法
(1)将联系转换为一个独立的关系; 其属性由与该联系相连的各实体集的码以及联系本身的属性组成 关系的码为n端实体集的码; 2)在n端实体集中增加新属性 新属性由联系对应的1端实体集的码和联系自身的属性构成 新增属性后原关系的码不变。
方案1:联系形成的关系独立存在。 仓库(仓库号,地点,面积); 产品(产品号,产品名,价格); 仓储(仓库号,产品号,数量). 方案2:联系形成的关系与n端对象合并。 仓库(仓库号,地点,面积); 产品(产品号,产品名,价格,仓库 号,数量).
15
给出三个域: D1 = 姓名 = {王平,李丽,张晓刚};
D2 = 性别 = {男,女}; D3 = 年龄 = {19,20}.
则D1,D2,D3的笛卡儿积为D1×D2×D3 ,其基数为三个域基数之积,其目为属性之和 姓名 王平 王平 性别 男 男 年龄 19 20
王平
王平 李丽
女
女 男 男 女 女 男 男 女 女
间接超类:C1是C3的间接超类
一个类可以继承它的所有超类的属性和方法。
3.1.3 数据库设计的基本方法
新奥尔良法:规范设计法中的一种,它将数据库设计分为4个阶 段:需求分析、概念设计、逻辑设计和物理设计。 改进方法:分6个阶段进行:需求分析、概念结构设计、逻辑结 构设计、物理结构设计、数据库实施和数据库运行与维护。 为了简化E-R图,在对E-R图的调整中应当遵循的一条原则:现实
应用程序对数据全局逻辑结构的依赖程度。数据逻辑独立性
高是指当数据库系统的数据全局逻辑结构改变时,它们对应的 应用程序不需要改变仍可以正常运行。
1.2.4 数据库系统管理数据特点
数据的安全性控制指保护数据库,以防止不合法的使用造成的数 据泄漏、破坏和更改。 数据的完整性控制指为保证数据的正确性、有效性和相容性, 防止不符合语义的数据输入或输出所采用的控制机制。 数据的并发控制指排除由于数据共享,即用户并行使用数据库中 的数据时,所造成的数据不完整和系统运行错误问题。
5. 数据库中数据的最小存取单位是数据项
数据模型用数据描述语言给出的精确描述称为数据模式。 数据库 的模式由外模式,模式和内模式三级模式组成。
1. 数据库的三级模式结构
(1) 逻辑模式及概念数据库
对数据库中数据的整体逻辑结构和特征的描述。 一个数据库系统只能有一个逻辑模式。
(2) 外模式及用户数据库
学号 S1 S1 S1 S2 S2 S3 S3 S4 S4 课号 C1 C2 C3 C1 C3 C1 C3 C1 C2 成绩 A B B A B B B A A 课号 C1 C3 课号 C2 课名 计算机图 形学
必修课
科名 数据结构 操作系统
选课÷选修课 学号 成绩
S5
S5 S5
C2
C3 C1
B
B A
数据库系统原理及应用
复习
宋怀波
2013.6
2. 数据、数据和信息的关系及数据的特征
数据是用于承载信息的物理符号,是信息的最佳表现形式。 正确的数据可表达信息,错误的、虚假的数据不是信息。
1. 数据处理及分类
(1) 数据管理 其他数据处理的核心和基础。 (2) 数据加工 (3) 数据传播 一个数据库系统应由计算机 硬件、数据库、数据库管理 系统、应用软件和数据库管 理员等5部分构成。
13
(3) m:n联系的转换方法
一个m:n联系转换为一个关系:
(1)与该联系相连的各实体集的码以及联系本身的属性均转换 为关系的属性;
(2)新关系的码为两个相连实体码的组合(该码为多属性构成 的组合码)。
转换的关系模型为:
学生(学号,姓名,年龄,性别); 课程(课程号,课程名,学时数); 选修(学号,课程号,成绩).
【例3-1】将图中E-R图转换为关系模型。
职工号 姓名 年龄 方案1:联系形成的关系独立存在 职工(职工号,姓名,年龄); 职工 1 负责 产品 1 产品(产品号,产品名,价格); 负责(职工号,产品号).
方案2:‚负责‛与‚职工‛两关系合并:
职工(职工号,姓名,年龄,产品号); 产品(产品号,产品名,价格); 方案3:‚负责‛与‚产品‛两关系合并: 价格 职工(职工号,姓名,年龄); 产品(产品号,产品名,价格,职工号).
4.1.3 关系的完整性
三类完整性约束:实体完整性、参照完整性、用户定义完整性
1. 关系模型的实体完整性(Entity Integrity) 若属性A是基本关系R的主属性,则属性A的值不能为空值。
2. 关系模型的参照完整性 1) 外码和参照关系 设F是基本关系R的一个或一组属性,但不是关系R的主码(或候 选码)。如果F与基本关系S的主码相对应,则称F是R的外码, 并称R为参照关系,S为被参照关系或目标关系。
2) 参照完整性规则
若F是关系R的外码,它与关系S的主码相对应,则R中每个元组 在F上的值必须取空值或者等于S中某个元组的主码值。
RS A
a1
a1 a2
R
S
B C
B
b1
b2 b2
C
c1
c2 c1
A
A
B
C
a1
a1 a2
b1
b2 b2
c1
c2 c1
a1
a1 a2
b2
b3 b2
c2
c2 c1
a1
b3
c2
选课
课程名 数据库 数据结构 微积分 成绩 62 73 80
学生×选课
学生.学号 姓名 年龄 所在系 选课.学号 课名 成绩
98001 98001 98001 98005 98005 98005
张三 张三 张三 李四 李四 李四
20 20 20 21 21 21
计算机系 计算机系 计算机系 数学系 数学系 数学系
对各个用户或程序所涉及到的数据的逻辑结构和数据特征的描述。 一个数据库系统可以有多个外模式。
(3) 内模式及物理数据库
数据的内部表示或底层描述。 一个数据库只有一个内模式。 1) 外模式/模式的映象:定义并保证了外模式与数据模式之间的对应关系。数 据的逻辑独立性 2) 模式/内模式的映象及作用:定义并保证了数据的逻辑模式与内模式之间的 对应关系。 数据的物理独立性
【例4-2】用关系代数表示在学生课程数据库中查询年龄小 于20岁的学生的操作。
σ年龄<20(学生)
【例4-3】在学生课程数据库中,查询学生的姓名和所在系。 表示为: π姓名,所在系(学生)
【例4-4】设学生和选课关系中的数据如下,学生与选课之间的笛 卡儿积、等值连接和自然连接的结果如表所示。