大学计算机基础(第十一章)
数据库的基本概念
2. 数据库
数据库是长期储存在计算机内,有组织的、可共享的大 量数据的集合,其具有统一的结构形式并存放于统一的存储 介质内,是多种应用数据的集成,并可被各个应用程序所共 享,所以数据库技术的根本目标是解决数据共享问题。
数据库的基本概念
3. 数据库管理系统 数据库管理系统(database management system,
1)数据结构 2)数据操作 3)数不同的应用层次分成3种类型,即概 念数据模型(conceptual date model)、逻辑数据 模型(logic date model)和物理数据模型 (physical date model)。
数据模型的类型
1)概念数据模型简称概念模型 目前,较为有名的概念模型有E-R模型、扩充的E-R 模型、面向对象模型及谓词模型等。
2. E-R模型的图示法 E-R模型用E-R图来表示,如图11-2所示。
11.3 E-R模型
1)实体表示法,在E-R图中用矩形表示实体集,在矩形 内写上该实体集的名称。 2)属性表示法,在E-R图中用椭圆形表示属性,在椭圆形内 写上该属性的名称。 3)联系表示法,在E-R图中用菱形表示联系,菱形内写上联 系名。
≡{t|t∈R∧F(t)为真}
11.5关系代数
其中,F表示选择条件,它是一个逻辑表达式,
取逻辑值“真”或“假”。逻辑表达式F由逻辑运算
符连接各算术表达式组成。算术表达式的基本形式
为σ θ β
其中 变量)或常量,但
又不能同为
常量,是比较符,其可以是≤,≥,<,>,=及≠。
σ θ β 称为基本逻辑条件。
11.5关系代数
由若干个基本逻辑条件经过逻辑运算得到,逻 辑运算为∧(并且)、∨(或者)及┓(否)构成,称为 复合逻辑条件。
例如,对关系R中选择“C”大于20的元组,记
为 σ C>θ20(βR),如表11-3所列,得到无重复元组的
新关系T,如表11-5所示。
11.5关系代数
(3)笛卡儿积 设有n元关系R和m元关系S,它们分别有p和q个
11.6 数据库设计与原理
1. 数据库设计概述 数据库设计中有两种方法,即面向数据的方法
和面向过程的方法。 面向数据的方法是以信息需求 为主,兼顾处理需求;面向过程的方法是以处理需 求为主,兼顾信息需求。由于数据在系统中稳定性 高,数据已成为系统的核心,因此面向数据的设计 方法已成为主流。
11.5关系代数
连接运算又可称为连接运算,这是一种二元运 算,通过它可以将两个关系合并成一个大关系。设 有关系R、S以及比较式,其中i为R中的域,j为S中 的域,含义同前,则可以将它的含义用下式定义 即R与S的连接是由R与S的笛卡儿积中满足限制的元 组构成的关系,一般其元组的数目远远少于R×S的 数目。应当注意的是,在连接中,i与j需具有相同 域,否则无法作比较。
(1)交
假设有n元关系R和n元关系S,它们的交仍然是一个n 元关系,它由属于关系R且属于关系S的元组组成, 记为 R I S ,其形式定义为
R I S ≡{t|t∈R∧t∈S}
显然,R I S=R -(R-S),或者
。
11.5关系代数
例如,对上述的关系R和关系S做交运算的结果 如表11-8所示。
11.5关系代数
11.4 关系模型
4)候选码或候选键。在二维表中唯一标志元组的最 小属性值称为该表的候选码或候选健。 5)主键或主码。从二维表的所有候选键选取一个作 为用户使用的键称为主键或 主码。 6)外键或外码。二维表A中的某属性集F,但F不是A 的主键,并且F是另一个二维表B的主键,则称F为二 维表A的外键或外码。
库、数据库管理系统、数据库管理员、硬件平台、 软件平台等5部分构成。
数据库系统的发展与基本特点
1. 数据库系统的发展 数据管理技术的发展经历了3个阶段,即人工管
理阶段、文件系统阶段和数据库系统阶段。
数据库系统的发展与基本特点
关于数据管理3个阶段中的软硬件背景及处理特点,简单 概括如表11-1所示。
DBMS)是数据库的机构,它是一种系统软件,负责 数据库中的数据组织、数据操作、数据维护、控制 及保护和数据服务等。数据库管理系统是数据系统 的核心。为完成数据库管理系统的功能,数据库管 理系统提供相应的数据语言,有数据定义语言、数 据操纵语言和数据控制语言。
1)数据定义功能。 2)数据操作功能。 3)控制和管理功能。 4)数据通信功能。
11.4 关系模型
1. 关系模型的数据结构 关系模型(relation model)是目前最常用的
数据模型。关系模型的数据结构非常单一,在关系 模型中,现实世界的实体以及实体间的各种联系均 用关系来表示。
11.4 关系模型
关系模型中常用的术语如下所示。 1)元组。在一个二维表(一个具体关系)中, 水平方向的行称为元组。元组对应存储文件中的一 个具体记录。 2)属性。二维表中垂直方向的列称为属性,每 一列有一个属性名。 3)域。域指的是属性的取值范围,也就是不同 元组对同一属性的取值所限定的范围。
元组,则R与S的笛卡儿积记为R×S,其形式定义为 R×S≡{t|t=<tr,ts>∧tr∈R∧ts∈s}
其中R×S是一个m+n元关系,元组个数是p×q。
11.5关系代数
例如,表11-3所示的关系R和表11-6所示的关系S的 笛卡儿积运算的结果关系T如表11-7所示。
11.5关系代数
2. 关系代数的扩充运算
到数据的物理存储结构间的对应关系。
数据库系统的内部体系结构
2)外模式到概念模式的映射。
11.2 数据模型的基本概念
11.2.1 数据模型的概念 11.2.2 数据模型的三要素 11.2.3 数据模型的类型
数据模型的基本概念
数据库中的数据模型可以将复杂的现实世界要 求反映到计算机数据库中的物理世界,这种反映是 一个逐步转化的过程,它分为两个阶段,由现实世 界开始,经历信息世界而至计算机世界,从而完成 整个转化。
1)现实世界(real world)。 2)信息世界(information world)。 3)计算机世界(computer world)。
数据模型的三要素
数据是现实世界符号的抽象,而数据模型(date model)则是数据特征的抽象,其从抽象层次上描述 了系统的静态特征、动态行为和约束条件,为数据 库系统的信息表示与操作提供一个抽象的框架。
数据模型的类型
2)逻辑数据模型也称数据模型
数据模型的类型
3)物理数据模型也称物理模型,它是一种面向 计算机物理表示的模型,此模型给出了数据模型在 计算机上物理结构的表示。
数据库管理系统所支持的数据模型分为3种,即 层次模型、网状模型和关系模型。
11.3 E-R模型
1. E-R模型的基本概念 1)实体。现实世界中的事物可以抽象成为实体,实 体是概念世界中的基本单位,它们是客观存在的且 又能相互区别的事物。 2)属性。现实世界中事物均有一些特性,这些特性 可以用属性来表示。 3)码。唯一标志实体的属性集称为码。 4)域。属性的取值范围称为该属性的域。
11.3 E-R模型
5)联系。 在现实世界中,事物间的关联称为联系。 两个实体 集间的联系实际上是实体集间的函数关系,这种函 数关系可以有下面几种方式,即一对一联系、一对 多或多对一联系、多对多联系。 ① 一对一联系(1∶1)。 ② 一对多联系(1∶n)。 ③ 多对多联系(m∶n)。
11.3 E-R模型
5)二维表中属性名各不相同——属性名唯一性。 6)二维表中属性与次序无关,可任意交换—— 属性的次序无关性。 7)二维表属性的分量具有与该属性相同的值 域——分量值域的统一性。
11.4 关系模型
2. 关系模型的数据操作 1)数据查询。 2)数据删除。 3)数据插入。 4)数据修改。
11.4 关系模型
11.4 关系模型
关系模型采用二维表来表示,二维表一般满足下 面7个性质。
1)二维表中元组个数是有限的——元组个数有 限性。
2)二维表中元组均不相同——元组的唯一性。 3)二维表中元组的次序可以任意交换——元组 的次序无关性。
11.4 关系模型
4)二维表中元组的分量是不可分割的基本数据 项——元组分量的原子性。
11.5关系代数
在实际应用中,最常用的连接是一个称为自然 连接的特例。自然连接要求两个关系中进行比较的 分量必须是相同属性,并且进行等值连接,相当于 恒为“=”,在结果中还要把重复的属性列去掉。自 然连接可记为 RS
11.5关系代数
例如,假设有关系R(见表11-12)及关系S(见表11-13), 则关系R与关系S自然连接后的结果如表11-14所示。
11.5关系代数
例如,有关系T,如表11-9所示;关系R,如表11-10所示;求关 系S=T÷R,结果关系S如表11-11所示。
除法的定义虽然较复杂,但在实际中,除法的意义 还是比较容易理解的。
11.5关系代数
(3)连接运算与自然连接运算 在数学上,可以用笛卡儿积建立两个关系间的连 接,但这样得到的关系庞大,而且数据大量冗余, 在实际应用中,一般两个相互连接的关系往往须满 足一些条件,所得到的结果也较为简单,这样就引 入了连接运算与自然连接运算。
(2)除如果将笛卡儿积运算看做乘运算的话,那么 除运算就是其逆运算。当关系T=R×S时,则可将除 运算定义为
T÷R=S 或 T/R=S
式中,S称为T除以R的商。
11.5关系代数
在除运算中关系S的域由关系T中那些不出现在 关系R中的域所组成,对于关系S中任一有序组,由 它与关系R中每个有序组所构成的有序组均出现在关 系T中。
3. 关系模型的完整性约束 关系模型允许定义3类数据约束,分别是实体完整性 约束、参照完整性约束以及用户定义的完整性约束。
(1)实体完整性约束 (2)参照完整性约束 (3)用户定义的完整性约束