当前位置:文档之家› 数据需求分析与建模

数据需求分析与建模


数据字典应用


外部实体说明 > 实体名或标识:即在数据流图中所对应的实体名称 > 描述:说明实体的用途与目的 > 别名:可选择的名字 > 输入数据流 > 输出数据流 数据元素说明的常用表示法 > :由…构成 > :和,代表顺序连接的关系 > [ | ]:或,代表从中选择一个 > {}*:n次重复 > ():代表可选的数据项 > *…*:表示特定限制的注释
过程/加工
输入数据在此进 行变换产生输 出数据,其中要 注明加工的名称
数据输入的源点或 数据输出的 汇点,其中要注明 外部实体/源/宿 源点和汇点的名称
数据流
实时连接
数据流图:图的结构
数据流图:分层的DFD
绘制数据流图:构建顶层图
绘制数据流图:绘制DFD片断
数据建模过程
需求捕获与分析
E-R图
多对一联系性 组合标识判别原则 3 4 对象命名 确定实体标 识(键) 命名原则
实体的标识是指能够惟一标识一个实体的属性或属性组,也就是该 实体的关键字。
实体分析法:确定实体间联系



一对一关系: > 两个实体都是强制性的 > 仅有一类实体是强制的 > 两类实体均非强制性的 一对多关系 > 多端强制性 > 多端非强制性 多对多关系
数据字典应用

数据流说明 > 数据流名或标识:即在DFD中所对应的数据流名称 > 描述:说明数据流的用途与目的 > 别名:可选择的名字 > 数据源:数据流的起点 > 目的:数据流的终止点 > 记录:每个数据流都代表了一组被称为记录或数据 结构的相关实体 > 量和频率:描述单位时间内数据流发生的次数。
数据字典应用


数据存储(文件)说明 > 数据存储名或标识:在DFD中对应的数据存储名称 > 描述:说明数据存储的用途与目的 > 别名:可选择的名字 > 属性:输入或离开数据存储的标准数据流图名 > 量和频率:描述数据存储中记录出现的可估计的个 数和更新频度 加工说明 > 加工名或标识:即在数据流图中所对应的加工名称 > 描述:说明加工的用途与目的 > 加工数据标识:用来指明加工所在的层次 > 加工描述:说明包括的输入和输出数据流
实体-关系图:图例
实体 可选关系 属性 关键属性 关系
强制关系
强制/可选关系
1对多
多对多
实体分析法

确定局部视图的范围:实体的个数应适量 识别实体及标识 确定实体间的联系 分配实体及联系的属性
识别实体及标识
序号 步骤 1 2 对数据对象 进行分类 识别实体与 属性 原则 同一类中的对象在概 念上应具有共性 描述信息原则 多值性原则 存在性原则 描述 这个过程,类似于面向对象中类的识别,也 可以有超类和子类的概念 实体均有描述信息,属性则没有 若描述中存在多个值描述,则即使该描述项 本身无描述信息也应划为实体 若对象类R的描述的值集中去掉某个值,如果 对应用不产生影响,就应为属性,否则应为 实体 属性不再与其描述对象之外的其他对象类发 生联系 若一个对象类的标识是由其它对象类的标识 组成的,则通常应定义为联系 对象名清晰、易于记忆,反应对象的主要特 定,遵守缩写规则
数据需求分析与建模

数据流通过程Leabharlann 数据流图(DFD) 数据存储方式:实体-关系图(ERD) 数据定义方式:数据字典(DD) 数据需求分析与设计要素
数据流图:基本元素
存放数据的地方,这些 数据在以后使用,通常 与实体 - 联系图中的一个 数据实体相对应 数据存储/文件 被加工的数据与流向, 箭头边应给出数据流名 字,可用名词或名词性 短语命名 当过程 / 加工执行时 , 外部实体与过程之间来 回通信


数据共享考虑 > 数据库、文件、XML > 逐段加密问题 > 数据Filter原则 > 谁建立?谁修改?谁查询?谁应用? 数据挖掘与分析 > 查询报表—从规则入手 > BI > 数据挖掘,仓库(电信数据整合)
数据仓库
查询工具 数据仓库 抽取、清理 装载、刷新 OLAP服务器 服务 分析工具 …… 数据挖掘 工具 报表工具
属性综合法 自底向上法 将收集的数据元素作为分析对象,各 层实体及联系通过低层属性综合而成
1.确定属性分类
联系,建立初步数据模型框架; •确定实体构成 •逐步求精,加上必要描述属性, •确定实体间联系联系 形成完整的模型(用户视图) 1.通过对数据元素与应用任务联系的 •将这些视图集成为一个统一的数 定性、定量统计分析技术推导出相应 据模型(用户视图集成) 的信息结构 1.用E-R图描述全局信息结构 优点 减少分析中所涉及的对象数,简 化分析过程;采用图形法使得整 个过程更直观、易理解,有利用 户介入 基于统计分析(定量/定性)推导, 对于较为简单的设计对象特别有效
E-R图到关系模式的转换

一对多关系模式:在n端实体类型对应的关系模式 中加入1端实体类型的键和联系类型的属性
身份证号 客户名 客户 地址 帐户号 联系电话 1 存款者 M 帐户 余额
开户时间
校长(姓名,性别,职称,年龄,校名,任职时间) 学校(校名,地址,电话)
E-R图到关系模式的转换

多对多关系模式:将联系类型也转换成关系模式, 属性为两端实体类型的键加上联系类型的属性
姓名 学号 学生 性别 课程号 年龄 M 考试 N 课程 课程名 授课老师
成绩
学生(学号,姓名,性别,年龄) 课程(课程号,课程名,授课老师) 考试(课程号,学号,成绩)
数据字典应用

数据元素说明 > 数据元素名或标识:即对用户而言有意义的名称; > 别名:可选择的名字 > 类型和长度:说明数据元素的组成部分,是数字、 字母还是其他;而长度则是指其最大的组成个数 > 默认值:即数据元素的一个初始值; > 可接受的值:即数据元素有效的合法取值范围 > 数据源:即对数据元素值的起源点的具体说明 > 安全:对于有权访问或更新每个数据元素的人或部 门的标识 > 有责任用户:负责输入/改变数据元素值的用户标识 > 描述和评论:加上一些更好的说明数据元素的注解
概念结构设计 逻辑结构设计
需求分析阶段
概念设计阶段
数据模型优化 逻辑设计阶段 物理结构设计 设计评价 性能评估 物理设计阶段 物理实现
试运行 数据库实施阶段 使用与维护 运行维护阶段
概念结构设计的方法
方法 别称 要点 步骤 实体分析法 自顶向下法 从总体概念入手,从分析一个单 位的事务活动开始
1.识别用户关心的实体及实体间
数据集市 数据源
OLAP服务器
确定实体间联系时的陷阱
类型 说明 示例
扇形 陷阱
若两个实体类间的一对多联 这样将丢失教师和系之间的联系 系,由一个实体值引出多个 表示。 同一类型的联系值,那么其 学校 系 学校 教师 值图将呈扇形结构,也称为 1 1 包含 拥有 扇形联系。而扇形陷阱是指 双扇 N N 由一个实体引出两种不同类 系 教师 型的扇形联系,形成双扇形 A)E-R模型 B)值图 结构。 是指因为型图包含了传递联 该模型无法表示直接属于学校的教 系,而掩盖了某些特定的直 师 接联系 1 N 1 N
学校 包含 系 拥有 教师
断层 陷阱
E-R图到关系模式的转换

实体模型:每个实体转成一个模式 客户(客户名,身份证号,地址,联系电话)
性别
身份证号 地址
职称 校名 年龄 校长 任职
地址 电话
姓名
客户名 客户 联系电话
学校
任职时间

一对一关系模式:在两个关系模式中的任意一个模式 中,加入另一个模式的键和联系类型的属性 校长(姓名,性别,职称,年龄,校名,任职时间) 学校(校名,地址,电话)
数据需求分析与设计要素


术语表 数据结构分析,对表的内容要区分 > 主要字段和次要字段 > 稳定字段和不稳定字段 > 即时记录和历史记录 另个需要考虑 > 联机事务需要报表需求决策查询需求 > 数据量与增长速度(数据查询失效案例) > 性能与扩展 > 并发可能性与数量
数据需求分析与设计要素
数据字典应用实例
客户基本信息=客户编号+客户名称+身份证号码+手机+小灵通+家庭电话 客户编号={0…9}8 客户名称={字}4 身份证号码=[{0…9}15|{0…9}18] 手机=[{0…9}11|{0…9}12] 小灵通=(区号)+本地号 家庭电话=(区号)+本地号 办公电话=(区号)+本地号 区号={0…9}4 本地号=[{0…9}7|{0…9}8]
相关主题