数据存储和管理
❖ 企业资源计划 (ERP)系统字段长度可变; ❖用唯一的划界字符分隔
❖ CAAT工具处理容易 ❖ 首选,当固定长度不能用时
可变长度
❖ 几种情形
不同类型的记录,包含可变的字段 单一类型的记录,不包含可变字段
❖ 审计处理的难点 ❖ 找到区别的字段/字符过滤文件 ❖ 有时,被审计单位提供的报告文件
用过滤技术处理
❖类似于可变长度数据的处理
本讲内容
❖ 平面文件系统 ❖ 关系数据库管理系统 (RDBMS) ❖ 结构化数据存储的其它形式
平面文件系统
❖ 数据存储在一个或以上的文本文件中 (ASCII/EBCDIC)
能用文本编辑器阅读
❖ 主要以前遗留的COBOL/FORTRAN 系统的 文件
主要特点
❖ 几个数据文件包含了若干数据元素 ❖ 数据存储不是集中处理和控制的 ❖ 没有固定的关系
关系数据库管理系统 (RDBMS)
❖ 数据存储在规范化的有关联关系的表中 ❖ 数据库组成的不同实体
属性存储在数据字典中 程序脱离数据束缚
❖ 重复和冗余最少 ❖ 结构化查询语言 (SQL) ❖ 数据通过 RDBMS引擎存储 ❖ 客户机-服务器技术
其它形式
❖ 微机基础的办公自动化产品
如 Microsoft Access
只能通过程序建立 有相当多的数据重复和冗余
❖存在数据一致性问题
平行文件数据分类
❖ 固定长度数据 ❖ 划界数据 ❖ 可变长度数据
固定长度数据
❖ 全部记录
一样的长度 有一样的字段,
❖从第一条记录到最后一条记录
有字段通过填充达到统一
❖ 首选的数据下载格式
划界数据
❖ 全部记录
是同样的长度 有相同的字段