当前位置:文档之家› 09 - 信息集成平台之数据质量管理

09 - 信息集成平台之数据质量管理

密级:保密(只限于合作客户单位)
文档编号:HIP060002
第1.0版
分册名称:模版
第2册/共10 册
信息集成平台之
数据质量管理
长沙廖氏软件科技有限公司
2020年07月
版权声明
《信息集成平台之数据质量管理》的版权归长沙廖氏软件科技公司所有,任何侵犯版权的行为将被追究法律责任。

未经版权所有者的书面准许,不得将本手册的任何部分以任何形式、采用任何手段(电子的或机械的,包括照相复制或录制)或为任何目的,进行复制或扩散。

Copyright © 2015长沙廖氏软件科技有限公司。

版权所有,复制必究。

长沙廖氏软件科技有限公司不对因为使用该软件、安装手册或由于该软件、安装手册中的缺陷所造成的任何损失负责。

阅读指南
〖手册目标〗
本手册详细介绍了信息集成平台之数据质量管理的相关概念,帮助用户迅速了解信息集成平台之数据质量管理的相关知识。

〖阅读对象〗
本手册是针对软件厂商开发人员、实施人员及医疗机构的IT管理人员编写的,用户在使用本系统之前,应先阅读本手册,以避免误操作。

〖手册构成〗
“信息集成平台之数据质量管理”分成两个章节:
第一章:基础知识;
第二章:功能操作;
〖手册约定〗
【界面图示】展示窗口图片
【功能描述】减速模块的功能,让读者有个大概的了解。

【注意】的意思是请读者注意那些需要注意的事项。

【警告】的意思是请读者千万注意某些事项,否则将造成严重错误。

目录
第1章基础知识 (1)
§1.1质量管理的定义 (1)
§1.2质量管理的目的 (1)
§1.3质量规则类型 (2)
第2章功能操作 (3)
§2.1质量扣分规则 (3)
§2.2质量规则定义 (3)
§2.2.1 自动生成质量规则 (3)
§2.2.2 自定义质量规则 (3)
§2.3质量分析报告 (5)
第1章基础知识
§1.1 质量管理的定义
PDCA:Plan(计划)、Do(执行)、Check(检查)和Act(处理)。

PDCA循环又叫戴明环,是美国质量管理专家戴明博士提出的,它是全面质量管理所应遵循的科学程序。

全面质量管理活动的全部过程,就是质量计划的制订和组织实现的过程,这个过程就是按照PDCA循环,不停顿地周而复始地运转的。

参考PDCA管理方法,实现信息集成平台的全面数据质量管理实现,形成如下图如示的数据质量管理框架构:
§1.2 质量管理的目的
质量管理的目的是提高数据的质量。

§1.3 质量规则类型
1、强制类型
a) 数据元编码
b) 数据元长度
c) 数据元类型
d) 数据值格式
2、宽松类型
a) 非空:不能为空的定义。

定义时只需要选择质量类型属性为非空就完成定
义;
b) 值域范围:如果数据元定义指定了值域,则配置成数据对应的值域编码;
或者配置成值域代码中维护的其它值域编码;
c) 取值范围:如果数据元是数字型且取值是有一个范围内的话,可以定义相
应的取值范围,定义方法参考这个例子:数据元>= and( or ) 数据元<=;
d) 数据项逻辑:通过SQL语句配置数据集上的逻辑关系。

第2章功能操作
§2.1 质量扣分规则
1、质量扣分是根据表“公共代码值域表(p_b_codevalue)”进行扣分。

2、具体扣分值是根据列“specialtype”。

3、具体扣分值则是根据所制定的质量规则进行扣分。

4、系统代码表中的编码是:2016。

§2.2 质量规则定义
§2.2.1自动生成质量规则
系统以数据集为单元进行质量标准定义,系统提供自动化生成质量标准,单击“质量标准定义”中“自动质量规则”生成功能,能自动生成一些数据质量规则。

如下图:
§2.2.2自定义质量规则
如果自动生成质量规则不能满足需求的话,我们也可以对质量规则进行自定义。

单击‘质量标准定义’而后选中具体需要生成规则的数据集,新增或者选择需要修改的规则进行修改、删除。

如下图:
系统提供了以下几种质量规则定义方式:
1、非空:不能为空的定义。

定义时只需要选择质量类型属性为非空就完成定义;
2、值域范围:如果数据元定义指定了值域,则配置成数据对应的值域编码;或者配置
成值域代码中维护的其它值域编码;
3、取值范围:如果数据元是数字型且取值是有一个范围内的话,可以定义相应的取值
范围,定义方法参考这个例子:数据元>= and( or ) 数据元<=
4、数据项逻辑:通过SQL语句配置数据集上的逻辑关系。

§2.3 质量分析服务
制定好质量规则后,需要修改配置文件启动质量分析服务,配置文件路径为:datacenter\ WEB-INF\classes\config\app下的app.extend.xml和app.service.xml 如下面两张图:
§2.4 质量分析报告
发布数据后平台会自动将按照制定好的质量规则将扣分结果存储到“数据质量监控表(P_Q_MONITORDETAIL)”中,如果需要查看自己的数据是否符合定义的质量规则、是否被扣分、扣分的数值与具体细节可以点击“质量分析报告”进行查询。

如下图:。

相关主题