
49
内企业面临的数据问题表显示了数 据质量 评估的常 见 等级
注
数据质量问题频率
数据质量问题发生次数
存储的总数据量
指标单位为次
吉字节表显示了数据质量评
估的参考维度
表3-1数据质量评估的常见等级
数据质量等级 描述 统计口径
一级 数据质量差
需要重点监控 数据质量问题频率大于或等于次
吉字节
二级 数据质量一般 数据质量问题频 率 大 于 或 等 于 次
吉字节
小 于
次
吉字节
三级 数据质量好 数据质量问题频率小于次
吉字节
表3-2数据质量评估的参考维度
维度 描述 标准
准确性 数据准确体现了真实情况 数据内容和定义是否一致
精确性 数据精度满足业务要求的程度 数据精度是否达到业务规则要求的位数
完整性 必需的数据项已经被记录 业务指定必 需 的 数 据 是 否 缺 失
不 允 许 为 空 字 符
或者空值等
时效性 数据被及时更新以体现当前事实 当需要使用时
数 据 能 否 反 映 当 前 事 实
即 数 据 必
须及时
能够满足系统对数据时效的要求
唯一性 数据在特定数据集中不存在重复值 每条数据是否唯一
依赖一致性 数据项的取值满足与其他数据项之
间的依赖关系 数据是否有相同的依赖
可访问性 数据易于访问 数据是否便于自动化读取
业务有效性 数据符合已定义的业务规则 数据项是否按已定义的格式标准组织
技术有效性 数据符合已定义的格式规范 数据是否符合规范
可用性 数据在需要时是可用的 数据可用时间和数据需要被访问时间的比例
参照完整性 数据项在被引用的父表中有定义 数据项是否在父表中有定义
5.
ISO
8000数据质量标准
数据质量标准是国际标准化组织针对数据质量制定的标准
该标准致力于管理
数据质量
具体来说
包括规范和管理数据质量活动
数据质量原则
数据质量术语
数据质量
特征
标准
和数据质量测试根据数据质量标准的要求
数据质量的高低程度由系
统数据与明确定义的数据要求进行对比得到通过标准的规范
可以保证用户在满
足决策需求和数据质量的基础上
在整个产品或服务的周期内高质量地交换
分享和存储数
据
从而保证用户可以依托获取的数据高效地做出最优化的安全决策
通过将标准应用于组织内部
可以对组织内的数据进行规范化整合和管理
对
各个部门的数据进行统一识别和管理
从组织的整体层面进行资源与信息的协调管理
从而减
少因为信息沟通不畅带来的运营成本此外
如果在合作公司之间或整个行业采用
标准
数据或信息将会更有可用性例如
在医疗卫生领域
各个医疗机构的信息系统不能很
好地兼容
导致同一 病 人 在 不 同 医 院 的 信 息 无 法 快 速 共 享 和 传 递通过在全国范围内应用
数据质量标准
可以将病历信息与特定信息系统分离
使病历的所有信息独立于医
疗信息系统存在
并可被任意一个应用数据质量标准的信息系统读取
患者可以更
加自主地选择就医医院
而不用担心由于对自身的健康信息缺失导致医疗误判