临床数据质量评估指标研究(4)
表3 数据完整性相关指标指标编码指标名称指标来源C01 数据元完整 文献、数据问题报告C02 数据值完整 文献、数据问题报告C03 记录完整 文献、数据问题报告C04 数据总量足够文献、数据问题报告C05 记录事实完整文献 C06 信息完整 文献、数据问题报告C07 上下文完整 文献、数据问题报告C08 时序数据完整文献、数据问题报告C09 数据状态完整文献
表4 数据合理性相关指标指标编码指标名称指标来源P01数值合理 文献、数据问题报告P02标识不重复 文献、数据问题报告P03重复值合理 文献、数据问题报告P04结论合理 文献 P05上下文合理 文献、数据问题报告P06数据客观 文献、数据问题报告P07主索引合理 文献、数据问题报告P08冗余数据 文献、数据问题报告P09记录出现次数文献 P10数据量的变化文献
表5 数据一致性相关指标指标编码指标名称指标来源S01数值一致性 文献、数据问题报告S02内容与编码一致 文献、数据问题报告S03计算参数与结果一致文献 S04字段默认值一致 文献、数据问题报告S05数据关系与结构一致文献 S06内容与定义一致 文献 S07计算方法一致 文献 S08数据的度量单位一致文献
表6 数据时间性相关指标指标编码指标名称指标来源T01数据的时效 文献、数据问题报告T02数据的时间逻辑文献、数据问题报告T03数据的记录频率文献 T04数据的实时程度文献、数据问题报告T05数据的及时程度文献 T06持续时间 文献
表7 数据准确性相关指标指标编码指标名称指标来源A01计算准确 文献 A02数据类型准确文献、数据问题报告A03 表达合法 文献、数据问题报告A04 表达精确 文献、数据问题报告A05 数据关系的粒度文献、数据问题报告A06 表达准确 文献、数据问题报告A07 数据格式准确 文献、数据问题报告A08 编码/术语准确 文献、数据问题报告A09 测量准确 文献 A10 元数据准确 文献、数据问题报告
4.2.2 结果验证 本研究选择国标中住院病历相关质量需求作为金标准,比较Kahn指标、本研究所提出的评估指标与国标需求的对应唯一性。结果表明国标中关于住院病历的质量需求能够与本研究所提出的指标实现一对一对应;而在与Kahn的对应过程中,需求(1-4),(6-7)没有找到对应指标;需求(5)、(12-13)能够明确对应到Kahn框架中的某个指标;需求(8-11)能模糊对应到Kahn指标。本研究所提出的质量评估指标能够更全面、更准确地对应到实际评估需求。
4.2.3 结果讨论 标准化的临床数据质量评估对于提高临床数据质量意义重大。构建全面、描述唯一的质量评估指标是实现标准化评估的重要前提。本研究结合文献知识与实际数据问题,提出一套临床数据质量评估指标,详细描述指标所适用的评估方法,为实现标准化、自动化的临床数据质量评估奠定基础。本研究选择两种不同类型临床场景数据问题报告,收集的问题条目数量上有较大差异,原因有以下两点:一是在本研究所选择的注册研究采集场景中研究人员将不同机构数据合并后再进行评估,因此同一份报告中不同机构的相同数据问题被合并在一起;二是注册研究场景中各机构会根据报告迅速地采取相关措施,因此后续报告中数据问题会逐渐减少。然而在本研究的分析过程中,同一类型数据问题只要出现一次就会关联相关指标,同类型问题出现的次数不会影响最终指标结果。因此在本研究中两种场景数据问题在数目上的差异没有影响最终建立指标的结果。高效、自动的数据质量评估技术是研究者一直致力的目标。本研究描述评估指标所适用的评估方法,构建评估需求与评估方法的联系,为研究自动化评估技术提供一定支持。统计指标适用的评估方法,有29项指标(67%)可以通过逻辑规则方法进行评估,其余14项(33%)则适用于统计分析、自然语言处理算法等手段进行评估。这29项指标涉及5个质量维度,其中包括数据值完整、数值合理等被大多数研究或标准所要求的评估指标,因此也说明基于逻辑规则的评估方法是一种相对普适的评估手段。然而逻辑规则的定义与具体的知识相关,目前逻辑规则的创建主要依赖人工完成。基于本研究,研究者能够了解适于采用逻辑规则方式进行评估的指标,这些指标代表了相关临床数据质量问题类型。因此如果能够找到与这些指标相关的评估知识源,则可以在这些知识源的基础上探索自动化评估的可能性。目前逻辑规则评估所涉及的知识包括临床知识、通用常识以及数据知识等。临床指南、临床信息模型中都对这些知识有一定的描述。通过自然语言处理等技术提取其中的相关知识自动化的生成评估规则是具有可行性的自动化评估手段之一。后续本研究基于指标探索以临床信息模型为基础的自动化逻辑规则生成技术。
文章来源:《冶金自动化》 网址: http://www.yjzdhzz.cn/qikandaodu/2021/0502/468.html