临床数据质量评估指标研究(3)
3.3.2 基于语料分析归纳指标 指标归纳流程,见图1。(1)语料分解。从文献中收集的语料可能存在一条语料描述多种质量问题的情况。为实现指标对质量问题的唯一表达,对语料进行分析与拆解。例如从文献[22]中收集到的语料“数据一致是指相同数据在不同应用、系统中的描述应该一致,例如患者的医疗档案编号。此外相关联的数据也应当不冲突”。该语料描述了两种情况,因此将其拆分为“数据一致是指相同数据在不同应用、系统中的描述应该一致,例如患者的医疗档案编号”,“相关联的数据也应当不冲突”两条描述。(2)语料分类。依据内容对语料进行分类。第1类语料是文献作者对相同类型临床数据质量问题的归纳总结,例如 “数据包含任务所需的所有数据项目”;第2类语料通常是文献作者用来举例说明的示例,需经过归纳总结才能表示为相应的评估指标,例如“数据应包含患者的血压、心率值”。(3)指标合并。对于第1类语料,通过分析语料语义对相似观点进行合并,从而形成对应的评估指标。语料语义分析主要从其描述的数据对象(数据值、数据记录等)、数据问题(数据缺数、重复等)或数据约束(不为空、不重复等)描述、对应的质量维度(完整性、合理性)3个方面进行考虑。(4)指标映射。将第2类语料与步骤3中已得到的指标进行映射,剔除能映射到指标的语料,避免指标重复。(5)归纳总结。对于步骤4中尚未对应指标的语料,基于其含义归纳总结相应的临床数据质量评估指标。与步骤3中类似,将语料描述抽象为3个部分:数据对象、数据问题或数据约束以及对应的维度。最终将所有语料转化为相应的评估指标。
图1 指标归纳流程
3.3.3 基于数据问题报告归纳指标 本研究所收集的问题数据报告主要包含数据库表名、问题描述、不符合要求数3部分内容。其中问题描述部分是对质量问题发生的位置、对象以及对质量问题的描述。问题数据分析总结流程,见图2。首先,对于数据问题报告中的每条记录,分析问题描述部分,获取两部分关键信息:问题发生的数据对象和该质量问题的描述。其中根据其数据对象的描述,将其抽象为数据元、数据值或数据记录等。其次,根据所抽象的评估对象以及问题描述,将其与已成立的指标进行映射匹配。若评估的数据对象和质量问题描述都能匹配至对应指标则说明该条问题记录已存在对应指标;若没有对应的指标与问题关联,则针对该问题新建指标。
图2 数据问题归纳为指标的流程
3.3.4 指标信息补充 对于最终得到的指标,按照其指标属性定义,依据指标所来源的文献描述或案例场景的实际情况,对其补充评估方法、适用场景等相关信息。
3.4 结果验证
Kahn在2016年提出一套质量评估框架,在其研究中将个人提出的框架与前人研究框架进行比较,证明个人提出的评估框架具有一定全面性[9]。我国卫健委发布的《电子病历系统应用水平分级评价标准》[38](下文简称国标)是针对电子病历应用评级的质量要求标准,按照维度对不同类别临床数据提出相应的质量评估需求。病房病历是国标中的一个类别,其中包括患者住院病历所涉及的相关数据,这些数据因为含有丰富临床信息,有很高的二次利用价值,其数据质量问题被广泛关注[40]。本研究设计以下对比试验来验证研究所提出指标的全面性和描述唯一性。选择国标中病房病历类别相关的质量评估需求作为金标准,将本研究提出的评估指标和Kahn框架中所提出的评估指标与国标的质量需求进行对应,比较两种指标的完善程度和对应需求的难易程度。
4 实验结果与讨论
4.1 当前统计的热点维度
基于对30篇文献的分析,出现次数最高的前5种质量维度和定义,见表2,分别为完整性(28/30)、准确性(24/30)、时间性(21/30)、一致性(18/30)和合理性(18/30)。
表2 质量维度、相关术语和定义维度名称相关术语定义完整性Completeness;Integrity;Comprehensiveness数据的存在或缺失准确性Accuracy;Correctness;Validity; Reliability数据是否准确反映所记录的临床事实时间性Timeliness;Currency;Temporal 数据实时、及时的程度一致性Consistency;Conformance;Concordance;Agreement;相互关联的数据是否表达一致合理性Plausibility;Trustworthiness;Validity;Reliability数据的表达是否符专业知识或使用预期
4.2 质量评估指标
4.2.1 指标及其定义 基于30篇相关文献以及3 712条临床实际问题,本研究从5种质量维度归纳出43项评估指标。各指标代码、名称和指标来源,见表3-7。43项指标在文献中均有提及,29项指标源自数据问题报告。
文章来源:《冶金自动化》 网址: http://www.yjzdhzz.cn/qikandaodu/2021/0502/468.html