← 返回列表

一种健康医疗数据实时采集与质量控制方法

申请号: CN202311592034.X
申请人: 浙江省卫生健康信息中心
申请日期: 2023/11/27

摘要文本

本发明公开了一种健康医疗数据实时采集与质量控制方法,涉及医疗信息化技术领域;本发明在数据采集时,使用基于日志的变更数据捕获技术,代替基于查询的ETL数据抽取技术,使用系统文件I/O代替数据查询,将数据采集对医疗机构数据库的影响降至最低,从而在医疗机构信息系统与数据中心之间建立可稳定运行的实时数据交换通道;本发明将质量评价规则与计算系数结合,可以获得指定数据集、医疗机构和区域的质量分数;有助于了解数据的质量状况,帮助医疗机构和区域识别数据质量问题,并采取相应的措施进行改进,从而提高整体的数据质量和数据应用效果。。 (更多数据,详见马克数据网)

专利详细信息

项目 内容
专利名称 一种健康医疗数据实时采集与质量控制方法
专利类型 发明申请
申请号 CN202311592034.X
申请日 2023/11/27
公告号 CN117524388A
公开日 2024/2/6
IPC主分类号 G16H10/00
权利人 浙江省卫生健康信息中心
发明人 郭一; 胡盈盈; 张润; 李博
地址 浙江省杭州市庆春路216号

专利主权项内容

1.一种健康医疗数据实时采集与质量控制方法,其特征在于,包括以下步骤:S1:通过分析医疗机构规格部署前置机,采集医疗健康数据并转化存储至前置机,以实现异构数据标准化;S2:通过创建数据队列并利用主从复制协议,将数据队列伪装成从数据库,以建立实时数据交换通道;当医疗机构产生新数据或发生数据变更时,数据将实时同步到数据中心;同时还将对医疗健康数据进行校验,对校验不通过的医疗健康数据进行异常处理;其中校验步骤为:S21:将接收到的数据进行解析以得到健康医疗数据字段,提取健康医疗数据字段的字段长度和字符类型;S22:将字段长度与设定的字段长度区间进行比较分析,当字段长度不属于设定的字段长度区间之内时,则将字段长度减去设定的字段长度区间中的最大值或最小值并取绝对值以得到字段差值;S23:设定每种类型的健康医疗数据字段均对应一种或一种以上的字符类型,提取健康医疗数据字段的类型并将其与所有设定的健康医疗数据字段的类型进行匹配以得到对应的字符类型,遍历健康医疗数据字段中所有字符并将其与对应的字符类型进行匹配,当存在与对应的字符类型不匹配的字符类型时,则将不匹配的字符类型记为异位字符,并统计健康医疗数据字段中异位字符的数量记为异位数量;S24:将字段差值与异位数量进行归一化处理并取其数值,对数值分析以得到校验值;将校验值与设定的校验标准阈值进行比较分析,当校验值大于设定的校验标准阈值时,则将该健康医疗数据字段记为不合格字段;当校验值小于或等于设定的校验标准阈值时,则将该健康医疗数据字段记为合格字段;S25:遍历健康医疗数据中所有健康医疗数据字段的判断结果,其中判断结果为合格字段和不合格字段;当健康医疗数据中存在任一一个或多个健康医疗数据字段不合格时,则健康医疗数据的校验不通过,并返回步骤一重新进行校验;当健康医疗数据所有健康医疗数据字段均为合格字段时,则健康医疗数据校验通过;S26:提取校验结果为不通过的健康医疗数据的校验不通过的次数,当检验不通过的次数大于设定的次数阈值时,则将健康医疗数据记为异常数据;S3:通过分析健康医疗数据的数据量以及数据量变以得到校验参数,依据检验参数对数据进行周期性的自运行数据质量评估;S4:通过依据用户输入告警配置参数以建立数据质量告警规则,并对存在质量问题的数据进行告警和创建运维工单。