← 返回列表

基于电子病历文本的手术费用识别方法、装置及存储介质

申请号: CN202410056657.3
申请人: 之江实验室
更新日期: 2026-03-20

专利详细信息

项目 内容
专利名称 基于电子病历文本的手术费用识别方法、装置及存储介质
专利类型 发明申请
申请号 CN202410056657.3
申请日 2024/1/16
公告号 CN117574896A
公开日 2024/2/20
IPC主分类号 G06F40/289
权利人 之江实验室
发明人 李劲松; 马骁勇; 杨宗峰; 周天舒; 田雨
地址 浙江省杭州市余杭区中泰街道科创大道之江实验室

摘要文本

本发明涉及一种基于电子病历文本的手术费用识别方法、装置及存储介质,其中方法包括:步骤S1:获取标准手术词集合,并构建标准手术词集合的超集;步骤S2:将非结构化的电子病历文本预处理,得到和手术相关的片段,并对各片段进行分词,分别得到关联于各片段的单词序列;步骤S3:将单词序列输入至训练好的手术词生成模型,生成原始手术词序列;步骤S4:对所有原始手术词进行合并,得到多个原始手术词集合;步骤S5:基于原始手术词集合构建手术词树;步骤S6:将手术词树中的节点映射至标准手术词,并将根节点的所有第一级子节点所映射的标准手术词的费用之和作为识别结果。与现有技术相比,本发明具有准确率高等优点。

专利主权项内容

1.一种基于电子病历文本的手术费用识别方法,其特征在于,包括:步骤S1:获取标准手术词集合,并构建标准手术词集合的超集,其中,所述标准手术词集合的超集中包含与各标准手术词同义的非标准手术词;步骤S2:将非结构化的电子病历文本预处理,得到和手术相关的片段,并对各片段进行分词,分别得到关联于各片段的单词序列;步骤S3:将单词序列输入至训练好的手术词生成模型,生成原始手术词序列,其中,所述手术词生成模型的输入为单词序列,输出为由多个原始手术词组成的原始手术词序列,原始手术词为所述超集中的元素;步骤S4:对所有原始手术词进行合并,得到多个原始手术词集合,其中,每个原始手术词集合中,若该原始手术词集合存在两个及以上的手术词,则对于任一原始手术词,至少存在另一个原始手术词与所述任一原始手术词的关系为并列、等价、修饰或被修饰;步骤S5:基于原始手术词集合构建手术词树,其中,所述手术词树中,除根节点以外,各节点均对应一个原始手术词集合,任一节点被其上一级母节点包含,并包含下一级的所有子节点;步骤S6:将手术词树中的节点映射至标准手术词,并将根节点的所有第一级子节点所映射的标准手术词的费用之和作为识别结果。