一种基于强化学习和迁移学习的命名实体识别方法和装置

申请号: CN202410182078.3

申请人: 广东省人民医院; 神州医疗科技股份有限公司

更新日期: 2026-03-17

摘要文本

广东省人民医院; 神州医疗科技股份有限公司取得“一种透气窗帘布”专利技术，本申请提供了一种基于强化学习和迁移学习的命名实体识别方法和装置，所述方法包括：利用每个高概率预测错误数据对应的第一转换数据以及预设分数对文本打分原始模型进行强化学习训练，得到文本打分模型；将已标注文本数据的第二转换数据输入到文本打分模型中，确定出已标注文本数据对应的文本分数；利用每个已标注文本数据对应的文本分数对源域命名实体识别模型进行迁移学习，以得到目标域对应的目标域命名实体识别模型将目标域对应的医学文本数据输入到目标域命名实体识别模型中，得到目标域命名实体识别模型对医学文本数据进行实体识别的结果。通过方法及装置，提升了命名实体识别模型在目标域的实体识别准确性。

专利主权项内容

1.一种基于强化学习和迁移学习的命名实体识别方法，其特征在于，所述命名实体识别方法包括：针对于目标域对应的每个待预测文本数据，将该待预测文本数据输入到预先通过源域本文数据训练好的源域命名实体识别模型中，确定出该待预测文本数据对应的预测结果；其中，所述预测结果包括该待预测文本数据在每个实体标签下的预测实体，以及该待预测文本数据中的每个字符在每个实体标签下的第一概率值；基于每个待预测文本数据对应的预测结果从多个待预测文本数据中筛选出高概率预测错误数据；利用每个高概率预测错误数据对应的预测结果对每个高概率预测错误数据进行格式转换，得到每个高概率预测错误数据对应的第一转换数据，并利用每个高概率预测错误数据对应的第一转换数据以及预设分数对文本打分原始模型进行强化学习训练，得到文本打分模型；针对于所述目标域对应的每个已标注文本数据，对该已标注文本数据进行格式转换，得到第二转换数据，并将所述第二转换数据输入到所述文本打分模型中，确定出该已标注文本数据对应的文本分数；将多个已标注文本数据输入到所述源域命名实体识别模型中，利用每个已标注文本数据对应的文本分数对所述源域命名实体识别模型进行迁移学习，以得到所述目标域对应的目标域命名实体识别模型；将所述目标域对应的医学文本数据输入到所述目标域命名实体识别模型中，得到所述目标域命名实体识别模型对所述医学文本数据进行实体识别的结果。

专利申请信息

项目	内容
专利名称	一种基于强化学习和迁移学习的命名实体识别方法和装置
专利类型	发明申请
申请号	CN202410182078.3
申请日	2024/2/19
公告号	CN117744660A
公开日	2024/3/22
IPC主分类号	G06F40/295
权利人	广东省人民医院; 神州医疗科技股份有限公司
发明人	梁会营; 杨雅婷; 林晓兰; 白焜太; 梁铭标
地址	广东省广州市越秀区中山二路106号; 北京市海淀区颐和园路2号未来科技大厦主楼12层1201室

一种基于强化学习和迁移学习的命名实体识别方法和装置

摘要文本

专利主权项内容

专利申请信息

热门技术领域

快速入口

专利技术资料

一种基于强化学习和迁移学习的命名实体识别方法和装置

摘要文本

专利主权项内容

专利申请信息

相关专利推荐

一种可逆交联共价含硫聚合物弹性体及其制备方法

一种基于自适应更新策略的在线NOx预测方法和系统

一株对病原真菌具有拮抗作用的贝莱斯芽孢杆菌及其应用

一种隧道岩溶水重金属处理用的吸附分离装置

一种产业链安全监测分析方法、介质及设备

一种钢壳沉管隧道预埋件柔性隔热套及其制造方法

热门技术领域

快速入口

专利技术资料