← 返回列表
历史人物信息纠错方法、系统、电子设备和存储介质
摘要文本
上海蜜度科技股份有限公司取得“一种透气窗帘布”专利技术,本申请提供一种历史人物信息纠错方法、系统、电子设备和存储介质,所述方法包括:应用预训练的关系抽取模型识别待纠错文本,得到模型识别结果;判断所述模型识别结果中是否包括三元组信息;若是,则将模型识别结果输入预先构建好的知识图谱,并利用所述知识图谱校正所述模型识别结果;否则基于LangChain、大语言模型和知识图谱库,校正所述待纠错文本。本申请采用自动化技术,减少了人工审核的时间和工作量,提高纠错效率;基于LangChain、大语言模型和知识图谱库进行纠错,结合专业知识和上下文信息,提高纠错的针对性、准确性和可靠性;通过知识图谱引入更多的上下文信息和关联知识,提高了对于缺乏结构性信息的历史人物纠错能力,避免出现大量的误报和漏报。
专利主权项内容
1.一种历史人物信息纠错方法,其特征在于,包括:应用预训练的关系抽取模型识别待纠错文本,得到模型识别结果;判断所述模型识别结果中是否包括三元组信息;若是,则将所述模型识别结果输入预先构建好的知识图谱,并利用所述知识图谱校正所述模型识别结果;否则基于LangChain、大语言模型和知识图谱库,校正所述待纠错文本;基于LangChain、大语言模型和知识图谱库,校正所述待纠错文本包括:利用所述LangChain从所述知识图谱库提取第一文本向量,并基于所述第一文本向量建立向量存储库;从所述待纠错文本中提取第二文本向量;从所述向量存储库中获取与所述第二文本向量相似的所述第一文本向量,得到相似文本向量;将所述第二文本向量和所述相似文本向量进行拼接,得到提示词;将所述提示词输入所述大语言模型;利用所述大语言模型对所述提示词进行处理,得到纠错后的文本。
专利申请信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 历史人物信息纠错方法、系统、电子设备和存储介质 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311760431.3 |
| 申请日 | 2023/12/20 |
| 公告号 | CN117454884A |
| 公开日 | 2024/1/26 |
| IPC主分类号 | G06F40/232 |
| 权利人 | 上海蜜度科技股份有限公司 |
| 发明人 | 杨子昭 |
| 地址 | 上海市浦东新区中国(上海)自由贸易试验区张衡路198弄10号301AB室 |