历史人物信息知识库更新方法、系统、介质及电子设备
摘要文本
本发明提供一种历史人物信息知识库更新方法、系统、存储介质及电子设备,包括:获取历史人物未标注文本和所述历史人物未标注文本对应的错误文本;基于所述历史人物未标注文本和所述错误文本,采用大语言模型识别所述历史人物未标注文本对应的标注文本;基于所述标注文本构建对应的标注错误文本;基于所述标注文本和所述标注错误文本对所述大语言模型进行微调,获取微调后的大语言模型;基于微调后的大语言模型识别待识别的历史人物未标注文本对应的标注文本;基于识别到的标注文本对历史人物信息知识库进行更新。本发明的历史人物信息知识库更新方法、系统、存储介质及电子设备采用大语言模型对历史人物信息库进行自动更新,且精准高效。
申请人信息
- 申请人:上海蜜度科技股份有限公司
- 申请人地址:201204 上海市浦东新区中国(上海)自由贸易试验区张衡路198弄10号301AB室
- 发明人: 上海蜜度科技股份有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 历史人物信息知识库更新方法、系统、介质及电子设备 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410182537.8 |
| 申请日 | 2024/2/19 |
| 公告号 | CN117743357A |
| 公开日 | 2024/3/22 |
| IPC主分类号 | G06F16/23 |
| 权利人 | 上海蜜度科技股份有限公司 |
| 发明人 | 杨子昭 |
| 地址 | 上海市浦东新区中国(上海)自由贸易试验区张衡路198弄10号301AB室 |
专利主权项内容
1.一种历史人物信息知识库更新方法,其特征在于,所述方法包括以下步骤:获取历史人物未标注文本和所述历史人物未标注文本对应的错误文本;基于所述历史人物未标注文本和所述错误文本,采用大语言模型识别所述历史人物未标注文本对应的标注文本;基于所述标注文本构建对应的标注错误文本;基于所述标注文本和所述标注错误文本对所述大语言模型进行微调,获取微调后的大语言模型;基于微调后的大语言模型识别待识别的历史人物未标注文本对应的标注文本;基于识别到的标注文本对历史人物信息知识库进行更新;基于所述历史人物未标注文本和所述错误文本,采用大语言模型识别所述历史人物未标注文本对应的标注文本包括以下步骤:生成最佳prompt;将所述历史人物未标注文本、所述错误文本和所述最佳prompt输入所述大语言模型,获取所述大语言模型识别的标注文本;生成最佳prompt包括以下步骤:获取训练文本信息和对应的标注信息;获取所述训练文本信息对应的错误信息;采用不同的prompt,基于大语言模型获取所述训练文本信息、所述标注信息和所述错误信息对应的预测结果;根据所述预测结果评估各个prompt的效果指标,并将效果指标最好的prompt作为最佳prompt。。更多数据: