一种基于大语言模型的统一信息抽取方法、介质及设备
摘要文本
本发明提供了一种基于大语言模型的统一信息抽取方法、介质及设备,涉及信息抽取技术领域,包括:获取待处理文本以及目标指令,将待处理文本和目标指令拼接后输入目标信息抽取模型,以得到目标信息抽取模型输出的信息抽取结果。目标信息抽取模型,通过以下步骤得到:获取若干原始文本集,对若干原始文本集中的每一原始文本,进行目标训练样本生成处理,以得到目标训练样本集,根据目标训练数据集对预设大语言模型进行训练,以得到目标信息抽取模型。本发明能够使得目标信息抽取模型具备抽取不同任务类型信息的能力,提高信息抽取的效率,并可以降低模型的发散性。
申请人信息
- 申请人:北京中科闻歌科技股份有限公司
- 申请人地址:100190 北京市海淀区北四环西路9号楼7层717室
- 发明人: 北京中科闻歌科技股份有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种基于大语言模型的统一信息抽取方法、介质及设备 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311671334.7 |
| 申请日 | 2023/12/7 |
| 公告号 | CN117764062A |
| 公开日 | 2024/3/26 |
| IPC主分类号 | G06F40/279 |
| 权利人 | 北京中科闻歌科技股份有限公司 |
| 发明人 | 王磊; 王宇琪; 王亦洁; 肖星琳; 徐楠; 曹家; 罗引 |
| 地址 | 北京市海淀区北四环西路9号楼7层717室 |
专利主权项内容
1.一种基于大语言模型的统一信息抽取方法,其特征在于,所述方法包括如下步骤:S100,获取待处理文本以及目标指令;所述目标指令包括至少一个目标任务类型的名称标签和/或至少一个目标任务子类型的名称标签;所述目标任务类型为若干预设的任务类型中的任一;每一预设的任务类型具有若干对应的任务子类型;所述目标任务子类型为任一任务子类型;S110,将所述待处理文本和所述目标指令拼接后输入目标信息抽取模型,以得到所述目标信息抽取模型输出的信息抽取结果;所述信息抽取结果包括所述待处理文本中目标任务类型和/或目标任务子类型对应的信息;所述目标信息抽取模型,通过以下步骤得到:S200,获取若干原始文本集;每一所述原始文本集具有对应的原始任务类型列表,每一原始任务类型列表中包括若干原始任务类型,每一原始任务类型为若干预设的任务类型中的其中之一;每一原始任务类型具有对应的原始任务子类型列表,每一原始任务子类型列表中包括若干原始任务子类型,每一原始任务子类型为对应的预设的任务类型的若干任务子类型的其中之一;每一所述原始文本集中包括若干原始文本;S210,对所述若干原始文本集中的每一原始文本,进行目标训练样本生成处理,以得到目标训练样本集;S220,根据所述目标训练数据集对预设大语言模型进行训练,以得到目标信息抽取模型。