← 返回列表

一种对用于问答的大语言模型进行样本筛选的方法及装置

申请号: CN202410007433.3
申请人: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
更新日期: 2026-03-17

专利详细信息

项目 内容
专利名称 一种对用于问答的大语言模型进行样本筛选的方法及装置
专利类型 发明申请
申请号 CN202410007433.3
申请日 2024/1/3
公告号 CN117493890A
公开日 2024/2/2
IPC主分类号 G06F18/214
权利人 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
发明人 刘学博; 刘良鑫; 张民
地址 广东省深圳市南山区桃源街道深圳大学城哈尔滨工业大学校区

摘要文本

本发明涉及文本处理技术领域,特别是指一种对用于问答的大语言模型进行样本筛选的方法及装置,方法包括:从样本数据集中筛选出特定样本,基于特定样本对待训练大语言模型进行训练,得到前置模型;基于样本数据集以及前置模型,得到样本数据集中的每个样本数据的多个不同评分,进而确定出每个样本数据的一致性分数以及自信度分数,进而确定每个样本数据的质量评估分数;基于质量评估分数,筛选出微调样本数据;基于微调样本数据,对待训练大语言模型进行训练,得到训练好的大语言模型;基于待回答的用户问题以及训练好的大语言模型,得到更加对齐人类偏好的问题回答。采用本发明,可以提升模型处理和预测的准确性,提高用户问题回答的准确性。 ()

专利主权项内容

1.一种对用于问答的大语言模型进行样本筛选的方法,其特征在于,所述方法包括:S1、基于预设的初步筛选方法,从样本数据集中筛选出特定样本,基于所述特定样本对用于问答的待训练大语言模型进行训练,得到前置模型;S2、基于所述样本数据集以及所述前置模型,得到所述样本数据集中的每个样本数据的多个不同评分;S3、基于所述每个样本数据的多个不同评分,确定出每个样本数据的一致性分数;S4、基于所述每个样本数据的多个不同评分,确定出每个样本数据的自信度分数;S5、基于每个样本数据的一致性分数以及自信度分数,确定每个样本数据的质量评估分数;S6、基于所述每个样本数据的质量评估分数,筛选出微调样本数据;S7、基于所述微调样本数据,对所述待训练大语言模型进行训练,得到训练好的大语言模型;S8、基于待识别的用户问题以及所述训练好的大语言模型,得到所述用户问题对应的回答。 马 克 数 据 网