← 返回列表
一种对用于问答的大语言模型进行样本筛选的方法及装置
申请人信息
- 申请人:哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
- 申请人地址:518000 广东省深圳市南山区桃源街道深圳大学城哈尔滨工业大学校区
- 发明人: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种对用于问答的大语言模型进行样本筛选的方法及装置 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410007433.3 |
| 申请日 | 2024/1/3 |
| 公告号 | CN117493890A |
| 公开日 | 2024/2/2 |
| IPC主分类号 | G06F18/214 |
| 权利人 | 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) |
| 发明人 | 刘学博; 刘良鑫; 张民 |
| 地址 | 广东省深圳市南山区桃源街道深圳大学城哈尔滨工业大学校区 |
摘要文本
本发明涉及文本处理技术领域,特别是指一种对用于问答的大语言模型进行样本筛选的方法及装置,方法包括:从样本数据集中筛选出特定样本,基于特定样本对待训练大语言模型进行训练,得到前置模型;基于样本数据集以及前置模型,得到样本数据集中的每个样本数据的多个不同评分,进而确定出每个样本数据的一致性分数以及自信度分数,进而确定每个样本数据的质量评估分数;基于质量评估分数,筛选出微调样本数据;基于微调样本数据,对待训练大语言模型进行训练,得到训练好的大语言模型;基于待回答的用户问题以及训练好的大语言模型,得到更加对齐人类偏好的问题回答。采用本发明,可以提升模型处理和预测的准确性,提高用户问题回答的准确性。 ()
专利主权项内容
1.一种对用于问答的大语言模型进行样本筛选的方法,其特征在于,所述方法包括:S1、基于预设的初步筛选方法,从样本数据集中筛选出特定样本,基于所述特定样本对用于问答的待训练大语言模型进行训练,得到前置模型;S2、基于所述样本数据集以及所述前置模型,得到所述样本数据集中的每个样本数据的多个不同评分;S3、基于所述每个样本数据的多个不同评分,确定出每个样本数据的一致性分数;S4、基于所述每个样本数据的多个不同评分,确定出每个样本数据的自信度分数;S5、基于每个样本数据的一致性分数以及自信度分数,确定每个样本数据的质量评估分数;S6、基于所述每个样本数据的质量评估分数,筛选出微调样本数据;S7、基于所述微调样本数据,对所述待训练大语言模型进行训练,得到训练好的大语言模型;S8、基于待识别的用户问题以及所述训练好的大语言模型,得到所述用户问题对应的回答。 马 克 数 据 网