一种对用于问答的大语言模型进行样本筛选的方法及装置

申请号: CN202410007433.3

申请人: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)

更新日期: 2026-03-17

摘要文本

哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)取得“一种透气窗帘布”专利技术，本发明涉及文本处理技术领域，特别是指一种对用于问答的大语言模型进行样本筛选的方法及装置，方法包括：从样本数据集中筛选出特定样本，基于特定样本对待训练大语言模型进行训练，得到前置模型；基于样本数据集以及前置模型，得到样本数据集中的每个样本数据的多个不同评分，进而确定出每个样本数据的一致性分数以及自信度分数，进而确定每个样本数据的质量评估分数；基于质量评估分数，筛选出微调样本数据；基于微调样本数据，对待训练大语言模型进行训练，得到训练好的大语言模型；基于待回答的用户问题以及训练好的大语言模型，得到更加对齐人类偏好的问题回答。采用本发明，可以提升模型处理和预测的准确性，提高用户问题回答的准确性。（）

专利主权项内容

1.一种对用于问答的大语言模型进行样本筛选的方法，其特征在于，所述方法包括：S1、基于预设的初步筛选方法，从样本数据集中筛选出特定样本，基于所述特定样本对用于问答的待训练大语言模型进行训练，得到前置模型；S2、基于所述样本数据集以及所述前置模型，得到所述样本数据集中的每个样本数据的多个不同评分；S3、基于所述每个样本数据的多个不同评分，确定出每个样本数据的一致性分数；S4、基于所述每个样本数据的多个不同评分，确定出每个样本数据的自信度分数；S5、基于每个样本数据的一致性分数以及自信度分数，确定每个样本数据的质量评估分数；S6、基于所述每个样本数据的质量评估分数，筛选出微调样本数据；S7、基于所述微调样本数据，对所述待训练大语言模型进行训练，得到训练好的大语言模型；S8、基于待识别的用户问题以及所述训练好的大语言模型，得到所述用户问题对应的回答。马克数据网

专利申请信息

项目	内容
专利名称	一种对用于问答的大语言模型进行样本筛选的方法及装置
专利类型	发明申请
申请号	CN202410007433.3
申请日	2024/1/3
公告号	CN117493890A
公开日	2024/2/2
IPC主分类号	G06F18/214
权利人	哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
发明人	刘学博; 刘良鑫; 张民
地址	广东省深圳市南山区桃源街道深圳大学城哈尔滨工业大学校区

一种对用于问答的大语言模型进行样本筛选的方法及装置

摘要文本

专利主权项内容

专利申请信息

热门技术领域

快速入口

专利技术资料

一种对用于问答的大语言模型进行样本筛选的方法及装置

摘要文本

专利主权项内容

专利申请信息

相关专利推荐

氮化镓功率器件

对象类别识别模型的训练方法、对象类别识别方法及装置

智能设备的升级数据包获取方法、智能设备及存储介质

无源光网络系统的业务加密方法、电子设备及存储介质

基于函数秘密共享的隐私保护神经网络训练方法及装置

一种电源电路及开关电源

热门技术领域

快速入口

专利技术资料