← 返回列表

大语言模型的提示词确定方法、装置、设备及介质

申请号: CN202410182475.0
申请人: 浙江同花顺智能科技有限公司
更新日期: 2026-03-20

专利详细信息

项目 内容
专利名称 大语言模型的提示词确定方法、装置、设备及介质
专利类型 发明申请
申请号 CN202410182475.0
申请日 2024/2/19
公告号 CN117744753A
公开日 2024/3/22
IPC主分类号 G06N3/092
权利人 浙江同花顺智能科技有限公司
发明人 王强; 赵愿; 马中柱; 陈康明; 吴海胖
地址 浙江省杭州市余杭区五常街道同顺街18号3楼305室

摘要文本

本申请公开了一种大语言模型的提示词确定方法、装置、设备及介质,涉及计算机技术领域,包括:利用强化学习算法对初始大语言模型进行训练,以得到目标大语言模型;从当前提示词集合中选择当前提示词,将当前提示词确定为当前动作;将当前动作和当前测试样本输入至目标大语言模型,以便目标大语言模型生成当前测试结果;根据当前测试结果及其准确性得分对当前提示词集合进行调整,得到下一提示词集合,基于准确性得分从下一提示词集合中选择下一提示词,以进行下一轮的提示词准确性得分确定,直至满足预设停止测试条件,以确定目标大语言模型的目标提示词集合。通过上述方案,能够确定出准确的提示词以提升大语言模型的推理能力。

专利主权项内容

1.一种大语言模型的提示词确定方法,其特征在于,包括:利用强化学习算法对初始大语言模型进行训练,以得到目标大语言模型;从当前提示词集合中选择当前提示词,并将所述当前提示词确定为当前动作;将所述当前动作和当前测试样本输入至所述目标大语言模型,以便所述目标大语言模型生成当前测试结果,并确定所述当前测试结果的准确性得分;根据所述当前测试结果和所述准确性得分对所述当前提示词集合进行调整,以得到下一提示词集合,并将所述下一提示词集合更新为当前提示词集合;基于所述准确性得分从所述当前提示词集合中选择下一提示词,并将所述下一提示词更新为当前提示词,然后重新跳转至所述将所述当前提示词确定为当前动作的步骤,直至满足预设停止测试条件,以将输出的当前提示词集合确定为所述目标大语言模型的目标提示词集合。。