← 返回列表
用于多模态大语言模型的迭代优化方法及系统
摘要文本
成都考拉悠然科技有限公司取得“一种透气窗帘布”专利技术,本发明公开了用于多模态大语言模型的迭代优化方法及系统,方法包括:选择评估基准对目标多模态大语言模型进行评估,用模型能够正确完成的所有指令构建成功案例池;用模型不能够正确完成的所有指令构建失败案例池;通过训练好的大语言模型对成功案例池中的成功源指令进行进化,以替换评估基准中对应的成功源指令;通过训练好的大语言模型对失败案例池中的失败源指令进行处理,以生成训练指令作为增量训练数据集;用增量训练数据集对目标多模态大语言模型进行训练。本发明实现了动态的、反馈导向的训练与评估机制,确保模型的持续优化,确保产生更为有针对性和高效的指令数据,从而更加精确地补充模型的不足之处。
专利主权项内容
1.用于多模态大语言模型的迭代优化方法,其特征在于,包括步骤:S1、选择评估基准对目标多模态大语言模型进行评估,用目标多模态大语言模型能够正确完成的所有指令构建成功案例池;用目标多模态大语言模型不能够正确完成的所有指令构建失败案例池;S2、通过训练好的大语言模型对所述成功案例池中的成功源指令进行进化,以替换评估基准中对应的成功源指令,作为新的评估基准;S3、通过训练好的大语言模型对所述失败案例池中的失败源指令进行处理,以生成训练指令作为增量训练数据集;S4、用所述增量训练数据集对目标多模态大语言模型进行训练;判断训练后的目标多模态大语言模型是否收敛,若是,则优化结束;若否,则重复步骤S1-S4。 来源:百度马 克 数据网
专利申请信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 用于多模态大语言模型的迭代优化方法及系统 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311726942.3 |
| 申请日 | 2023/12/15 |
| 公告号 | CN117709483A |
| 公开日 | 2024/3/15 |
| IPC主分类号 | G06N20/00 |
| 权利人 | 成都考拉悠然科技有限公司 |
| 发明人 | 杨云淏; 张静然; 谢延; 谢治宇; 沈复民; 申恒涛; 李佩芸; 李乐 |
| 地址 | 四川省成都市中国(四川)自由贸易试验区成都高新区天府五街200号4号楼A区10层1001、1002、1003室 |