← 返回列表

一种基于指令链的多属性图像编辑方法、装置和电子设备

申请号: CN202311705594.1
申请人: 北京智源人工智能研究院
申请日期: 2023/12/13

摘要文本

本发明公开了一种基于指令链的多属性图像编辑方法、装置和电子设备,属于人工智能技术领域。方法包括:构建有监督微调训练(Supervised Fine Tuning,SFT)数据集,SFT数据集包括多属性指令和对应的单属性指令链;利用SFT数据集中的多属性指令和对应的单属性指令链对预训练的大语言模型进行微调,得到训练好的大语言模型;利用训练好的大语言模型将一个待编辑的多属性指令分解为待编辑的单属性指令链;对待编辑的图像,利用编辑模型逐步执行待编辑的单属性指令链中的各个单属性指令,得到编辑好的图像。本发明的技术方案可以有效解决多属性指令的图像编辑问题,使得编辑后的图像与多属性指令有较高的一致性。

专利详细信息

项目 内容
专利名称 一种基于指令链的多属性图像编辑方法、装置和电子设备
专利类型 发明申请
申请号 CN202311705594.1
申请日 2023/12/13
公告号 CN117475037A
公开日 2024/1/30
IPC主分类号 G06T11/60
权利人 北京智源人工智能研究院
发明人 张振铎; 刘广
地址 北京市海淀区成府路150号5层501号

专利主权项内容

1.一种基于指令链的多属性图像编辑方法,其特征在于,包括:构建SFT数据集,所述SFT数据集包括多属性指令和对应的单属性指令链;利用所述SFT数据集中的多属性指令和对应的单属性指令链对预训练的大语言模型进行微调,得到训练好的大语言模型;利用训练好的大语言模型将一个待编辑的多属性指令分解为待编辑的单属性指令链;对待编辑的图像,利用编辑模型逐步执行待编辑的单属性指令链中的各个单属性指令,得到编辑好的图像。。更多数据: