← 返回列表

基于反馈强化学习的小样本表面缺陷图像生成方法及系统

申请号: CN202311781415.2
申请人: 山东大学
申请日期: 2023/12/21

摘要文本

本发明公开了一种基于反馈强化学习的小样本表面缺陷图像生成方法及系统,该方法包括:获取少量表面缺陷图像样本,进行语义标签标注,构建训练集;构建条件扩散模型,利用训练集训练条件扩散模型,完成条件扩散模型的初步微调;扩充语义标签,利用微调后的条件扩散模型生成每一语义标签下的多张初始表面缺陷图像;对每一语义标签下的多张初始缺陷图像进行人工评分,进而构建评价数据集;构建奖励模型,利用评价数据集训练奖励模型;扩充语义标签,构建语义标签库,并基于奖励模型二次优化条件扩散模型,生成每一语义标签所对应的最优表面缺陷图像。本发明能够有效提高表面缺陷图像样本生成的性能和数据增强的能力。 微信公众号马克 数据网

专利详细信息

项目 内容
专利名称 基于反馈强化学习的小样本表面缺陷图像生成方法及系统
专利类型 发明申请
申请号 CN202311781415.2
申请日 2023/12/21
公告号 CN117710349A
公开日 2024/3/15
IPC主分类号 G06T7/00
权利人 山东大学
发明人 宋然; 房体育; 屈益民; 张伟; 魏致远
地址 山东省济南市历城区山大南路27号

专利主权项内容

1.一种基于反馈强化学习的小样本表面缺陷图像生成方法,其特征是,包括:获取少量表面缺陷图像样本,通过人工标注对每一表面缺陷图像样本进行语义标签标注,构建训练集;构建条件扩散模型,利用训练集训练条件扩散模型,完成条件扩散模型的初步微调;扩充语义标签,利用微调后的条件扩散模型生成每一语义标签下的多张初始表面缺陷图像;对每一语义标签下的多张初始缺陷图像进行人工评分,以每一语义标签所对应生成的多张初始缺陷图像及其评分,构建评价数据集;构建奖励模型,利用评价数据集训练奖励模型;扩充语义标签,构建语义标签库,并基于奖励模型二次优化条件扩散模型,生成语义标签库中每一语义标签所对应的最优表面缺陷图像。