← 返回列表
一种基于适配网络增强扩散模型的人体姿态场景恢复方法
摘要文本
本发明公开了一种基于适配网络增强扩散模型的人体姿态场景恢复方法,属于计算机视觉的图像生成领域,该方法首先每一组训练用的数据表示为一个五元组(A(N), B(N), y, ZA, ZB),并用点阵A(N), B(N)分别制作灰度图A0, B0。其次由扩散模型得到扩散模型中主副适配器的差异,并根据差异计算出损失函数,并计算结余损失。最后根据损失函数和结余损失函数得到全局优化函数,对输出的人物姿态图进行优化。本发明消除了通过试探方法训练寻找损失函数间权值时所需的计算开销,实现了预训练模型功能细分的训练方式,使得输出的人物姿态图更为准确稳定。 来自马-克-数-据-官网
申请人信息
- 申请人:杭州电子科技大学
- 申请人地址:310018 浙江省杭州市钱塘区白杨街道2号大街1158号
- 发明人: 杭州电子科技大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种基于适配网络增强扩散模型的人体姿态场景恢复方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311293866.1 |
| 申请日 | 2023/10/9 |
| 公告号 | CN117392675A |
| 公开日 | 2024/1/12 |
| IPC主分类号 | G06V20/70 |
| 权利人 | 杭州电子科技大学 |
| 发明人 | 陈鼎; 王可逸; 余宙; 俞俊 |
| 地址 | 浙江省杭州市钱塘区白杨街道2号大街1158号 |
专利主权项内容
1.一种基于适配网络增强扩散模型的人体姿态场景恢复方法,其特征在于,包括以下步骤:步骤1.每一组训练用的数据表示为一个五元组(A,B,y,Z,Z),其中y为文本描述标注,A,B是两个元素个数均为的点阵,/>为图像数据,其中数字3意味着图像按照RGB格式存储,w,h分别表示图像的宽度和高度;用Ψ(·)表示输入图像产生图像中人物关节基点坐标点点集的模型,以δ为权重;根据图像Z,Z分别得到的点阵A,B;(N)(N)AB(N)(N)δAB(N)(N)步骤2.用点阵A,B分别制作灰度图A,B;(N)(N)00步骤3.由扩散模型得到扩散模型中主副适配器的差异,并根据差异计算出损失函数,并计算结余损失;步骤4.根据损失函数和结余损失函数得到全局优化函数,对输出的人物姿态图进行优化。