← 返回列表
文本图像模型的训练方法、相关方法及相关产品
申请人信息
- 申请人:深圳惟德精准医疗科技有限公司
- 申请人地址:518000 广东省深圳市坪山区坪山街道六联社区坪山大道2007号创新广场B1504
- 发明人: 深圳惟德精准医疗科技有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 文本图像模型的训练方法、相关方法及相关产品 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410036431.7 |
| 申请日 | 2024/1/10 |
| 公告号 | CN117556077A |
| 公开日 | 2024/2/13 |
| IPC主分类号 | G06F16/583 |
| 权利人 | 深圳惟德精准医疗科技有限公司 |
| 发明人 | 谢卫国; 黄炳顶; 肖楚达 |
| 地址 | 广东省深圳市坪山区坪山街道六联社区坪山大道2007号创新广场B1504 |
摘要文本
本申请公开了一种文本图像模型的训练方法、相关方法及相关产品。该文本图像模型的训练方法包括:获取训练图像、训练文本和训练文本的预测标签,训练图像的维度大于1,训练图像包括目标器官;将训练图像转换为第一图像向量;通过对第一图像向量进行特征提取,得到第一特征向量;对第一图像向量进行降采样,得到第二图像向量;通过对第二图像向量进行特征提取处理,得到第二特征向量;待训练模型基于第一特征向量和第二特征向量,预测训练文本中被遮挡的内容,得到预测结果;基于预测结果与预测标签的差异,更新待训练模型的参数,得到目标文本图像模型。
专利主权项内容
1.一种文本图像模型的训练方法,其特征在于,所述方法包括:获取训练图像、训练文本和所述训练文本的预测标签,所述训练图像的维度大于1,所述训练图像包括目标器官,所述训练文本为描述所述训练图像中的所述目标器官的文本,且所述训练文本中与所述目标器官相关的内容已被遮挡,所述预测标签包括所述训练文本中被遮挡的内容;将所述训练图像转换为第一图像向量;通过对所述第一图像向量进行特征提取,得到第一特征向量;对所述第一图像向量进行降采样,得到第二图像向量;通过对所述第二图像向量进行特征提取处理,得到第二特征向量;待训练模型基于所述第一特征向量和所述第二特征向量,预测所述训练文本中被遮挡的内容,得到预测结果;基于所述预测结果与所述预测标签的差异,更新所述待训练模型的参数,得到目标文本图像模型,所述目标文本图像模型用于基于目标文本生成目标向量,所述目标文本为描述所述目标器官的文本,所述目标向量携带的所述目标器官的信息与所述目标文本对所述目标器官的描述匹配。