← 返回列表
一种基于Transformer模型的细粒度生物图像分类方法
摘要文本
本发明公开了一种基于Transformer模型的细粒度生物图像分类方法。本发明方法针对需要细粒度生物分类需求,建立包含特征提取模块、特征选择模块和预测模块的分类模型;特征提取模块基于Transformer网络实现,输出以特征块patch表示的图像特征;特征选择模块将patch进行非线性映射,再通过softmax函数生成权重选择一定数量的patch作为新的图像特征,预测模块根据图像特征预测细粒度的生物分类。训练时,计算样本特征间的余弦距离作为距离损失,再结合分类损失优化分类模型参数。本发明方法适用不同基于Transformer的骨干网络,实现了细粒度生物图像分类且分类准确率高。。
申请人信息
- 申请人:北京邮电大学; 河北师范大学
- 申请人地址:100876 北京市海淀区西土城路10号
- 发明人: 北京邮电大学; 河北师范大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种基于Transformer模型的细粒度生物图像分类方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311265910.8 |
| 申请日 | 2023/9/27 |
| 公告号 | CN117593557A |
| 公开日 | 2024/2/23 |
| IPC主分类号 | G06V10/764 |
| 权利人 | 北京邮电大学; 河北师范大学 |
| 发明人 | 邢颖; 刘敬泽; 于志军; 管宇 |
| 地址 | 北京市海淀区西土城路10号; 河北省石家庄市南二环东路20号 |
专利主权项内容
1.一种基于Transformer模型的细粒度生物图像分类方法,其特征在于,包括:步骤1,利用历史生物图像生成训练样本,训练样本的标签为细粒度生物类别;步骤2,建立分类模型,分类模块包含特征提取模块、特征选择模块和预测模块;所述特征提取模块采用基于Transformer的网络,对输入图像提取特征,输出以特征块patch表示的图像特征;所述特征选择模块先使用两层全连接网络将patch进行非线性映射,然后再通过softmax函数生成权重,根据生成的权重选择预先设定数量的patch作为新的图像特征F;choose所述预测模块根据图像特征F预测细粒度的生物分类;choose步骤3,使用训练样本训练分类模型;训练时,使用投影网络对F进行映射并计算样本间的余弦距离作为距离损失L,使用交叉熵损失计算分类损失L,基于L和L优化分类模型参数;choosedistanceclsdistancecls步骤4,使用训练后的分类模型进行生物图像细粒度分类。 数据由马 克 数 据整理