← 返回列表

一种场景分类方法、装置、计算机设备及可读存储介质

申请号: CN202410109125.1
申请人: 深圳市万物云科技有限公司
更新日期: 2026-03-17

专利详细信息

项目 内容
专利名称 一种场景分类方法、装置、计算机设备及可读存储介质
专利类型 发明申请
申请号 CN202410109125.1
申请日 2024/1/26
公告号 CN117636080A
公开日 2024/3/1
IPC主分类号 G06V10/764
权利人 深圳市万物云科技有限公司
发明人 吕勤学
地址 广东省深圳市前海深港合作区前湾一路1号A栋201室

摘要文本

本发明公开了一种场景分类方法、装置、计算机设备及可读存储介质,方法包括:获取待分类图片和场景图片;将待分类图片输入至FCOS算法模型,得到待分类图片中目标物的类别和置信度信息;利用颜色提取方法得到待分类图片的颜色占比信息;将目标物的类别、置信度信息和颜色占比信息输入多层感知机模型进行场景分类,得到每个场景的概率值;利用Swin‑Transformer网络模型分别对场景图片和待分类图片进行特征提取,得到场景图片向量和待分类图片向量;利用余弦相似度函数对待分类图片向量与场景图片向量进行计算,得到相似度;将每个场景的概率值和相似度输入至D‑S证据融合模型进行融合,得到待分类图片的场景类别。本发明通过该方法提升了图片场景分类的效率和精度。

专利主权项内容

1.一种场景分类方法,其特征在于,包括:获取待分类图片和场景图片;将所述待分类图片输入至FCOS算法模型,得到所述待分类图片中目标物的类别和置信度信息;利用颜色提取方法得到所述待分类图片的颜色占比信息;将所述目标物的类别、置信度信息和所述颜色占比信息输入多层感知机模型中进行场景分类,得到每个场景的概率值;利用Swin-Transformer网络模型分别对所述场景图片和所述待分类图片进行特征提取,得到场景图片向量和待分类图片向量;利用余弦相似度函数对所述待分类图片向量与所述场景图片向量进行计算,得到所述场景图片和所述待分类图片之间的相似度;将所述每个场景的概率值和所述相似度输入至D-S证据融合模型进行融合,得到所述待分类图片的场景类别。