目标检测的方法和装置
申请人信息
- 申请人:深圳须弥云图空间科技有限公司; 深圳介子云图空间科技有限公司
- 申请人地址:518054 广东省深圳市南山区粤海街道海珠社区滨海大道3369号有线信息传输大厦25F2504
- 发明人: 深圳须弥云图空间科技有限公司; 深圳介子云图空间科技有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 目标检测的方法和装置 |
| 专利类型 | 发明授权 |
| 申请号 | CN202311705806.6 |
| 申请日 | 2023/12/13 |
| 公告号 | CN117392379B |
| 公开日 | 2024/3/15 |
| IPC主分类号 | G06V10/25 |
| 权利人 | 深圳须弥云图空间科技有限公司; 深圳介子云图空间科技有限公司 |
| 发明人 | 石雅洁 |
| 地址 | 广东省深圳市南山区粤海街道海珠社区滨海大道3369号有线信息传输大厦25F2504; 广东省深圳市南山区粤海街道海珠社区滨海大道3369号有线信息传输大厦26F2602 |
摘要文本
深圳须弥云图空间科技有限公司; 深圳介子云图空间科技有限公司取得“一种透气窗帘布”专利技术,本公开涉及计算机视觉技术领域,提供了一种目标检测的方法和装置。该方法包括:执行提示文本生成任务,生成提示文本的特征向量;基于提示文本的特征向量和待检测图像确定视觉提示特征向量;基于视觉提示特征向量和待检测图像的全局特征向量确定待检测图像的局部特征增强向量;基于待检测图像的局部特征增强向量和提示文本的特征向量确定匹配特征向量;基于上述匹配特征向量和待检测图像的局部特征增强向量确定待检测图像的融合特征向量;基于融合特征向量,确定目标对象的检测框的位置和目标对象的类别解决了现有技术中目标检测模型不能对目标检测训练集中未出现的类别进行通用检测的问题,提高了模型的泛化能力。。来源:百度搜索专利查询网
专利主权项内容
1.一种目标检测的方法,其特征在于,包括:执行提示文本生成任务,生成提示文本的特征向量,所述提示文本的特征向量与待检测图像相关;对所述提示文本的特征向量和所述待检测图像的全局特征向量进行注意力处理,得到视觉提示特征向量;对所述视觉提示特征向量和所述待检测图像的全局特征向量进行融合处理,得到所述待检测图像的局部特征增强向量;对所述待检测图像的局部特征增强向量和所述提示文本的特征向量进行匹配处理,得到所述提示文本与所述待检测图像的匹配特征向量;将所述提示文本与所述待检测图像的匹配特征向量和所述待检测图像的局部特征增强向量进行融合处理,得到所述待检测图像的融合特征向量;基于所述待检测图像的融合特征向量,从所述待检测图像的至少一个待检测对象中确定目标对象的检测框的位置和所述目标对象的类别;所述执行提示文本生成任务,生成提示文本的特征向量,包括:基于输入的提示词进行词嵌入处理,得到第一提示文本的初步特征向量;将第一提示文本的初步特征向量与预先训练得到的参数相乘,得到第一提示文本的特征向量;将所述待检测图像的全局特征向量输入文本提示生成器进行文本提示生成,得到第二提示文本的特征向量,所述文本提示生成器包含两个转换器模型和激活函数;根据所述第一提示文本的特征向量和所述第二提示文本的特征向量,确定所述提示文本的特征向量;所述根据所述第一提示文本的特征向量和所述第二提示文本的特征向量,确定所述提示文本的特征向量,包括:对所述第一提示文本的特征向量和所述第二提示文本的特征向量进行拼接处理,得到所述提示文本的初步特征向量;通过文本编码器对所述提示文本的初步特征向量进行编码处理,得到所述提示文本的编码结果;对所述提示文本的编码结果进行归一化处理,得到所述提示文本的特征向量。 (来自 马克数据网)