← 返回列表
基于遥感多模态基础模型的遥感图像文本检索方法
摘要文本
本发明提供一种基于遥感多模态基础模型的遥感图像文本检索方法,涉及计算模型和计算机系统领域,用以解决遥感图文检索精度差、效率低的问题。具体包括:获取遥感图像数据和文本描述数据;获取遥感图像数据的图像密集向量和文本描述数据的文本密集向量;从遥感图像数据中提取图像密集向量和从文本描述数据中提取文本密集向量;将图像密集向量转化为图像稀疏向量,并将文本密集向量转化为文本稀疏向量;以及基于图像稀疏向量和文本稀疏向量建立索引模型,并根据索引模型检索文本描述数据所对应的遥感图像数据。本发明利用稀疏向量建立索引模型,减少了遥感图文检索过程中的计算量,提升了模型的效率。
申请人信息
- 申请人:中国科学院空天信息创新研究院
- 申请人地址:100190 北京市海淀区北四环西路19号
- 发明人: 中国科学院空天信息创新研究院
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 基于遥感多模态基础模型的遥感图像文本检索方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311851226.8 |
| 申请日 | 2023/12/29 |
| 公告号 | CN117743614A |
| 公开日 | 2024/3/22 |
| IPC主分类号 | G06F16/51 |
| 权利人 | 中国科学院空天信息创新研究院 |
| 发明人 | 许光銮; 张文凯; 李霁豪; 李硕轲; 张伟航; 佟博远; 李重阳 |
| 地址 | 北京市海淀区北四环西路19号 |
专利主权项内容
1.一种基于遥感多模态基础模型的遥感图像文本检索方法,其特征在于,包括:获取遥感图像数据和文本描述数据;从所述遥感图像数据中提取图像密集向量和从所述文本描述数据中提取文本密集向量;将所述图像密集向量转化为图像稀疏向量,并将所述文本密集向量转化为文本稀疏向量;以及基于所述图像稀疏向量和所述文本稀疏向量建立索引模型,并根据所述索引模型检索所述文本描述数据所对应的遥感图像数据。