← 返回列表
多模态作品评审方法、装置、介质和设备
摘要文本
本发明公开了一种多模态作品评审方法、装置、介质和设备,首先,从多模态作品集合中选取一个目标多模态作品,对其文字信息和图像进行编码。接着,将这些编码填入一个空白矩阵,形成一个多模态矩阵。随后,将多模态矩阵输入一个已经收敛的多模态模型,获取每个作品的综合评分。最后,从多模态作品集合中筛选出预设数量个综合评分最高的多模态作品,形成第一目标集合。本方法有助于实现对同时涵盖文字信息和图像的多模态作品的自动评审,提高了评审效率和评价的综合性。
申请人信息
- 申请人:天津创意星球网络科技股份有限公司
- 申请人地址:301700 天津市武清区武清开发区顺源道与新开路交口东侧鑫海大厦518室(存在多址信息)
- 发明人: 天津创意星球网络科技股份有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 多模态作品评审方法、装置、介质和设备 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410250877.X |
| 申请日 | 2024/3/6 |
| 公告号 | CN117829098A |
| 公开日 | 2024/4/5 |
| IPC主分类号 | G06F40/126 |
| 权利人 | 天津创意星球网络科技股份有限公司 |
| 发明人 | 穆虹; 李西子 |
| 地址 | 天津市武清区武清开发区顺源道与新开路交口东侧鑫海大厦518室(存在多址信息) |
专利主权项内容
1.一种多模态作品评审方法,其特征在于,所述方法包括:获取多模态作品集合;其中,所述多模态作品集合中包括多个多模态作品,每个多模态作品包含文字信息和图像;对目标多模态作品的文字信息进行编码,以获取编码得到的文字编码,且对所述目标多模态作品的图像进行编码,以获取编码得到的图像编码;其中,所述目标多模态作品为所述多个多模态作品中的任意一个;获取创建的空白矩阵,将所述文字编码填入所述空白矩阵的文字区域,将所述图像编码填入所述空白矩阵的图像区域,将所述空白矩阵的空白区域填入预设的空白编码,以获取每一多模态作品填入得到的多模态矩阵;其中,所述空白区域为所述空白矩阵中未填入所述文字编码或所述图像编码的区域;将每一多模态作品的多模态矩阵输入已收敛的多模态模型,获取输出的每一多模态作品的综合评分,从所述多模态作品集合中筛选出预设数量个综合评分最高的多模态作品作为第一目标集合。。来源:马 克 团 队