← 返回列表

一种视频处理方法、装置及相关产品

申请号: CN202410163555.1
申请人: 北京搜狐新媒体信息技术有限公司
申请日期: 2024/2/5

摘要文本

本申请公开了一种视频处理方法、装置及相关产品。利用视频处理模型对语音模态特征集和图像模态特征集进行特征融合,获得多模态融合特征,其中视频处理模型用于生成多模态融合特征;根据多模态融合特征对待处理视频进行处理,获得待处理视频的处理结果,其中处理结果包括对于待处理视频的分类结果、对于待处理视频的主题生成结果和对于待处理视频的标签提取结果。可见,在本申请中提出对待处理视频中的语音模态特征集和图像模态特征集进行特征融合,以获得多模态融合特征,此时便可以根据该多模态融合特征确定视频的分类、标签提取等结果。如此,在本申请中采用对多种模态特征进行融合的方式来确定视频的处理结果,提高了视频处理效果。。来源:马 克 数 据 网

专利详细信息

项目 内容
专利名称 一种视频处理方法、装置及相关产品
专利类型 发明申请
申请号 CN202410163555.1
申请日 2024/2/5
公告号 CN117708375A
公开日 2024/3/15
IPC主分类号 G06F16/75
权利人 北京搜狐新媒体信息技术有限公司
发明人 高鹏
地址 北京市海淀区科学院南路2号院3号楼12层1201

专利主权项内容

1.一种视频处理方法,其特征在于,包括:获取待处理视频;对所述待处理视频进行解析,获得语音模态特征集和图像模态特征集;利用视频处理模型对所述语音模态特征集和所述图像模态特征集进行特征融合,获得多模态融合特征,其中所述视频处理模型用于生成多模态融合特征;根据所述多模态融合特征对所述待处理视频进行处理,获得所述待处理视频的处理结果,其中所述处理结果包括对于所述待处理视频的分类结果、对于所述待处理视频的主题生成结果和对于所述待处理视频的标签提取结果。