← 返回列表
视频标题生成方法和视频标题生成模型的训练方法
申请人信息
- 申请人:腾讯科技(深圳)有限公司
- 申请人地址:518057 广东省深圳市南山区高新区科技中一路腾讯大厦35层
- 发明人: 腾讯科技(深圳)有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 视频标题生成方法和视频标题生成模型的训练方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410065332.1 |
| 申请日 | 2024/1/17 |
| 公告号 | CN117609550A |
| 公开日 | 2024/2/27 |
| IPC主分类号 | G06F16/738 |
| 权利人 | 腾讯科技(深圳)有限公司 |
| 发明人 | 蓝玮毓 |
| 地址 | 广东省深圳市南山区高新区科技中一路腾讯大厦35层 |
摘要文本
本申请涉及一种视频标题生成方法、视频标题生成模型的训练方法、装置、计算机设备、存储介质和计算机程序产品,涉及计算机视觉和自然语言处理技术。所述方法包括:获取待处理的视频素材、以及与该视频素材的发布场景匹配的提示模板;对视频素材进行语义提取,得到视频素材的文本语义信息和视觉语义信息;使用所述文本语义信息填充与发布场景匹配的提示模板,生成提示信息;将视觉语义信息和提示信息输入至预训练的大语言模型,以使大语言模型在该提示信息的引导下,生成与视觉语义信息匹配的摘要信息;基于摘要信息,确定视频素材在该发布场景下的视频标题。采用上述方法能够提高视频标题的准确性。 搜索专利查询网
专利主权项内容
1.一种视频标题生成方法,其特征在于,所述方法包括:获取待处理的视频素材、以及与所述视频素材的发布场景匹配的提示模板;对所述视频素材进行语义提取,得到所述视频素材的文本语义信息和视觉语义信息;使用所述文本语义信息填充所述提示模板,生成提示信息;将所述视觉语义信息和所述提示信息输入至预训练的大语言模型,以使所述大语言模型在所述提示信息的引导下,生成与所述视觉语义信息匹配的摘要信息;基于所述摘要信息,确定所述视频素材在所述发布场景下的视频标题。