← 返回列表

一种标题预测模型的处理方法和装置

申请号: CN202311490760.0
申请人: 北京邮电大学
申请日期: 2023/11/9

摘要文本

本发明实施例涉及一种标题预测模型的处理方法和装置,所述方法包括:构建标题预测模型、模型训练网络;基于模型训练网络对音频特征提取模型和文本向量去噪模型进行一阶段训练得到对应的二阶段训练数据集;并基于二阶段训练数据集对文本向量解码模型进行二阶段训练;标题预测模型训练结束后,接收任意音频作为对应的第一音频;并设置对应的第一反向扩散总步数为预设的总步数阈值;并将第一音频和第一反向扩散总步数输入标题预测模型进行标题文本预测处理得到对应的第一标题文本;并对第一标题文本进行显示。通过本发明可以提高预测标题文本的多样性。

专利详细信息

项目 内容
专利名称 一种标题预测模型的处理方法和装置
专利类型 发明申请
申请号 CN202311490760.0
申请日 2023/11/9
公告号 CN117371433A
公开日 2024/1/9
IPC主分类号 G06F40/258
权利人 北京邮电大学
发明人 肖立; 朱勇钢
地址 北京市海淀区西土城路10号

专利主权项内容

1.一种标题预测模型的处理方法,其特征在于,所述方法包括:构建标题预测模型;所述标题预测模型包括音频特征提取模型、文本向量初始化模块、文本向量去噪模型、DDIM反向扩散算法模块、反向扩散计数模块和文本向量解码模型;构建模型训练网络;所述模型训练网络包括文本向量编码模型、文本向量噪声添加模块、所述音频特征提取模型、所述文本向量去噪模型、所述DDIM反向扩散算法模块、所述反向扩散计数模块和所述文本向量解码模型;基于所述模型训练网络对所述音频特征提取模型和所述文本向量去噪模型进行一阶段训练得到对应的二阶段训练数据集;并基于所述二阶段训练数据集对所述文本向量解码模型进行二阶段训练;所述标题预测模型训练结束后,接收任意音频作为对应的第一音频;并设置对应的第一反向扩散总步数为预设的总步数阈值;并将所述第一音频和所述第一反向扩散总步数输入所述标题预测模型进行标题文本预测处理得到对应的第一标题文本;并对所述第一标题文本进行显示。。来源:百度搜索马克数据网