一种标题预测模型的处理方法和装置

申请号: CN202311490760.0

申请人: 北京邮电大学

申请日期: 2023/11/9

摘要文本

本发明实施例涉及一种标题预测模型的处理方法和装置，所述方法包括：构建标题预测模型、模型训练网络；基于模型训练网络对音频特征提取模型和文本向量去噪模型进行一阶段训练得到对应的二阶段训练数据集；并基于二阶段训练数据集对文本向量解码模型进行二阶段训练；标题预测模型训练结束后，接收任意音频作为对应的第一音频；并设置对应的第一反向扩散总步数为预设的总步数阈值；并将第一音频和第一反向扩散总步数输入标题预测模型进行标题文本预测处理得到对应的第一标题文本；并对第一标题文本进行显示。通过本发明可以提高预测标题文本的多样性。

申请人信息

申请人:北京邮电大学
申请人地址:100876 北京市海淀区西土城路6号
发明人: 北京邮电大学

专利详细信息

项目	内容
专利名称	一种标题预测模型的处理方法和装置
专利类型	发明申请
申请号	CN202311490760.0
申请日	2023/11/9
公告号	CN117371433A
公开日	2024/1/9
IPC主分类号	G06F40/258
权利人	北京邮电大学
发明人	肖立; 朱勇钢
地址	北京市海淀区西土城路10号

专利主权项内容

1.一种标题预测模型的处理方法，其特征在于，所述方法包括：构建标题预测模型；所述标题预测模型包括音频特征提取模型、文本向量初始化模块、文本向量去噪模型、DDIM反向扩散算法模块、反向扩散计数模块和文本向量解码模型；构建模型训练网络；所述模型训练网络包括文本向量编码模型、文本向量噪声添加模块、所述音频特征提取模型、所述文本向量去噪模型、所述DDIM反向扩散算法模块、所述反向扩散计数模块和所述文本向量解码模型；基于所述模型训练网络对所述音频特征提取模型和所述文本向量去噪模型进行一阶段训练得到对应的二阶段训练数据集；并基于所述二阶段训练数据集对所述文本向量解码模型进行二阶段训练；所述标题预测模型训练结束后，接收任意音频作为对应的第一音频；并设置对应的第一反向扩散总步数为预设的总步数阈值；并将所述第一音频和所述第一反向扩散总步数输入所述标题预测模型进行标题文本预测处理得到对应的第一标题文本；并对所述第一标题文本进行显示。。来源：百度搜索马克数据网

一种标题预测模型的处理方法和装置

摘要文本

申请人信息

专利详细信息

专利主权项内容

热门技术领域

快速入口

专利技术资料

特别鸣谢

一种标题预测模型的处理方法和装置

摘要文本

申请人信息

专利详细信息

专利主权项内容

相关专利推荐

一种高频变压器串并联倍流输出的整流电路

沙发(HSN-6053)

时延对齐方法及装置

一种高脱色竹制活性碳及其制备工艺

床(HSN-B016)

座椅部件(GF-82733H)

热门技术领域

快速入口

专利技术资料

特别鸣谢