← 返回列表

一种基于噪声绑定扩散模型的对话摘要方法

申请号: CN202311395915.2
申请人: 中国科学技术大学
更新日期: 2026-03-09

摘要文本

中国科学技术大学取得“一种透气窗帘布”专利技术,本发明涉及对话摘要生成技术领域,公开了一种基于噪声绑定扩散模型的对话摘要方法,训练过程包括:根据输入对话生成相应的询问信息;将询问信息和对话串联拼接输入对话编码器,得到询问感知的对话表征;随机生成噪声信息,并将人工标注的对话摘要转换为二进制的比特表征,使用噪声信息对进行扩散加噪处理,得到加噪表征;使用扩散编码‑解码器对加噪表征进行去噪处理,得到去噪的比特表征,将去噪的比特表征与比特表征对比得到扩散损失,通过扩散损失并使用反向传播算法更新扩散编码‑解码器的模型参数;通过使用基于噪声绑定的扩散编码‑解码器进行不同角色的摘要生成,能够有效地从对话中辨别出充当噪声的无关信息,提升生成摘要的质量。

专利主权项内容

1.一种基于噪声绑定扩散模型的对话摘要方法,将对话输入对话摘要模型,生成对话摘要;对话摘要模型包括噪声绑定模块、询问生成模块、对话编码器和扩散编码-解码器;扩散编码-解码器包括扩散编码器和扩散解码器;对话摘要模型的训练过程,包括以下步骤:S1,使用询问生成模块,根据输入的对话生成相应的询问信息/>;S2,将询问信息和对话/>串联拼接,输入对话编码器,得到询问感知的对话表征/>;S3,通过噪声绑定模块随机生成噪声向量,并将人工标注的对话摘要/>转换为二进制的比特表征/>,扩散编码器使用噪声向量/>对/>进行扩散加噪处理,扩散加噪处理过程总共包括/>步,得到扩散加噪处理第t步的加噪表征/>以及最后一步的加噪表征/>;S4,将对话表征输入扩散编码-解码器,并使用扩散解码器/>对加噪表征/>进行去噪处理,去噪处理包括/>步,得到去噪处理第/>步的去噪比特表征/>、最后一步的去噪比特表征/>以及预测的对话摘要/>,将去噪处理第/>步的去噪比特表征/>与第t步得到的加噪表征/>对比得到扩散损失/>;将预测的对话摘要/>与人工标注的对话摘要对比,计算损失/>;则总损失/>;通过总损失/>并使用反向传播算法更新扩散编码-解码器的模型参数;即,对话摘要模型训练时,仅更新扩散编码-解码器的模型参数;步骤S3中,通过噪声绑定模块随机生成噪声向量时,具体包括:通过噪声绑定模块生成噪音集,从噪音集中随机采样/>个噪声单词,使用一个嵌入层矩阵/>将各噪声单词转换成噪声表征/>,然后对所有的噪声表征取平均值并进行归一化操作/>,得到噪声向量/>;/>表示第/>个噪声表征;步骤S3中,将人工标注的对话摘要转换为二进制的比特表征/>,使用噪声向量/>对进行扩散加噪处理,得到加噪表征/>时,具体包括:基于比特扩散网络将对话摘要/>中的单词转换为二进制的比特表征/>,然后使用噪声向量/>对/>进行扩散加噪处理,扩散加噪处理过程总共包括/>步,扩散加噪处理第t步得到的加噪表征/>为:;/>表示预先定义的超参数;步骤S4中,所述扩散损失为:/>;其中/>用于计算向量的长度;通过损失函数/>计算所述损失/>:/>;损失函数为交叉熵损失函数。 马 克 数 据 网

专利申请信息

项目 内容
专利名称 一种基于噪声绑定扩散模型的对话摘要方法
专利类型 发明授权
申请号 CN202311395915.2
申请日 2023/10/26
公告号 CN117131187B
公开日 2024/2/9
IPC主分类号 G06F16/34
权利人 中国科学技术大学
发明人 宋彦; 田元贺; 刘畅; 张勇东
地址 安徽省合肥市包河区金寨路96号