← 返回列表

一种基于元学习扩散模型的限定域受限文本生成方法

申请号: CN202311451928.7
申请人: 北京计算机技术及应用研究所
申请日期: 2023/11/3

摘要文本

本发明涉及一种基于元学习扩散模型的限定域受限文本生成方法,属于人工智能、大数据、自然语言处理领域。本发明通过关键词抽取和在原始句子中随机插入特定的占位符标记[EMP],构造大量训练样本;采用局部扩散的方式固定关键词,从而使扩散模型能够完成Hard‑CTG任务,并引入元学习策略对扩散模型训练过程进行优化;引入了另外一个特殊的标记[SLOT]用以指示MDM进行插入的位置,在逆扩散过程中,[SLOT]所标识的位置会逐步由标准高斯噪声转换为一个实际的单词或[EMP],从而得到包含关键词输入的生成文本。本发明使得扩散模型可在条件文本生成领域发挥其强大的生成优势。

专利详细信息

项目 内容
专利名称 一种基于元学习扩散模型的限定域受限文本生成方法
专利类型 发明申请
申请号 CN202311451928.7
申请日 2023/11/3
公告号 CN117521666A
公开日 2024/2/6
IPC主分类号 G06F40/30
权利人 北京计算机技术及应用研究所
发明人 刘琦; 柯文俊; 贺垚; 王又辰; 宋颖毅; 栾真; 苗旭
地址 北京市海淀区永定路51号

专利主权项内容

1.一种基于元学习扩散模型的限定域受限文本生成方法,其特征在于,该方法包括如下步骤:步骤一、在训练数据构造阶段中,通过关键词抽取和在原始句子中随机插入特定的占位符标记[EMP],构造大量训练样本;步骤二、在模型训练阶段,采用局部扩散的方式固定关键词,从而使扩散模型能够完成Hard-CTG任务,并引入元学习策略对扩散模型训练过程进行优化;步骤三、最后在模型推理阶段,通过特殊的标记[SLOT]用以指示元学习扩散模型(MetaDiffusion Model,MDM)进行插入的位置,在逆扩散过程中,[SLOT]所标识的位置会逐步由标准高斯噪声转换为一个实际的单词或[EMP],从而得到包含关键词输入的生成文本;给定一组关键词C={c, c, ..., c},其中K代表关键词的个数;受限文本生成(Hard-Constrained Text Generation,Hard-CTG)任务的目标是生成一个句子S={s, s..., s},使S包含C中的所有关键词,其中n,n≥K表示生成的句子长度。12K12n。百度搜索马 克 数 据 网