← 返回列表

用于大数据分析的基于图生成自然语言文本的方法及装置

申请号: CN202410050301.9
申请人: 西湖大学
申请日期: 2024/1/15

摘要文本

本申请提供了一种用于大数据分析的基于图生成自然语言文本的方法及装置。所述方法包括如下步骤,由处理器接收待分析的图,所述图以图结构的形式来表达目标领域的人类知识;基于所述图,利用经过图的自监督预训练的第一编码器,来提取图特征向量,其中,图的自监督预训练至少包括图遍历顺序转换任务和子图补全任务的多任务训练,图遍历顺序转换任务用于将图的深度优先遍历得到的线性序列转换为图的广度优先遍历序列,所述子图补全任务用于将子图替换为掩码的含噪声图恢复还原为原始图;以及基于所提取的图特征向量,利用解码器进行解码,以生成自然语言文本。

专利详细信息

项目 内容
专利名称 用于大数据分析的基于图生成自然语言文本的方法及装置
专利类型 发明申请
申请号 CN202410050301.9
申请日 2024/1/15
公告号 CN117576710A
公开日 2024/2/20
IPC主分类号 G06V30/41
权利人 西湖大学
发明人 白雪峰; 陈雨龙; 张岳
地址 浙江省杭州市西湖区墩余路600号

专利主权项内容

1.一种用于大数据分析的基于图生成自然语言文本的方法,其特征在于,所述方法包括如下步骤,由处理器:接收待分析的图,所述图以图结构的形式来表达目标领域的人类知识;基于所述图,利用经过图的自监督预训练的第一编码器,来提取图特征向量,其中,图的自监督预训练至少包括图遍历顺序转换任务和子图补全任务的多任务训练,图遍历顺序转换任务用于将图的深度优先遍历得到的线性序列转换为图的广度优先遍历序列,所述子图补全任务用于将子图替换为掩码的含噪声图恢复还原为原始图;以及基于所提取的图特征向量,利用解码器进行解码,以生成自然语言文本。