用于大数据分析的基于图生成自然语言文本的方法及装置

申请号: CN202410050301.9

申请人: 西湖大学

申请日期: 2024/1/15

摘要文本

本申请提供了一种用于大数据分析的基于图生成自然语言文本的方法及装置。所述方法包括如下步骤，由处理器接收待分析的图，所述图以图结构的形式来表达目标领域的人类知识；基于所述图，利用经过图的自监督预训练的第一编码器，来提取图特征向量，其中，图的自监督预训练至少包括图遍历顺序转换任务和子图补全任务的多任务训练，图遍历顺序转换任务用于将图的深度优先遍历得到的线性序列转换为图的广度优先遍历序列，所述子图补全任务用于将子图替换为掩码的含噪声图恢复还原为原始图；以及基于所提取的图特征向量，利用解码器进行解码，以生成自然语言文本。

申请人信息

申请人:西湖大学
申请人地址:310030 浙江省杭州市西湖区墩余路600号
发明人: 西湖大学

专利详细信息

项目	内容
专利名称	用于大数据分析的基于图生成自然语言文本的方法及装置
专利类型	发明申请
申请号	CN202410050301.9
申请日	2024/1/15
公告号	CN117576710A
公开日	2024/2/20
IPC主分类号	G06V30/41
权利人	西湖大学
发明人	白雪峰; 陈雨龙; 张岳
地址	浙江省杭州市西湖区墩余路600号

专利主权项内容

1.一种用于大数据分析的基于图生成自然语言文本的方法，其特征在于，所述方法包括如下步骤，由处理器：接收待分析的图，所述图以图结构的形式来表达目标领域的人类知识；基于所述图，利用经过图的自监督预训练的第一编码器，来提取图特征向量，其中，图的自监督预训练至少包括图遍历顺序转换任务和子图补全任务的多任务训练，图遍历顺序转换任务用于将图的深度优先遍历得到的线性序列转换为图的广度优先遍历序列，所述子图补全任务用于将子图替换为掩码的含噪声图恢复还原为原始图；以及基于所提取的图特征向量，利用解码器进行解码，以生成自然语言文本。

用于大数据分析的基于图生成自然语言文本的方法及装置

摘要文本

申请人信息

专利详细信息

专利主权项内容

热门技术领域

快速入口

专利技术资料

特别鸣谢

用于大数据分析的基于图生成自然语言文本的方法及装置

摘要文本

申请人信息

专利详细信息

专利主权项内容

相关专利推荐

一种高频变压器串并联倍流输出的整流电路

沙发(HSN-6053)

时延对齐方法及装置

一种高脱色竹制活性碳及其制备工艺

床(HSN-B016)

座椅部件(GF-82733H)

热门技术领域

快速入口

专利技术资料

特别鸣谢