← 返回列表

一种图的文本结构信息融合编码方法、装置、设备及介质

申请号: CN202311787801.2
申请人: 北京智谱华章科技有限公司
申请日期: 2023/12/25

摘要文本

本发明涉及一种图的文本结构信息融合编码方法、装置、设备及介质,方法包括:获取第一图,第一图的节点具有历史发文;对历史发文进行编码以获得第一图的特征矩阵;根据第一图的邻接矩阵和特征矩阵对第一图进行边和节点文本特征的随机掩码,以至少获得第二图和第三图;通过编码器分别根据第二图的邻接矩阵和特征矩阵进行编码以获得第一嵌入矩阵,通过编码器分别根据第三图的邻接矩阵和特征矩阵进行编码以获得第二嵌入矩阵;根据第一嵌入矩阵和第二嵌入矩阵构建节点特征重建损失和边重建损失,根据节点特征重建损失和边重建损失确定损失值;依据损失值对编码器进行训练,通过训练获得的编码器对图进行编码以获得嵌入矩阵。

专利详细信息

项目 内容
专利名称 一种图的文本结构信息融合编码方法、装置、设备及介质
专利类型 发明申请
申请号 CN202311787801.2
申请日 2023/12/25
公告号 CN117763163A
公开日 2024/3/26
IPC主分类号 G06F16/36
权利人 北京智谱华章科技有限公司
发明人 王博杰; 岑宇阔
地址 北京市海淀区中关村东路1号院9号楼10层整层

专利主权项内容

1.一种图的文本结构信息融合编码方法,其特征在于,包括以下步骤:获取第一图,所述第一图的节点具有历史发文;对所述历史发文进行编码以获得所述第一图的特征矩阵,所述特征矩阵包含对应于节点的文本特征;根据所述第一图的邻接矩阵和所述特征矩阵对所述第一图进行边和节点文本特征的随机掩码,以至少获得第二图和第三图;通过编码器分别根据所述第二图的邻接矩阵和特征矩阵进行编码以获得第一嵌入矩阵,通过所述编码器分别根据所述第三图的邻接矩阵和特征矩阵进行编码以获得第二嵌入矩阵;根据所述第一嵌入矩阵和所述第二嵌入矩阵构建节点特征重建损失和边重建损失,根据所述节点特征重建损失和边重建损失确定损失值;依据所述损失值对所述编码器进行训练,通过训练获得的编码器对图进行编码以获得嵌入矩阵。 关注公众号马克数据网