← 返回列表

一种基于关键注意力机制的专利信息的相似度计算方法

申请号: CN202311781267.4
申请人: 数据空间研究院
更新日期: 2026-03-09

专利详细信息

项目 内容
专利名称 一种基于关键注意力机制的专利信息的相似度计算方法
专利类型 发明申请
申请号 CN202311781267.4
申请日 2023/12/22
公告号 CN117763088A
公开日 2024/3/26
IPC主分类号 G06F16/33
权利人 数据空间研究院
发明人 王建; 陈一根; 王佐成; 吕孝忠; 孙昕
地址 安徽省合肥市高新区柏堰科技园创新大道288号工投高新智谷B区

摘要文本

本发明涉及专利信息处理技术领域,具体是一种基于关键注意力机制的专利信息的相似度计算方法,在本发明中相似度的计算不再仅依赖于传统的余弦相似度方法,而是采用基于关键注意力机制来理解专利文本的深层次语义,以及关键词的动态权重,提高了相似度评估的准确性和相似度评估的检索速度。这种方法使得相似度计算不仅反映了文本的字面相似性,更重要的是反映了文本间的深层语义关联,从而提高了检索结果的准确性和相关性。同时本发明还提高了信息处理的效率,特别是在处理大规模专利库时,通过上述这些改进,能够显著提高处理大规模专利数据的能力,为用户提供更高效、更智能的检索体验。

专利主权项内容

1.一种基于关键注意力机制的专利信息的相似度计算方法,其特征在于,包括以下步骤:S1、将专利文本输入到关键词识别模块中,识别出专利文本中的关键词;S2、将专利文本输入到关键注意力机制中,获得专利文本中包括关键词在内各个词在该专利为本中的向量表示,并同时计算各个词在该专利文本中的权重;S3、将词的向量表示,以及词的权重输入到基于关键注意力机制的相似度计算公式中,计算出任意两篇专利文本之间的相似度;所述相似度计算公式具体表示如下:其中,similarity(S, S)表示专利文本p和专利文本q之间的相似度;表示专利文本p中的第i词t的权重;/>表示专利文本q中的第j词t的权重;softmax表示归一化指数函数;/>表示专利文本p中的词t和专利文本q中的词t之间的相互影响力,即t和t之间的关键字加权因子;/>表示专利文本p中的词t的向量表示;/>表示专利文本q中的词t的向量表示。pqpiqjpiqjpiqjpiqj