← 返回列表
一种基于关键注意力机制的专利信息的相似度计算方法
申请人信息
- 申请人:数据空间研究院
- 申请人地址:231200 安徽省合肥市高新区柏堰科技园创新大道288号工投高新智谷B区
- 发明人: 数据空间研究院
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种基于关键注意力机制的专利信息的相似度计算方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311781267.4 |
| 申请日 | 2023/12/22 |
| 公告号 | CN117763088A |
| 公开日 | 2024/3/26 |
| IPC主分类号 | G06F16/33 |
| 权利人 | 数据空间研究院 |
| 发明人 | 王建; 陈一根; 王佐成; 吕孝忠; 孙昕 |
| 地址 | 安徽省合肥市高新区柏堰科技园创新大道288号工投高新智谷B区 |
摘要文本
本发明涉及专利信息处理技术领域,具体是一种基于关键注意力机制的专利信息的相似度计算方法,在本发明中相似度的计算不再仅依赖于传统的余弦相似度方法,而是采用基于关键注意力机制来理解专利文本的深层次语义,以及关键词的动态权重,提高了相似度评估的准确性和相似度评估的检索速度。这种方法使得相似度计算不仅反映了文本的字面相似性,更重要的是反映了文本间的深层语义关联,从而提高了检索结果的准确性和相关性。同时本发明还提高了信息处理的效率,特别是在处理大规模专利库时,通过上述这些改进,能够显著提高处理大规模专利数据的能力,为用户提供更高效、更智能的检索体验。
专利主权项内容
1.一种基于关键注意力机制的专利信息的相似度计算方法,其特征在于,包括以下步骤:S1、将专利文本输入到关键词识别模块中,识别出专利文本中的关键词;S2、将专利文本输入到关键注意力机制中,获得专利文本中包括关键词在内各个词在该专利为本中的向量表示,并同时计算各个词在该专利文本中的权重;S3、将词的向量表示,以及词的权重输入到基于关键注意力机制的相似度计算公式中,计算出任意两篇专利文本之间的相似度;所述相似度计算公式具体表示如下:其中,similarity(S, S)表示专利文本p和专利文本q之间的相似度;表示专利文本p中的第i词t的权重;/>表示专利文本q中的第j词t的权重;softmax表示归一化指数函数;/>表示专利文本p中的词t和专利文本q中的词t之间的相互影响力,即t和t之间的关键字加权因子;/>表示专利文本p中的词t的向量表示;/>表示专利文本q中的词t的向量表示。pqpiqjpiqjpiqjpiqj