一种材料与化工行业科技情报分析方法
申请人信息
- 申请人:北京大学深圳研究生院
- 申请人地址:518055 广东省深圳市南山区西丽大学城北大园区
- 发明人: 北京大学深圳研究生院
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种材料与化工行业科技情报分析方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410199947.3 |
| 申请日 | 2024/2/23 |
| 公告号 | CN117787250A |
| 公开日 | 2024/3/29 |
| IPC主分类号 | G06F40/205 |
| 权利人 | 北京大学深圳研究生院 |
| 发明人 | 龙云凤; 孟鸿; 任志宽; 陈孟 |
| 地址 | 广东省深圳市南山区西丽深圳大学城北大校区 |
摘要文本
来自: 一种材料与化工行业科技情报分析方法,属于科技情报分析处理领域。为解决考虑关键词的动态演化规律进行材料与化工行业科技情报精确分析,本发明采集材料与化工行业科技情报,构建文献矩阵,构建实词向量矩阵计算实词长度,利用实词长度对撰写错误的实词进行判断,然后对实词向量矩阵中撰写错误的实词进行修正得到修正的实词向量矩阵的每个实词进行编码,基于设定的实词数量阈值进行判断,对修正的实词的编码矩阵、修正的实词的位置矩阵进行不平衡数据处理,得到数据平衡后的实词向量矩阵,然后利用一种考虑上下文信息的方法解算关键词对应的特征矩阵构建相似评价函数,进行关键词识别,构建关键词数量演化函数,进行材料与化工行业科技情报分析。
专利主权项内容
1.一种材料与化工行业科技情报分析方法,其特征在于,包括如下步骤:S1、采集材料与化工行业科技情报,构建文献矩阵,其中,/>为文献总数量,然后构建关键词矩阵/>,其中,/>为关键词总数量;/>为第个关键词;iS2、基于步骤S1中的第个文献中的科技情报信息数据,提取材料与化工行业科技情报信息数据中的实词向量gs,构建实词向量矩阵/>,/>,其中,B为实词总数量;iS3、基于步骤S2构建的实词向量矩阵,计算实词向量矩阵GS中实词长度/>,构建实词长度矩阵/>;S4、利用实词长度对撰写错误的实词进行判断,然后对实词向量矩阵中撰写错误的实词进行修正,得到修正的实词向量矩阵;S5、对步骤S4得到的修正的实词向量矩阵中的每个实词进行编码,设定关键词编码为1,非关键词编码为0,构建修正的实词的编码矩阵/>,其中/>为修正的实词的编码矩阵中的第B个元素,修正的实词的位置矩阵/>,其中/>为修正的实词的位置矩阵中的第B个元素,设定实词数量阈值,对修正的实词的编码矩阵进行实词数量判断,当修正的实词的编码矩阵中实词数量大于实词数量阈值时,进入步骤S6,当修正的实词的编码矩阵中实词数量小于等于实词数量阈值时,修正的实词向量矩阵/>与数据平衡后的全部实词向量相等,然后进入步骤S7;SLS6、对步骤S4得到的修正的实词向量矩阵,基于步骤S4构建的修正的实词的编码矩阵、修正的实词的位置矩阵进行不平衡数据处理,得到数据平衡后的实词向量矩阵;S7、基于步骤S5和S6得到的数据平衡后的全部实词向量矩阵,利用一种考虑上下文信息的方法解算关键词对应的特征矩阵;S8、基于步骤S7得到的关键词对应的特征矩阵,构建相似评价函数,进行关键词识别;S9、基于步骤S1构建的文献矩阵,重复步骤S2-S8,对文献矩阵中的每一篇文献进行关键词识别,构建关键词数量演化函数,进行材料与化工行业科技情报分析。