← 返回列表
一种网络引接资源关键要素提取方法
摘要文本
本发明公开了一种网络引接资源关键要素提取方法,包括:对网络引接资源数据进行预处理,得到文本表示和实体表示;利用初始分类模型,对所述文本表示和实体表示进处理,得到所述网络引接资源数据的初始类别;基于所述初始类别,利用损失函数对初始分类模型进行训练,得到分类模型;利用所述分类模型,对待测试数据进行处理,得到待测数据的类别。可见,本发明所提供的方法,利用循环神经网络提取文本的上下文语义特征,融合实体信息,实现重要上文特征提取,最终从待测数据中识别出实体关键要素信息,提升对引接资源的自动化处理和标准化生产能力。
申请人信息
- 申请人:中国电子科技集团公司第十五研究所; 中电科网络空间安全研究院有限公司
- 申请人地址:100083 北京市海淀区北四环中路211号
- 发明人: 中国电子科技集团公司第十五研究所; 中电科网络空间安全研究院有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种网络引接资源关键要素提取方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311546201.7 |
| 申请日 | 2023/11/20 |
| 公告号 | CN117573869A |
| 公开日 | 2024/2/20 |
| IPC主分类号 | G06F16/35 |
| 权利人 | 中国电子科技集团公司第十五研究所; 中电科网络空间安全研究院有限公司 |
| 发明人 | 李宝静; 任传伦; 杨天长; 张先国; 刘策越; 肖锋; 郭强; 唐然 |
| 地址 | 北京市海淀区北四环中路211号; 河北省保定市容城县上坡村上坡街88号101室 |
专利主权项内容
1.一种网络引接资源关键要素提取方法,其特征在于,所述方法包括:S1、对网络引接资源数据进行预处理,得到文本表示和实体表示;所述文本表示表征将所述网络引接资源数据用词嵌入表示;所述实体表示表征所述网络引接资源数据中实体对象对应的词嵌入表示;S2、利用初始分类模型,对所述文本表示和实体表示进处理,得到所述网络引接资源数据的初始类别;所述初始类别为关键要素,或,非关键要素;所述初始分类模型包括第一特征提取模块、第一注意力计算模块、特征融合模块、Highway网络模块;S3、基于所述初始类别,利用损失函数对初始分类模型进行训练,得到分类模型;S4、利用所述分类模型,对待测试数据进行处理,得到待测数据的类别。