← 返回列表
文献识别方法、装置、电子设备和存储介质
申请人信息
- 申请人:北京工业大学
- 申请人地址:100124 北京市朝阳区平乐园100号
- 发明人: 北京工业大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 文献识别方法、装置、电子设备和存储介质 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311238385.0 |
| 申请日 | 2023/9/22 |
| 公告号 | CN117391073A |
| 公开日 | 2024/1/12 |
| IPC主分类号 | G06F40/279 |
| 权利人 | 北京工业大学 |
| 发明人 | 徐硕; 王聪聪 |
| 地址 | 北京市朝阳区平乐园100号 |
摘要文本
本申请实施例提供了一种文献识别方法、装置、电子设备和存储介质,涉及数据挖掘和技术情报分析领域。该方法包括:确定文献集的语料集,所述文献集包括多篇原始文献,多篇原始文献包括待识别的第一原始文献;将每篇第一原始文献的术语集作为第一术语集,对每个第一术语集,根据语料集中的各个术语集,确定第一术语集的预设参考指标的指标值;向预设分类模型发送每个第一术语集的预设参考指标的指标值,获得识别结果,识别结果表征每个第一术语集所属的第一原始文献是否涉及目标技术。本申请实施例实现了基于术语集识别一个文献是否涉及创新程度和技术影响程度达到预设条件的目标技术的目的。 来自马-克-数-据-官网
专利主权项内容
1.一种文献识别方法,其特征在于,包括:确定文献集的语料集,所述文献集包括多篇原始文献,所述多篇原始文献包括待识别的第一原始文献,所述语料集包括每篇原始文献各自的术语集和各自关联的文献的术语集;将每篇第一原始文献的术语集作为第一术语集,对每个第一术语集,根据所述语料集中的各个术语集,确定所述第一术语集的预设参考指标的指标值,所述预设参考指标表征一个术语集的创新程度和技术影响程度;向预设分类模型发送每个第一术语集的预设参考指标的指标值,获得识别结果,所述识别结果表征每个第一术语集所属的第一原始文献是否涉及目标技术,所述目标技术为创新程度和技术影响程度符合预设条件的技术。