← 返回列表
一种多源数据的实体识别方法、装置及电子设备
摘要文本
一种多源数据的实体识别方法、装置及电子设备,涉及数据处理领域。在该方法中,获取多项资产数据;采用预设方法,对第一资产数据进行编码,得到第一编码结果,并对第二资产数据进行编码,得到第二编码结果;根据第一编码结果,确定第一资产数据对应的第一向量,并根据第二编码结果,确定第二资产数据对应的第二向量;采用余弦相似度计算第一向量和第二向量的相似度;根据相似度,采用预设聚类算法得到第一聚类编号和第二聚类编号;若确定第一聚类编号和第二聚类编号相同,则确定第一资产数据和第二资产数据为同一实体主机的资产数据。实施本申请提供的技术方案,便于确定不同数据源对应的资产数据中,属于同一主机的资产数据。
申请人信息
- 申请人:北京知其安科技有限公司
- 申请人地址:102200 北京市昌平区回龙观东大街318号院1号楼5层509(昌平示范园)
- 发明人: 北京知其安科技有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种多源数据的实体识别方法、装置及电子设备 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311712458.5 |
| 申请日 | 2023/12/13 |
| 公告号 | CN117668581A |
| 公开日 | 2024/3/8 |
| IPC主分类号 | G06F18/23 |
| 权利人 | 北京知其安科技有限公司 |
| 发明人 | 聂君; 张践鳌; 郭威; 孟繁强; 张游知; 宫华; 吴佳波; 陈瑜; 石天浩 |
| 地址 | 北京市昌平区回龙观东大街318号院1号楼5层509(昌平示范园) |
专利主权项内容
1.一种多源数据的实体识别方法,其特征在于,所述方法包括:获取多项资产数据,每项所述资产数据包括IP地址、MAC地址、Hostname以及SN码中的一种或多种;采用预设方法,对第一资产数据进行编码,得到第一编码结果,并对第二资产数据进行编码,得到第二编码结果,所述第一资产数据和所述第二资产数据为多项所述资产数据中的任意两项资产数据;根据所述第一编码结果,确定所述第一资产数据对应的第一向量,并根据所述第二编码结果,确定所述第二资产数据对应的第二向量;采用余弦相似度计算所述第一向量和所述第二向量的相似度;根据所述相似度,采用预设聚类算法对所述第一向量和所述第二向量进行聚类,得到第一聚类编号和第二聚类编号,所述第一聚类编号为所述第一向量对应的聚类编号,所述第二聚类编号为所述第二向量对应的聚类编号;若确定所述第一聚类编号和所述第二聚类编号相同,则确定所述第一资产数据和所述第二资产数据为同一实体主机的资产数据。