← 返回列表
基于大数据语义的相似事件检索方法、系统、设备和介质
摘要文本
本申请涉及基于大数据语义的相似事件检索方法、系统、设备和介质,该方法利用分布式计算平台对指定业务领域的多源异构数据进行数据汇聚和整编,加快数据计算速度,然后采用伯特模型将事件案例库中事件的文本信息进行向量化处理,实现事件的文本向量化,再采用费斯向量数据库进行相似语义搜索,得到各事件的事件相关属性,最后根据各事件的事件相关属性和指定的目标事件,进一步利用事件相似度计算模型分别计算得到目标事件的相似事件的结构相似度和属性相似度,实现较细粒度的指定业务领域的相似事件区分,大幅提高了细分业务领域的相似事件检索准确率。
申请人信息
- 申请人:中国电子科技集团公司第十五研究所
- 申请人地址:100089 北京市海淀区北四环中路211号
- 发明人: 中国电子科技集团公司第十五研究所
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 基于大数据语义的相似事件检索方法、系统、设备和介质 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410013690.8 |
| 申请日 | 2024/1/4 |
| 公告号 | CN117520484A |
| 公开日 | 2024/2/6 |
| IPC主分类号 | G06F16/33 |
| 权利人 | 中国电子科技集团公司第十五研究所 |
| 发明人 | 赵蕊; 王记坤; 罗批; 张岩; 张胤; 裘慧媛; 杨淑卉; 贾坤; 原鑫 |
| 地址 | 北京市海淀区北四环中路211号 |
专利主权项内容
1.一种基于大数据语义的相似事件检索方法,其特征在于,包括步骤:获取指定业务领域的多源异构数据;所述多源异构数据包括结构化数据和半结构化数据;利用分布式计算平台对所述多源异构数据进行奇异值剔除和冗余信息合并,构成事件案例库并整编存入所述分布式计算平台的蜂箱数据仓库;采用伯特模型将所述事件案例库中事件的文本信息进行向量化处理,生成各事件对应的高维文本向量;根据各所述高维文本向量采用费斯向量数据库进行相似语义搜索,得到各事件的事件相关属性;根据各事件的事件相关属性和指定的目标事件,利用事件相似度计算模型分别计算得到所述目标事件的相似事件的结构相似度和属性相似度。