← 返回列表

一种基于大数据的智慧监督管理方法及系统

申请号: CN202311398701.0
申请人: 浙江建达科技股份有限公司
申请日期: 2023/10/26

摘要文本

本发明涉及分布式文件系统技术领域,具体涉及一种基于大数据的智慧监督管理方法及系统,包括:通过针对文本信息的自适应降维的方法,对采集的文本信息进行分段处理,通过得到的目标字符串获取文本信息之间的文本相似性,将文本相似性高的文本信息构建为文本矩阵,分解文本矩阵后通过对稀疏矩阵中每一列对应的稀疏向量进行特征值提取,根据特征值的大小进而对文本信息进行降维处理获得新文本矩阵。本发明避免了案情信息和法规信息中的冗余信息对案情信息和法规信息的匹配过程造成的干扰,导致匹配结果不准确的缺点,提高了案情信息和法规信息匹配结果的准确性,进而实现对案情信息数据更加准确的智慧监督管理。

专利详细信息

项目 内容
专利名称 一种基于大数据的智慧监督管理方法及系统
专利类型 发明申请
申请号 CN202311398701.0
申请日 2023/10/26
公告号 CN117370623A
公开日 2024/1/9
IPC主分类号 G06F16/903
权利人 浙江建达科技股份有限公司
发明人 刘洪健; 戴建新; 杨佳铭
地址 浙江省杭州市滨江区西兴街道联慧街88号(联慧科创中心)

专利主权项内容

来自马-克-数-据-官网 1.一种基于大数据的智慧监督管理方法,其特征在于,该方法包括以下步骤:获取案情信息数据以及法律法规数据,将案情信息数据中的任意一件案情记为一个案情文本信息,将法律法规数据中的任意一个法条记为一个法律文本信息,将案情文本信息和法律文本信息统称为文本信息,任意文本信息中包含若干个字符;获取字符以及字符组合的频率值,根据字符组合以及对应字符的频率值获得字符组合的局部范围程度,根据局部范围程度的大小获得目标字符串;对任意目标字符串进行转换获得字符向量,根据字符向量之间余弦相似度的大小获得目标字符串的匹配字符串,结合字符向量的余弦相似度以及匹配字符串在文本信息中出现的次数,获得文本信息之间的文本相似度,根据文本相似度的大小获得文本矩阵,所述字符组合为文本信息中任意相邻的两个字符形成的字符串;对文本矩阵进行分解获得字典矩阵和稀疏矩阵,将稀疏矩阵的稀疏向量进行重置获得新稀疏矩阵,结合字典矩阵和新稀疏矩阵进行重构获得重构矩阵,根据稀疏矩阵和重构矩阵中文本相似性的差异以及目标字符串的余弦匹配度获得稀疏向量的特征值,利用特征值对稀疏向量进行调整获得最终稀疏矩阵,结合字典矩阵和最终稀疏矩阵进行重构获得新文本矩阵,所述稀疏向量为稀疏矩阵的列向量;获取案情信息数据以及法律法规数据中的新文本矩阵并进行存储。