← 返回列表

一种版式文件的实时数据在线智能处理方法

申请号: CN202410121659.6
申请人: 北京点聚信息技术有限公司
申请日期: 2024/1/30

摘要文本

本发明版式文件数据处理技术领域,具体涉及一种版式文件的实时数据在线智能处理方法,该方法包括:获取版式文本数据,计算各情感词语的关联情感极性词语;对于每种名词,计算第k种名词的各种情感类型的全文情感特征倾向及情感转化混乱度;构建每个第k种名词的各种情感类型的局部情感特征倾向;根据名词在文本数据集合中的词语位置构建每个第k种名词的位置变异指数;计算每个第k种名词在各种情感类型上的情感逻辑特征异常变化值,进而计算每个第k种名词在第t种情感类型上的内部情感逻辑混乱系数;结合LOF异常检测算法对文本数据集合进行智能处理。本发明准确分析版式文件中逻辑错误的名词,保证数据处理效果。

专利详细信息

项目 内容
专利名称 一种版式文件的实时数据在线智能处理方法
专利类型 发明申请
申请号 CN202410121659.6
申请日 2024/1/30
公告号 CN117669566A
公开日 2024/3/8
IPC主分类号 G06F40/289
权利人 北京点聚信息技术有限公司
发明人 杨瑞钦; 陆猛; 朱静宇; 赵云; 庄玉龙; 张伟
地址 北京市海淀区永丰路9号院3号楼2层101

专利主权项内容

1.一种版式文件的实时数据在线智能处理方法,其特征在于,该方法包括以下步骤:获取版式文本数据分词处理得到分词数据集合,相同的分词为同一种类词语;提取分词数据集合中的名词、情感词语及对应情感类型和情感强烈程度、情感极性词语及对应的极性值;提取各情感词语的关联情感极性词语;对于每种名词,根据第种名词所在句子中各种情感类型的情感词语的情感强烈程度、关联情感极性词语的极性值以及与第/>种名词之间的词语间隔得到第/>种名词的各种情感类型的全文情感特征倾向;根据第/>种名词所在句子中各种情感类型的全文情感特征倾向得到第/>种名词的各种情感类型的情感转化混乱度;根据文本数据集合中出现的每个第/>种名词所在句子中各种情感类型的各情感词语的情感强烈程度、关联情感极性词语的极性值以及与第/>种名词的词语间隔构建每个第/>种名词的各种情感类型的局部情感特征倾向;根据所述每个第/>种名词在文本数据集合中的词语位置构建每个第/>种名词的位置变异指数;根据位置变异指数、局部情感特征倾向、全文情感特征倾向以及情感转化混乱度构建每个第/>种名词在各种情感类型上的情感逻辑特征异常变化值;根据各句子中各名词的各种情感类型的全文情感特征倾向、局部情感特征倾向以及各名词的信息量得到各句子的内部情感逻辑混乱度;根据第种名词所在的各句子的内部情感逻辑混乱度、每个第/>种名词的各种情感类型的全文情感特征倾向、局部情感特征倾向得到每个第/>种名词在第/>种情感类型上的内部情感逻辑混乱系数;根据情感逻辑特征异常变化值以及内部情感逻辑混乱系数得到每个第种名词的各种情感类型混乱度,结合LOF异常检测算法对文本数据集合进行智能处理。