基于AIGC的话题文本大数据分析方法及系统
摘要文本
本申请实施例提供一种基于AIGC的话题文本大数据分析方法及系统,通过从话题文本大数据中获取候选话题文本,并为其生成两个话题视角下的话题文本向量,同时,也为已经标定的话题文本序列中的每个文本生成相应的两个话题视角下的话题文本向量,有助于将复杂的话题文本信息转化为易于处理和分析的向量形式,大大提高了后续处理的效率,通过对候选话题文本的第一话题视角的话题文本向量与每个标定话题文本的第一话题视角的话题文本向量进行关联性分析,生成第二话题文本序列,能够有效地缩小后续处理的数据规模,提高处理速度。最后,通过对更高维度的特征进行关联性分析,能够更精确地找到与候选话题文本相关的信息,从而提高了查找的准确性。 来自:马 克 团 队
申请人信息
- 申请人:广州阿凡提电子科技有限公司
- 申请人地址:510275 广东省广州市海珠区新港西路135号大院园西区705号楼中大科技园B座自编号1009-1015室
- 发明人: 广州阿凡提电子科技有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 基于AIGC的话题文本大数据分析方法及系统 |
| 专利类型 | 发明授权 |
| 申请号 | CN202311653831.4 |
| 申请日 | 2023/12/5 |
| 公告号 | CN117371440B |
| 公开日 | 2024/3/12 |
| IPC主分类号 | G06F40/284 |
| 权利人 | 广州阿凡提电子科技有限公司 |
| 发明人 | 张征 |
| 地址 | 广东省广州市海珠区新港西路135号大院园西区705号楼中大科技园B座自编号1009-1015室 |
专利主权项内容
1.一种基于AIGC的话题文本大数据分析方法,其特征在于,所述方法包括:获取话题文本大数据中的候选话题文本的第一话题视角的话题文本向量和第二话题视角的话题文本向量,以及第一话题文本序列中每个标定话题文本的第一话题视角的话题文本向量和第二话题视角的话题文本向量,所述第一话题视角的特征维度数量小于所述第二话题视角;对所述候选话题文本的第一话题视角的话题文本向量与所述第一话题文本序列中每个标定话题文本的第一话题视角的话题文本向量进行关联性分析,获得对应的第一关联值,并依据所述第一关联值从所述第一话题文本序列中确定设定数量的标定话题文本,生成第二话题文本序列;对所述候选话题文本的第二话题视角的话题文本向量与所述第二话题文本序列中每个标定话题文本的第二话题视角的话题文本向量进行关联性分析,获得对应的第二关联值,并依据所述第二关联值确定所述候选话题文本的话题文本查找数据;获取第一话题文本序列中每个标定话题文本的第一话题视角的话题文本向量和第二话题视角的话题文本向量,包括:分别对所述第一话题文本序列中每个标定话题文本,对所述标定话题文本的文本语义特征进行衍生扩展,获得所述标定话题文本对应的第三衍生扩展话题文本;对所述标定话题文本对应的第三衍生扩展话题文本进行初始主题向量编码,获得所述标定话题文本对应的第三初始主题向量;对所述标定话题文本对应的第三初始主题向量进行启发式搜索,获得所述标定话题文本对应的第三启发式搜索向量;对所述第三启发式搜索向量进行不同知识图谱生成维度的话题关键词的知识关系提取,获得所述标定话题文本对应的第一话题视角的话题文本向量和第二话题视角的话题文本向量;所述对所述标定话题文本对应的第三衍生扩展话题文本进行初始主题向量编码,获得所述标定话题文本对应的第三初始主题向量,包括:基于图自编码网络,对所述标定话题文本对应的第三衍生扩展话题文本进行初始主题向量编码,获得所述标定话题文本对应的多个图自编码向量,并将所述多个图自编码向量作为第三初始主题向量;所述对所述标定话题文本对应的第三初始主题向量进行启发式搜索,获得所述标定话题文本对应的第三启发式搜索向量,包括:对所述多个图自编码向量进行聚合,获得所述标定话题文本对应的第三启发式搜索向量。