基于知识图谱的智能客服语义分析方法
摘要文本
本发明涉及数字数据处理技术领域,提出了基于知识图谱的智能客服语义分析方法,包括:获取半结构化数据、非结构化数据构建知识数据库;基于不同实体所在文本数据中表达语义的可替换程度确定任意语义替换距离;基于语义替换距离得到所有实体的聚类结果;根据每个聚类簇对应同类句法依存树中节点之间句法距离的差异程度确定位置优化因子;根据位置优化因子以及节点的深度信息确定依存权重因子;基于依存权重因子、词向量以及实体识别结果获取知识数据库中的关系抽取结果;基于关系抽取结果确定客户输入文本的意图识别结果;基于意图识别结果生成回复文本由智能客服发送至客户。本发明通过优化句法依存树提高知识数据库中关系抽取结果的准确率。
申请人信息
- 申请人:卓世科技(海南)有限公司
- 申请人地址:572025 海南省三亚市崖州区崖州湾科技城用友产业园(三亚)2号楼102室
- 发明人: 卓世科技(海南)有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 基于知识图谱的智能客服语义分析方法 |
| 专利类型 | 发明授权 |
| 申请号 | CN202311789691.3 |
| 申请日 | 2023/12/25 |
| 公告号 | CN117540750B |
| 公开日 | 2024/3/22 |
| IPC主分类号 | G06F40/30 |
| 权利人 | 卓世科技(海南)有限公司 |
| 发明人 | 王亚; 屠静; 赵策; 苏岳; 万晶晶; 李伟伟; 颉彬; 周勤民; 张玥; 雷媛媛; 孙岩; 潘亮亮; 刘岩 |
| 地址 | 海南省三亚市崖州区崖州湾科技城用友产业园(三亚)2号楼102室 |
专利主权项内容
1.基于知识图谱的智能客服语义分析方法,其特征在于,该方法包括以下步骤:获取在线购物系统中的半结构化数据、以及客户与智能客服产生的非结构化数据构建知识数据库;基于文本数据集中不同实体所在文本数据中表达语义的可替换程度确定任意两个实体之间的语义替换距离;采用聚类算法基于所述语义替换距离得到实体识别结果中所有实体的聚类结果;根据每个聚类簇内不同实体对应同类句法依存树中节点之间句法距离的差异程度确定每个句法依存树上每个节点的位置优化因子;根据每个句法依存树上每个节点的位置优化因子以及每个节点的深度信息确定每个句法依存树对应文本数据中每个词语的依存权重因子;基于每个文本数据中每个词语的依存权重因子、词向量以及实体识别结果获取知识数据库中的关系抽取结果;基于知识数据库中的关系抽取结果确定客户输入文本的意图识别结果;基于所述意图识别结果生成回复文本由智能客服发送至客户;所述基于文本数据集中不同实体所在文本数据中表达语义的可替换程度确定任意两个实体之间的语义替换距离的方法为:将预设数量个客户与智能客服之间对话产生的文本数据组成的数据集组成文本数据集,将文本数据集中包含每个实体的文本数据组成的集合作为每个实体的归纳数据集;将包含每个实体的每个属性的文本数量与每个实体的归纳数据集中文本数据数量的比值作为所述每个属性的频率;将包含每个属性的文本数据的数量与文本数据集内文本数据数量比值的映射结果作为每个属性的比例因子,将预设参数与每个属性的比例因子的差值作为每个属性的语义可信度;将每个实体的归纳数据集中每个属性的频率与为每个属性的语义可信度的乘积作为每个实体关于每个属性的重要性评估值;将任意两个实体关于每个属性的重要性评估值之间差值的绝对值在任意两个实体中属性数量最大值上的累加作为两个实体之间的语义替换距离。