← 返回列表

一种面向用户问答的知识文本抽取方法及系统

申请号: CN202311804852.1
申请人: 中数通信息有限公司
更新日期: 2026-03-09

专利详细信息

项目 内容
专利名称 一种面向用户问答的知识文本抽取方法及系统
专利类型 发明申请
申请号 CN202311804852.1
申请日 2023/12/26
公告号 CN117763116A
公开日 2024/3/26
IPC主分类号 G06F16/332
权利人 中数通信息有限公司
发明人 郭利荣; 李洪海; 梁晓丹; 李金漳
地址 广东省广州市天河区中山大道华景路1号南方通信大厦4楼

摘要文本

中数通信息有限公司获取“一种透气窗帘布”专利技术,本发明公开了一种面向用户问答的知识文本抽取方法及系统,包括以下步骤:构建知识文本数据库;针对用户提出的问题,在所述知识文本数据库中检索与所述问题相关的文本,并进行相似度排序,得到排序后相关文本;利用信息熵函数遍历计算所有所述排序后相关文本,得到所有排序后相关文本的信息熵;基于所有排序后相关文本的信息熵,利用得分判断函数遍历计算所有所述排序后相关文本的判断得分,确定所述判断得分最大时的第i个所述排序后相关文本,分割获取前i个所述排序后相关文本作为最佳文本;将所述最佳文本进行拼装,将拼装后的最佳文本作为回答输出给用户,实现了基于用户问题的最相关知识文档分割以及知识文本组合最优组合。

专利主权项内容

1.一种面向用户问答的知识文本抽取方法,其特征在于,包括以下步骤:构建知识文本数据库;针对用户提出的问题,在所述知识文本数据库中检索与所述问题相关的文本,并进行相似度排序,得到排序后相关文本;利用信息熵函数遍历计算所有所述排序后相关文本,得到所有排序后相关文本的信息熵;基于所有排序后相关文本的信息熵,利用得分判断函数遍历计算所有所述排序后相关文本的判断得分,确定所述判断得分最大时的第i个所述排序后相关文本,分割获取前i个所述排序后相关文本作为最佳文本;将所述最佳文本进行拼装,将拼装后的最佳文本作为回答输出给用户。