← 返回列表

扩展问答知识库的装置

申请号: CN201711362322.0
申请人: 上海智臻智能网络科技股份有限公司
申请日期: 2017年12月18日

摘要文本

一种扩展问答知识库的装置,该装置包括:数据获取模块,用以获取待扩展问题,并对所述待扩展问题进行分词,以得到多个原始词语,所述待处理问题为问答知识库中的标准问或扩展问;替换模块,用以对所述多个原始词语进行相关词替换,以得到原始词语与相关词组合或者相关词与相关词组合组合的多个扩展问句;判断模块,用以对每一扩展问句中包括所述相关词的相邻词语之间的组合有效性进行判断;过滤模块,用以根据判断结果对所述多个扩展问句进行过滤;输出模块,用以将过滤后的多个扩展问句作为待处理问题的扩展问加入问答知识库。通过本发明技术方案可以自动生成扩展问并保证扩展问的有效性。

专利详细信息

项目 内容
专利名称 扩展问答知识库的装置
专利类型 发明授权
申请号 CN201711362322.0
申请日 2017年12月18日
公告号 CN109934347B
公开日 2024年2月2日
IPC主分类号 G06N5/022
权利人 上海智臻智能网络科技股份有限公司
发明人 陈培华; 朱频频
地址 上海市嘉定区金沙江西路1555弄398号7层

专利主权项内容

1.一种扩展问答知识库的装置,其特征在于,包括:词向量模型训练模块,用以利用预设原始语料对词向量模型进行训练;更新模块,用以利用训练完成的词向量模型获取多组新增相关词,并更新同义词词典,以用于进行相关词替换;所述更新模块包括:第二词向量计算单元,用以利用所述训练完成的词向量模型获取每组同义词中所有词语的词向量,以及所述预设原始语料中所有词语的词向量;相关词计算单元,用以根据词向量之间的距离确定每组同义词中所有词语的相关词;第二相关词确定单元,用以将每组同义词中所有词语的相关词取交集,以确定所述多组新增相关词数据获取模块,用以获取待扩展问题,并对所述待扩展问题进行分词,以得到多个原始词语,所述待处理问题为问答知识库中的标准问或扩展问;替换模块,用以对所述多个原始词语进行相关词替换,以得到原始词语与相关词组合或者相关词与相关词组合组合的多个扩展问句;判断模块,用以对每一扩展问句中包括所述相关词的相邻词语之间的组合有效性进行判断;过滤模块,用以根据判断结果对所述多个扩展问句进行过滤;输出模块,用以将过滤后的多个扩展问句作为待处理问题的扩展问加入问答知识库。