← 返回列表

一种基于大模型的搜索问答方法

申请号: CN202311473359.6
申请人: 天讯瑞达通信技术有限公司
申请日期: 2023/11/8

摘要文本

本发明公开了一种基于大模型的搜索问答方法,涉及自然语言处理技术领域。方法包括步骤:获取知识信息;根据知识信息制作指令微调数据集,通过指令微调数据集对大模型进行微调训练,提高问答模型的精度和准确性;将知识信息入库,并根据知识信息对大模型进行训练;将用户输入问题处理为第一prompt文本;对第一prompt文本进行LangChain检索得到相似度;若相似度大于第一相似度阈值,则获取答案,提高问复速度;若相似度小于第一相似度阈值,则根据坐席困惑摘要、Topk知识信息和预设大模型prompt模板生成第三prompt文本,将第三prompt文本输入大模型得到答案,提高搜索问答的准确率和效率。

专利详细信息

项目 内容
专利名称 一种基于大模型的搜索问答方法
专利类型 发明申请
申请号 CN202311473359.6
申请日 2023/11/8
公告号 CN117609444A
公开日 2024/2/27
IPC主分类号 G06F16/332
权利人 天讯瑞达通信技术有限公司
发明人 道炜; 梁颖欣; 沈泳龙; 何建伟
地址 广东省广州市天河区华利路19号三楼

专利主权项内容

1.一种基于大模型的搜索问答方法,其特征在于:包括步骤:S1、获取知识信息;S2、根据知识信息制作指令微调数据集,通过指令微调数据集对大模型进行微调训练;S3、通过LangChain将知识信息入库,并根据知识信息对大模型进行Embedding训练;S4、接收用户输入问题,将用户输入问题处理为第一prompt文本;S5、对第一prompt文本进行LangChain检索得到相似度;若相似度大于第一相似度阈值,则获取答案,结束流程;若相似度小于第一相似度阈值,则进入步骤S6;S6、根据第一prompt文本和历史信息文本获取坐席困惑摘要,根据第一prompt文本和坐席困惑摘要获取LangChain中的Topk知识信息,根据所述坐席困惑摘要、Topk知识信息和预设大模型prompt模板生成第三prompt文本,将第三prompt文本输入大模型得到答案。 马-克-数据