一种基于大模型的搜索问答方法

申请号: CN202311473359.6

申请人: 天讯瑞达通信技术有限公司

申请日期: 2023/11/8

摘要文本

本发明公开了一种基于大模型的搜索问答方法，涉及自然语言处理技术领域。方法包括步骤：获取知识信息；根据知识信息制作指令微调数据集，通过指令微调数据集对大模型进行微调训练，提高问答模型的精度和准确性；将知识信息入库，并根据知识信息对大模型进行训练；将用户输入问题处理为第一prompt文本；对第一prompt文本进行LangChain检索得到相似度；若相似度大于第一相似度阈值，则获取答案，提高问复速度；若相似度小于第一相似度阈值，则根据坐席困惑摘要、Topk知识信息和预设大模型prompt模板生成第三prompt文本，将第三prompt文本输入大模型得到答案，提高搜索问答的准确率和效率。

申请人信息

申请人:天讯瑞达通信技术有限公司
申请人地址:510000 广东省广州市天河区华利路19号三楼
发明人: 天讯瑞达通信技术有限公司

专利详细信息

项目	内容
专利名称	一种基于大模型的搜索问答方法
专利类型	发明申请
申请号	CN202311473359.6
申请日	2023/11/8
公告号	CN117609444A
公开日	2024/2/27
IPC主分类号	G06F16/332
权利人	天讯瑞达通信技术有限公司
发明人	道炜; 梁颖欣; 沈泳龙; 何建伟
地址	广东省广州市天河区华利路19号三楼

专利主权项内容

1.一种基于大模型的搜索问答方法，其特征在于：包括步骤：S1、获取知识信息；S2、根据知识信息制作指令微调数据集，通过指令微调数据集对大模型进行微调训练；S3、通过LangChain将知识信息入库，并根据知识信息对大模型进行Embedding训练；S4、接收用户输入问题，将用户输入问题处理为第一prompt文本；S5、对第一prompt文本进行LangChain检索得到相似度；若相似度大于第一相似度阈值，则获取答案，结束流程；若相似度小于第一相似度阈值，则进入步骤S6；S6、根据第一prompt文本和历史信息文本获取坐席困惑摘要，根据第一prompt文本和坐席困惑摘要获取LangChain中的Topk知识信息，根据所述坐席困惑摘要、Topk知识信息和预设大模型prompt模板生成第三prompt文本，将第三prompt文本输入大模型得到答案。马-克-数据

一种基于大模型的搜索问答方法

摘要文本

申请人信息

专利详细信息

专利主权项内容

热门技术领域

快速入口

专利技术资料

一种基于大模型的搜索问答方法

摘要文本

申请人信息

专利详细信息

专利主权项内容

相关专利推荐

一种焊接管路的辅助装置

一种导轨滑块刚性疲劳测试装置及其测试方法

X射线管及其阴极冷却装置、管芯组件

双歧杆菌分离培养方法

一种用于电子级硫酸生产废液的回收处理装置

自动化全内置超导磁铁磁场强度测量装置及测量方法

热门技术领域

快速入口

专利技术资料