← 返回列表
一种基于大模型的搜索问答方法
摘要文本
本发明公开了一种基于大模型的搜索问答方法,涉及自然语言处理技术领域。方法包括步骤:获取知识信息;根据知识信息制作指令微调数据集,通过指令微调数据集对大模型进行微调训练,提高问答模型的精度和准确性;将知识信息入库,并根据知识信息对大模型进行训练;将用户输入问题处理为第一prompt文本;对第一prompt文本进行LangChain检索得到相似度;若相似度大于第一相似度阈值,则获取答案,提高问复速度;若相似度小于第一相似度阈值,则根据坐席困惑摘要、Topk知识信息和预设大模型prompt模板生成第三prompt文本,将第三prompt文本输入大模型得到答案,提高搜索问答的准确率和效率。
申请人信息
- 申请人:天讯瑞达通信技术有限公司
- 申请人地址:510000 广东省广州市天河区华利路19号三楼
- 发明人: 天讯瑞达通信技术有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种基于大模型的搜索问答方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311473359.6 |
| 申请日 | 2023/11/8 |
| 公告号 | CN117609444A |
| 公开日 | 2024/2/27 |
| IPC主分类号 | G06F16/332 |
| 权利人 | 天讯瑞达通信技术有限公司 |
| 发明人 | 道炜; 梁颖欣; 沈泳龙; 何建伟 |
| 地址 | 广东省广州市天河区华利路19号三楼 |
专利主权项内容
1.一种基于大模型的搜索问答方法,其特征在于:包括步骤:S1、获取知识信息;S2、根据知识信息制作指令微调数据集,通过指令微调数据集对大模型进行微调训练;S3、通过LangChain将知识信息入库,并根据知识信息对大模型进行Embedding训练;S4、接收用户输入问题,将用户输入问题处理为第一prompt文本;S5、对第一prompt文本进行LangChain检索得到相似度;若相似度大于第一相似度阈值,则获取答案,结束流程;若相似度小于第一相似度阈值,则进入步骤S6;S6、根据第一prompt文本和历史信息文本获取坐席困惑摘要,根据第一prompt文本和坐席困惑摘要获取LangChain中的Topk知识信息,根据所述坐席困惑摘要、Topk知识信息和预设大模型prompt模板生成第三prompt文本,将第三prompt文本输入大模型得到答案。 马-克-数据