一种用于行业的智能问答方法及系统
摘要文本
本发明涉及一种用于行业的智能问答方法及系统,通过获取用户输入的问题文本;基于预先构建的编码器将用户输入的问题文本转换为查询向量;将查询向量与预先构建的行业知识库进行匹配;在行业知识库中存在匹配度超过阈值的目标资源时,将目标资源返回至用户;在行业知识库中不存在匹配度超过阈值的目标资源时,基于查询向量与预先调整的行业大模型执行问答,得到意图信息;将与意图信息对应的资源返回至用户。本申请建立行业知识库,并在执行问答过程中,现将用户的问题文本转换为查询向量,先直接在行业知识库中进行查询,在行业知识库中无匹配资源时,再通过调整的行业大模型执行问答动作,得到符合用户意图的目标资源。本申请具有回答更加准确,且更加灵活的优点。 微信公众号
申请人信息
- 申请人:北京环球医疗救援有限责任公司
- 申请人地址:100022 北京市朝阳区永安东里8号1幢17层1701内05单元
- 发明人: 北京环球医疗救援有限责任公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种用于行业的智能问答方法及系统 |
| 专利类型 | 发明授权 |
| 申请号 | CN202410010351.4 |
| 申请日 | 2024/1/4 |
| 公告号 | CN117520524B |
| 公开日 | 2024/3/29 |
| IPC主分类号 | G06F16/332 |
| 权利人 | 北京环球医疗救援有限责任公司 |
| 发明人 | 钟晓斌 |
| 地址 | 北京市朝阳区永安东里8号1幢17层1701内05单元 |
专利主权项内容
1.一种用于行业的智能问答方法,其特征在于,包括步骤:获取用户输入的问题文本;基于预先构建的编码器将所述用户输入的问题文本转换为查询向量;将所述查询向量与预先构建的行业知识库进行匹配;在所述行业知识库中存在匹配度超过阈值的目标资源时,将所述目标资源返回至用户;在所述行业知识库中不存在匹配度超过阈值的目标资源时,基于所述查询向量与预先调整的行业大模型执行问答,得到意图信息,其中,所述目标资源为文字、图片和视频其中之一或者多种组合;所述行业知识库包括文本库,还包括如下过程构建所述文本库:获取行业文字材料,其中,所述行业文字材料的来源为电子文档或者行业音频文件;按照所述行业文字材料的目录对所述行业知识材料进行分割,得到多个片段;将长度大于N的片段作为目标片段,并基于句号将所述目标片段分为m个句子;将所述m个句子划归至多个段落;基于所述多个段落,调用语言大模型生成多个问题文本;并基于所述多个问题文本,调用语言大模型进行问题扩展,得到问题集合;抽取所述问题集合中的问题文本,并以所述问题文本对应的答案、答案的来源段落、段落的所属行业文字材料、以及行业文字材料的对应的行业实体为节点,构建图结构的文本库,其中,所述文本库包括节点以及节点之间的关系;所述行业知识库包括影像库,还包括如下过程构建所述影像库:获取行业影像材料,其中,所述行业影像材料包括图片材料和视频材料;对所述视频材料进行采样,得到采样图片材料;将所述图片材料和所述采样图片材料作为原始图像,并通过图像描述模型对所述原始图像进行描述,得到总结文本;将所述总结文本输入至图像生成模型中,得到生成图像;基于CNN网络提取所述原始图像和所述生成图像的图像特征,基于双向LSTM网络提取所述总结文本的文本特征;并基于预先构建的编码器将所述文本特征进行向量化,得到文本特征向量;将所述原始图像的图像特征与所述文本特征向量进行融合,得到第一融合向量;并将所述生成图像的图像特征与所述文本特征向量进行融合,得到第二融合向量;将原始图像、原始图像的图像特征、原始图像的总结文本、原始图像的第一融合相邻进行格式化存储;并将总结文本、总结文本的文本特征、总结文本的生成图像、总结文本的第二融合相邻进行格式化存储;得到影像库;将与所述意图信息对应的资源返回至用户。