← 返回列表
答案生成方法、装置、设备及存储介质
申请人信息
- 申请人:腾讯科技(深圳)有限公司
- 申请人地址:518064 广东省深圳市南山区高新区科技中一路腾讯大厦35层
- 发明人: 腾讯科技(深圳)有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 答案生成方法、装置、设备及存储介质 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410140323.4 |
| 申请日 | 2024/2/1 |
| 公告号 | CN117669512A |
| 公开日 | 2024/3/8 |
| IPC主分类号 | G06F40/166 |
| 权利人 | 腾讯科技(深圳)有限公司 |
| 发明人 | 罗锦文; 郭伟东 |
| 地址 | 广东省深圳市南山区高新区科技中一路腾讯大厦35层 |
摘要文本
本申请实施例提供了一种答案生成方法、装置、设备及存储介质,方法包括:基于目标文本中的各段落在目标文本中的位置,确定N个文本片段;基于预设长度对每个段落进行划分,得到每个段落对应的至少一个子片段,每个子片段对应的文本长度小于预设长度;由第一编码器提取针对目标文本的问题的向量表示;由第二编码器提取每个子片段的向量表示;基于N个文本片段中各文本片段中子片段的向量表示和问题的向量表示,从N个文本片段中确定问题的答案所在的候选文本片段;通过生成式语言模型基于候选文本片段和问题进行答案生成,得到问题的答案。通过采用上述的答案生成方法,可以有效提升生成的答案的准确性。
专利主权项内容
1.一种答案生成方法,其特征在于,包括: 获取目标文本和针对目标文本提出的问题,所述目标文本中包括M个段落,所述M为正整数;基于各段落在所述目标文本中的位置,确定N个文本片段,一个文本片段包括所述目标文本中至少两个连续的段落,N为正整数;基于预设长度对每个所述段落进行划分,得到每个段落对应的至少一个子片段,每个所述子片段对应的文本长度小于预设长度;由第一编码器提取所述问题的向量表示;由第二编码器提取每个所述子片段的向量表示,所述预设长度不超过所述第二编码器的最大输入长度;基于所述N个文本片段中各文本片段中子片段的向量表示和所述问题的向量表示,从所述N个文本片段中确定所述问题的答案所在的候选文本片段;通过生成式语言模型基于所述候选文本片段和所述问题进行答案生成,得到所述问题的答案。 数据由马 克 数 据整理