← 返回列表

一种会话文本匹配方法及装置、存储介质、设备

申请号: CN202311558885.2
申请人: 北京假日阳光环球旅行社有限公司
申请日期: 2023/11/21

摘要文本

本发明提供了一种会话文本匹配方法及装置、存储介质、设备,其中方法构建基于sentence‑Bert构架的向量编码模型,并搭建包含两个向量编码模型的siamese孪生神经网络结构的预训练模型;预训练模型用于执行文本分类任务和/或文本相似度计算任务;预先收集训练语料,利用训练语料对预训练模型进行训练,以得到微调完成的目标向量编码模型;获取待匹配目标语句,将待匹配会话文本输入目标向量编码模型,得到待匹配会话文本对应的向量编码;利用预先创建的具有索引功能的目标向量数据库对向量编码进行相似度匹配,将相似度最高的标准问文本作为待匹配会话文本的目标匹配结果。通过本发明,实现了快速增加标准问,又满足了严格区分问询意图的要求。 关注公众号专利查询网

专利详细信息

项目 内容
专利名称 一种会话文本匹配方法及装置、存储介质、设备
专利类型 发明申请
申请号 CN202311558885.2
申请日 2023/11/21
公告号 CN117574877A
公开日 2024/2/20
IPC主分类号 G06F40/211
权利人 北京假日阳光环球旅行社有限公司
发明人 付乐兰; 田鹏飞; 吴天斌; 孙洪静; 朱钦
地址 北京市通州区榆西一街1号院4号楼4层402-03

专利主权项内容

1.一种会话文本匹配方法,其特征在于,所述方法包括:构建基于sentence-Bert构架的向量编码模型,并搭建包含两个所述向量编码模型的siamese孪生神经网络结构的预训练模型;所述预训练模型用于执行文本分类任务和/或文本相似度计算任务;预先收集训练语料,利用所述训练语料对所述预训练模型进行训练,以得到微调完成的目标向量编码模型;获取待匹配目标语句,将所述待匹配会话文本输入所述目标向量编码模型,得到所述待匹配会话文本对应的向量编码;利用预先创建的具有索引功能的目标向量数据库对所述向量编码进行相似度匹配,将相似度最高的标准问文本作为所述待匹配会话文本的目标匹配结果。