← 返回列表

一种模型处理方法、装置、设备、介质及产品

申请号: CN202410097648.9
申请人: 腾讯科技(深圳)有限公司
更新日期: 2026-03-17

专利详细信息

项目 内容
专利名称 一种模型处理方法、装置、设备、介质及产品
专利类型 发明申请
申请号 CN202410097648.9
申请日 2024/1/24
公告号 CN117609479A
公开日 2024/2/27
IPC主分类号 G06F16/332
权利人 腾讯科技(深圳)有限公司
发明人 许冉; 岑东益; 邵燃; 郭润增; 侯锦坤
地址 广东省深圳市南山区高新区科技中一路腾讯大厦35层

摘要文本

本申请提供了一种模型处理方法、装置、设备、介质及产品;该方法包括:获取查询业务场景的业务知识库,并对业务知识库进行文本分割处理,得到N个知识文本块;调用文本生成模型分别为每个知识文本块构建问题簇;每个知识文本块分别对应一个问题簇,每个问题簇包含多个问题,每个问题簇包含的各个问题的答案均能够从对应的知识文本块中获得;基于N个知识文本块及构建得到的N个问题簇,构建微调数据集;采用微调数据集对预训练表征模型进行微调处理,得到目标表征模型;目标表征模型被应用在查询业务场景中为文本生成表征向量。本申请能应用目标表征模型为查询业务场景生成准确表征文本的表征向量,有利于提升查询准确率。

专利主权项内容

1.一种模型处理方法,其特征在于,包括:获取查询业务场景的业务知识库,并对所述业务知识库进行文本分割处理,得到N个知识文本块;N为正整数;调用文本生成模型分别为每个所述知识文本块构建问题簇;每个所述知识文本块分别对应一个问题簇,每个所述问题簇包含多个问题,每个所述问题簇包含的各个问题的答案均能够从对应的知识文本块中获得;基于所述N个知识文本块及构建得到的N个问题簇,构建微调数据集;采用所述微调数据集对预训练表征模型进行微调处理,得到目标表征模型;所述目标表征模型被应用在所述查询业务场景中为文本生成表征向量。 更多数据:搜索马克数据网来源: