← 返回列表

数据处理方法、数据处理模型及其训练方法

申请号: CN202311765827.7
申请人: 北京百度网讯科技有限公司
申请日期: 2023/12/20

摘要文本

本公开提供了一种数据处理方法、数据处理模型及其训练方法,涉及人工智能领域,具体涉及自然语言处理、深度学习技术、大模型技术。实现方案为:确定输入数据,所述输入数据包括多个分词;根据门控矩阵确定所述多个分词中每个分词与多个专家网络中的每个专家网络之间的相关性,其中所述多个专家网络用于对所述多个分词进行强化;根据所述相关性以及每个专家网络的预设容量将所述多个分词以均匀的方式分配给所述多个专家网络,以对所述多个分词进行强化;根据经强化的所述多个分词确定数据处理结果。

专利详细信息

项目 内容
专利名称 数据处理方法、数据处理模型及其训练方法
专利类型 发明申请
申请号 CN202311765827.7
申请日 2023/12/20
公告号 CN117744644A
公开日 2024/3/22
IPC主分类号 G06F40/284
权利人 北京百度网讯科技有限公司
发明人 陈徐屹; 柯博; 李晨辉; 黄正杰; 黄世维; 李伟彬; 冯仕堃
地址 北京市海淀区上地十街10号百度大厦2层

专利主权项内容

1.一种数据处理方法,包括:确定输入数据,所述输入数据包括多个分词;根据门控矩阵确定所述多个分词中每个分词与多个专家网络中的每个专家网络之间的相关性,其中所述多个专家网络用于对所述多个分词进行强化;根据所述相关性以及每个专家网络的预设容量将所述多个分词以均匀的方式分配给所述多个专家网络,以对所述多个分词进行强化;根据经强化的所述多个分词确定数据处理结果。 搜索马 克 数 据 网