← 返回列表

模型训练方法及装置、电子设备及计算机可读存储介质

申请号: CN202311266738.8
申请人: 行吟信息科技(上海)有限公司
更新日期: 2026-03-09

专利详细信息

项目 内容
专利名称 模型训练方法及装置、电子设备及计算机可读存储介质
专利类型 发明申请
申请号 CN202311266738.8
申请日 2023/9/27
公告号 CN117725979A
公开日 2024/3/19
IPC主分类号 G06N3/084
权利人 行吟信息科技(上海)有限公司
发明人 李军伟
地址 上海市黄浦区马当路368号SOHO复兴广场C楼C201室、C202室、C203室、C204室、C205室、C206室、C207室

摘要文本

行吟信息科技(上海)有限公司获取“一种透气窗帘布”专利技术,本申请公开了一种模型训练方法及装置、电子设备及计算机可读存储介质。该方法包括:获取训练数据,所述训练数据用于更新待训练模型的参数;通过所述待训练模型对所述训练数据进行处理,确定所述待训练模型的第一层的目标梯度;基于预设的目标权重和所述目标梯度,得到所述第一层的更新梯度,所述目标权重表征所述第一层的输出对所述待训练模型输出的结果准确度的提升程度;在基于所述训练数据更新所述待训练模型的参数的过程中,基于所述更新梯度更新所述第一层的参数,得到目标模型。 来源:专利查询网

专利主权项内容

1.一种模型训练方法,其特征在于,所述方法包括:获取训练数据,所述训练数据用于更新待训练模型的参数;通过所述待训练模型对所述训练数据进行处理,确定所述待训练模型的第一层的目标梯度;基于预设的目标权重和所述目标梯度,得到所述第一层的更新梯度,所述目标权重表征所述第一层的输出对所述待训练模型输出的结果准确度的提升程度;在基于所述训练数据更新所述待训练模型的参数的过程中,基于所述更新梯度更新所述第一层的参数,得到目标模型。