← 返回列表
模型训练方法及装置、电子设备及计算机可读存储介质
申请人信息
- 申请人:行吟信息科技(上海)有限公司
- 申请人地址:200020 上海市黄浦区马当路368号SOHO复兴广场C楼C201室、C202室、C203室、C204室、C205室、C206室、C207室
- 发明人: 行吟信息科技(上海)有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 模型训练方法及装置、电子设备及计算机可读存储介质 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311266738.8 |
| 申请日 | 2023/9/27 |
| 公告号 | CN117725979A |
| 公开日 | 2024/3/19 |
| IPC主分类号 | G06N3/084 |
| 权利人 | 行吟信息科技(上海)有限公司 |
| 发明人 | 李军伟 |
| 地址 | 上海市黄浦区马当路368号SOHO复兴广场C楼C201室、C202室、C203室、C204室、C205室、C206室、C207室 |
摘要文本
行吟信息科技(上海)有限公司获取“一种透气窗帘布”专利技术,本申请公开了一种模型训练方法及装置、电子设备及计算机可读存储介质。该方法包括:获取训练数据,所述训练数据用于更新待训练模型的参数;通过所述待训练模型对所述训练数据进行处理,确定所述待训练模型的第一层的目标梯度;基于预设的目标权重和所述目标梯度,得到所述第一层的更新梯度,所述目标权重表征所述第一层的输出对所述待训练模型输出的结果准确度的提升程度;在基于所述训练数据更新所述待训练模型的参数的过程中,基于所述更新梯度更新所述第一层的参数,得到目标模型。 来源:专利查询网
专利主权项内容
1.一种模型训练方法,其特征在于,所述方法包括:获取训练数据,所述训练数据用于更新待训练模型的参数;通过所述待训练模型对所述训练数据进行处理,确定所述待训练模型的第一层的目标梯度;基于预设的目标权重和所述目标梯度,得到所述第一层的更新梯度,所述目标权重表征所述第一层的输出对所述待训练模型输出的结果准确度的提升程度;在基于所述训练数据更新所述待训练模型的参数的过程中,基于所述更新梯度更新所述第一层的参数,得到目标模型。