← 返回列表

深度学习模型训练方法和深度学习模型训练系统

申请号: CN202311636365.9
申请人: 杭州阿里云飞天信息技术有限公司
申请日期: 2023/11/30

摘要文本

本说明书实施例提供深度学习模型训练方法和深度学习模型训练系统,其中所述深度学习模型训练方法包括:获取初始的深度学习模型和样本数据集;按照预设分布式训练策略,基于样本数据集对深度学习模型进行分布式训练,并在分布式训练的调整参数计算过程中,按照目标存储参数对深度学习模型的模型参数进行存储,其中,目标存储参数基于深度学习模型的模型规格信息和预设分布式训练策略确定。基于深度学习模型的模型规格信息和预设分布式训练策略确定目标存储参数,充分考虑了分布式训练的迭代规律,在调整参数计算过程中,按照目标存储参数,完成了对深度学习模型的模型参数的存储,在使得深度学习模型的训练具备高容错能力的同时,具有高效率。。来自:www.macrodatas.cn

专利详细信息

项目 内容
专利名称 深度学习模型训练方法和深度学习模型训练系统
专利类型 发明申请
申请号 CN202311636365.9
申请日 2023/11/30
公告号 CN117669700A
公开日 2024/3/8
IPC主分类号 G06N3/098
权利人 杭州阿里云飞天信息技术有限公司
发明人 林哲宇; 赵汉宇; 肖文聪; 李永
地址 浙江省杭州市余杭区五常街道文一西路969号3幢5层553室

专利主权项内容

1.一种深度学习模型训练方法,包括:获取初始的深度学习模型和样本数据集;按照预设分布式训练策略,基于所述样本数据集对所述深度学习模型进行分布式训练,并在所述分布式训练的调整参数计算过程中,按照目标存储参数对所述深度学习模型的模型参数进行存储,其中,所述目标存储参数基于所述深度学习模型的模型规格信息和所述预设分布式训练策略确定。