← 返回列表

深度学习模型的训练方法、推理方法、装置、设备和介质

申请号: CN202311766496.9
申请人: 北京百度网讯科技有限公司
申请日期: 2023/12/20

摘要文本

本公开提供了一种深度学习模型的训练方法、推理方法、装置、设备和介质,涉及人工智能技术领域,尤其涉及机器学习和深度学习等技术领域。第一模型包括多个第一参数,第二模型包括多个第二参数,多个第二参数被初始化为在多个第一参数中选择的多个目标参数的参数值。训练方法包括:确定第一模型和第二模型的目标损失;基于目标损失,调整多个第一参数和多个第二参数的参数值,包括:响应于确定目标损失指示第一模型包括的至少一部分目标参数的参数值需要被调整,同步调整第二模型包括的对应的第二参数的参数值;响应于确定目标损失指示第二模型包括的至少一部分第二参数的参数值需要被调整,同步调整第一模型包括的对应的目标参数的参数值。

专利详细信息

项目 内容
专利名称 深度学习模型的训练方法、推理方法、装置、设备和介质
专利类型 发明申请
申请号 CN202311766496.9
申请日 2023/12/20
公告号 CN117744732A
公开日 2024/3/22
IPC主分类号 G06N3/08
权利人 北京百度网讯科技有限公司
发明人 王硕寰; 尚骏远; 杨茵淇; 王国霞; 张林昊; 孙宇; 吴华; 王海峰
地址 北京市海淀区上地十街10号百度大厦2层

专利主权项内容

1.一种深度学习模型的训练方法,其中,第一深度学习模型包括多个第一参数,第二深度学习模型包括多个第二参数,所述多个第二参数被初始化为所述多个第一参数中的与所述多个第二参数对应的多个目标参数的参数值,所述多个第二参数的数量少于所述多个第一参数,所述方法包括:确定所述第一深度学习模型和所述第二深度学习模型的目标损失;基于所述目标损失,调整所述多个第一参数和所述多个第二参数的参数值,以得到训练后的第一深度学习模型和第二深度学习模型,包括:响应于确定所述目标损失指示所述第一深度学习模型所包括的所述多个目标参数中的至少一部分目标参数的参数值需要被调整,同步调整所述第二深度学习模型所包括的与所述至少一部分目标参数对应的第二参数的参数值;以及响应于确定所述目标损失指示所述第二深度学习模型所包括的所述多个第二参数中的至少一部分第二参数的参数值需要被调整,同步调整所述第一深度学习模型所包括的与所述至少一部分第二参数对应的目标参数的参数值。