← 返回列表

一种面向协作学习的动态聚合方法及装置

申请号: CN202410161417.X
申请人: 清华大学
申请日期: 2024/2/5

摘要文本

本发明公开了一种面向协作学习的动态聚合方法及装置,该方法应用于协作学习的聚合节点,获取协作学习模型和参与协作学习模型的训练节点,并根据协作学习模型和训练节点的训练节点状态,得到初始化数据集;基于初始化数据集,构建并初始化面向协作学习动态聚合策略的初始强化学习模型;基于训练节点的实时训练节点状态与训练协作学习模型一个轮次所需的实际时间开销,在线训练初始强化学习模型,得到目标强化学习模型;基于目标强化学习模型的预测结果得到目标协作学习聚合策略,并利用目标协作学习聚合策略完成对协作学习模型的训练。本发明保证了协作学习过程中所有训练节点均参与训练,减少了训练节点整体闲置率,提高了全局训练效率与精确度。

专利详细信息

项目 内容
专利名称 一种面向协作学习的动态聚合方法及装置
专利类型 发明申请
申请号 CN202410161417.X
申请日 2024/2/5
公告号 CN117709486A
公开日 2024/3/15
IPC主分类号 G06N20/00
权利人 清华大学
发明人 徐恪; 松永健宏; 赵乙; 苏家兴; 刘欣睿; 李奥; 谭崎
地址 北京市海淀区双清路30号清华大学清华园北京100084-82信箱

专利主权项内容

1.一种面向协作学习的动态聚合方法,其特征在于,所述方法应用于聚合节点,包括:协作学习任务开始前,获取协作学习模型和参与所述协作学习模型的训练节点,并根据所述协作学习模型和所述训练节点的训练节点状态,得到初始化数据集;基于所述初始化数据集,构建并初始化面向协作学习动态聚合策略的初始强化学习模型;执行协作学习任务中,获取所述训练节点的实时训练节点状态与训练所述协作学习模型一个轮次所需的实际时间开销;基于所述实时训练节点状态与实际时间开销,在线训练所述初始强化学习模型,得到目标强化学习模型;基于所述目标强化学习模型的预测结果得到目标协作学习聚合策略,并利用所述目标协作学习聚合策略完成对所述协作学习模型的训练。