一种面向协作学习的动态聚合方法及装置

申请号: CN202410161417.X

申请人: 清华大学

申请日期: 2024/2/5

摘要文本

本发明公开了一种面向协作学习的动态聚合方法及装置，该方法应用于协作学习的聚合节点，获取协作学习模型和参与协作学习模型的训练节点，并根据协作学习模型和训练节点的训练节点状态，得到初始化数据集；基于初始化数据集，构建并初始化面向协作学习动态聚合策略的初始强化学习模型；基于训练节点的实时训练节点状态与训练协作学习模型一个轮次所需的实际时间开销，在线训练初始强化学习模型，得到目标强化学习模型；基于目标强化学习模型的预测结果得到目标协作学习聚合策略，并利用目标协作学习聚合策略完成对协作学习模型的训练。本发明保证了协作学习过程中所有训练节点均参与训练，减少了训练节点整体闲置率，提高了全局训练效率与精确度。

申请人信息

申请人:清华大学
申请人地址:100084 北京市海淀区清华园
发明人: 清华大学

专利详细信息

项目	内容
专利名称	一种面向协作学习的动态聚合方法及装置
专利类型	发明申请
申请号	CN202410161417.X
申请日	2024/2/5
公告号	CN117709486A
公开日	2024/3/15
IPC主分类号	G06N20/00
权利人	清华大学
发明人	徐恪; 松永健宏; 赵乙; 苏家兴; 刘欣睿; 李奥; 谭崎
地址	北京市海淀区双清路30号清华大学清华园北京100084-82信箱

专利主权项内容

1.一种面向协作学习的动态聚合方法，其特征在于，所述方法应用于聚合节点，包括：协作学习任务开始前，获取协作学习模型和参与所述协作学习模型的训练节点，并根据所述协作学习模型和所述训练节点的训练节点状态，得到初始化数据集；基于所述初始化数据集，构建并初始化面向协作学习动态聚合策略的初始强化学习模型；执行协作学习任务中，获取所述训练节点的实时训练节点状态与训练所述协作学习模型一个轮次所需的实际时间开销；基于所述实时训练节点状态与实际时间开销，在线训练所述初始强化学习模型，得到目标强化学习模型；基于所述目标强化学习模型的预测结果得到目标协作学习聚合策略，并利用所述目标协作学习聚合策略完成对所述协作学习模型的训练。

一种面向协作学习的动态聚合方法及装置

摘要文本

申请人信息

专利详细信息

专利主权项内容

热门技术领域

快速入口

专利技术资料

一种面向协作学习的动态聚合方法及装置

摘要文本

申请人信息

专利详细信息

专利主权项内容

相关专利推荐

一种全光产品的质量检测方法及系统

一种3D打印机脱料装置

一种基于试验数据库的压气机性能仿真程序精度评估方法

一种基于灰盒模型的节流阀响应预测方法

一种用于水性工业漆的加工装置

双辐板涡轮盘

热门技术领域

快速入口

专利技术资料