一种基于图神经网络和双向深度知识蒸馏的联邦学习方法
申请人信息
- 申请人:中国海洋大学
- 申请人地址:266100 山东省青岛市崂山区松岭路238号
- 发明人: 中国海洋大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种基于图神经网络和双向深度知识蒸馏的联邦学习方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410244640.0 |
| 申请日 | 2024/3/5 |
| 公告号 | CN117829320A |
| 公开日 | 2024/4/5 |
| IPC主分类号 | G06N20/00 |
| 权利人 | 中国海洋大学 |
| 发明人 | 王晓东; 杨昊宇; 魏志强; 李一奥 |
| 地址 | 山东省青岛市崂山区松岭路238号 |
摘要文本
本发明属于图像处理技术领域,公开了一种基于图神经网络和双向深度知识蒸馏的联邦学习方法,包括以下步骤:服务器端初始化一个全局模型,并将初始权重分发给所有客户端;客户端接收服务器下发的全局模型,并使用基于注意力机制的视觉图神经网络进行本地训练;客户端获取其本地模型的中间层表示和最终输出,并接收服务器在前一轮模型更新中的中间层表示和最终输出,计算出客户端的知识蒸馏损失,进而计算客户端的总损失;更新客户端本地模型梯度并发送到服务器;服务器端接收各客户端模型上传的本地模型更新和蒸馏损失,计算平均梯度和平均蒸馏损失;最后服务器端计算总损失并更新全局模型。通过本发明实现客户端和服务器之间知识共享。
专利主权项内容
1.一种基于图神经网络和双向深度知识蒸馏的联邦学习方法,其特征在于,包括以下步骤:S1、服务器端初始化一个全局模型,并将初始权重分发给所有客户端;S2、客户端接收服务器下发的全局模型,并使用基于注意力机制的视觉图神经网络进行本地训练;S3、客户端获取其本地模型的中间层表示和最终输出/>,并接收服务器在前一轮模型更新中的中间层表示/>和最终输出/>,计算出客户端的知识蒸馏损失,进而计算客户端的总损失/>;S4、更新客户端本地模型梯度:客户端完成本地训练后,基于客户端总损失计算模型参数的梯度并发送到服务器,并将其计算的蒸馏损失/>发送到服务器;S5、服务器端接收各客户端模型上传的本地模型更新和蒸馏损失:服务器从所有客户端聚合梯度取平均,计算平均梯度;同时服务器从所有客户端收集蒸馏损失,并计算平均蒸馏损失/>;S6、服务器端计算总损失并更新全局模型:通过计算服务器模型输出和真实标签/>之间的差异来计算服务器端的本地损失/>,进而结合/>计算出服务器总损失/>;利用聚合后的平均梯度,服务器更新其全局模型的权重/>;S7、完成上述步骤后,服务器再次分发更新后的权重到所有客户端,进行新一轮的学习直到满足收敛条件或达到预设的轮数。