一种动态通信环境下的客户端调度方法
申请人信息
- 申请人:南京邮电大学
- 申请人地址:210023 江苏省南京市栖霞区文苑路9号
- 发明人: 南京邮电大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种动态通信环境下的客户端调度方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410149801.8 |
| 申请日 | 2024/2/2 |
| 公告号 | CN117692939A |
| 公开日 | 2024/3/12 |
| IPC主分类号 | H04W24/04 |
| 权利人 | 南京邮电大学 |
| 发明人 | 郭永安; 王国成; 李嘉靖; 王宇翱 |
| 地址 | 江苏省南京市鼓楼区新模范马路66号 |
摘要文本
本发明属于动态通信环境下的客户端调度技术领域,涉及一种动态通信环境下的客户端调度方法;将所有客户端都进行本地模型训练,然后基于客户端训练的状态(通信延迟、资源能耗)定义客户端的状态向量,再结合客户端的两个动作状态选择性能最优的一批客户端;根据客户端的状态向量和动作空间定义客户端可用性,再选择一组客户端上传本地模型进行全局聚合,本发明状态向量是根据客户端的实时状态进行动态调整和适应,这使得系统能够根据客户端的实际情况做出更合理的决策,最大效率的选择合适的客户端参与模型聚合,客户端可用性可以更准确的评估每个客户端的性能和可参与度,提高模型训练的精度和效率。。百度搜索专利查询网
专利主权项内容
1.一种动态通信环境下的客户端调度方法,其特征在于,所述方法包括以下步骤:步骤1,通过1个边缘服务器和N个客户端构成联邦学习模型;客户端的集合为U,每个客户端拥有一个本地数据集;步骤2,k轮次迭代训练中,边缘服务器将全局模型分配给N个客户端,客户端n基于其本地数据集/>进行训练,得到本地模型/>;步骤3,根据客户端的通信延迟和资源能耗/>得到客户端的状态向量;步骤4,定义客户端的动作空间,动作空间/>包括两个动作:客户端未被选中参与联邦学习模型的聚合和客户端被选中参与联邦学习模型的聚合;步骤5,基于客户端的两个动作分别获得奖励,通过奖励/>评估客户端选择某个动作的利弊;步骤6,根据客户端的状态向量、动作空间/>和奖励/>定义Q函数,通过Q函数计算客户端每个动作的Q值,并选择两个动作中Q值大的作为客户端当前的动作;步骤7,将当前动作为客户端被选中参与联邦学习模型的聚合的客户端形成客户端子集C;步骤8,根据客户端的状态向量和动作空间/>定义客户端可用性/>,然后,计算客户端子集C中每个客户端的客户端可用性;步骤9,将计算得到的客户端可用性从大到小排序,并判断客户端是否和边缘服务器连通,最后进行遍历,按照客户端可用性从大到小的顺序从与边缘服务器连通的客户端中选择前s个客户端,形成被选中参与联邦学习模型聚合的客户端集合S;如果第一次遍历时,与边缘服务器连通的客户端数量小于s,则从客户端子集C中剩下的客户端进行下一次或多次遍历,直至被选中参与联邦学习模型聚合的客户端集合S中客户端数量达到s;步骤10,完成客户端的选择,集合S中的客户端上传本地模型参与联邦学习模型的聚合,得到全局模型。