一种基于超启发式强化学习的分布式装配阻塞流水车间调度方法

申请号: CN202311565429.0

申请人: 昆明理工大学

更新日期: 2026-03-09

摘要文本

昆明理工大学取得“一种透气窗帘布”专利技术，本发明公开了一种基于超启发式强化学习的分布式装配阻塞流水车间调度方法，在分布式装配流水车间调度问题的基础上，建立考虑机器阻塞的DABFSP的数学模型并设计调度优化算法；应用基于Q学习的QLHHEA对DABFSP的数学模型进行求解；将低层启发式LLH定义为状态，状态间的转移定义为动作，全局探索采用基于Q学习的高层策略，在特定状态下自动选择合适的动作，有效驱动搜索方向，局部开发采用基于问题特性的LLHs，有效地丰富了搜索行为。使用基于插入的加速策略有效节省了计算成本并提高搜索效率；提高了初始解的质量，本发明旨在确定DABFSP中各工厂的产品分配、工件的加工顺序和产品的装配顺序，使所有工厂的最大完工时间实现最小化。

专利主权项内容

来源：马克数据网 1.一种基于超启发式强化学习的分布式装配阻塞流水车间调度方法，其特征在于，具体包括如下步骤：步骤1：初始化种群、Q表，低层种群中的个体采用构造启发式方法生成，高层种群中的个体随机产生，两种群规模相同；设置相关参数；设置状态动作对的q值为零；步骤2：采用前向或后向计算方法来解码每个个体获取全局最优解π，同时在计算前执行基于插入的两种加速策略以节省评估解决方案的计算成本；best步骤3：对低层个体中的可行调度解依次执行高层个体中的LLH，如果新解适应值更好，则用新解替换老解并更新全局最优解；计算每个高层个体的贡献率，据此选择个贡献率高的高层个体，采用更新机制更新Q表；同时设置count＝0；步骤4：采样更新后的Q表生成新的高层个体，即利用基于Q学习的高层策略操作低层启发式以搜索解空间；步骤4.1：利用行动选择策略来选择状态s，获取动作a和下一个状态s；ttt+1步骤4.2：将状态s应用于π上得到π′；计算π的适应值(C(π))、C(π′)、IR，获取奖励函数r(s, a)；更新Q值(Q(s, a))，概率ε和π；t+1bestbestbestbestbestttt+1tttbest步骤4.3：如果C(π′)＜C(π)，更新全局最优解π为π′，否则跳转步骤4.1；bestbestbestbest步骤4.4：如果count＝popsize，则跳转至步骤3，否则跳转到步骤4；步骤5：检查停止条件是否满足，如果不满足则跳转步骤4，否则输出π。best

专利申请信息

项目	内容
专利名称	一种基于超启发式强化学习的分布式装配阻塞流水车间调度方法
专利类型	发明申请
申请号	CN202311565429.0
申请日	2023/11/22
公告号	CN117519030A
公开日	2024/2/6
IPC主分类号	G05B19/418
权利人	昆明理工大学
发明人	张梓琪; 李瑛; 钱斌; 胡蓉
地址	云南省昆明市呈贡区景明南路727号

一种基于超启发式强化学习的分布式装配阻塞流水车间调度方法

摘要文本

专利主权项内容

专利申请信息

热门技术领域

快速入口

专利技术资料

一种基于超启发式强化学习的分布式装配阻塞流水车间调度方法

摘要文本

专利主权项内容

专利申请信息

相关专利推荐

具有五极板耦合机构的UUV电场耦合无线电能传输系统

一种粗锡双锅加硫除杂反应器

一种水文气象耦合的长期径流深模拟方法

线路故障检测方法、系统、设备及计算机可读存储介质

一种羟胺插层氧基氯化铁材料及其制备方法与应用

一种微生物培养设备

热门技术领域

快速入口

专利技术资料