一种基于超启发式强化学习的分布式装配阻塞流水车间调度方法
申请人信息
- 申请人:昆明理工大学
- 申请人地址:650093 云南省昆明市一二一大街文昌路68号
- 发明人: 昆明理工大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种基于超启发式强化学习的分布式装配阻塞流水车间调度方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311565429.0 |
| 申请日 | 2023/11/22 |
| 公告号 | CN117519030A |
| 公开日 | 2024/2/6 |
| IPC主分类号 | G05B19/418 |
| 权利人 | 昆明理工大学 |
| 发明人 | 张梓琪; 李瑛; 钱斌; 胡蓉 |
| 地址 | 云南省昆明市呈贡区景明南路727号 |
摘要文本
昆明理工大学获取“一种透气窗帘布”专利技术,本发明公开了一种基于超启发式强化学习的分布式装配阻塞流水车间调度方法,在分布式装配流水车间调度问题的基础上,建立考虑机器阻塞的DABFSP的数学模型并设计调度优化算法;应用基于Q学习的QLHHEA对DABFSP的数学模型进行求解;将低层启发式LLH定义为状态,状态间的转移定义为动作,全局探索采用基于Q学习的高层策略,在特定状态下自动选择合适的动作,有效驱动搜索方向,局部开发采用基于问题特性的LLHs,有效地丰富了搜索行为。使用基于插入的加速策略有效节省了计算成本并提高搜索效率;提高了初始解的质量,本发明旨在确定DABFSP中各工厂的产品分配、工件的加工顺序和产品的装配顺序,使所有工厂的最大完工时间实现最小化。
专利主权项内容
来源:马 克 数 据 网 1.一种基于超启发式强化学习的分布式装配阻塞流水车间调度方法,其特征在于,具体包括如下步骤:步骤1:初始化种群、Q表,低层种群中的个体采用构造启发式方法生成,高层种群中的个体随机产生,两种群规模相同;设置相关参数;设置状态动作对的q值为零;步骤2:采用前向或后向计算方法来解码每个个体获取全局最优解π,同时在计算前执行基于插入的两种加速策略以节省评估解决方案的计算成本;best步骤3:对低层个体中的可行调度解依次执行高层个体中的LLH,如果新解适应值更好,则用新解替换老解并更新全局最优解;计算每个高层个体的贡献率,据此选择个贡献率高的高层个体,采用更新机制更新Q表;同时设置count=0;步骤4:采样更新后的Q表生成新的高层个体,即利用基于Q学习的高层策略操作低层启发式以搜索解空间;步骤4.1:利用行动选择策略来选择状态s,获取动作a和下一个状态s;ttt+1步骤4.2:将状态s应用于π上得到π′;计算π的适应值(C(π))、C(π′)、IR,获取奖励函数r(s, a);更新Q值(Q(s, a)),概率ε和π;t+1bestbestbestbestbestttt+1tttbest步骤4.3:如果C(π′)<C(π),更新全局最优解π为π′,否则跳转步骤4.1;bestbestbestbest步骤4.4:如果count=popsize,则跳转至步骤3,否则跳转到步骤4;步骤5:检查停止条件是否满足,如果不满足则跳转步骤4,否则输出π。best