基于数字孪生及知识图谱的强化学习的车间调度方法
申请人信息
- 申请人:暨南大学; 广东云熵科技有限公司
- 申请人地址:510000 广东省广州市黄埔大道西601号
- 发明人: 暨南大学; 广东云熵科技有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 基于数字孪生及知识图谱的强化学习的车间调度方法 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311750332.7 |
| 申请日 | 2023/12/18 |
| 公告号 | CN117669984A |
| 公开日 | 2024/3/8 |
| IPC主分类号 | G06Q10/0631 |
| 权利人 | 暨南大学; 广东云熵科技有限公司 |
| 发明人 | 郭洪飞; 欧阳雅捷; 曾云辉; 任亚平; 何智慧; 阎龙; 朝宝 |
| 地址 | 广东省广州市天河区黄埔大道西601号; |
摘要文本
本发明提出了基于数字孪生及知识图谱的强化学习的车间调度方法,包括:建立数据接收与存储结构收集多模态数据,根据多模态数据生成标签和元数据,并利用图模型的连接性预测与现有数据相关的标签和元数据;对生成的标签和元数据进行数据质量评估与过滤,所述数据质量评估是根据数据质量评分进行评估;设计多层次车间状态表示并建立车间数字孪生模型;构建知识图谱和可解释强化学习模型;根据可解释强化学习模型生成决策逻辑和解释决策逻辑;根据决策逻辑和车间数字孪生模型搭建实验环境并评估实验性能。本发明综合性地解决了车间调度的效率、成本和解释性问题。
专利主权项内容
1.基于数字孪生及知识图谱的强化学习的车间调度方法,其特征在于,所述方法包括:S1、建立数据接收与存储结构收集多模态数据,根据多模态数据生成标签和元数据,并利用图模型的连接性预测与现有数据相关的标签和元数据;所述根据多模态数据生成标签和元数据,具体指:对收集到的每个数据点,使用基于图模型的预先训练好的分类器进行标签生成,表示如下:L=f(D, G)tag其中,L表示生成的标签,f()表示基于图模型的标签生成函数,D表示原始数据,G表示现有的知识图谱;tag最后为每个数据点生成元数据;S2、对生成的标签和元数据进行数据质量评估与过滤,所述数据质量评估是根据数据质量评分进行评估,所述数据质量评分表示如下:Q=g(D, M, T)quality其中,Q表示数据质量评分,g表示评分函数,M表示数据的元数据,T表示时间因素;qualityS3、设计多层次车间状态表示并建立车间数字孪生模型,包括:S301、识别关键数据源;S302、设计数据融合代理采集数据,其中,每一个数据融合代理负责采集特定类型的数据;S303、定义多层次车间状态表示,构建车间数字孪生模型,具体包括:使用数据融合代理收集的数据,生成基础生产数据矩阵工作流程信息矩阵/>环境参数矩阵ε和人员动态矩阵/>然后利用时间序列分解处理基础生产数据矩阵/>工作流程信息矩阵/>环境参数矩阵ε和人员动态矩阵/>获取车间状态特征,其中,所述时间序列分解表示为:其中,表示处理后的基础生产数据矩阵,λ表示STL的平滑参数,利用这些处理后的数据矩阵,使用高维张量T进行多层次车间状态表示,通过形成高维张量T从而形成一个车间数字孪生模型;MLWSRMLWSRS4、构建知识图谱并实现动态更新,具体包括:S401、利用自然语言处理工具对文档进行分析,识别实体和关系,手动校验并调整自然语言处理工具的输出,生成初步的知识图谱原型,表示如下:其中,表示知识图谱关系,V表示实体的集合,E表示关系的集合;S402、根据知识图谱的原型构建动态知识图谱;S403、使用基于强化学习的算法来实时更新动态知识图谱;S5、构建并训练可解释强化学习模型;S6、根据可解释强化学习模型生成决策逻辑和解释决策逻辑;S7、根据决策逻辑和车间数字孪生模型搭建实验环境并评估实验性能。