一种基于强化学习的流水车间调度方法
授权
摘要
本发明公开一种基于强化学习的流水车间调度方法,该方法分为处理加工时间矩阵,构建奖励函数,构造神经网络模型,训练模型,模型应用五个阶段进行。对已知的加工时间矩阵进行处理,构造一个二维矩阵M,来描述每个工件在不同时刻的特征。根据优化目标定义奖励函数。将状态矩阵M作为人工神经网络模型的输入,输出为每一个工件的选取概率,并遮罩当前选择的工件对应的输出神经元,直到所有工件都被选取,视为一个回合的结束。回合结束后采用Policy Gradient算法训练模型调整网络模型参数。本方法训练的模型可以高效地优化同等规模下的流水车间调度问题,得到加工时间总和较短的加工顺序。
基本信息
专利标题 :
一种基于强化学习的流水车间调度方法
专利标题(英):
暂无
公开(公告)号 :
CN112987665A
申请号 :
CN202110177162.2
公开(公告)日 :
2021-06-18
申请日 :
2021-02-09
授权号 :
CN112987665B
授权日 :
2022-04-12
发明人 :
张皓东任涛王心悦董卓然戚放
申请人 :
东北大学
申请人地址 :
辽宁省沈阳市和平区文化路3号巷11号
代理机构 :
沈阳东大知识产权代理有限公司
代理人 :
李在川
优先权 :
CN202110177162.2
主分类号 :
G05B19/418
IPC分类号 :
G05B19/418
IPC结构图谱
G
G部——物理
G05
控制;调节
G05B
一般的控制或调节系统;这种系统的功能单元;用于这种系统或单元的监视或测试装置
G05B19/00
程序控制系统
G05B19/02
电的
G05B19/418
全面工厂控制,即集中控制许多机器,例如直接或分布数字控制、柔性制造系统、集成制造系统、计算机集成制造
法律状态
2022-04-12 :
授权
2021-07-06 :
实质审查的生效
IPC(主分类) : G05B 19/418
申请日 : 20210209
申请日 : 20210209
2021-06-18 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载