一种基于深度强化学习的车间调度方法、装置和系统
公开
摘要
本发明公开了一种基于深度强化学习的车间调度方法、装置和系统,属于作业车间调度领域,所述方法包括:S1:根据车间调度问题的目标函数确定出车间仿真环境;S2:利用深度强化学习DRL智能体与车间仿真环境获取交互三元组;S3:将多个三元组作为训练数据集训练智能体Actor和智能体Critic;智能体Actor用于选取加工工件,智能体Critic用于评价当前加工状态的期望奖励值;S4:利用执行智能体继承训练后的智能体Actor的网络参数,控制执行智能体在线对车间加工工序中的调度实例进行决策,以确定出下一个待加工工件。本发明为基于数据驱动的科学决策,决策效率高,能够准确为待加工工件分配优先级,同时适用于各种加工场景,兼容性强。
基本信息
专利标题 :
一种基于深度强化学习的车间调度方法、装置和系统
专利标题(英):
暂无
公开(公告)号 :
CN114565247A
申请号 :
CN202210147308.3
公开(公告)日 :
2022-05-31
申请日 :
2022-02-17
授权号 :
暂无
授权日 :
暂无
发明人 :
沈卫明赵林林
申请人 :
华中科技大学
申请人地址 :
湖北省武汉市洪山区珞喻路1037号
代理机构 :
华中科技大学专利中心
代理人 :
尹丽媛
优先权 :
CN202210147308.3
主分类号 :
G06Q10/06
IPC分类号 :
G06Q10/06 G06Q50/04 G06F17/11 G05B19/418
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06Q
专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10/00
行政;管理
G06Q10/06
资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
法律状态
2022-05-31 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载