一种基于深度强化学习的车间调度方法、装置和系统

公开

摘要

本发明公开了一种基于深度强化学习的车间调度方法、装置和系统，属于作业车间调度领域，所述方法包括：S1：根据车间调度问题的目标函数确定出车间仿真环境；S2：利用深度强化学习DRL智能体与车间仿真环境获取交互三元组；S3：将多个三元组作为训练数据集训练智能体Actor和智能体Critic；智能体Actor用于选取加工工件，智能体Critic用于评价当前加工状态的期望奖励值；S4：利用执行智能体继承训练后的智能体Actor的网络参数，控制执行智能体在线对车间加工工序中的调度实例进行决策，以确定出下一个待加工工件。本发明为基于数据驱动的科学决策，决策效率高，能够准确为待加工工件分配优先级，同时适用于各种加工场景，兼容性强。

基本信息

专利标题：

一种基于深度强化学习的车间调度方法、装置和系统

专利标题（英）：

暂无

公开（公告）号：

CN114565247A

申请号：

CN202210147308.3

公开（公告）日：

2022-05-31

申请日：

2022-02-17

授权号：

暂无

授权日：

暂无

发明人：

沈卫明赵林林

申请人：

华中科技大学

申请人地址：

湖北省武汉市洪山区珞喻路1037号

代理机构：

华中科技大学专利中心

代理人：

尹丽媛

优先权：

CN202210147308.3

主分类号：

G06Q10/06

IPC分类号：

G06Q10/06 G06Q50/04 G06F17/11 G05B19/418

IPC结构图谱

G部——物理

G06

计算；推算或计数

G06Q

专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法；其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法

G06Q10/00

行政；管理

G06Q10/06

资源、工作流、人员或项目管理，例如组织、规划、调度或分配时间、人员或机器资源；企业规划；组织模型

法律状态

2022-05-31 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载