一种基于时序差分的混合流水车间调度方法

授权

摘要

本发明公开了一种基于时序差分的深度强化学习算法，用以求解相关并行机的混合流水车间调度问题，该算法将卷积神经网络与强化学习中的TD学习进行结合，依据输入的状态特征进行行为选取，更加符合实际订单响应式生产制造系统的调度决策过程。通过把调度问题转化为多阶段决策问题，用卷积神经网络模型拟合状态价值函数，把制造系统加工状态特征数据输入模型，采用时序差分法训练模型，将启发式算法或分配规则作为调度决策候选行为，结合强化学习奖惩机制，为每次调度决策选取最优组合行为策略。与现有技术相比，本发明提出的算法具有实时性强、灵活性高等优势。

基本信息

专利标题：

一种基于时序差分的混合流水车间调度方法

专利标题（英）：

暂无

公开（公告）号：

CN112734172A

申请号：

CN202011568657.X

公开（公告）日：

2021-04-30

申请日：

2020-12-25

授权号：

CN112734172B

授权日：

2022-04-01

发明人：

陆宝春陈志峰顾钱翁朝阳张卫张哲

申请人：

南京理工大学

申请人地址：

江苏省南京市玄武区孝陵卫200号

代理机构：

南京理工大学专利中心

代理人：

朱沉雁

优先权：

CN202011568657.X

主分类号：

G06Q10/06

IPC分类号：

G06Q10/06 G06N3/04

IPC结构图谱

G部——物理

G06

计算；推算或计数

G06Q

专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法；其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法

G06Q10/00

行政；管理

G06Q10/06

资源、工作流、人员或项目管理，例如组织、规划、调度或分配时间、人员或机器资源；企业规划；组织模型

法律状态

2022-04-01 ：

授权

2021-05-21 ：

实质审查的生效

IPC(主分类) : G06Q 10/06
申请日 : 20201225

2021-04-30 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载