一种基于多策略深度强化学习的云制造服务组合方法

实质审查的生效

摘要

本发明涉及一种基于多策略深度强化学习的云制造服务组合方法，该方法结合基本DQN算法、竞争结构、双估计器和优先回放机制，同时还在模型中加入了一些策略，如奖励策略，ε‑greedy策略和启发式策略，来提高算法的性能。启发式策略可以屏蔽不可用服务，克服了由于超参数和奖励设计不合理导致DLR无法恢复到稳定状态的缺点。奖励可以让DLR可以根据真实奖励值来有效调整参数，ε‑greedy策略使算法有机会跳出局部最优。实验表明该模型不仅具有对动态环境适应性强的优点，而且比其他深度强化学习方法更好。

基本信息

专利标题：

一种基于多策略深度强化学习的云制造服务组合方法

专利标题（英）：

暂无

公开（公告）号：

CN114331754A

申请号：

CN202111589813.5

公开（公告）日：

2022-04-12

申请日：

2021-12-23

授权号：

暂无

授权日：

暂无

发明人：

曾骏姚娟于扬吴映波

申请人：

重庆大学

申请人地址：

重庆市沙坪坝区沙正街174号

代理机构：

重庆晟轩知识产权代理事务所(普通合伙)

代理人：

王海凤

优先权：

CN202111589813.5

主分类号：

G06Q50/04

IPC分类号：

G06Q50/04 G06N3/08 G06N3/04

IPC结构图谱

G部——物理

G06

计算；推算或计数

G06Q

专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法；其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法

G06Q50/00

特别适用于特定商业行业的系统或方法，例如公用事业或旅游

G06Q50/04

制造业

法律状态

2022-04-29 ：

实质审查的生效

IPC(主分类) : G06Q 50/04
申请日 : 20211223

2022-04-12 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载