基于深度强化学习的多阶段装备发展规划方法及系统
授权
摘要
本发明公开了一种基于深度强化学习的多阶段装备发展规划方法及系统,该方法包括:构建多阶段装备发展规划模型,该多阶段装备发展规划模型用于评估装备发展方案在面向每阶段投资预算和最终能力需求两种不确定条件的能力评价值;根据多阶段装备发展规划模型中的不确定条件构建对应的强化学习框架;基于DQN思想和强化学习框架,构建多阶段装备发展规划优化算法;基于多阶段装备发展规划优化算法,生成最优的多阶段装备发展方案。本发明针对由深度不确定条件下的任意一种随机环境,无需对算法做出任何调整即可快速响应,得到近似最优的多阶段装备发展方案。
基本信息
专利标题 :
基于深度强化学习的多阶段装备发展规划方法及系统
专利标题(英):
暂无
公开(公告)号 :
CN113296413A
申请号 :
CN202110616596.8
公开(公告)日 :
2021-08-24
申请日 :
2021-06-02
授权号 :
CN113296413B
授权日 :
2022-06-14
发明人 :
刘鹏李际超夏博远杨克巍姜江葛冰峰杨志伟
申请人 :
中国人民解放军国防科技大学
申请人地址 :
湖南省长沙市开福区德雅路109号
代理机构 :
北京风雅颂专利代理有限公司
代理人 :
曾志鹏
优先权 :
CN202110616596.8
主分类号 :
G05B13/04
IPC分类号 :
G05B13/04
IPC结构图谱
G
G部——物理
G05
控制;调节
G05B
一般的控制或调节系统;这种系统的功能单元;用于这种系统或单元的监视或测试装置
G05B13/00
自适应控制系统,即系统按照一些预定的准则自动调整自己使之具有最佳性能的系统
G05B13/02
电的
G05B13/04
包括使用模型或模拟器的
法律状态
2022-06-14 :
授权
2021-09-10 :
实质审查的生效
IPC(主分类) : G05B 13/04
申请日 : 20210602
申请日 : 20210602
2021-08-24 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载