基于深度强化学习的空空导弹越肩发射制导律设计方法

实质审查的生效

摘要

本发明一种基于深度强化学习的空空导弹越肩发射制导律设计方法，包括步骤如下：步骤1，对越肩发射进行归一化动力学建模；对模型进行归一化使各状态量具有相近的量级，从而使神经网络的权重更新能够更加稳定；步骤2，为了适应强化学习的研究范式，需要将步骤1中的研究问题建模为马尔科夫决策过程；步骤3，搭建算法网络，设置算法参数；选用的深度学习算法为近端策略优化算法PPO，步骤4，在训练达到目标奖励值或最大步数之前，智能体将根据PPO算法不断收集状态转移数据及奖励，并不断迭代更新Actor网络和Critic网络的参数。应用本发明的技术方案，可以使导弹在复杂的气动环境中获得具有次优性和鲁棒性的攻角制导律，且考虑了导弹不同机动能力的限制，在未来空战中具有实用价值。

基本信息

专利标题：

基于深度强化学习的空空导弹越肩发射制导律设计方法

专利标题（英）：

暂无

公开（公告）号：

CN114519292A

申请号：

CN202111550831.2

公开（公告）日：

2022-05-20

申请日：

2021-12-17

授权号：

暂无

授权日：

暂无

发明人：

陈万春龚晓鹏陈中原

申请人：

北京航空航天大学

申请人地址：

北京市海淀区学院路37号

代理机构：

北京慧泉知识产权代理有限公司

代理人：

王顺荣

优先权：

CN202111550831.2

主分类号：

G06F30/27

IPC分类号：

G06F30/27 G06F119/02

IPC结构图谱

G部——物理

G06

计算；推算或计数

G06F

电数字数据处理

G06F30/27

使用机器学习，例如人工智能，神经网络，支持向量机或训练模型

法律状态

2022-06-07 ：

实质审查的生效

IPC(主分类) : G06F 30/27
申请日 : 20211217

2022-05-20 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载