基于深度强化学习的变质量水下航行器避障方法及系统

授权

摘要

本发明公开一种基于深度强化学习的变质量水下航行器避障方法及系统，包括：根据变质量水下航行器的运动状态和执行机构动作构建基于深度强化学习网络的避障仿真模型；将历史避障任务完整轨迹作为专家数据存入经验回放池，根据变质量水下航行器初始运动状态和高斯噪声得到当前执行动作，根据当前执行动作得到新运行状态和当前执行动作的奖励值，并存入经验回放池；根据经验回放池对避障仿真模型进行训练，根据当前训练的执行动作奖励值和历史训练的奖励平均值更新高斯噪声；以迭代训练完成后的基于深度强化学习网络的避障仿真模型得到变质量水下航行器避障任务行驶路径。对基于深度强化学习的DDPG网络模型进行改进，解决水下航行器的避障问题。

基本信息

专利标题：

基于深度强化学习的变质量水下航行器避障方法及系统

专利标题（英）：

暂无

公开（公告）号：

CN113010963A

申请号：

CN202110240036.7

公开（公告）日：

2021-06-22

申请日：

2021-03-04

授权号：

CN113010963B

授权日：

2022-04-29

发明人：

李沂滨李沐阳缪旭弘魏征尤岳周广礼贾磊庄英豪宋艳

申请人：

山东大学

申请人地址：

山东省青岛市即墨滨海路72号

代理机构：

济南圣达知识产权代理有限公司

代理人：

闫伟姣

优先权：

CN202110240036.7

主分类号：

G06F30/15

IPC分类号：

G06F30/15 G06F30/27 G06N3/04 G06N3/08

IPC结构图谱

G部——物理

G06

计算；推算或计数

G06F

电数字数据处理

G06F30/15

车辆、飞行器或船只的设计

法律状态

2022-04-29 ：

授权

2021-07-09 ：

实质审查的生效

IPC(主分类) : G06F 30/15
申请日 : 20210304

2021-06-22 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载