一种基于强化学习的水下机器人避障路径规划方法

公开

摘要

一种基于强化学习的水下机器人避障路径规划方法，首先对水下机器人的能耗模型以及动力学模型，水下洋流场景模型进行建模；其次将水下机器人对到达路径点的能耗与时长最小化问题建模为抽象的马尔可夫决策过程；将当前水下机器人的观测信息通过抽象网络转到隐藏层成为隐藏状态，将隐藏状态和想采取的动作通过转移预测网络映射至下一隐藏向量和预测奖励，另外策略网络通过给定的隐藏向量选择采取的动作以及当前局面的总奖励，在这个场景中即为到达目标点。通过水下机器人与环境的不断交互学习环境模型，得到即时奖励改进神经网络。最后将训练好的策略网络部署到水下机器人中。

基本信息

专利标题：

一种基于强化学习的水下机器人避障路径规划方法

专利标题（英）：

暂无

公开（公告）号：

CN114625151A

申请号：

CN202210236892.X

公开（公告）日：

2022-06-14

申请日：

2022-03-10

授权号：

暂无

授权日：

暂无

发明人：

覃振权孔令同卢炳先王雷朱明孙伟峰

申请人：

大连理工大学

申请人地址：

辽宁省大连市甘井子区凌工路２号

代理机构：

辽宁鸿文知识产权代理有限公司

代理人：

隋秀文

优先权：

CN202210236892.X

主分类号：

G05D1/06

IPC分类号：

G05D1/06

IPC结构图谱

G部——物理

G05

控制；调节

G05D

非电变量的控制或调节系统

G05D1/00

陆地、水上、空中或太空中的运载工具的位置、航道、高度或姿态的控制，例如自动驾驶仪

G05D1/04

高度或深度的控制

G05D1/06

高度或深度的变化率

法律状态

2022-06-14 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载