一种基于模型参考强化学习的无人船容错控制方法
公开
摘要
本发明公开了一种基于模型参考强化学习的无人船容错控制方法,该方法包括:对无人船的不确定性因素进行分析,构建无人船名义动力学模型;基于无人船名义动力学模型,设计无人船标称控制器;基于最大熵的Actor‑Critic方法,根据实际无人船系统、无人船名义动力学模型的状态变量差值和无人船标称控制器的输出,构建基于模型参考强化学习的容错控制器;根据控制任务需求,搭建强化学习评价函数和控制策略模型并训练容错控制器,得到训练完成的控制策略。通过使用本发明,能够显著提高无人船系统的安全性和可靠性。本发明作为一种基于模型参考强化学习的无人船容错控制方法,可广泛应用于无人船控制领域。
基本信息
专利标题 :
一种基于模型参考强化学习的无人船容错控制方法
专利标题(英):
暂无
公开(公告)号 :
CN114296350A
申请号 :
CN202111631716.8
公开(公告)日 :
2022-04-08
申请日 :
2021-12-28
授权号 :
暂无
授权日 :
暂无
发明人 :
张清瑞熊培轩张雷朱波胡天江
申请人 :
中山大学
申请人地址 :
广东省广州市海珠区新港西路135号
代理机构 :
深圳市创富知识产权代理有限公司
代理人 :
高冰
优先权 :
CN202111631716.8
主分类号 :
G05B13/04
IPC分类号 :
G05B13/04
IPC结构图谱
G
G部——物理
G05
控制;调节
G05B
一般的控制或调节系统;这种系统的功能单元;用于这种系统或单元的监视或测试装置
G05B13/00
自适应控制系统,即系统按照一些预定的准则自动调整自己使之具有最佳性能的系统
G05B13/02
电的
G05B13/04
包括使用模型或模拟器的
法律状态
2022-04-08 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载