基于演员-评论家强化学习和模糊逻辑的多智能体编队控制方法

授权

摘要

本发明提出一种基于演员‑评论家强化学习和模糊逻辑的多智能体编队控制方法，将最优控制方法引入多机器人系统领航跟随者编队控制方法中，利用模糊逻辑系统逼近连续函数的能力，解决最优控制中汉密尔顿‑雅可比‑贝尔曼方程难以求取解析解的问题；同时，结合演员‑评论家强化学习算法，形成演员模糊逻辑系统模块和评论家模糊逻辑系统模块，前者执行控制行为，后者对前者所选择的行为进行评价并将评价信息反馈给前者。该方法可以平衡控制性能和资源损耗，并且以在线学习的方式提高多机器人系统对于环境的适应性。

基本信息

专利标题：

基于演员-评论家强化学习和模糊逻辑的多智能体编队控制方法

专利标题（英）：

暂无

公开（公告）号：

CN111897224A

申请号：

CN202010811359.2

公开（公告）日：

2020-11-06

申请日：

2020-08-13

授权号：

CN111897224B

授权日：

2022-04-01

发明人：

黄捷张子鹏王武蔡逢煌陈宇韬柴琴琴林琼斌张祯毅李卓敏

申请人：

福州大学

申请人地址：

福建省福州市闽侯县福州大学城乌龙江北大道2号福州大学

代理机构：

福州元创专利商标代理有限公司

代理人：

丘鸿超

优先权：

CN202010811359.2

主分类号：

G05B13/04

IPC分类号：

G05B13/04

IPC结构图谱

G部——物理

G05

控制；调节

G05B

一般的控制或调节系统；这种系统的功能单元；用于这种系统或单元的监视或测试装置

G05B13/00

自适应控制系统，即系统按照一些预定的准则自动调整自己使之具有最佳性能的系统

G05B13/02

电的

G05B13/04

包括使用模型或模拟器的

法律状态

2022-04-01 ：

授权

2020-11-24 ：

实质审查的生效

IPC(主分类) : G05B 13/04
申请日 : 20200813

2020-11-06 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

1、

CN111897224A.PDF

PDF下载