强化学习多智能体沟通与决策方法

授权

摘要

本发明公开了一种强化学习多智能体沟通与决策方法，包括：根据各个智能体的观测状态信息通过神经网络提取相应的状态特征；将所有智能体的状态特征作为沟通信息输入至VLAD层中进行软分配与聚类，得到聚类后的沟通信息；将聚类后的沟通信息分发给各个智能体，由各个智能体将自身的状态特征与接收到的聚类后的沟通信息进行聚合，并通过智能体内部的全连接神经网络进行动作决策。该方法可以对各智能体的状态信息进行聚类并与其他智能体进行沟通，进而提高智能体的决策水平。

基本信息

专利标题：

强化学习多智能体沟通与决策方法

专利标题（英）：

暂无

公开（公告）号：

CN108921298A

申请号：

CN201810606662.1

公开（公告）日：

2018-11-30

申请日：

2018-06-12

授权号：

CN108921298B

授权日：

2022-04-19

发明人：

查正军李厚强温忻李斌王子磊

申请人：

中国科学技术大学

申请人地址：

安徽省合肥市包河区金寨路96号

代理机构：

北京凯特来知识产权代理有限公司

代理人：

郑立明

优先权：

CN201810606662.1

主分类号：

G06N99/00

IPC分类号：

G06N99/00 G06K9/62 G06N3/063

IPC结构图谱

G部——物理

G06

计算；推算或计数

G06N

基于特定计算模型的计算机系统

G06N99/00

本小类其他各组中不包括的技术主题

法律状态

2022-04-19 ：

授权

2018-12-25 ：

实质审查的生效

IPC(主分类) : G06N 99/00
申请日 : 20180612

2018-11-30 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载