面向多要素联合指控的分层多智能体增强学习方法

实质审查的生效

摘要

本发明公开了一种面向多要素联合指控的分层多智能体增强学习方法，针对强化学习的状态空间、动作空间和奖励机制进行建模，在多智能体环境下分别进行研究和设计，将Actor‑Critic网络的思想融入多智能体环境之中，形成顶层制定规划，底层执行的智能决策框架，并在模型中使用多层次的结构分别学习不同层次的策略来提高模型解决复杂问题的能力，实现了底层的并行训练，进而实现了智能体的自主行动规划。

基本信息

专利标题：

面向多要素联合指控的分层多智能体增强学习方法

专利标题（英）：

暂无

公开（公告）号：

CN114330651A

申请号：

CN202111530472.4

公开（公告）日：

2022-04-12

申请日：

2021-12-14

授权号：

暂无

授权日：

暂无

发明人：

路鹰郑本昌惠俊鹏黄虎李君张佳任金磊阎岩王振亚范佳宣李丝然何昳頔李博遥吴志壕刘峰范中行张旭辉陈海鹏赵大海韩特矫慧古月郭晶

申请人：

中国运载火箭技术研究院

申请人地址：

北京市丰台区南大红门路1号

代理机构：

中国航天科技专利中心

代理人：

范晓毅

优先权：

CN202111530472.4

主分类号：

G06N3/04

IPC分类号：

G06N3/04 G06N3/08

IPC结构图谱

G部——物理

G06

计算；推算或计数

G06N

基于特定计算模型的计算机系统

G06N3/00

基于生物学模型的计算机系统

G06N3/02

采用神经网络模型

G06N3/04

体系结构，例如，互连拓扑

法律状态

2022-04-29 ：

实质审查的生效

IPC(主分类) : G06N 3/04
申请日 : 20211214

2022-04-12 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载