一种应对大规模问题的递归强化学习方法

公开

摘要

本发明公开了一种应对大规模问题的递归强化学习框架，包括以下步骤：步骤1，基于模型构建算法对问题进行建模，创建环境模型。步骤2，进行递归强化学习问题求解算法的训练求解过程。本发明的一种应对大规模问题的递归强化学习框架能够增强智能体对于可递归求解问题的学习能力，通过递归求解小规模问题来完成大规模问题的求解目的，在取得较好的扩展效果的同时，具有较强的可解释性，并且该框架能够适用于任意一种经典的强化学习算法，能够让智能体具备学会任意长度的问题的能力。

基本信息

专利标题：

一种应对大规模问题的递归强化学习方法

专利标题（英）：

暂无

公开（公告）号：

CN114564890A

申请号：

CN202210190797.0

公开（公告）日：

2022-05-31

申请日：

2022-02-28

授权号：

暂无

授权日：

暂无

发明人：

张铖汪亮陶先平

申请人：

南京大学

申请人地址：

江苏省南京市栖霞区仙林大道163号

代理机构：

南京钟山专利代理有限公司

代理人：

王路

优先权：

CN202210190797.0

主分类号：

G06F30/27

IPC分类号：

G06F30/27 G06F119/02

IPC结构图谱

G部——物理

G06

计算；推算或计数

G06F

电数字数据处理

G06F30/27

使用机器学习，例如人工智能，神经网络，支持向量机或训练模型

法律状态

2022-05-31 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载