一种基于自适应模型的机器人强化学习方法

授权

摘要

本发明提出了一种基于自适应模型的机器人强化学习方法，在正常学习一个环境模型的同时，加入模型自适应的步骤，从而可以达到提升虚拟数据准确性的效果。具体来说，当模型是一个神经网络结构，模型自适应通过减小真实数据和虚拟数据在网络隐藏层的特征分布，从而来提升模型在虚拟数据上的准确性。实验证明，在机器人控制等领域，我们的方法相比于之前的基于模型的强化学习方法有着更高的采样效率以及最终性能。

基本信息

专利标题：

一种基于自适应模型的机器人强化学习方法

专利标题（英）：

暂无

公开（公告）号：

CN112297012A

申请号：

CN202011191173.8

公开（公告）日：

2021-02-02

申请日：

2020-10-30

授权号：

CN112297012B

授权日：

2022-05-31

发明人：

张伟楠沈键赵晗

申请人：

上海交通大学

申请人地址：

上海市闵行区东川路800号

代理机构：

上海旭诚知识产权代理有限公司

代理人：

郑立

优先权：

CN202011191173.8

主分类号：

B25J9/16

IPC分类号：

B25J9/16 G06K9/62 G06N3/04

IPC结构图谱

B部——作业；运输

B25

手动工具；轻便机动工具；手动器械的手柄；车间设备；机械手

B25J

机械手；装有操纵装置的容器

B25J9/00

程序控制机械手

B25J9/16

程序控制

法律状态

2022-05-31 ：

授权

2021-02-23 ：

实质审查的生效

IPC(主分类) : B25J 9/16
申请日 : 20201030

2021-02-02 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载