基于强化学习和残差建模的机器人现实迁移系统和方法
公开
摘要
本发明公开一种基于强化学习和残差建模的机器人现实迁移系统和方法,在只有少量混合离线数据和带偏差模拟器的情况下,利用离线数据和偏差模拟器构造最优模拟器。基于最优模拟器通过强化学习算法训练出机器人行为策略并让机器人能自主适应现实环境,这种自适应性使行为策略能够更有效地推广到真实环境。本发明提出了一种机器人训练框架,为减机器人控制从模拟器环境应用到现实场景中的偏差提供了一种创新性的方法。该方法基于离线数据对模拟器环境状态空间和真实环境状态空间的残差进行建模,并使用学得的残差模型修正原始模拟器。最终将机器人在修正模拟器中学到的策略,迁移到真实环境中。
基本信息
专利标题 :
基于强化学习和残差建模的机器人现实迁移系统和方法
专利标题(英):
暂无
公开(公告)号 :
CN114290339A
申请号 :
CN202210221230.5
公开(公告)日 :
2022-04-08
申请日 :
2022-03-09
授权号 :
暂无
授权日 :
暂无
发明人 :
俞扬刘驭壬詹德川周志华魏宏伟
申请人 :
南京大学
申请人地址 :
江苏省南京市栖霞区仙林大道163号
代理机构 :
南京乐羽知行专利代理事务所(普通合伙)
代理人 :
李玉平
优先权 :
CN202210221230.5
主分类号 :
B25J9/16
IPC分类号 :
B25J9/16 G06N3/08 G06N3/04 G06N3/00
IPC结构图谱
B
B部——作业;运输
B25
手动工具;轻便机动工具;手动器械的手柄;车间设备;机械手
B25J
机械手;装有操纵装置的容器
B25J9/00
程序控制机械手
B25J9/16
程序控制
法律状态
2022-04-08 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载