基于强化学习的微零件精密装配方法、装置和系统
授权
摘要
本发明属于控制技术,具体涉及了一种基于强化学习的微零件精密装配方法、装置和系统,旨在解决现有装配技术效率低适用性差的问题。本发明包括:实时获取微零件的图像和力传感器信息,先通过微零件的图像进行位姿对准,再基于力传感器信息通过基于强化学习的装配模型完成装配。所述基于强化学习的装配模型,通过构建力的雅可比矩阵获取专家动作并通过强化学习框架获取改进动作,将专家动作和改进动作相加获得最终动作,基于最终动作通过本发明特有的回合‑单步动态探索策略完成装配并获取基于强化学习的装配模型,本发明提高了操作的便捷度,还提高了模型的训练效率和精密装配效率同时提高了微零件精确装配方法的适用性。
基本信息
专利标题 :
基于强化学习的微零件精密装配方法、装置和系统
专利标题(英):
暂无
公开(公告)号 :
CN112965372A
申请号 :
CN202110137780.4
公开(公告)日 :
2021-06-15
申请日 :
2021-02-01
授权号 :
CN112965372B
授权日 :
2022-04-01
发明人 :
李迎徐德
申请人 :
中国科学院自动化研究所
申请人地址 :
北京市海淀区中关村东路95号
代理机构 :
北京市恒有知识产权代理事务所(普通合伙)
代理人 :
郭文浩
优先权 :
CN202110137780.4
主分类号 :
G05B13/04
IPC分类号 :
G05B13/04 G06N20/00 B25B27/00
IPC结构图谱
G
G部——物理
G05
控制;调节
G05B
一般的控制或调节系统;这种系统的功能单元;用于这种系统或单元的监视或测试装置
G05B13/00
自适应控制系统,即系统按照一些预定的准则自动调整自己使之具有最佳性能的系统
G05B13/02
电的
G05B13/04
包括使用模型或模拟器的
法律状态
2022-04-01 :
授权
2021-07-02 :
实质审查的生效
IPC(主分类) : G05B 13/04
申请日 : 20210201
申请日 : 20210201
2021-06-15 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载