基于强化学习的机器人一体化网络架构优化方法及系统
公开
摘要
本发明提供了一种基于强化学习的机器人一体化网络架构优化方法及系统,首先基于多模传感器在一个由浅入深的分层式网络中进行不同程度的环境抽象特征提取;然后以上述分层式网络为主干,根据移动机器人的定位、规划、目标识别和博弈决策等方面的需求,在不同抽象层位置设计分支网络进行一体化网络实现;最后采用多目标联合的融合优化对前述一体化网络进行迭代优化,使得机器人输出合理移动和博弈策略。本发明提出的一种主干特征分层抽取、多任务分支式设计的一体化网络结构及其优化方法,解决了现有移动机器人各功能模块松耦合和分离研究的问题,提升了网络运行效率和数据利用率,减少了模块间冗余和耦合调试成本,有利于实际应用。
基本信息
专利标题 :
基于强化学习的机器人一体化网络架构优化方法及系统
专利标题(英):
暂无
公开(公告)号 :
CN114610037A
申请号 :
CN202210254462.0
公开(公告)日 :
2022-06-10
申请日 :
2022-03-15
授权号 :
暂无
授权日 :
暂无
发明人 :
王贺升刘启明张金鹏
申请人 :
上海交通大学;中国长峰机电技术研究设计院
申请人地址 :
上海市闵行区东川路800号
代理机构 :
上海段和段律师事务所
代理人 :
牛山
优先权 :
CN202210254462.0
主分类号 :
G05D1/02
IPC分类号 :
G05D1/02 G06K9/62 G06N3/04 G06N3/08
IPC结构图谱
G
G部——物理
G05
控制;调节
G05D
非电变量的控制或调节系统
G05D1/00
陆地、水上、空中或太空中的运载工具的位置、航道、高度或姿态的控制,例如自动驾驶仪
G05D1/02
二维的位置或航道控制
法律状态
2022-06-10 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载