基于先验知识与DQN算法的多机器人路径规划方法
授权
摘要
本发明涉及机器人路径规划技术领域,具体涉及基于先验知识与DQN算法的多机器人路径规划方法,包括:初始化多机器人系统的参数;判断是否出现特殊状态,若是,则选取先验Q值向量的最大先验对应的动作指令,若否,则根据ε‑greedy策略生成动作指令;然后,计算生成机器人执行动作指令后的运行状态参数和奖赏函数,将相关数据存储到经验池中,并更新targetQ网络;根据多机器人系统的targetQ网络和初始状态参数,重复执行选取动作指令和生成状态参数以规划得到多机器人系统的最优路径。本发明能更好地帮助改善将DQN算法用于多机器人系统的路径规划时,targetQ网络收敛速度慢和训练随机性过大的问题。
基本信息
专利标题 :
基于先验知识与DQN算法的多机器人路径规划方法
专利标题(英):
暂无
公开(公告)号 :
CN110321666A
申请号 :
CN201910735725.8
公开(公告)日 :
2019-10-11
申请日 :
2019-08-09
授权号 :
CN110321666B
授权日 :
2022-05-03
发明人 :
李波易洁梁宏斌
申请人 :
重庆理工大学
申请人地址 :
重庆市巴南区李家沱红光大道69号
代理机构 :
重庆博凯知识产权代理有限公司
代理人 :
黄河
优先权 :
CN201910735725.8
主分类号 :
G06F17/50
IPC分类号 :
G06F17/50 G06N3/04 G05D1/02
法律状态
2022-05-03 :
授权
2019-11-05 :
实质审查的生效
IPC(主分类) : G06F 17/50
申请日 : 20190809
申请日 : 20190809
2019-10-11 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载