基于强化学习的机器人复杂时序逻辑任务路径规划方法

实质审查的生效

摘要

本发明涉及一种基于强化学习的机器人复杂时序逻辑任务路径规划方法，该方法包括：将机器人与环境之间的交互过程抽象建模为马尔可夫决策过程模型；将设定环境下的机器人的任务需求描述成信号时序逻辑任务；设计鲁棒度；基于鲁棒度设计奖励函数；在马尔可夫决策过程模型上使用设计的奖励函数，运动强化学习算法求解得到针对信号时序逻辑任务的最优路径规划策略使得任务满足概率最大。与现有技术相比，本发明强化学习训练过程中使用到的奖励函数在体现信号时序逻辑任务的特征的基础上更具有合理性，使得路径规划结果更加合理、有效。

基本信息

专利标题：

基于强化学习的机器人复杂时序逻辑任务路径规划方法

专利标题（英）：

暂无

公开（公告）号：

CN114355947A

申请号：

CN202210028141.9

公开（公告）日：

2022-04-15

申请日：

2022-01-11

授权号：

暂无

授权日：

暂无

发明人：

殷翔任晓华李少远

申请人：

上海交通大学

申请人地址：

上海市闵行区东川路800号

代理机构：

上海科盛知识产权代理有限公司

代理人：

丁云

优先权：

CN202210028141.9

主分类号：

G05D1/02

IPC分类号：

G05D1/02

IPC结构图谱

G部——物理

G05

控制；调节

G05D

非电变量的控制或调节系统

G05D1/00

陆地、水上、空中或太空中的运载工具的位置、航道、高度或姿态的控制，例如自动驾驶仪

G05D1/02

二维的位置或航道控制

法律状态

2022-05-03 ：

实质审查的生效

IPC(主分类) : G05D 1/02
申请日 : 20220111

2022-04-15 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载