基于最大熵强化学习的自动驾驶汽车决策规划方法

公开

摘要

本发明涉及一种基于最大熵强化学习的自动驾驶汽车决策规划方法，属于自动驾驶汽车领域。该方法包括：S1：构建基于最大熵强化学习的决策规划模型，该模型包括：状态空间、动作空间、奖励函数、策略函数与评价模型；S2：构建具有交互性的高速公路仿真训练场景：使用二自由度汽车运动学模型描述训练场景中车辆的运动，并利用基于规则的智能决策规划模型控制环境车辆，使环境具有交互特性；S3：训练基于最大熵强化学习的决策规划模型。本发明利用最大熵强化学习提高了自动驾驶汽车的高速公路决策规划策略的最优性与稳定性。

基本信息

专利标题：

基于最大熵强化学习的自动驾驶汽车决策规划方法

专利标题（英）：

暂无

公开（公告）号：

CN114580302A

申请号：

CN202210261432.2

公开（公告）日：

2022-06-03

申请日：

2022-03-16

授权号：

暂无

授权日：

暂无

发明人：

唐小林黄冰刘腾杨丰阁杨凯李佳承

申请人：

重庆大学

申请人地址：

重庆市沙坪坝区沙坪坝正街174号

代理机构：

北京同恒源知识产权代理有限公司

代理人：

赵荣之

优先权：

CN202210261432.2

主分类号：

G06F30/27

IPC分类号：

G06F30/27 G06N20/00 B60W40/00 B60W60/00

IPC结构图谱

G部——物理

G06

计算；推算或计数

G06F

电数字数据处理

G06F30/27

使用机器学习，例如人工智能，神经网络，支持向量机或训练模型

法律状态

2022-06-03 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载