一种训练端到端的自动驾驶策略的方法

实质审查的生效

摘要

本发明公开了一种训练端到端的自动驾驶策略的方法。该方法包括：将反映驾驶环境的高维视觉信息输入到预训练的表示网络，自动学习低维信息，其中所述表示网络利用采集的示教数据进行监督学习，所述低维度信息是与自动驾驶任务相关度强的抽象特征；构建强化学习模型，智能体通过预训练的表示网络的低维信息表示结果来获取观测结果，得到优化的驾驶策略，其中强化学习过程基于离散时间的马尔可夫决策过程实现，强化学习的目标是获取最大长期回报期望。本发明在强化学习之前学习与自动驾驶任务相关度强的抽象特征表征，能够更快速、准确的获得最优驾驶策略。

基本信息

专利标题：

一种训练端到端的自动驾驶策略的方法

专利标题（英）：

暂无

公开（公告）号：

CN114358128A

申请号：

CN202111480162.6

公开（公告）日：

2022-04-15

申请日：

2021-12-06

授权号：

暂无

授权日：

暂无

发明人：

徐坤冯时羽李慧云

申请人：

深圳先进技术研究院

申请人地址：

广东省深圳市南山区西丽大学城学苑大道1068号

代理机构：

北京市诚辉律师事务所

代理人：

耿慧敏

优先权：

CN202111480162.6

主分类号：

G06K9/62

IPC分类号：

G06K9/62 G06N3/04 G06N3/08

IPC结构图谱

G部——物理

G06

计算；推算或计数

G06K

数据识别；数据表示；记录载体；记录载体的处理

G06K9/00

用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置

G06K9/62

应用电子设备进行识别的方法或装置

法律状态

2022-05-03 ：

实质审查的生效

IPC(主分类) : G06K 9/62
申请日 : 20211206

2022-04-15 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载