一种基于记忆网络的深度强化学习交通信号控制方法

公开

摘要

本发明公开了一种基于记忆网络的深度强化学习交通信号控制方法，包括：1、建立基于DQN算法的交通信号灯控制主网络和目标值网络；主网络将t时刻状态值s_t输入LSTM中得到t+1时刻预测状态值合并s_t和并输入全连接网络，得到预测Q值的最大值和对应动作2、初始化算法参数，采集路况信息建立状态值s_t；3、将s_t输入主网络得到预测Q值取最大值的动作采用1‑ε策略选择动作a_t；4、执行动作a_t并计算奖励r_t和状态s_t+1；5、在经验池中随机抽样B个记录，通过最小化损失函数训练主网络参数；6、定时更新目标值网络参数，根据当前路况更新s_t，跳转至步骤3继续执行。该方法根据当前路况以及对当前路况的预测来计算Q值，能够更精确地对交通信号进行控制。

基本信息

专利标题：

一种基于记忆网络的深度强化学习交通信号控制方法

专利标题（英）：

暂无

公开（公告）号：

CN114613168A

申请号：

CN202210408279.1

公开（公告）日：

2022-06-10

申请日：

2022-04-19

授权号：

暂无

授权日：

暂无

发明人：

孔燕卢学亮

申请人：

南京信息工程大学

申请人地址：

江苏省南京市江北新区宁六路219号

代理机构：

南京苏高专利商标事务所(普通合伙)

代理人：

常虹

优先权：

CN202210408279.1

主分类号：

G08G1/08

IPC分类号：

G08G1/08 G08G1/01 G06N3/08 G06N3/04

IPC结构图谱

G部——物理

G08

信号装置

G08G

交通控制系统

G08G1/00

道路车辆的交通控制系统

G08G1/07

交通信号控制

G08G1/08

根据检测的车辆数或速度的

法律状态

2022-06-10 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载