基于强化学习和相位竞争的自适应信号控制方法及系统

实质审查的生效

摘要

本发明涉及一种基于强化学习和相位竞争的自适应信号控制方法及系统，其包括：与仿真环境交互得到交叉口状态，利用策略网络π_θ的输出得到决策，在决策后收集奖励和下一时刻的状态，得到样本仿真轨迹；基于仿真轨迹，对PPO网络进行训练和参数更新，重复若干轮直至收敛。收敛后模型能基于交通流量的实时状态进行信号调整控制信号。本发明在保证信号控制的效果同时，能够适用于不同交叉口。本发明可以广泛在城市交通信号控制领域中应用。

基本信息

专利标题：

基于强化学习和相位竞争的自适应信号控制方法及系统

专利标题（英）：

暂无

公开（公告）号：

CN114419884A

申请号：

CN202210031174.9

公开（公告）日：

2022-04-29

申请日：

2022-01-12

授权号：

暂无

授权日：

暂无

发明人：

胡坚明吴智楷彭黎辉裴欣

申请人：

清华大学

申请人地址：

北京市海淀区100084信箱82分箱清华大学专利办公室

代理机构：

北京纪凯知识产权代理有限公司

代理人：

孙楠

优先权：

CN202210031174.9

主分类号：

G08G1/01

IPC分类号：

G08G1/01 G08G1/07 G06F30/27 G06N3/04 G06N3/08

IPC结构图谱

G部——物理

G08

信号装置

G08G

交通控制系统

G08G1/00

道路车辆的交通控制系统

G08G1/01

检测要统计或要控制的交通运动

法律状态

2022-05-20 ：

实质审查的生效

IPC(主分类) : G08G 1/01
申请日 : 20220112

2022-04-29 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载