基于多智能体深度强化学习的异构车联网用户关联方法

实质审查的生效

摘要

本发明公开了一种基于多智能体深度强化学习的异构车联网用户关联方法，该方法先将问题建模成部分可观察马尔可夫决策过程，再采用分解团队值函数的思想，具体包括建立集中式训练分布式执行框架，将团队值函数与各个用户值函数利用求和连接起来，以达到隐性训练用户值函数的目的；接着本发明亦借鉴经验回放以及目标网络机制，使用ε‑greedy策略进行动作的探索与选择，利用循环神经网络储存历史信息，并且选择Huber损失函数来计算损失同时进行梯度下降，最终学习到异构车联网用户的关联策略。本发明在异构车联网环境下，相较于多智能体独立深度Q学习算法和其它传统算法，可以更加有效地同时提高能量效率和降低切换开销。

基本信息

专利标题：

基于多智能体深度强化学习的异构车联网用户关联方法

专利标题（英）：

暂无

公开（公告）号：

CN114449482A

申请号：

CN202210242124.5

公开（公告）日：

2022-05-06

申请日：

2022-03-11

授权号：

暂无

授权日：

暂无

发明人：

陶奕宇林艳包金鸣张一晋邹骏李骏束锋

申请人：

南京理工大学

申请人地址：

江苏省南京市玄武区孝陵卫200号

代理机构：

南京理工大学专利中心

代理人：

薛云燕

优先权：

CN202210242124.5

主分类号：

H04W4/44

IPC分类号：

H04W4/44 H04W4/46 H04W4/02 H04W4/021 G06N3/04 G06N3/08

法律状态

2022-05-24 ：

实质审查的生效

IPC(主分类) : H04W 4/44
申请日 : 20220311

2022-05-06 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载