一种基于迁移强化学习的资源分配方法
实质审查的生效
摘要
本发明是一种基于迁移强化学习的资源分配方法,该资源分配方法适用于上行多小区的混合多址接入场景,包括:步骤1:搭建用于资源分配的深度强化学习网络;步骤2:进行MA‑DRL与环境的交互,每一轮交互中;步骤3:进行MA‑DRL的训练过程,训练将依据步骤2中交互得到的经验块进行,将每次与环境交互得到的经验块都存入记忆库中,并施加价值标签,抽取记忆块时选取价值标签更大的经验块;步骤4:在资源分配网络的基础上,提出一种基于MA‑DRL的迁移学习方案。本发明提出的资源分配方法以最大化所有用户总速率为目标,可以有效地提升用户总速率,并且和迁移学习结合后可以达到更快的收敛速度。
基本信息
专利标题 :
一种基于迁移强化学习的资源分配方法
专利标题(英):
暂无
公开(公告)号 :
CN114531685A
申请号 :
CN202210162552.7
公开(公告)日 :
2022-05-24
申请日 :
2022-02-22
授权号 :
暂无
授权日 :
暂无
发明人 :
王小明张义坚蒋锐李大鹏徐友云
申请人 :
南京邮电大学
申请人地址 :
江苏省南京市鼓楼区新模范马路66号
代理机构 :
南京正联知识产权代理有限公司
代理人 :
王素琴
优先权 :
CN202210162552.7
主分类号 :
H04W16/10
IPC分类号 :
H04W16/10 H04W72/04 G06N3/04 G06N3/08
法律状态
2022-06-10 :
实质审查的生效
IPC(主分类) : H04W 16/10
申请日 : 20220222
申请日 : 20220222
2022-05-24 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载