一种基于模仿学习的智能路由决策保护方法和装置

授权

摘要

本发明提出一种基于模仿学习的智能路由决策保护方法和装置。其中方法包括：步骤S1、基于软件定义网络SDN中各个网络节点的流量状态矩阵，利用Q网络算法对目标智能体进行预训练；具体包括：步骤S1.1、获取第一Q网络的网络结构，构建具有第一Q网络的网络结构的第二Q网络，第一Q网络为Q网络算法中当前状态的Q目标网络，第二Q网络为Q网络算法中构建的Q预测网络；步骤S1.2、基于第一Q网络的Q值和第二Q网络的Q值计算Q值损失函数，当Q值损失函数具有最小值时，预训练过程结束，目标智能体具有将流量以最优策略进行下发的决策能力；步骤S2、利用经预训练的目标智能体执行流量下发任务。

基本信息

专利标题：

一种基于模仿学习的智能路由决策保护方法和装置

专利标题（英）：

暂无

公开（公告）号：

CN114189470A

申请号：

CN202210131705.1

公开（公告）日：

2022-03-15

申请日：

2022-02-14

授权号：

CN114189470B

授权日：

2022-04-19

发明人：

杨林冯涛张京京高先明王雯陶沛琳

申请人：

军事科学院系统工程研究院网络信息研究所

申请人地址：

北京市丰台区大成路13号院

代理机构：

中国和平利用军工技术协会专利中心

代理人：

刘光德

优先权：

CN202210131705.1

主分类号：

H04L45/00

IPC分类号：

H04L45/00 G06N3/08

法律状态

2022-04-19 ：

授权

2022-04-01 ：

实质审查的生效

IPC(主分类) : H04L 45/00
申请日 : 20220214

2022-03-15 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载