基于注意力机制的CPS系统强化学习控制方法
实质审查的生效
摘要

本发明提供了基于注意力机制的CPS系统强化学习控制方法,包括以下步骤:控制对象通过策略网络选择一个合适的策略,并且对环境进行执行;环境在策略的执行下产生变化和回应,生成一个奖励;预设的多个传感器对环境进行一个探测,获得了多个传感器探测信息;将传感器探测信息传入自注意力网络,将获取的传感器信息的奖励和当前的状态同时输入策略网络,更新策略网络的梯度,并且作为策略网络的输入去选择下一时间段的策略,重复进行即可完成学习控制方法。本发明在使用强化学习算法解决实际的控制问题的时候,该方法对于奖励的设计要求更加的宽松和便利,即部分信息可以通过传感器的隐知识学到。

基本信息
专利标题 :
基于注意力机制的CPS系统强化学习控制方法
专利标题(英):
暂无
公开(公告)号 :
CN114527666A
申请号 :
CN202210221958.8
公开(公告)日 :
2022-05-24
申请日 :
2022-03-09
授权号 :
暂无
授权日 :
暂无
发明人 :
卢岩涛李青孙仕琦
申请人 :
西北工业大学
申请人地址 :
陕西省西安市西北工业大学
代理机构 :
西安汇恩知识产权代理事务所(普通合伙)
代理人 :
张伟花
优先权 :
CN202210221958.8
主分类号 :
G05B13/04
IPC分类号 :
G05B13/04  
IPC结构图谱
G
G部——物理
G05
控制;调节
G05B
一般的控制或调节系统;这种系统的功能单元;用于这种系统或单元的监视或测试装置
G05B13/00
自适应控制系统,即系统按照一些预定的准则自动调整自己使之具有最佳性能的系统
G05B13/02
电的
G05B13/04
包括使用模型或模拟器的
法律状态
2022-06-10 :
实质审查的生效
IPC(主分类) : G05B 13/04
申请日 : 20220309
2022-05-24 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332