一种基于深度强化学习的AGV自动调整PID参数的方法
实质审查的生效
摘要

本发明公开一种基于深度强化学习的AGV自动调整PID参数的方法,方法首先将生产环境的实际场景进行建模,建立马尔可夫决策过程;然后初始化AGV的当前状态,根据ε‑greedy决策选择动作,获得AGV的下一个状态,并将其发送给AGV运行,获取AGV运行过程中的数据,计算奖励值;接着储存当前状态、动作、奖励值和下一个状态到记忆库中,从记忆库中取样并使用深度强化学习DQN网络模型中的评估网络和目标网络分别计算当前状态和下一状态的所有值函数,使用梯度下降、均方差损失函数计算损失,并将评估网络参数更新到目标网络;最后根据AGV运行情况判断当前的PID是否为最终状态,结束PID参数的调整。本发明的方法不仅适用于所有生产环境,还能提高AGV投入使用的工作效率。

基本信息
专利标题 :
一种基于深度强化学习的AGV自动调整PID参数的方法
专利标题(英):
暂无
公开(公告)号 :
CN114527642A
申请号 :
CN202210207327.0
公开(公告)日 :
2022-05-24
申请日 :
2022-03-03
授权号 :
暂无
授权日 :
暂无
发明人 :
陈愉彬李丹程
申请人 :
东北大学
申请人地址 :
辽宁省沈阳市和平区文化路3号巷11号
代理机构 :
沈阳东大知识产权代理有限公司
代理人 :
李在川
优先权 :
CN202210207327.0
主分类号 :
G05B11/42
IPC分类号 :
G05B11/42  
IPC结构图谱
G
G部——物理
G05
控制;调节
G05B
一般的控制或调节系统;这种系统的功能单元;用于这种系统或单元的监视或测试装置
G05B11/00
自动控制器
G05B11/01
电的
G05B11/36
具有为获得特定性能的装置,例如比例、积分、微分
G05B11/42
为获得比例和与时间有关的两个特性的,例如,比例积分,比例积分微分
法律状态
2022-06-10 :
实质审查的生效
IPC(主分类) : G05B 11/42
申请日 : 20220303
2022-05-24 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332