一种实现智能实时决策系统实时确定最优决策动作的方法
实质审查的生效
摘要
本发明公开了一种实现智能实时决策系统实时确定最优决策动作的方法,包括以:步骤1,离散化决策过程:确定最小决策时刻间隔;步骤2,定义系统状态:根据系统状态建立蒙特卡洛树搜索模型;步骤3,训练状态转移模型:将智能实时决策系统的状态转移过程建模为状态转移模型,基于历史数据训练所述状态转移模型,测试模型精度并选择最优模型参数;步骤4,挂载状态转移模型:用状态转移模型,状态转移模型预测蒙特卡洛树搜索模型的下一时刻系统状态作为漂移后的根节点,在下一个决策时刻到达前完成搜索,根据决策结果确定智能实时决策系统的当前最优的决策动作。该方法实现了在智能实时决策系统中利用蒙特卡洛树搜索实时确定最优决策动作。
基本信息
专利标题 :
一种实现智能实时决策系统实时确定最优决策动作的方法
专利标题(英):
暂无
公开(公告)号 :
CN114462566A
申请号 :
CN202210180990.6
公开(公告)日 :
2022-05-10
申请日 :
2022-02-25
授权号 :
暂无
授权日 :
暂无
发明人 :
王杰李厚强刘骐源潘涛星周祺
申请人 :
中国科学技术大学
申请人地址 :
安徽省合肥市包河区金寨路96号
代理机构 :
北京凯特来知识产权代理有限公司
代理人 :
郑立明
优先权 :
CN202210180990.6
主分类号 :
G06N3/02
IPC分类号 :
G06N3/02 G06N3/08 G06Q10/04 G06Q10/06 G06Q50/26
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06N
基于特定计算模型的计算机系统
G06N3/00
基于生物学模型的计算机系统
G06N3/02
采用神经网络模型
法律状态
2022-05-27 :
实质审查的生效
IPC(主分类) : G06N 3/02
申请日 : 20220225
申请日 : 20220225
2022-05-10 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载