用于增强学习模型的状态模拟器
实质审查的生效
摘要

公开了一种用于为增强模型生成数据集的方法、装置和产品。所述方法包括:获得所述特征集合的多个不同子集;使用马尔可夫决策过程来为每个特征子集确定策略;获得包括对所述特征集合中的每个特征的评估的状态;基于所述状态到不同特征子集上的不同投影,对所述状态应用所述多个策略,由此为所述状态获得多个建议动作;基于所述多个建议动作来为所述状态确定一个或多个动作及其对应分数;以及使用所述状态以及所述一个或多个动作及其对应分数来训练增强学习模型。

基本信息
专利标题 :
用于增强学习模型的状态模拟器
专利标题(英):
暂无
公开(公告)号 :
CN114365157A
申请号 :
CN202080063367.1
公开(公告)日 :
2022-04-15
申请日 :
2020-08-11
授权号 :
暂无
授权日 :
暂无
发明人 :
M·马西恩A·扎多罗杰尼
申请人 :
国际商业机器公司
申请人地址 :
美国纽约
代理机构 :
中国贸促会专利商标事务所有限公司
代理人 :
鲍进
优先权 :
CN202080063367.1
主分类号 :
G06N20/00
IPC分类号 :
G06N20/00  G06K9/62  G06N3/08  G06N5/00  G06N7/00  
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06N
基于特定计算模型的计算机系统
G06N20/00
机器学习
法律状态
2022-05-03 :
实质审查的生效
IPC(主分类) : G06N 20/00
申请日 : 20200811
2022-04-15 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332