任务决策方法、装置、设备及存储介质
公开
摘要
本申请实施例公开了一种任务决策方法、装置、设备及存储介质,属于人工智能技术领域。所述方法包括:从离线数据池中采样获取多个任务分别对应的训练样本集;采用数据增强的方法,得到每个任务分别对应的多个训练样本集;通过任务推断网络生成训练样本集的任务表示向量;采用对比学习的方法,确定任务推断网络的训练损失;基于各个训练样本的状态向量、动作向量和任务表示向量,确定策略网络的训练损失和评判网络的训练损失;基于上述训练损失对任务决策模型进行训练。本申请通过结合对比学习对任务决策模型的任务推断网络进行训练,实现了任务决策模型的实用性和泛化性能的提高。本申请可适用于机器人控制、自动驾驶、智慧农业等场景中。
基本信息
专利标题 :
任务决策方法、装置、设备及存储介质
专利标题(英):
暂无
公开(公告)号 :
CN114282741A
申请号 :
CN202111107294.4
公开(公告)日 :
2022-04-05
申请日 :
2021-09-22
授权号 :
暂无
授权日 :
暂无
发明人 :
陈明哲李蓝青罗迪君
申请人 :
腾讯科技(深圳)有限公司
申请人地址 :
广东省深圳市南山区高新区科技中一路腾讯大厦35层
代理机构 :
北京三高永信知识产权代理有限责任公司
代理人 :
孙晓丽
优先权 :
CN202111107294.4
主分类号 :
G06Q10/06
IPC分类号 :
G06Q10/06 G06Q30/02 G06V10/774 G06V10/84 G06V10/82 G06K9/62 G06N3/04 G06N3/08
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06Q
专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10/00
行政;管理
G06Q10/06
资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
法律状态
2022-04-05 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载