任务决策方法、装置、设备及存储介质

公开

摘要

本申请实施例公开了一种任务决策方法、装置、设备及存储介质，属于人工智能技术领域。所述方法包括：从离线数据池中采样获取多个任务分别对应的训练样本集；采用数据增强的方法，得到每个任务分别对应的多个训练样本集；通过任务推断网络生成训练样本集的任务表示向量；采用对比学习的方法，确定任务推断网络的训练损失；基于各个训练样本的状态向量、动作向量和任务表示向量，确定策略网络的训练损失和评判网络的训练损失；基于上述训练损失对任务决策模型进行训练。本申请通过结合对比学习对任务决策模型的任务推断网络进行训练，实现了任务决策模型的实用性和泛化性能的提高。本申请可适用于机器人控制、自动驾驶、智慧农业等场景中。

基本信息

专利标题：

任务决策方法、装置、设备及存储介质

专利标题（英）：

暂无

公开（公告）号：

CN114282741A

申请号：

CN202111107294.4

公开（公告）日：

2022-04-05

申请日：

2021-09-22

授权号：

暂无

授权日：

暂无

发明人：

陈明哲李蓝青罗迪君

申请人：

腾讯科技（深圳）有限公司

申请人地址：

广东省深圳市南山区高新区科技中一路腾讯大厦35层

代理机构：

北京三高永信知识产权代理有限责任公司

代理人：

孙晓丽

优先权：

CN202111107294.4

主分类号：

G06Q10/06

IPC分类号：

G06Q10/06 G06Q30/02 G06V10/774 G06V10/84 G06V10/82 G06K9/62 G06N3/04 G06N3/08

IPC结构图谱

G部——物理

G06

计算；推算或计数

G06Q

专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法；其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法

G06Q10/00

行政；管理

G06Q10/06

资源、工作流、人员或项目管理，例如组织、规划、调度或分配时间、人员或机器资源；企业规划；组织模型

法律状态

2022-04-05 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载