决策模型的训练方法、装置、计算机设备及存储介质

实质审查的生效

摘要

本申请实施例公开了一种决策模型的训练方法、装置、计算机设备及存储介质，属于人工智能领域。该方法包括：获取第一模型池，第一模型池中包含至少一个决策模型，决策模型用于指示虚拟角色在对战时采用的对战策略；在第n轮迭代过程中，将第i对战状态数据输入第n决策模型，得到第n决策模型输出的动作指令，动作指令用于指示第一客户端控制第一虚拟角色执行动作，并反馈第一虚拟角色执行动作后的收集到的第i+1对战状态数据；基于对战过程中的对战状态数据训练第n决策模型，得到第n+1决策模型；将第n+1决策模型添加至第一模型池。通过对战过程中的对战状态数据训练决策模型，提高决策模型的对战拟人性。

基本信息

专利标题：

决策模型的训练方法、装置、计算机设备及存储介质

专利标题（英）：

暂无

公开（公告）号：

CN114404976A

申请号：

CN202210067453.0

公开（公告）日：

2022-04-29

申请日：

2022-01-20

授权号：

暂无

授权日：

暂无

发明人：

刘若尘曹琪扬廖詩颺张良鹏曾政文

申请人：

腾讯科技（深圳）有限公司

申请人地址：

广东省深圳市南山区高新区科技中一路腾讯大厦35层

代理机构：

北京三高永信知识产权代理有限责任公司

代理人：

李文静

优先权：

CN202210067453.0

主分类号：

A63F13/55

IPC分类号：

A63F13/55 A63F13/67 A63F13/833 G06N20/00 G06N5/00

IPC结构图谱

A部——人类生活必需

A63

运动；游戏；娱乐活动

A63F

纸牌，棋盘或轮盘赌游戏；利用小型运动物体的室内游戏；视频游戏；其他类目不包含的游戏

A63F13/00

视频游戏，即使用二维或多维电子显示器的游戏

A63F13/55

根据游戏进程控制游戏中的人物或游戏对象

法律状态

2022-05-20 ：

实质审查的生效

IPC(主分类) : A63F 13/55
申请日 : 20220120

2022-04-29 ：

公开

注：本法律状态信息仅供参考，即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。

文件下载

暂无PDF文件可下载