决策模型的训练方法、装置、计算机设备及存储介质
实质审查的生效
摘要
本申请实施例公开了一种决策模型的训练方法、装置、计算机设备及存储介质,属于人工智能领域。该方法包括:获取第一模型池,第一模型池中包含至少一个决策模型,决策模型用于指示虚拟角色在对战时采用的对战策略;在第n轮迭代过程中,将第i对战状态数据输入第n决策模型,得到第n决策模型输出的动作指令,动作指令用于指示第一客户端控制第一虚拟角色执行动作,并反馈第一虚拟角色执行动作后的收集到的第i+1对战状态数据;基于对战过程中的对战状态数据训练第n决策模型,得到第n+1决策模型;将第n+1决策模型添加至第一模型池。通过对战过程中的对战状态数据训练决策模型,提高决策模型的对战拟人性。
基本信息
专利标题 :
决策模型的训练方法、装置、计算机设备及存储介质
专利标题(英):
暂无
公开(公告)号 :
CN114404976A
申请号 :
CN202210067453.0
公开(公告)日 :
2022-04-29
申请日 :
2022-01-20
授权号 :
暂无
授权日 :
暂无
发明人 :
刘若尘曹琪扬廖詩颺张良鹏曾政文
申请人 :
腾讯科技(深圳)有限公司
申请人地址 :
广东省深圳市南山区高新区科技中一路腾讯大厦35层
代理机构 :
北京三高永信知识产权代理有限责任公司
代理人 :
李文静
优先权 :
CN202210067453.0
主分类号 :
A63F13/55
IPC分类号 :
A63F13/55 A63F13/67 A63F13/833 G06N20/00 G06N5/00
IPC结构图谱
A
A部——人类生活必需
A63
运动;游戏;娱乐活动
A63F
纸牌,棋盘或轮盘赌游戏;利用小型运动物体的室内游戏;视频游戏;其他类目不包含的游戏
A63F13/00
视频游戏,即使用二维或多维电子显示器的游戏
A63F13/55
根据游戏进程控制游戏中的人物或游戏对象
法律状态
2022-05-20 :
实质审查的生效
IPC(主分类) : A63F 13/55
申请日 : 20220120
申请日 : 20220120
2022-04-29 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载