深度学习模型训练方法、系统及介质
实质审查的生效
摘要
本发明公开了深度学习模型训练方法、系统及介质,其中方法包括以下步骤:对深度学习模型做可变维度变化处理并训练,得到多个满足不同算力平台部署需求的深度学习模型;其中,可变维度变化处理包括但不限于以下维度,也包括可变维度的组合变化:宽度变化处理、深度变化处理、卷积核大小变化处理、attention head的数量变化处理以及embedding维度变化处理。本发明实施例解决深度学习模型在不同算力平台上部署时碰到的重复训练难题,通过将深度学习网络结构和训练流程进行改造,实现一次训练即可满足不同算力平台部署的需求。
基本信息
专利标题 :
深度学习模型训练方法、系统及介质
专利标题(英):
暂无
公开(公告)号 :
CN114528975A
申请号 :
CN202210070754.9
公开(公告)日 :
2022-05-24
申请日 :
2022-01-20
授权号 :
暂无
授权日 :
暂无
发明人 :
钟成周颖婕邓星张泽熙
申请人 :
珠高智能科技(深圳)有限公司
申请人地址 :
广东省深圳市宝安区新安街道海滨社区N26区宝兴路21号万俊经贸大厦504
代理机构 :
广州嘉权专利商标事务所有限公司
代理人 :
张志辉
优先权 :
CN202210070754.9
主分类号 :
G06N3/04
IPC分类号 :
G06N3/04 G06N3/08
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06N
基于特定计算模型的计算机系统
G06N3/00
基于生物学模型的计算机系统
G06N3/02
采用神经网络模型
G06N3/04
体系结构,例如,互连拓扑
法律状态
2022-06-10 :
实质审查的生效
IPC(主分类) : G06N 3/04
申请日 : 20220120
申请日 : 20220120
2022-05-24 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载