用于压缩神经网络的方法和装置
实质审查的生效
摘要
本申请公开了一种用于压缩神经网络的方法和装置,其中该方法包括:获取待压缩神经网络,其包括J个待压缩运算层;对于第j个待压缩运算层使用Kj种不同的压缩率进行压缩,以生成Kj个运算支路;获取分别与Kj个运算支路对应的Kj个权重因子;使用Kj个运算支路替换待压缩运算层,产生替换后的神经网络;对替换后的神经网络进行前向传播,将Kj个运算支路的Kj个运算结果与Kj个权重因子进行加权求和作为第j个待压缩运算层的输出;对替换后的神经网络进行反向传播,基于替换后的神经网络相对于待压缩神经网络的模型损失计算Kj个权重因子的更新值;和对第j个待压缩运算层,将Kj个权重因子的更新值中最大者对应的运算支路确定为压缩后的第j个运算层。
基本信息
专利标题 :
用于压缩神经网络的方法和装置
专利标题(英):
暂无
公开(公告)号 :
CN114519423A
申请号 :
CN202011308961.0
公开(公告)日 :
2022-05-20
申请日 :
2020-11-20
授权号 :
暂无
授权日 :
暂无
发明人 :
董祯聂远飞冯欢
申请人 :
澜起科技股份有限公司
申请人地址 :
上海市徐汇区宜山路900号1幢A6
代理机构 :
北京市君合律师事务所
代理人 :
毛健
优先权 :
CN202011308961.0
主分类号 :
G06N3/08
IPC分类号 :
G06N3/08 G06N3/04
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06N
基于特定计算模型的计算机系统
G06N3/00
基于生物学模型的计算机系统
G06N3/02
采用神经网络模型
G06N3/08
学习方法
法律状态
2022-06-07 :
实质审查的生效
IPC(主分类) : G06N 3/08
申请日 : 20201120
申请日 : 20201120
2022-05-20 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载