一种基于4bit普通卷积计算的优化方法
公开
摘要

本发明提供一种基于4bit普通卷积计算的优化方法,本方法在完整的卷积计算的过程中,在算法最里层的一个循环中加入simd指令运算;在所述最里层的循环中通过加载数据simd指令加载数据,将数据加载后,数据一直在寄存器中不重复加载;在所述最里层的循环中,通过拷贝simd指令实现数据的重复使用;再通过乘法simd指令、选择simd指令和移位simd指令最终实现8个16bit数据存放到一个128位寄存器。所述方法使用的是一次加载16个数据,数据一次运算16个结果,所述方法每次加载的数据中的一个数据拷贝到simd指令的变量中,进行8bit的乘法simd指令计算,再进行转化16bit后,进行累加simd指令计算;这种乘法和累加是在算法的最内层循环中实现。方法简单,比纯使用C算法速度提升10‑20倍左右。

基本信息
专利标题 :
一种基于4bit普通卷积计算的优化方法
专利标题(英):
暂无
公开(公告)号 :
CN114581280A
申请号 :
CN202011372384.1
公开(公告)日 :
2022-06-03
申请日 :
2020-11-30
授权号 :
暂无
授权日 :
暂无
发明人 :
田凤彬于晓静
申请人 :
北京君正集成电路股份有限公司
申请人地址 :
北京市海淀区西北旺东路10号院东区14号楼一层A101-A113
代理机构 :
北京竹辰知识产权代理事务所(普通合伙)
代理人 :
聂鹏
优先权 :
CN202011372384.1
主分类号 :
G06T1/00
IPC分类号 :
G06T1/00  
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06T
一般的图像数据处理或产生
G06T1/00
通用图像数据处理
法律状态
2022-06-03 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
暂无PDF文件可下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332