基于向量指令加速计算的Winograd卷积实现方法
授权
摘要

本发明公开了基于向量指令加速计算的Winograd卷积实现方法,包括如下步骤:S1,构建寄存器分块策略,在CPU上的Winograd卷积实现过程中,原始数据转换到Winograd数据域时,对中间缓冲的数据进行向量分块和寄存器分块;S2,构建内存数据布局策略,将Winograd卷积的原始数据和中间缓冲的数据在内存上进行排列,相对于矩阵乘法的最优性,对中间缓冲的数据布局,将Winograd分块维度安排到更内层的位置;S3,构建cache分块搜索,根据CPU硬件参数和卷积参数确定的小范围内,搜索cache分块的性能最优解,并将其与对应的卷积参数一起保存,后续通过卷积参数直接采用该性能最优解。

基本信息
专利标题 :
基于向量指令加速计算的Winograd卷积实现方法
专利标题(英):
暂无
公开(公告)号 :
CN113835758A
申请号 :
CN202111412784.5
公开(公告)日 :
2021-12-24
申请日 :
2021-11-25
授权号 :
CN113835758B
授权日 :
2022-04-15
发明人 :
曾令仿陈晓锋陈志广
申请人 :
之江实验室
申请人地址 :
浙江省杭州市余杭区文一西路1818号人工智能小镇10号楼
代理机构 :
杭州浙科专利事务所(普通合伙)
代理人 :
孙孟辉
优先权 :
CN202111412784.5
主分类号 :
G06F9/30
IPC分类号 :
G06F9/30  G06F9/50  G06N3/04  G06N3/063  
相关图片
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06F
电数字数据处理
G06F9/00
程序控制装置,例如,控制单元
G06F9/06
应用存入的程序的,即应用处理设备的内部存储来接收程序并保持程序的
G06F9/30
与执行机器指令相关的设计,例如指令译码
法律状态
2022-04-15 :
授权
2022-01-11 :
实质审查的生效
IPC(主分类) : G06F 9/30
申请日 : 20211125
2021-12-24 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
1、
CN113835758A.PDF
PDF下载
  • 联系电话
    电话:023-6033-8768
    QQ:1493236332
  • 联系 Q Q
    电话:023-6033-8768
    QQ:1493236332
  • 关注微信
    电话:023-6033-8768
    QQ:1493236332
  • 收藏
    电话:023-6033-8768
    QQ:1493236332