一种基于CPU-FPGA内存共享的卷积神经网络加速器
授权
摘要
本发明公开了一种基于CPU‑FPGA内存共享的卷积神经网络加速器,其中:CPU处理子系统包括输入控制模块、配置参数生成模块和输出控制模块;输入控制模块接收和缓存像素数据和权重数据;配置参数生成模块控制配置参数;输出控制模块控制数据的传输;FPGA加速子系统包括片上存储模块、计算引擎模块和控制模块;片上存储模块用于数据的缓冲和读写访问;计算引擎模块对计算进行加速;控制模块控制片上存储模块对数据的读写操作,与计算引擎模块的数据交换和计算控制。本发明既能充分发挥FPGA的高并行度、高吞吐率和低功耗特点,同时又能充分利用CPU处理器灵活高效的数据处理特点,从而使得整个系统能够以较低的功耗,高效快速实现卷积神经网络的推理过程。
基本信息
专利标题 :
一种基于CPU-FPGA内存共享的卷积神经网络加速器
专利标题(英):
暂无
公开(公告)号 :
CN111626403A
申请号 :
CN202010408260.8
公开(公告)日 :
2020-09-04
申请日 :
2020-05-14
授权号 :
CN111626403B
授权日 :
2022-05-10
发明人 :
姜宏旭张永华李波刘晓戬林珂玉胡宗琦
申请人 :
北京航空航天大学
申请人地址 :
北京市海淀区学院路37号
代理机构 :
北京慕达星云知识产权代理事务所(特殊普通合伙)
代理人 :
曹鹏飞
优先权 :
CN202010408260.8
主分类号 :
G06N3/04
IPC分类号 :
G06N3/04 G06N3/063 G06N3/08 G06F9/54 G06F15/78
IPC结构图谱
G
G部——物理
G06
计算;推算或计数
G06N
基于特定计算模型的计算机系统
G06N3/00
基于生物学模型的计算机系统
G06N3/02
采用神经网络模型
G06N3/04
体系结构,例如,互连拓扑
法律状态
2022-05-10 :
授权
2020-09-29 :
实质审查的生效
IPC(主分类) : G06N 3/04
申请日 : 20200514
申请日 : 20200514
2020-09-04 :
公开
注:本法律状态信息仅供参考,即时准确的法律状态信息须到国家知识产权局办理专利登记簿副本。
文件下载
1、
CN111626403A.PDF
PDF下载