基于FPGA的深度学习目标检测系统的设计与实现

上传:yilu87461 浏览: 22 推荐: 0 文件:PDF 大小:530.78KB 上传时间:2020-11-10 20:12:21 版权申诉
针对当前深度学习目标检测算法计算复杂度高和内存需求大等问题,设计并实现了一种基于FPGA的深度学习目标检测系统。设计对应YOLOv2-Tiny目标检测算法的硬件加速器,对加速器各模块的处理时延建模,给出卷积计算模块的详细设计。实验结果表明,与CPU相比,CPU+FPGA的异构系统是双核ARM-A9能效的67.5倍,Xeon的94.6倍;速度是双核ARM-A9的84.4倍,Xeon的5.5倍左右。并且,当前设计在性能上超过之前的工作。
上传资源
用户评论