1. 首页
  2. 课程学习
  3. 3G/移动开发
  4. 嵌入式系统/ARM技术中的如何使用FPGA加速机器学习算法?

嵌入式系统/ARM技术中的如何使用FPGA加速机器学习算法?

上传者: 2020-10-17 01:50:35上传 PDF文件 94.82KB 热度 10次
当前,AI因为其CNN(卷积神经网络)算法出色的表现在图像识别领域占有举足轻重的地位。基本的CNN算法需要大量的计算和数据重用,非常适合使用FPGA来实现。上个月,Ralph Wittig(Xilinx CTO Office的卓越工程师) 在2016年OpenPower峰会上发表了约20分钟时长的演讲并讨论了包括清华大学在内的中国各大学研究CNN的一些成果。 在这项研究中出现了一些和CNN算法实现能耗相关的几个有趣的结论: 1限定使用片上Memory; 2使用更小的乘法器; 3进行定点匹配:相对于32位定点或浮点计算,将定点计算结果精度降为16位。如果使用动态量化,8位
下载地址
用户评论