FT BLAS 源码
FT-BLAS:具有在线容错功能的高性能BLAS实现 文件组织 为了便于阅读,我们将每个子例程放在单独的文件夹中。 我们上传了6种双精度的Level-1 BLAS例程:DDOT,DAXPY,DNRM2,DSCAL,DROT,DROTM,3种Level-2的BLAS例程:DGEMV,DGER,DTRSV和4种Level-3的BLAS例程进行了测试。 硬件和软件要求 硬件:Intel Xeon Skylake或Cascade Lake处理器。 软件:Intel icc编译器-更新为能够编译SIMD内部函数和AVX512汇编代码。 您可能需要通过键入以下chmod +x xxx.sh使提供的shell脚本可执行: chmod +x xxx.sh然后再运行其中任何一个。 在测试之前,请务必设置线程号并从终端发送AVX-512指令。 export MKL_ENABLE_INSTRUCTION
用户评论