1. 首页
  2. 考试认证
  3. 其它
  4. SIMD_Benchmarking 基本矩阵和向量运算的性能比较。参考与x86 SIMD内在函数(SSE、AVX(1282...

SIMD_Benchmarking 基本矩阵和向量运算的性能比较。参考与x86 SIMD内在函数(SSE、AVX(1282...

上传者: 2024-07-18 13:46:40上传 ZIP文件 9.55KB 热度 43次

SIMD基准测试测试基本矩阵和向量运算与其SIMD对应物的相对性能。每个操作的时间平均超过10000次运行。使用随机单精度浮点数的4x4矩阵或4D向量。对AVX 128位(XMM)和256位(YMM)寄存器执行的单独计算。 AVX2/FMA3(128位)指令集(融合乘加)需要Intel Haswell CPU。所有操作都经过了相当大的优化。SIMD矩阵乘法使用线性组合方法。在带有Intel i5-4278u 2.6 GHz双核Haswell CPU的2014 rMBP上进行测试。操作系统:在VMWare Fusion 7上运行的Windows 8.1。使用MSVC++2012编译: x64 mode 、 /arch:AVX 、 /fp:Fast通过__rdtsc()在CPU时钟周期中计时。

相关的矩阵运算在各种编程语言中都有实现。以下是一些有用的资源:

  1. 向量矩阵运算与应用——PPT模板下载

向量矩阵运算与应用

  1. 向量与矩阵的基本运算

  2. 矩阵运算程序

这些资源可以帮助您进一步理解和实现各种矩阵运算,提升程序性能。

下载地址
用户评论