oneAPI DirectProgramming 源码
oneAPI直接编程 该存储库包含用于评估oneAPI直接编程的数据并行程序的集合。 每个程序均以CUDA,SYCL和OpenMP-4.5目标卸载编写。 英特尔:registered:DPC ++兼容性工具(DPCT)可以CUDA程序转换成在其中存储管理迁移所使用的显式和受限制的统一共享内存扩展(DPCT USM)或DPCT头文件(DPCT头)实现的SYCL程序。 实验 我们比较了Intel集成GPU上每个程序的SYCL,DPCT生成的和OpenMP实施的性能。 下面的性能结果是通过。 “入队总数”表示并行程序调用的低级OpenCL入队命令的总数。 这些入队命令包括“ clEnqueueNDRangeKernel”,“ clEnqueueReadBuffer”和“ clEnqueueWriteBuffer”。 主机计时是在CPU主机上执行OpenCL API功能的总经过时间,而设备计时是在GPU装置上执行Ope
下载地址
用户评论