cuda_interp:加速3D NetCDF数据的插值 源码
CUDA NetCDF Interp 该工具的目的是使用NVidia GPU加速3D数据插值。 目前,内核只是一个简单的三线性插值,但可能还会更多。 安装 使用install.sh使用CMake构建和安装。 默认情况下,这会将项目安装到build / bin中。 这是通过DCMAKE_INSTALL_PREFIX参数控制的。 实施须知 网格和块结构 由于CudaInterp解决了3D插值问题,因此采用了3D CUDA块/网格结构。 在本实现中,简单地使用1D块结构并沿1D数组计算点实际上会更有效。 但是,对于将来将使用共享内存合并来加载输入数据的内核,最好具有内插问题的3D图片,因此在此阶段我们接受一些浪费。 我们使用Cuda Occupancy API查询目标设备的最佳(标量)块大小,然后通过质因子分解估计最佳3D块尺寸。 NetCDF接口 使用NetCDF C接口(与C ++相反)
用户评论