Parallel C Programs使用CUDA、OpenCL、MPI、OpenMP和pthreads的并行程序设计
并行C程序是挪威科技大学并行计算课程中的练习,帮助学生掌握并行计算的基本概念和技术。介绍了一个与矩阵相关的计算问题,其中涉及到MPI的应用。问题的基本描述是:给定一个二维像素网格,每个像素有一个灰度颜色(0到255之间的字节),并且有一个阈值和一些位置(种子)。如果相邻像素之间的颜色差异低于阈值,就将种子“生长”到这些像素,直到区域不再扩展。这个问题在多个练习中都得到了进一步的扩展,要求在并行环境下使用MPI进行实现。
此外,串行优化部分要求编写一个高效的稀疏矩阵向量乘法函数,要求通过实现优化版本的乘法来超越天真的实现。在此过程中,您还可以通过设计自定义的稀疏矩阵格式(使用struct
)来进一步优化性能。"
下载地址
用户评论