optimal_unified_memory 源码
此存储库包含重现我们名为“ XPlacer:指导GPU统一内存的最佳使用的框架”的论文的实验所需的指令,脚本和代码。 主要步骤概述 目标是确定哪种内存放置策略最适合使用CUDA内核的给定数据对象(数组)。 我们使用不同的内存放置策略准备内核的代码变体,输入数据大小并全部运行。 收集性能和配置文件信息,并将其制作为带标签的训练数据集。 之后,将构建机器学习模型并将其用于指导新程序的内存放置。 步骤1.收集内核级和对象级功能的基准指标 步骤2.合并内核和对象级功能 步骤3.标记训练数据 步骤4.生成模型 步骤5.使用模型预测新内核的对象策略 先决条件: 运行Ubuntu 18.04 LTS的GPU机器 p3.2xlarge:带有Volta GPU的AWS vm实例 Nvidia CUDA工具包10.2:nvcc --version,V10.2.89 python3和python3-pan
用户评论