1. 首页
  2. 数据库
  3. 其它
  4. AMDOpenCL大学课程(6)

AMDOpenCL大学课程(6)

上传者: 2021-02-23 21:21:39上传 PDF文件 522KB 热度 5次
本节主要讲述GPU的memory架构。优化基于GPUdevice的kernel程序时,我们需要了解很多GPU的memory知识,比如内存合并,bankconflit(冲突)等等,这样才能针对具体算法做一些优化工作。假定X是一个指向整数(32位整数)数组的指针,数组的首地址为0x00001232。一个线程要访问元素X[0],inttmp=X[0];假定memory总线宽度为256位(HD5870就是如此,即为32字节),因为基于字节地址的总线要访问memeory,必须和总线宽度对齐,也就是说按必须32字节对齐来访问memory,比如访问0x00000000,0x00000020,0x000000
用户评论