我是靠谱客的博主 听话睫毛,最近开发中收集的这篇文章主要介绍编写kernel,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

1、kernel以关键字__kernel开始,返回类型必须为void。
2、像c函数一样要求必须制定指针所指向的地址空间。
3、buffer可以声明为全局内存或者常量内存。
4、image被分配到全局内存,可以选择性的访问限定符( _ _read_only , _ _write_only , 以及 __read_write).
5、__local限定符用来声明一段内存,供workgroup中所有work-item共享。
6、当kernel参数声明为局部指针时,如__local float* shareData , 它所指向的数组将有整个workgroup共享。
也就是说,每个workgroup将新建一个具有64个元素的数组,workgroup中所有work-item都可以访问它。
7、声明本地内存分配的另一种方法是在kernel范围级别声明一个变量:

__kernel void akernel(...){
__local float shareData[32];
...
}

8、针对Opencl设备(尤其是GPU)进行编程时,将单个work-item或同一个workgroup内多个work-item中多次使用的数据缓存到本地内存(具有时间局部性的数据)可能会提高性能。

9、开发某个kernel时,我们通过显示的将全局内存指针赋给本地内存指针来实现

__kernel void cache(
__global float* data,
__local float* sharedData){
int globalId = get_global_id(0);
int localId = get_local_id(0);
shareData[localId] = data[globalId];
....
}

一旦work-item执行完成,其状态信息和使用的本地内存都是临时的,如果需要报讯计算结果,必须将结果传回到全局内部。

最后

以上就是听话睫毛为你收集整理的编写kernel的全部内容,希望文章能够帮你解决编写kernel所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(58)

评论列表共有 0 条评论

立即
投稿
返回
顶部