Intel® FPGA SDK for OpenCL™ Pro Edition: 最佳实践实践指南

ID 683521
日期 9/26/2022
Public
文档目录

7. 提高NDRange内核数据处理效率的策略

请参考如下内核代码:

__kernel void sum (__global const float * restrict a,
                   __global const float * restrict b,
                   __global float * restrict answer)
{
    size_t gid = get_global_id(0);

    answer[gid] = a[gid] + b[gid];
}

该内核添加数组ab,一次添加一个单元。每个work-item负责添加两个单元,各来自一个数组,并将求和结果存储到数组answer中。如果不进行优化,该内核对每个work-item执行一次加法。

要最大程度提高您的OpenCL™内核,请考虑实现使用的优化技术来提高数据处理的效率。