Intel® FPGA SDK for OpenCL™ Pro Edition: 最佳实践实践指南

ID 683521
日期 9/26/2022
Public
文档目录

8.1. 优化存储器访问的常规指导

优化OpenCL™内核中的存储器访问可提高整体内核性能。

考虑尽可能实现以下优化存储器访问的技术:

  • 如果您的OpenCL程序有一对内核(一个产生数据,另一个使用该数据),将这两个内核转换成单个内核来执行这两种功能。此外,此外实现辅助(helper)函数从逻辑上分离两个原始内核的功能。
    FPGA实现偏爱一个较大的内核而不是单独的小内核。内核一致化(unification)使得从另一个内核中获取同一数据之前,不再需要先将从一个内核来的结果临时写入全局存储器。

  • Intel® FPGA SDK for OpenCL™ Offline Compiler在FPGA中实现局部存储器与在GPU中非常不同。如果您的OpenCL内核包含避免特定于GPU局部存储器冲突的代码,请删除该代码,因为离线编译器生成的硬件会尽可能避免局部存储器冲突。