Intel® FPGA SDK for OpenCL™ Pro Edition: 最佳实践实践指南

ID 683521
日期 9/26/2022
Public
文档目录

6.1. 根据优化报告反馈解决单个Work-Item内核依赖项

在许多情况下,将您的OpenCL™应用程序设计成单个work-item内核就足以最限度提高性能,而无需执行其它优化步骤。 为了进一步改善单个work-item内核的性能,您可以通过解决优化报告中确认的依赖关系来进行优化。
提示: 如果您在找寻 Intel® oneAPI DPC++/C++ Compiler的具体详情,请参阅 Intel® oneAPI Toolkits的FPGA优化指南中的单个Work-item内核小节。

以下流程图概述了您可以用来迭代设计并优化单个work-item内核的方法。有关 Intel® FPGA SDK for OpenCL™ Emulator和Profiler的使用信息,请参阅 Intel® FPGA SDK for OpenCL™ 编程指南中的仿真和调试您的OpenCL内核以及分析您的OpenCL内核小节分别进行了解。有关 Intel® FPGA dynamic profiler for OpenCL™ GUI和profiling信息,请参阅分析您的内核以确认性能瓶颈小节。

Intel® 建议使用以下优化选项来解决单个work-item内核循环携带的依赖项,适用顺序为:删除、松弛、简化并转移到局部存储器。

图 75. 优化单个Work-Item内核的工作流程