仅对英特尔可见 — GUID: mwh1391807498429
Ixiasoft
产品终止通知
1. Intel® FPGA SDK for OpenCL™ Pro Edition最佳实践指南介绍
2. 查看您Kernel的report.html文件
3. OpenCL内核设计概念
4. OpenCL内核设计最佳实践
5. 分析(Profiling)您的内核来识别性能瓶颈
6. 提高单个Work-Item内核性能的策略
7. 提高NDRange内核数据处理效率的策略
8. 提高存储器访问效率的策略
9. 优化FPGA面积使用的策略
10. 优化英特尔 Stratix 10 OpenCL设计的策略
11. 提高主机应用程序性能的策略
12. Intel® FPGA SDK for OpenCL™ Pro版最佳实践指南存档
A. Intel® FPGA SDK for OpenCL™ Pro版最佳实践指南修订历史
仅对英特尔可见 — GUID: mwh1391807498429
Ixiasoft
4. OpenCL内核设计最佳实践
随着 Intel® FPGA SDK for OpenCL™ Offline Compiler技术的使用,您无需更改内核来适应固定的硬件架构。反而离线编译器会自动优化硬件架构以适应您的内核要求。
通常,您应该首先优化针对单个计算单元的内核。优化此计算单元后,通过增加计算单元的数量来调整硬件以填充FPGA其余的部分从而提高性能。请参阅多个计算单元了解更多详细信息。内核的面积使用与硬件编译所需的时间相关。因此,为避免长时间等待硬件编译,请首先关注于单个计算单元上的内核性能优化。
对优化内核性能的重要最佳实践,包括数据处理和存储器访问优化,请通读本指南的其余章节。本章的其余部分将介绍下列其他最佳实践。在创建您的内核时,请考虑如下设计实践是否适用。