仅对英特尔可见 — GUID: mwh1391807509323
Ixiasoft
产品终止通知
1. Intel® FPGA SDK for OpenCL™ Pro Edition最佳实践指南介绍
2. 查看您Kernel的report.html文件
3. OpenCL内核设计概念
4. OpenCL内核设计最佳实践
5. 分析(Profiling)您的内核来识别性能瓶颈
6. 提高单个Work-Item内核性能的策略
7. 提高NDRange内核数据处理效率的策略
8. 提高存储器访问效率的策略
9. 优化FPGA面积使用的策略
10. 优化英特尔 Stratix 10 OpenCL设计的策略
11. 提高主机应用程序性能的策略
12. Intel® FPGA SDK for OpenCL™ Pro版最佳实践指南存档
A. Intel® FPGA SDK for OpenCL™ Pro版最佳实践指南修订历史
仅对英特尔可见 — GUID: mwh1391807509323
Ixiasoft
8.1. 优化存储器访问的常规指导
优化OpenCL™内核中的存储器访问可提高整体内核性能。
考虑尽可能实现以下优化存储器访问的技术:
- 如果您的OpenCL程序有一对内核(一个产生数据,另一个使用该数据),将这两个内核转换成单个内核来执行这两种功能。此外,此外实现辅助(helper)函数从逻辑上分离两个原始内核的功能。
FPGA实现偏爱一个较大的内核而不是单独的小内核。内核一致化(unification)使得从另一个内核中获取同一数据之前,不再需要先将从一个内核来的结果临时写入全局存储器。
- Intel® FPGA SDK for OpenCL™ Offline Compiler在FPGA中实现局部存储器与在GPU中非常不同。如果您的OpenCL内核包含避免特定于GPU局部存储器冲突的代码,请删除该代码,因为离线编译器生成的硬件会尽可能避免局部存储器冲突。