仅对英特尔可见 — GUID: vcg1470763338276
Ixiasoft
产品终止通知
1. Intel® FPGA SDK for OpenCL™ Pro Edition最佳实践指南介绍
2. 查看您Kernel的report.html文件
3. OpenCL内核设计概念
4. OpenCL内核设计最佳实践
5. 分析(Profiling)您的内核来识别性能瓶颈
6. 提高单个Work-Item内核性能的策略
7. 提高NDRange内核数据处理效率的策略
8. 提高存储器访问效率的策略
9. 优化FPGA面积使用的策略
10. 优化英特尔 Stratix 10 OpenCL设计的策略
11. 提高主机应用程序性能的策略
12. Intel® FPGA SDK for OpenCL™ Pro版最佳实践指南存档
A. Intel® FPGA SDK for OpenCL™ Pro版最佳实践指南修订历史
仅对英特尔可见 — GUID: vcg1470763338276
Ixiasoft
5.1. 分析您内核的最佳实践
Intel® 建议在分析您的OpenCL内核时,请遵循如下最佳实践。
- 开发期间,在您的aoc命令中包含-profile Intel® FPGA SDK for OpenCL™ Offline Compiler命令选项,以将性能计数器插入到您的内核中。
- 从本地文件夹运行主机应用程序来减少分析程序(profiler)开销。避免从远程或NAS文件夹运行主机。
- 请确保内核运行时间长于20毫秒(ms)。否则,就会被读取主机Profiler性能开销的数据覆盖。
- 了解所有加载和存储操作以及通道在数据流中是如何连接的。