仅对英特尔可见 — GUID: mwk1597698386102
Ixiasoft
产品终止通知
1. Intel® FPGA SDK for OpenCL™ Pro Edition最佳实践指南介绍
2. 查看您Kernel的report.html文件
3. OpenCL内核设计概念
4. OpenCL内核设计最佳实践
5. 分析(Profiling)您的内核来识别性能瓶颈
6. 提高单个Work-Item内核性能的策略
7. 提高NDRange内核数据处理效率的策略
8. 提高存储器访问效率的策略
9. 优化FPGA面积使用的策略
10. 优化英特尔 Stratix 10 OpenCL设计的策略
11. 提高主机应用程序性能的策略
12. Intel® FPGA SDK for OpenCL™ Pro版最佳实践指南存档
A. Intel® FPGA SDK for OpenCL™ Pro版最佳实践指南修订历史
仅对英特尔可见 — GUID: mwk1597698386102
Ixiasoft
5.4. 减少分析时的面积资源使用
由于流水线中添加了各种性能计数器,在设计中引入profiling会导致大量面积资源使用。这样对于特别大的设计可能尤其不便,因为添加profiling性能计数器可能导致no fit错误。
要减少profiling占用的的面积资源量,您可以选择使用shared性能计数器来进行分析(profile)。该profiling模式允许计数器由多个设计运行中的各种信号共享,以减少添加到设计中的性能计数器的数量。“运行时”期间,Profiler Runtime Wrapper 运行应用程序4次,其中,对于每次运行,计数器count(计数)一个不同的信号。
注: 您必须仅调用Profiler Runtime Wrapper一次。
要打开共享性能计数器分析模式,请执行这些步骤:
- 您的aoc编译期间将-profile-shared-counters标记和-profile标记包含其中。
- 使用Profiler Runtime Wrapper运行您的设计时,请将-sc标记包含其中。
如果没有-sc标记,您的设计仅这样运行一次,因为在第一个共享信号后,您将缺乏所有数据。
警告:共享性能计数器分析模式仅适用于确定性好的内核和设计。因为主机应用程序和设计都需要运行多次来收集所有数据,非确定的(non-deterministic)设计会导致共享数据难以组合,并且可能难以确定临时出现问题的位置。