仅对英特尔可见 — GUID: gmw1597765152886
Ixiasoft
产品终止通知
1. Intel® FPGA SDK for OpenCL™ Pro Edition最佳实践指南介绍
2. 查看您Kernel的report.html文件
3. OpenCL内核设计概念
4. OpenCL内核设计最佳实践
5. 分析(Profiling)您的内核来识别性能瓶颈
6. 提高单个Work-Item内核性能的策略
7. 提高NDRange内核数据处理效率的策略
8. 提高存储器访问效率的策略
9. 优化FPGA面积使用的策略
10. 优化英特尔 Stratix 10 OpenCL设计的策略
11. 提高主机应用程序性能的策略
12. Intel® FPGA SDK for OpenCL™ Pro版最佳实践指南存档
A. Intel® FPGA SDK for OpenCL™ Pro版最佳实践指南修订历史
仅对英特尔可见 — GUID: gmw1597765152886
Ixiasoft
5.5. 时间(Temporal)性能集合
运行您的主机应用程序期间,Profiler以给定采样速率n收集性能计数器数据。在n个周期后,Profiler收集性能计数器数据并且输出profile.mon监控文件。
- 您可以通过设置Profiler Runtime Wrapper的-period标记来控制Profiler计数器的采样率。该指定周期是分析样本之间内核流水线时钟周期的最小数。如果您未设置周期,则默认行为是尽可能频繁地进行分析(profile)。
注: 对于特别大或长时间运行的设计,默认时间(temporal)周期生成的数据量可能会导致profile.mon和profile.json文件非常大。要减小该文件大小,请增加采样周期或则关闭temporal profiling(时序校准)。
- 要关闭temporal profiling并仅在内核完成执行后才收集性能数据,您可以设置Profiler Runtime Wrapper的-no-temporal标记。
- 如果您禁用了temporal profiling,Profiler不会自动收集autorun内核的分析信息,因为autorun内核永远不会完成。您可以使用主机API调用clGetProfileDataDeviceIntelFPGA,从autorun内核获得profiling数据。有关触发profiling,使用您主机应用程序的更多信息,请参阅Intel FPGA SDK for OpenCL Pro版:编程指南中的内核执行期间收集分析数据。
注: 如果您仅在执行的末尾收集性能数据,则该数据是内核整体执行的平均表示。