仅对英特尔可见 — GUID: onq1511463856934
Ixiasoft
产品终止通知
1. Intel® FPGA SDK for OpenCL™ Pro Edition最佳实践指南介绍
2. 查看您Kernel的report.html文件
3. OpenCL内核设计概念
4. OpenCL内核设计最佳实践
5. 分析(Profiling)您的内核来识别性能瓶颈
6. 提高单个Work-Item内核性能的策略
7. 提高NDRange内核数据处理效率的策略
8. 提高存储器访问效率的策略
9. 优化FPGA面积使用的策略
10. 优化英特尔 Stratix 10 OpenCL设计的策略
11. 提高主机应用程序性能的策略
12. Intel® FPGA SDK for OpenCL™ Pro版最佳实践指南存档
A. Intel® FPGA SDK for OpenCL™ Pro版最佳实践指南修订历史
仅对英特尔可见 — GUID: onq1511463856934
Ixiasoft
5.5.1. 分析(Profiling)Autorun内核
Autorun内核分析功能使您能够分析autorun内核。
标有autorun属性的内核称为autorun内核。Autorun内核不需要经过主机创建或启动就能开始执行,因此在内核显式入列(explicitly enqueued)之前,它已经在运行了,并会在完成运行后自动重新开始。有关autorun属性的更多信息,请参阅忽略主机和内核之间的通信硬件主题。
注意: Autorun内核分析功能不允许单独分析内核。设计中所有autorun内核的数据都是一次性读取的。
启用temporal profiling时,会在指定时间周期(temporal period)分析设计中的所有autorun内核。
禁用temporal profiling时,默认情况下,Profiler不提供任何分析信息,因为autorun内核永远不会结束运行。您可以调用主机二进制函数clGetProfileDataDeviceIntelFPGA来通知Profiler进行分析从而收集autorun profiler数据。可在执行过程中的任何时间点调用该函数。关于使用主机API调用进行分析的更多信息,请参阅分析Enqueued(入列)和Autorun内核。
注: 无论是否启用temporal,主机API调用都有效,但是在禁用temporal 时,需要获得autorun分析数据。