Intel® FPGA SDK for OpenCL™ Pro Edition: 最佳实践实践指南

ID 683521
日期 9/26/2022
Public
文档目录

5.6. 性能数据类型

Intel® FPGA dynamic profiler for OpenCL™ 提供各种类型的性能数据和信息,您可以使用 Intel® VTune Profiler查看。

下表描述了这些信息类型:

表 18.  信息数据类型
描述 访问类型
属性 存储器或者通道属性信息,例如存储器类型(局部或者全局)、相应存储器系统(DDR或者quad data rate (QDR,四倍数据传输))和读/写访问。 所有存储器和通道访问
Stall% 存储器或者通道访问导致的流水线停顿的时间百分比。这是对存储器或者通道访问完成一个访问请求的能力的衡量。 所有存储器和通道访问
Occupancy% 有效work-item执行存储器或者通道指令时,总体分析时间框架的百分比。 所有存储器和通道访问
Bandwidth 存储器访问使用的平均存储器带宽,及其整体效率。

对于每个全局存储器访问,分配FPGA资源以从全局存储器系统获得数据。但是,内核程序使用的数据量可能少于所获取的数据。整体效率是总字节数的百分比,该总字节数是从内核程序使用的全局存储器系统获得。

全局存储器访问
Channel Depth 3

通道未空闲时,通道FIFO的占用情况(以字节为单位)通过以下方式计量:

  • Average Channel Depth以已测量的样本时间片(time-slice)来测量通道的平均占用量。
  • Maximum Channel Depth测量通道的填充水平,指示样本时间片(time-slice)中通道的最大占用量。
所有通道访问
Idle 3 无有效work item执行或停顿的存储器或通道指令时,总体分析时间框架的百分比。 所有存储器和通道访问
注: 如果您的内核经过存储器优化来整合硬件资源并实现多个存储器操作,则可能无法获得每个内核操作的统计数据。一组统计数据映射到硬件中的整合点。
3 Intel® VTune Profiler将在未来发布的版本中显示此项信息。