仅对英特尔可见 — GUID: kjz1584555149480
Ixiasoft
产品终止通知
1. Intel® FPGA SDK for OpenCL™ Pro Edition最佳实践指南介绍
2. 查看您Kernel的report.html文件
3. OpenCL内核设计概念
4. OpenCL内核设计最佳实践
5. 分析(Profiling)您的内核来识别性能瓶颈
6. 提高单个Work-Item内核性能的策略
7. 提高NDRange内核数据处理效率的策略
8. 提高存储器访问效率的策略
9. 优化FPGA面积使用的策略
10. 优化英特尔 Stratix 10 OpenCL设计的策略
11. 提高主机应用程序性能的策略
12. Intel® FPGA SDK for OpenCL™ Pro版最佳实践指南存档
A. Intel® FPGA SDK for OpenCL™ Pro版最佳实践指南修订历史
仅对英特尔可见 — GUID: kjz1584555149480
Ixiasoft
5.6. 性能数据类型
Intel® FPGA dynamic profiler for OpenCL™ 提供各种类型的性能数据和信息,您可以使用 Intel® VTune Profiler查看。
下表描述了这些信息类型:
列 | 描述 | 访问类型 |
---|---|---|
属性 | 存储器或者通道属性信息,例如存储器类型(局部或者全局)、相应存储器系统(DDR或者quad data rate (QDR,四倍数据传输))和读/写访问。 | 所有存储器和通道访问 |
Stall% | 存储器或者通道访问导致的流水线停顿的时间百分比。这是对存储器或者通道访问完成一个访问请求的能力的衡量。 | 所有存储器和通道访问 |
Occupancy% | 有效work-item执行存储器或者通道指令时,总体分析时间框架的百分比。 | 所有存储器和通道访问 |
Bandwidth | 存储器访问使用的平均存储器带宽,及其整体效率。 对于每个全局存储器访问,分配FPGA资源以从全局存储器系统获得数据。但是,内核程序使用的数据量可能少于所获取的数据。整体效率是总字节数的百分比,该总字节数是从内核程序使用的全局存储器系统获得。 |
全局存储器访问 |
Channel Depth 3 | 通道未空闲时,通道FIFO的占用情况(以字节为单位)通过以下方式计量:
|
所有通道访问 |
Idle 3 | 无有效work item执行或停顿的存储器或通道指令时,总体分析时间框架的百分比。 | 所有存储器和通道访问 |
注: 如果您的内核经过存储器优化来整合硬件资源并实现多个存储器操作,则可能无法获得每个内核操作的统计数据。一组统计数据映射到硬件中的整合点。
3 Intel® VTune Profiler将在未来发布的版本中显示此项信息。