Intel®高层次综合编译器专业版: 最佳实践指南

ID 683152
日期 12/04/2023
Public
文档目录

3.3.3.1. 数据并行性

传统的基于指令集架构(基于ISA)的加速器(例如,GPU)从向量化指令,以及通过在多个处理单元上执行相同的操作来获得数据并行。

相比之下,FPGA通过利用其立体架构来获得其性能。FPGA编译器不需要您将代码向量化。编译器会尽可能自动将您的代码向量化。

生成的硬件通过以下方式实现数据并行: