此示例演示了仅 3D 有限差分模板计算的开放计算语言 (OpenCLTM) 实施。在 k 阶模板计算中,每个输出点都是 3k+1 输入点(每个方向上的 k 个相邻点)的函数。由于计算结构的原因,不同输出点之间存在大量数据重用,从而形成尝试最小化冗余内存访问的优化。
与传统 OpenCL 实施相比,本示例中的内核通过使用滑动体积计算模式(滑动窗口设计模式的 3D 模拟)来降低内存带宽要求,从而利用数据重用。可以在示例包中找到其他详细信息。
3D 有限差分计算性能
特性
- 高效的 3D 滑动体积
- 一个工作项目内核
下载
该设计示例提供 OpenCL 设备 (.cl) 和主机应用程序的源代码。为了编译主机应用程序,Linux* 包包含一个 Makefile,Windows* 包包含一个 Microsoft Visual Studio 2010 项目。
本示例提供以下下载:
该设计的使用受硬件参考设计许可协议中条款和条件的管理和约束。
软件和硬件要求
此设计示例需要以下工具:
- 英特尔® FPGA 软件 17.1 或更高版本
- 英特尔® FPGA SDK for OpenCL 17.1 或更高版本
- Linux:GNU Make 和 gcc
- Windows*:Microsoft Visual Studio 2010*
要下载英特尔设计工具,请访问 OpenCL 下载页面。对底层操作系统的要求与英特尔 FPGA SDK for OpenCL 的要求相同。
OpenCL 和 OpenCL 标识是苹果公司的商标,需获得 Khronos 的许可方能使用。
*产品基于已发布的 Khronos 规范,并已通过 Khronos 一致性测试流程。最新的一致性状态信息可以在 www.khronos.org/conformance 上找到。