英特尔® Agilex™ M 系列 FPGA 打破内存带宽瓶颈,满足多应用场景需求

作者

Laura Leon

产品营销工程师 英特尔公司

  • 在网络和数据中心领域,数据流量大幅增加。内存带宽的提升速度跟不上互连速度的发展,从而导致内存瓶颈的出现。英特尔® Agilex™ M 系列 FPGA 集合高逻辑结构密度和灵活的内存选择方案于一身,成为数字货币、下一代网络防火墙、800 GbE 测试仪和 8K 视频处理等高内存带宽应用的理想选择。

author-image

作者

英特尔® Agilex™ FPGA 产品家族再添新成员:采用高逻辑结构密度、封装 HBM2e 内存并支持 DDR5 接口的 M 系列设备,可满足各种高内存带宽应用的需求。

内容摘要

在网络和数据中心领域,数据流量大幅增加。内存带宽的提升速度跟不上互连速度的发展,从而导致内存瓶颈的出现。要缓解内存瓶颈,必须提高内存带宽和计算效率。

英特尔® Agilex™ M 系列 FPGA 集合高逻辑结构密度和灵活的内存选择方案(例如 HBM2e、DDR5 和英特尔® 傲腾™ 持久内存)于一身,妥善实现容量、能效和性能的平衡,满足各种由内存驱动的工作负载的要求。这些特性使英特尔® Agilex™ M 系列 FPGA 成为数字货币、下一代网络防火墙、800 GbE 测试仪和 8K 视频处理等高内存带宽应用的理想选择。

网络/通信

下一代防火墙 (NGFW) 等网络应用需要高性能数据路径、深度内存缓冲区和高带宽 连接。这些物理要求连同越来越多的软件处理功能已经超出了非 FPGA 部署的功能极限。英特尔® Agilex™ M 系列 FPGA 具备由 DDR5 和 HBM2e 组成的强大内存层次结构—— 一种能够满足高速数据移动需求的硬核内存片上网络 (NoC),同时还支持新一代以太网和 PCIe 连接标准,能够满足上述这些硬件要求。基于英特尔 7 制程工艺的可编程逻辑支持从 CPU 卸载以往基于软件的计算密集型工作负载。这些功能包括高性能深度包检测、 复杂访问控制列表处理以及传输层安全 (TLS)。此外,FPGA 还可以实现数 Gb 三元内容可寻址存储器 (TCAM) 部署,用于 n 元组访问控制列表和复杂的搜索功能。

英特尔® Agilex™ M 系列 FPGA 既可以部署在虚拟化网络中,也可以部署在非虚拟化的 NGFW 网络中。就虚拟化网络而言,使用配备 SmartNIC 的商用现货服务器或配备英特尔® Agilex™ M 系列 FPGA 的基础设施处理器 (IPU) 就可以替代基于物理设备的硬件。而对非虚拟化网络来说,在配备英特尔® Agilex™ M 系列 FPGA 的专用卡上即可实现 NGFW 部署。无论上述哪种情况,都可以从英特尔® Agilex™ M 系列 FPGA 的逻辑结构优势中获益。

图 1. 使用英特尔® Agilex™ M 系列 FPGA 实现下一代防火墙部署的示意图

广播

目前,4K 超高清是电视、相机和视频流的标配。8K 超高清时代即将到来,广播基础设施必须对组件和系统进行扩展,从而能够支持 8K 分辨率。8K 的像素分辨率为 7680 x 4320,像素是 4K 的 4 倍,因此需要 4 倍的内存和数据处理带宽。高端 8K 相机等应用更是复杂,需要将元数据添加到每个像素才能实现高清速率 (HDR)、处理传感器数据和进行色彩校正等等。将海量图像传感器管道传输到处理设备需要使用 100 G 以太网、12 G 串行数字接口 (SDI)、PCIe、DisplayPort 或 HDMI 等协议的高带宽连接,显示或存储处理过的数据也是如此。

英特尔® Agilex™ M 系列 FPGA 能够通过 DDR5 和 HBM2e 实现 1 TB/s 的内存带宽,用以支持 8K 数据处理,并通过集成式收发器处理高带宽数据传输。另外,英特尔® Agilex™ FPGA 还支持对现代广播应用进行重新配置。这样一来,制造商就能够根据新标准快速添加新功能,实现演进,从而加快产品上市速度并使产品能够在更长时间内保持竞争力。

图 2. 使用英特尔® Agilex™ M 系列 FPGA 的 8K 视频应用示意图

测试和测量

当前,以太网速度正呈指数级增加,使得以太网测试需求激增。 400 GbE 还没有完全普及,800 GbE 已经在开发当中。客户需要 能够支持各种网速和协议的测试仪。高性能 800 GbE 测试仪需要:
 

  • 支持将大量数据馈入测试仪的高带宽内存
  • 能够以高达 800 MHz 的时钟频率处理数据的高性能逻辑结构
  • 有足够的收发器,以实现多个 400 G 或 800 G 端口配置。

英特尔® Agilex™ M 系列 FPGA 能够满足上述所有三个性能指标: 它支持外部 DDR4、DDR5 和 LPDDR5 存储器进行数据包缓冲; 它的逻辑结构支持以 1,024 位、大约 800 MHz 的频率实现 800 Gbps 以太网部署,而不是以 2,048 位、大约 400 MHz 的频率来实现;它拥有多达 72 个收发器,可以自定义任意 400/800 G 端口配置组合。此外,由于设备利用率降低,动态功耗也随之降低, 而高时钟频率则使产品能够用于尺寸更小的设备。英特尔® Agilex™ M 系列 FPGA 支持 800 GbE 测试,反过来又将促进下一代设备的设计和开发。

图 3. 800 GbE 测试仪示意图

高内存带宽是人工智能 (AI)、网络处理、数据分析和数字货币等 常见应用的必备要求。通过深入了解数字货币你会发现,许多数字货币算法使用内存困难型循环来抵制 ASIC 并增强去中心化。内存困难型算法通常会使用循环,在循环中来自一个位置的存储 内容与来自其他位置的存储内容进行多次散列计算。这种循环 本质上是一个内存带宽测试。利用 FPGA 设计来挖掘这些代币的 工程师需要非常高的可用内存带宽和足够的容量来满足挖掘算法 的要求。该内存可以高达数 GB,因为尺寸太大而无法装入 FPGA 嵌入式存储器模块中。英特尔® Agilex™ M 系列 FPGA 使用封装 HBM2e 内存,可以满足这些需求。

在数字货币中,电力和余热散热的成本可谓数目巨大。那么高能效就可以直接转化为盈利能力。英特尔® Agilex™ M 系列 FPGA 采用封装 HBM2e 内存,可提供超高带宽以及比独立解决方案更低的功耗。对于许多内存困难型算法而言,FPGA 中的逻辑资源是不受限制的。要提高算法效率,可以将非内存困难型挖掘算法 加载到空闲的 FPGA 逻辑结构中,同时让主机使用高带宽内存 (HBM2e) 和更少的逻辑资源运行,根据盈利能力的变化来进行切换。

图 4. 利用 HBM2e 实施内存困难型算法,同时在 FPGA 逻辑结构中运行辅助算法

结论

迅猛增长的数据量需要能够处理海量数据的设备。与内存带宽技术的提升速度相比,数据传输速度的提升要大得多,因此造成内存瓶颈,导致现有内存无法满足应用需求。解决内存瓶颈问题需要升级内存带宽和计算效率。 

英特尔® Agilex™ M 系列 FPGA 具有多种独特的功能,可以满足 不断增加的内存带宽和计算效率需求。它支持包括 HBM2e、 DDR5、LPDDR5 和英特尔® 傲腾™ 持久内存在内的多种高性能内存协议,因此形成了广泛的内存层次,可以满足各种系统要求。硬核内存片上网络可确保 HBM2e 内存与逻辑结构之间进行高效内存事务处理。英特尔® Agilex™ M 系列 FPGA 作为第一款基于 英特尔 7 制程工艺构建的 FPGA,具备高逻辑密度,与 7 纳米 FPGA 其他产品相比,逻辑结构性能功耗比提高了 2 倍以上。除此之外, 这款支持 HBM2e 的 FPGA 还支持 PCIe Gen5、116 G 收发器和硬核浮点数字信号处理 (DSP),这些功能使英特尔® Agilex™ M 系列 FPGA 成为高内存带宽应用的理想解决方案。

了解更多