第五代英特尔® 至强® 处理器内置多种加速器,助力加速科学计算

借助内置英特尔® 加速引擎的第五代英特尔® 至强® 处理器,加速科学计算,更快获取洞察。

概述

  • 每路内核数量增至多达 64,内存带宽提升达 1.16 倍,三级缓存容量提升达 3 倍,每路配备多达 80 条 PCIe 5.0 通道,支持 CXL Type 1、Type 2 和 Type 3。与上一代产品相比,科学计算平均性能提升多达 1.22 倍;将 LAMMPS、ANSYS LS-DYNA 和 ANSYS FLUENT 等科学计算应用性能提升多达 1.42 倍;助力生命科学、材料科学、制造业和金融服务业等行业将科学计算应用性能提升多达 1.3 倍。

author-image

作者

与上一代产品相比:第五代英特尔® 至强® 处理器的平均科学计算性能提升高达 1.22 倍, 可以帮助企业显著提升基础设施的价值1;平均每瓦性能提升高达 1.08 倍,有助于降低成本和碳足迹1。其基于硬件的安全功能和可扩展的特性,还可帮助企业和机构提升系统的正常运行时间以及构建面向未来的 IT 基础设施。本代处理器还提供面向科学计算与 AI 融合工作负载的通用 CPU 平台,有助于加速价值实现。

虽然传统的科学计算系统是为单体应用设计的,但它正在向更灵活的方向转变,以应对更多样化的需求。同时,这种演变也让从业者更加重视开放标准的软硬件,以促使各类解决方案和工作负载能够共存,并在共享系统上实现更出色的结果。在未经优化的硬件上部署 AI 工作负载,可能无法实现每瓦性能目标。开放式跨架构编程模型可以避免为多种架构和异构加速器重新编码,其重要性日益凸显。这些模型还有助于避免专有软件绑定风险,延长科学应用的寿命,更好地应对未来需求。

第五代英特尔® 至强® 处理器依然受英特尔® 软硬件生态系统的支持,能够助力加速传统科学计算以及科学计算与 AI 融合工作负载,更快获取价值。本代处理器非常适合具有高级迁移学习或调优要求的中小型专用模型。针对深度学习和通用工作负载的基于硬件的加速技术可为融合科学计算应用提供实时吞吐量和更低时延。

与第四代英特尔® 至强® 处理器相比,第五代英特尔® 至强® 处理器每路提供多达 64 个高性能内核(128 条线程),三级缓存容量增加高达 3 倍3。这些变化可提升诸如电子设计自动化 (EDA) 和计算流体动力学 (CFD) 等要求严苛且高度并行工作负载的处理器内核利用率。第五代英特尔® 至强® 处理器提供速率高达 5600 MT/s 的 DDR5 内存4 以及多达 80 条 PCIe 5.0 通道,I/O 功能更强大,可优化时延并持续向内核传输数据。

多方面助力科学计算平台性能均衡提升

  • 高吞吐量、高能效执行资源:与上一代产品相比,每路内核数由 60 提升至 64,平均科学计算性能提升高达 1.22 倍1
  • 增强的内存子系统:与第四代英特尔® 至强® 可扩展处理器相比,第五代英特尔® 至强® 处理器 内存带宽提升高达 1.16 倍5,6,三级缓存容量提升高达 3 倍3
  • 高速、高容量 I/O每路多达 80 条 PCIe 5.0 通道,采用英特尔® UltraPath Interconnect (英特尔® UPI)2.0,速度高达 20 GT/s,并支持 Compute Express Link (CXL) Type 1、 Type 2 和 Type 3。

第五代英特尔® 至强® 处理器与第四代英特尔® 至强® 处理器在软件和引脚上兼容,升级后可以延长 IT 投资的生命周期并提升回报率。如果是基于更早的英特尔® 至强® 处理器进行升级,这些优势将更为显著。持续的平台创新更广泛地优化了数据传输和处理,同样有助于科学计算与 AI 融合的实施。

英特尔® 加速引擎

第五代英特尔® 至强® 处理器配备英特尔® 加速引擎,凭借众多内置加速器,为 AI、科学计算、数据分析、网络和存储等关键任务提升吞吐量。由于它们内置于处理器中,与独立解决方案或在内核上运行的基于软件的解决方案相比,不会产生从片外访问 PCIe 总线上独立加速器的时延,相应地,就节省了能耗。

因此,英特尔® 加速引擎能够帮助企业和机构实现更好的性能并节省资本支出 (CapEx) 和运营支出 (OpEx)。
 

  • 性能:专用的加速器大幅提升目标工作负载的吞吐量。其中, 英特尔® 高级矩阵扩展(Intel® Advanced Matrix Extensions, 英特尔® AMX)可加速 CPU 上的 AI 工作负载,无需额外的专用硬件即可提高吞吐量。
  • 运营和系统成本:使用内置加速器可以减少对额外系统投资的需求,而系统占用空间的减少可以节省大量能源。

基于第五代英特尔® 至强® 处理器的科学计算与 AI 融合解决案采用先进的指令集架构 (ISA),旨在加速常见的 AI 和机器学习任务。例如,英特尔® 矢量神经网络指令 (VNNI) 通过将三条指令

合并为一条,以完成 INT8 运算中的乘累加,从而加速推理。 支持的新数据类型还包括 BF16,这种 16 位浮点格式可以加速推理,同时保持模型准确性。通过使用较低精度并降低计算要求, 能够缩短模型训练时间(或推理时间)。

可立即部署的科学计算与 AI 融合工具

在各行各业以及各科学领域的科学计算工作流程中,AI 的应用越来越普遍,有望显著提高效率。AI 与科学计算的融合可能发生在应用或工作流程层面。在科学计算领域中,可运用 AI 模型替代传统模型来完成某些任务,比如从粗网格 (coarse mesh) 中创建细网格 (fine mesh) 结果。AI 模型可能会以更短的时间和更高的精确度完成这项工作。在科学计算工作流程中,AI 可用于后处理,以评估结果并为用户生成洞察,也可用于预处理,以改进科学计算工作负载中使用的输入数据集。

英特尔® 软件开发工具由 oneAPI 提供支持,包括编译器、库、 框架和性能工具,用以构建、分析和调整面向英特尔® 架构优化的高质量跨平台软件。具体而言,英特尔® 软件开发工具简化了 英特尔® 加速引擎在解决方案中的应用,有助于提高 CPU、GPU 以及 FPGA 等其他硬件的性能和效率。这些工具包括英特尔® oneAPI 基础工具套件和英特尔® oneAPI HPC 工具套件,用于在共享和分布式内存计算系统中构建、分析和扩展应用,以及英特尔® AI 工具,用于加速端到端数据科学和机器学习管线。

此外,英特尔还通过参与开源和将新增值优化提交至上游,以及与整个解决方案生态系统建立合作伙伴关系,坚定地致力于生态系统的支持。有了这些支持措施,开发人员就可以用更短的时间和更少的精力与英特尔的技术路线图保持一致,并能以经济高效的方式提高解决方案的性能、效率和未来就绪性。

更出色的性能和总体拥有成本优势

第五代英特尔® 至强® 处理器提高了一系列科学计算基准测试和工作负载的吞吐量。这些优势主要得益于更多的内核数、更大的三级缓存以及更大的内存带宽。除了提高系统资本投资的价值外,第五代英特尔® 至强® 处理器还有助于减少能源消耗,从而优化总体拥有成本 (TCO)。

为满足各种科学计算和 AI 融合用例,解决方案架构师可以采用额外的配套英特尔® 硬件技术,而无需移植或重构代码,从而保持整个环境的软件兼容性。为了改善要求严苛的内存带宽敏感型工作负载的性能,英特尔® 至强® CPU Max 系列在处理器封装上集成了高达 64 GB 的 HBM2e 高带宽内存,减少了通过内存总线获取数据的需求。

多样化的英特尔® 软硬件技术为科学计算与 AI 融合从业者提供了面向未来的创新能力,让他们能够更快、更经济高效地解决复杂的计算问题。