- 速度提升高达 19%(基于英特尔® oneAPI MKL 和英特尔® VX-5121)
- 性能提升高达 54% (较上一代处理器)2
应对计算流体力学挑战
设计工程师常利用计算流体力学 (CFD) 软件对产品在气流和水流中的性能表现进行仿真和分析。这类工作负载往往会涉及到由数千万单元组成的复杂的非结构化网格,因此需要高内存带宽来保证求解器高效执行任务。
英特尔出色的软硬件产品及强大的生态系统能够帮助制造商在预算范围内更快地设计出更好的产品。由于第三代英特尔® 至强® 可扩展处理器的内存带宽、系统内存和每时钟周期指令数 (IPC) 均有增加,因此与上一代处理器相比,更有利于 Ansys® Fluent® 软件实现出色的性能。另外,除了可提升配置灵活性的英特尔® Speed Select 技术外,第三代英特尔® 至强® 可扩展处理器还内置了高性能计算 (HPC) 和人工智能 (AI) 加速技术。
英特尔® 至强® 可扩展处理器的重要特性:
- 每时钟周期指令数增加 20%3
- 内置可加速 AI 推理和训练的英特尔® 深度学习加速 技术(英特尔® DL Boost)
- 内置可实现加速的英特尔® AVX-512
英特尔在 HPC 方面的领导力
英特尔出色的产品组合和广泛的生态系统可帮助用户:
- 更快解决复杂问题
- 扩展设计空间,获取全新洞察
- 准时、高质量交付
内置加速技术
采用英特尔® 高级矢量扩展 512(英特尔® AVX- 512)指令的英特尔® 至强® 可扩展处理器,每周期完成的指令数量是采用英特尔® 高级矢量扩展 2(英特尔® AVX2)指令的处理器的 2 倍。曾有研究表明,在英特尔® oneAPI 数学核心函数库(英特尔® oneAPI MKL)支持下, Ansys® Fluent® 软件基于上述特性将速度提升了 19% 1。
出色的性能
第三代英特尔® 至强® 可扩展处理器配备 8 条 DDR4 内存通道,每路内核最多可达 40 个,缓存空间更大,每时钟周期指令数较上一代处理器增加了 20%, 这些特点可为多种应用带来非常好的性能表现。第三代英特尔® 至强® 可扩展处理器支持英特尔® 傲腾™ 持久内存 200 系列,通过合理配置,每路处理器可实现高达 6 TB 的系统内存。内置的英特尔® Speed Select 技术,加上专为液冷系统设计的专用 SKU,可提供出色的灵活性。
广泛的生态系统
数十年来,英特尔一直在与 Ansys 等多家软件提供商合作,帮助他们针对英特尔® 架构优化各自的应用。由此,用户在提升性能和扩展能力的同时,还可从软件许可中获得更大的投资回报率 (ROI),而对开发人员来说,则获得了更好的开箱即用体验。
基于英特尔® 技术优化 Ansys® Fluent® 的性能
CFD 工作负载往往会受内存带宽的限制,因此增加内存通道要比增加内核数量或提高 CPU 运行速度更为重要。第三代英特尔® 至强® 可扩展处理器不仅拥有可达 6 TB 的总系统内存,还将其内存通道数量从 6 条增至 8 条,从而赋能需要大量内存的 Ansys® Fluent® 工作负载实现更优的表现。
此外,英特尔® AVX-512(仅英特尔可提供)也为 Ansys® Fluent® 带来了性能增益:这一技术让每条指令完成的工作量翻了一番,并为使用 Ansys® Fluent® 2020 R2 版软件的工程师带来了开箱即用的无缝体验。由于商业软件常常按内核授予许可, 因此部分用户会选择英特尔® 至强® 金牌 6300 处理器产品中内核数更少但频率更高的产品,这类处理器有 8-32 个内核,睿频速度最高可达 3.7 GHz。对于那些性能要求极高的客户而言, 英特尔® 至强® 铂金 8300 处理器能够以 32-40 个内核和高达 3.7 GHz 的频率满足他们的需求。全新内核微架构可带来出色的单核性能,这对投资 Ansys® Fluent® 这类领先应用软件的用户而言是至关重要的考量因素。
集群扩展可将 Ansys® Fluent® 软件的仿真用时从几天降至几小时或几分钟。如图 2 所示,结合高动态范围 (HDR) InfiniBand 网络和英特尔® MPI 库,英特尔® 至强® 铂金 8360Y 处理器可为 Ansys® Fluent® 提供近乎理想的扩展能力,使内核数达到 2,000 个 以上,充分满足其高工作负载需求。另外,英特尔® 至强® 可扩展 处理器也使超线性扩展成为可能。如图所示,机翼(14m 网格单元)当集群节点增加为 32 个时,性能表现超过了单节点性能的 32 倍。
图 1. 代际性能提升情况,归一化处理的 Ansys® Fluent® 2021 R1 版软件单核性能4
图 2. 节点扩展,Ansys® Fluent® 2021 R1 版软件节点扩展5
结论
英特尔® 架构除了多项开箱即用的优化外,还同时具备更高内存带宽、更多每时钟周期指令数这两个出色的特性, 因此可为 Ansys® Fluent® 用户带来更好的性能。第三代英特尔® 至强® 可扩展处理器既可支持英特尔® 傲腾™ 持久内存,又拥有比上一代处理器更多的内核。
当英特尔® 至强® 可扩展处理器采用英特尔® AVX-512 指令集时,其每时钟周期的每秒浮点运算次数 (FLOPS) 是以往使用英特尔® AVX2 指令集时的两倍。此外,Ansys® Fluent® 还利用多种英特尔® 工具进行了优化,以在英特尔® 架构上更好地运行。借助英特尔® 至强® 可扩展处理器和英特尔® oneAPI MKL(面向英特尔® 系统的速度最快、应用最广的数学函数库),Ansys® Fluent® 实现了出色的扩展能力、简化了开发,并且还确保新指令集架构 (ISA) 正常工作6。
英特尔与 Ansys 合作,帮助 Fluent® 软件的用户缩短项目时间,同时确保高保真建模,以更快速度交付更出色的产品。
了解更多信息
有关面向 HPC 的第三代英特尔® 至强® 可扩展处理器的更多信息,请访问 intel.cn/content/www/cn/zh/high-performance-computing/processors.html。
有关英特尔® 软件工具和库的更多信息,请访问 https://www.intel.cn/content/www/cn/zh/developer/topic-technology/data-center/tools.html。
有关 Ansys® Fluent® 的更多信息,请访问 ansys.com/zh-cn/products/fluids/ansys-fluent。