英特尔® 至强® 6 处理器家族引入强大的计算平台,实现了更高性能和更优能效,而这两大特性对满足现代数据中心不断变化的需求至关重要。从计算密集型 AI 到可扩展微服务,该处理器家族可灵活满足多种工作负载的不同需求。根据相关声明,以 5 年硬件换新周期来看,与第二代英特尔® 至强® 可扩展处理器相比,英特尔® 至强® 6 处理器具备显著优势。与第五代英特尔® 至强® 可扩展处理器相比,也具备优势。
满足当今数据中心的需求
数据中心基础设施是企业和机构最重要的投资之一。IT 负责人不仅需要利用这些资源来促进业务增长,还要权衡其安全性、能效、可管理性以及影响总体拥有成本 (TCO) 的其他因素。也许最重要的是,IT 负责人必须要了解推动数据中心需求迅速变化的市场因素。例如, 在工作负载自动化和生成式 AI (GenAI) 等技术变革的推动下,AI 的市场规模及其带来的机遇预计在未来五年内将增长 4 倍1。越来越多的企业应用开始添加推理能力,因此需要有并行数据计算能力以及更高单核性能的产品。此外,随着以云原生原则重新设计的单体应用面世,云微服务市场预计将增长 5 倍2。这些工作负载属于并行任务,因此处理这些任务更好的办法是借助高效的标量处理能力,而非增加复杂的计算能力。
趋势:到 2026 年,超过 80% 的企业将会采用生成式 AI (GenAI)3
通过加速多种工作负载更快获得业务成果
凭借更多内核、可供选择的微架构、更大的内存带宽和更出色的输入/输出 (I/O),英特尔® 至强® 6 处理器可为广泛的工作负载带来更加出色的性能表现。除了内置如英特尔® 数据保护与压缩加速技术(Intel® QuickAssist Technology,英特尔® QAT)等加速器外,英特尔® 至强® 6 处理器还具备诸如支持 Multiplexed Rank DIMM (MRDIMM) 和增强型 Compute Express Link (CXL) 等新特性,为目标工作负载带来进一步助力,实现了更高的性能和能效。
英特尔® 至强® 6 处理器与第五代英特尔® 至强® 可扩展处理器比较
Llama2 性能提升 (采用英特尔® AMX)4
HammerDB MySQL 性能提升5
HPCG 基准测试性能提升 (与 MRDIMM 对比)6
服务器端 Java 吞吐量 每瓦性能提升7
MySQL OLTP 每瓦性能提升8
AVC 每瓦性能提升9
英特尔® 至强® 6 处理器与第二代英特尔® 至强® 可扩展处理器比较
RestNet-50 BSX INT8 性能提升10
地球系统建模性能提升(采用 MRDIMM)11
MongoDB 性能提升12
MySQL OLTP 性能提升10
AVC 性能提升和高达 2.6 倍 每瓦性能提升13
5G UPF 性能提升和 高达 2.6 倍每瓦性能 提升14
性能和能效不打折扣
英特尔® 至强® 6 处理器家族引入了创新的模块化 x86 架构,使数据中心架构师能够配置和部署专为企业特定需求和跨私有云、公共云和混合云工作负载而构建的基础设施。如表 1 所示,英特尔® 至强® 6 处理器有四个不同系列,提供不同的性能水平,可以满足从入门级到要求严苛的工作负载的需求。与前几代产品相比,这四个系列的内核数、缓存、内存速度和容量以及 I/O 均有提升。
为充分灵活满足不同需求,英特尔® 至强® 6 处理器采用两种不同的 CPU 微架构:性能核 (P-core) 和能效核 (E-core)。两个版本均使用兼容的 x86 指令集架构 (ISA) 和通用硬件平台(包括 CPU 插槽类型)。此外,英特尔还与行业合作伙伴合作,通过通用操作系统、编译器、库和框架来确保对两种内核类型的无缝使用。有了这种共享的软件堆栈以及由软硬件供应商组成的全球生态系统,解决方案便可以满足不同的业务需求。
英特尔® 至强® 6 性能核处理器
英特尔® 至强® 6 性能核处理器,经过精心优化,具备更出色的单核性能。得益于其更多的内核、双倍内存带宽和内置于每个内核的 AI 加速技术,英特尔® 至强® 6 处理器可助力将 AI 和科学计算等广泛工作负载的性能提升至多达 2 倍4,6。英特尔® 至强® 6 性能核处理器可支持广泛工作负载, 并为诸如 AI 推理和机器学习 (ML) 等计算密集型工作负载提供优于其他通用 CPU 的出色性能。英特尔® 至强® 6 性能核处理器亦是公有云工作负载的理想之选,能够为浮点运算、事务型数据库和科学计算工作负载提供更高的每 vCPU 性能。凭借其出色的 AI 推理性能,英特尔® 至强® 处理器仍将是全球众多出色 AI 加速平台上用于支持数据处理的机头 CPU 优选之一。
- 每个内核均具备 AI 加速功能,更高效地助力实现 AI 无处不在。英特尔® 高级矩阵扩展(Intel® Advanced Matrix Extensions,英特尔® AMX)可加快 INT8 和 BF16 的推理速度,并为以 FP16 精度训练的模型提供更好支持(INT8 的速度高达每核每周期 2,048 次浮点运算,BF16/ FP16 的速度则高达每核每周期 1,024 次浮点运算)。
- 采用更快的 DDR5 内存 MRDIMM 来提升内存吞吐量。与 RDIMM 相比,内存带宽提高了 37% 以上15,预计数据传输速率高达 8,800 MT/s。英特尔® 至强® 6 处理器(包括性能核及能效核)还支持 DDR5 6400 高速内存,从而提供更高内存带宽15。
- 每路多达 128 个内核,三级缓存高达 504 MB,能够以较低的时延从三级缓存访问大量数据。英特尔® 至强® 6 性能核处理器所支持且可开箱即用的英特尔® 高级矢量扩展 512 (Intel® Advanced Vector Extensions 512,英特尔® AVX-512),可显著提升科学计算与传统 AI 中常见的矢量运算速度。
高达 2 倍性能提升(与第五代英特尔® 至强® 可扩展处理器相比)16
英特尔® 至强® 6 能效核处理器
英特尔® 至强® 6 能效核处理器经精心优化,实现了更高的内核密度,具备更出色的每瓦性能,可为需要较高任务并行吞吐量的云级工作负载带来明显优势。第二代英特尔® 至强® 可扩展处理器是目前大部分数据中心系统使用的处理器,并且是具有竞争力的数据中心优化每瓦性能的良好选择。与之相比,英特尔® 至强® 6 能效核处理器可带来超过 2.6 倍的每瓦性能提升14,实现了出色能效表现,成为了电力、空间和散热受限的情况下的理想选择。英特尔® 至强® 6 能效核处理器可以:
- 将 4 个基于第二代英特尔® 至强® 可扩展处理器的服务器替换为 1 个性能相似的服务器17
- 将 3 个基于第二代英特尔® 至强® 可扩展处理器的系统机架整合为 1 个机架18。
- 利用英特尔® 高级矢量扩展 2(Intel® Advanced Vector Extensions 2,英特尔® AVX2)和矢量神经网络指令 (VNNI) 以及将精度快速转换成 BF16 和 FP16 等全新增强功能,加速 AI 推理和面向矢量的运算。
- 每路多达 288 个内核,三级缓存高达 216 MB,能够以较低的时延从三级缓存访问大量数据。
英特尔® 至强® 6 性能核处理器和英特尔® 至强® 6 能效核处理器之所以能效出众,是因为它们能够随着服务器占用率的提高而提供可扩展的每瓦性能,使整个负载线的功耗/性能呈近线性关系。对于性能要求严苛的工作负载,这意味着在高负载下可以高效利用电能,以更快地完成任务。对于云或共享计算环境中常用的可扩展实施方案,这种能效水平意味着服务器在欠载时仅消耗所需的电能,从而在实例未被充分利用时降低成本。
英特尔® 至强® 6 处理器还支持全系统电源管理和遥测功能,可持续性得到了进一步增强。这些功能可以提高每个应用的每瓦性能,有助于降低总体能耗。
英特尔® 至强® 6 处理器的广泛用途和互补优势
针对需求截然不同甚至极端的工作负载,英特尔® 至强® 6 性能核处理器是 AI 等计算密集型、基于矢量的工作负载的理想之选;而英特尔® 至强® 6 能效核处理器则适合微服务等任务并行、基于标量的工作负载。对于需求介于这两种极端情况之间的工作负载,这两种微架构相结合可让解决方案互补且用途更广泛。例如,可使用搭载英特尔® 至强® 6 能效核处理器的系统来节省电能,以便为搭载英特尔® 至强® 6 性能核处理器的节点提供足够的电能来运行 AI 和科学工作负载。采用英特尔® 至强® 6 性能核处理器和英特尔® 至强® 6 能效核处理器混合设计的数据中心可以利用其平台通用性,根据性能和功耗需求将工作负载从一种内核的处理器转移到另一种内核的处理器。这种丰富的选项组合使数据中心可以随着业务增长轻松扩展。
英特尔® 至强® 6 处理器的互补优势还在于,数据中心可以轻松地混合使用基于英特尔® 至强® 6 性能核处理器和英特尔® 至强® 6 能效核处理器的服务器,以支持需要不同结构的数据库的业务需求。对于涉及复杂的数据关系、复杂的查询、连接和聚合的关系型数据库,就可以利用英特尔® 至强® 6 性能核处理器的并行数据处理能力。涉及大量小型独立数据检索请求(如键值存储)的非关系型数据库,则可以利用英特尔® 至强® 6 能效核处理器的任务并行设计。
亮点技术
英特尔® 至强® 6 处理器家族创新的性能核和能效核微架构具有以下先进功能和优势:
- 单路英特尔® 至强® 6 能效核处理器拥有多达 288 个内核,单路英特尔® 至强® 6 性能核处理器拥有多达 128 个内核,实现了更高密度计算性能和可扩展性。
- 对于基于 BF16 和 FP16 的模型,英特尔® AMX 的乘法累加 (MAC) 运算速度比英特尔® 高级矢量扩展 512(Intel® Advanced Vector Extensions 512,英特尔® AVX-512)提升高达 16 倍,AI 性能显著增强(英特尔® 至强® 6 性能核处理器的功能)。
- 英特尔® AVX-512 包含特有的指令,每个内核拥有两个 512 位融合乘加 (FMA) 单元,大幅提高了 AI、科学计算和数据库工作负载常见的矢量计算速度(英特尔® 至强® 6 性能核处理器的功能)。
- 支持 VNNI 指令的英特尔® AVX2 以及将精度快速转换为 BF16 和 FP16 的能力为英特尔® 至强® 6 能效核处理器提供了更好的 AI 兼容性。
- 与标准 DDR5 DIMM 相比,MRDIMM 能够提供超过 37% 的额外内存带宽,可支持 AI 和科学计算中的带宽受限用例(英特尔® 至强® 6 性能核处理器的功能)。英特尔® 至强® 6 处理器(包括性能核及能效核)还支持 DDR5 6400 高速内存,从而提供更高内存带宽15。
- 多达 12 条内存通道,进一步支持更高的内存带宽。
- 英特尔® 超级通道互联(Intel® Ultra Path Interconnect,英特尔® UPI)2.0 的跨插槽内带宽速度高达 24 GT/s,与上一代产品相比提升高达 20%。
- 双路服务器拥有多达 192 条 PCIe Gen 5 通道,单路服务器则多达 136 条,可以支持重要的 I/O 附加组件,包括加速器、网络适配器、存储控制器和存储。
- 多达 64 条 CXL 2.0 通道,每条通道的数据传输速率高达 32 GT/s,支持 CXL 功能,包括内存扩展和共享(包括 Type 3 设备)。
- 当使用低成本内存(如支持 CXL 2.0 的 DDR4)时,“Flat”内存模式可帮助扩展系统内存并优化 TCO。
- 英特尔® QAT 支持卸载批量加密和压缩,以加速网络和存储。
- 英特尔® 数据流加速器(Intel® Data Streaming Accelerator,英特尔® DSA)2.0 能够卸载数据传输和转换操作,例如移动、填充、比较、循环冗余校验 (CRC)、数据完整性字段 (DIF)、增量和刷新。
- 英特尔® 存内分析加速器(Intel® In-Memory Analytics Accelerator,英特尔® IAA)可以卸载内存压缩和解压缩、扫描和过滤功能以及循环冗余校验。
- 英特尔® 动态负载均衡器(Intel® Dynamic Load Balancer,英特尔® DLB)支持动态分配网络数据包处理和卸载重排序操作。
- 英特尔® Trust Domain Extensions(Intel® Trust Domain Extensions,英特尔® TDX)用 AES-256 和 2,048 个加密密钥进行了升级,机密计算能力进一步增强,能够更好地保护敏感的企业数据。
进一步了解英特尔® 至强® 6 处理器以及上文列举的功能特性,请访问 intel.cn/xeon。
英特尔® 至强® 6 处理器家族概览
英特尔® 至强® 6900 系列处理器采用全新的英特尔® 服务器平台设计,可为客户提供更出色性能、更高内存带宽和更高吞吐量,非常适合云、科学计算和 AI 环境。该系列处理器拥有更多内核、更多的内存通道和 I/O 通道,热设计点高于其他系列。
英特尔® 至强® 6700 系列和英特尔® 至强® 6500 系列处理器则采用经过升级的服务器平台设计,具备出色的性能、成本和能效优势,非常适合广泛的数据中心环境。这两个系列的处理器支持单路至 8 路配置,并可在既有的数据中心供电和散热条件下提供更大的 I/O 和内存。
出色的用户体验
英特尔® 至强® 6 处理器提供高水准的质量和可靠性,这是英特尔® 产品一贯为客户所称道的优势。保持持续运行并尽可能减少系统维护时间是管理数据中心服务级别协议 (SLA) 和整体 TCO 的基础。英特尔® 产品的可靠性、可用性和可维护性 (RAS) 是由一系列功能作为支撑,这些功能可以帮助延长系统正常运行时间、减少计划中断并保持数据完整性。英特尔® 至强® 6 处理器是首款未采用 平台控制器中枢 (PCH) 技术的英特尔® 处理器,使得 CPU 无需借助 PCH 助力即可实现自启动。因为不再采用 PCH 技术,本次产品升级实现了更优的生命周期支持和更高的可持续性,这对系统设计人员来说是非常有益的。
安全性对于用户体验和客户满意度非常重要。无论在本地还是云端,IT 团队都必须防范越来越多的安全威胁,并始终遵守隐私法规。为了保护使用中的数据,英特尔® 至强® 处理器采用了机密计算技术,能够更好地满足业务和监管要求。英特尔® TDX 提供虚拟机 (VM) 层面的隔离和保密性,而英特尔® 软件防护扩展(Intel® Software Guard Extensions,英特尔® SGX)则提供应用层面的隔离。
为更好地满足数据中心当今和未来的需求,企业可以选用英特尔® 至强® 6 处理器来推动业务增长,因为它不仅可让企业在安全性、能效和可管理性之间实现良好平衡,还能助力企业优化 TCO。英特尔® 至强® 6 处理器家族,提供更高性能,实现更优能效。