面向网络优化的第四代英特尔® 至强® 处理器具备更多内核、更快 I/O 和面向负载均衡、复制转发数据操作和加解密处理的内置加速技术,与前几代处理器相比,可使内容分发网络 (CDN) 的性能提高 1.46 倍1。这款处理器突破现有限制,不仅带来更出色的吞吐量性能,还可在单个服务器上支持更多的订阅用户同时连接。
高吞吐量内容分发网络可通过经济高效的扩展来满足不断增长的性能要求,这对于内容提供商和广播公司而言是不可或缺的战略资源。随着在物理距离上不断靠近终端用户,内容分发网络也在演进过程中,作为低时延基础设施向边缘计算转型。能够满足高吞吐量、低时延和成本效益要求的服务器平台在这一演进过程中扮演着至关重要的角色。
为满足高清 (HD) 和超高清 (UHD) 等高带宽流媒体内容迅速增长的需求,内容提供商必须持续优化自身的基础设施。而内容分发网络的效率正是这一技术创新的关注重点,特别是就单节点支持的会话密度和每个流媒体的能耗需求等指标而言。因此,必须通过更精简、更高效的机制才能在满足新兴服务需求的同时,保持相对稳定的资本支出 (CapEx) 和运营支出 (OpEx)。该细分市场预计将以超过 27% 的复合年增长率持续增长,到 2026 年市值将达到近 500 亿美元2。
随着内容分发网络在物理距离上不断靠近自身所服务的终端用户,运营商目前正在增设低时延计算基础设施,以推进核心内容分发网络工作负载之外的边缘计算演进,而能够满足低时延要求的服务器平台则在这一演进过程中扮演着重要角色。
面向网络优化的第四代英特尔® 至强® 可扩展处理器相较于前代处理器,可为内容分发网络提供商带来大幅性能提升,并同时降低时延与成本。作为性能均衡的平台,第四代英特尔® 至强® 可扩展处理器在执行、内存和 I/O 方面均有显著增益:
- 执行资源更强大:凭借优于前代产品的每核性能和内置于处理器中的先进硬件加速器阵列,能够实现更加出色的加密和其他内容分发网络数据包处理。
- 高达 1.5 倍的内存带宽和速度提升:多达 8 条传输速率高达 4800 MT/s 的 DDR5 内存通道,使每节点的 DRAM 能够存储更多数据,支持更多数据流的传输。
- 速度更快、处理能力更强的 I/O:每路处理器多达 80 条 PCIe 5.0 通道,与配备 64 条 PCIe 4.0 通道的上一代产品相比,每节点的存储容量更大、网络连接更快。这些 I/O 增益能够降低缓存未命中概率,为更多订阅用户带来大量的高清 (HD) 和超高清 (UHD) 会话。
内置于处理器中的硬件加速器可将内容分发网络操作的关键任务从处理器内核卸载至专用的硬件资源中,从而显著提升性能,同时释放处理器内核用于处理其他工作。这种方法不仅能带来吞吐量增益,还可避免数据通过 PCIe 总线传输至处理器外部的硬件,从而降低时延并优化能效。
无需占用处理器内核即可实现负载均衡
跨多个处理器内核、同时调度数万个 HTTPS 连接,是典型的占用专用内核的软件任务。英特尔® 动态负载均衡器(Intel® Dynamic Load Balancer,英特尔® DLB)在独立于处理器内核的芯片引擎中实施负载均衡的逻辑与规则。与使用软件的方法相比,英特尔® DLB 耗能更少,可释放资源,满足额外的连接需求。效率的提升表现为单节点流密度的增加和每瓦性能的优化,有助于降低设备需求和运营成本。
加速流数据传输
HTTPS 内容分发网络交付涉及大量的复制转发数据操作。请求先自网络接口传入 CPU,后由 CPU 从存储中获取内容,然后将其复制到 DRAM 中,并对其进行加密,最后再将其复制回 DRAM 并传至输出 NIC 端口。通常,这些操作中的每个步骤都需要在虚拟和物理内存地址空间之间进行由软件驱动的映射和复制操作,这不仅会占用处理器的内核资源,还会产生时延,对流媒体体验质量造成负面影响。英特尔® 数据流加速器(Intel® Data Streaming Accelerator,英特尔® DSA)使用不占用处理器内核的芯片资源处理内存复制操作。英特尔® DSA 芯片引擎相较软件速度更快,可改善时延、减少能耗,有助于降低总体拥有成本 (TCO)。
减少加密/解密操作的性能开销
通过 HTTPS 交付高带宽内容既需要大规模使用传输层安全性 (TLS) 加密,还需要有确定性的高吞吐量来保证体验质量。内置于第四代英特尔® 至强® 可扩展处理器的英特尔® 数据保护与压缩加速技术(Intel® QuickAssist Technology,英特尔® QAT),可加速加解密处理,提高内容分发网络节点可支持的新建连接速率。英特尔® QAT 可从处理器内核中卸载 TLS 握手操作的执行,为其他重要的边缘功能释放宝贵的计算资源,进而提高内容分发网络平台的效率。与前几代处理器平台相比,配备英特尔® QAT 硬件卸载功能的最新一代处理器每秒可处理更多握手操作,从而在新建连接速率层面提高自身的可扩展性。英特尔® QAT 还提高了内容有效负载加密的吞吐量,进一步增加处理器的整体容量。
结论
第四代英特尔® 至强® 可扩展处理器可为每个内容分发网络节点带来更高的订阅用户同时连接密度,实现更出色的每瓦性能,向更加经济高效的内容分发网络服务交付迈出了重要的一步。这款性能均衡的处理器平台在内核数、内存带宽和 I/O 可扩展性方面均有升级,并在此基础上将多种硬件加速器直接内置于芯片之中。这些加速器可提高负载平衡、流数据传输以及加密的性能和效率,从而提高吞吐量并减少时延,同时释放计算资源并减少能耗。