IPU:为云服务提供商量身打造的新型战略资源

作者:Patricia Kummrow | 2021 年 8 月 19 日

  • 现代云数据中心的工作负载主要呈现为一种微服务集合的样态,从而产生很多通信开销。利用基于英特尔推出的 IPU 的架构和无盘服务器架构,可提高性能、降低成本、提供更好的云数据中心架构,从而大幅提高数据中心收益。在本次英特尔架构日推出的 IPU 及英特尔 N6000 加速开发平台,可为云客户提供通用基础设施的基石。

author-image

签署人:

现代云数据中心的工作负载越来越多地呈现为一种微服务集合的样态。微服务导向架构虽然有很多优势,但由于其本质上是分离的,因此会产生大量的通信开销。在这种基础设施相关开销上所用的 CPU 周期无法为云服务提供商 (CSP) 带来收入。Srirama、Dhanota 等人在最近发表的论文中指出,超大规模企业的微服务开销比例为 31% 到 83% 不等1,如下图所示。

近期,英特尔推出了一款基础设施处理器 (IPU)。利用基于 IPU 的架构,CSP 可以将基础设施相关任务从 CPU 卸载到 IPU,将释放的服务器 CPU 周期用于处理能够创收的任务,以此大幅提高数据中心收益。通过将基础设施相关任务卸载到 IPU,CSP 可以把自己的服务器 CPU 全部都租给客户。


云数据中心更像 “酒店” 而非 “住宅”

我们简单地用家和酒店来打个比方,就可以更好地解释推动 IPU 开发的工作负载所有权是如何划分的。在我自己家里,我希望很容易就能从客厅走到厨房或是走到餐桌旁。于是,就有了开放式厨房。这样一来,一切都包含在了一个大的房间里,我们就可以自由地在不同区域间走来走去。

但是酒店就不同了。酒店的客房、餐厅和厨房都是各自独立的区域。酒店员工工作的区域和客人们就餐、饮酒、睡觉及会客的区域也是隔开的。通常酒店不同的功能区之间会用门进行分隔。为了安全起见,宾客区和员工区之间的门甚至还会设门禁。

这种将酒店的宾客区和员工区分隔开来的做法与在包含 IPU 的数据中心架构中租户与 CSP 工作负载的分离很相似。 通过将 IPU 引入数据中心来执行基础设施功能,CSP 的基础设施工作负载就可以在 IPU 上运行。这会减轻服务器 CPU 的负担,使服务器 CPU 可以运行更多租户的应用。

基于 IPU 的数据中心架构具有以下主要优势:
 

  • 基础设施功能和租户工作负载之间划分楚河汉界更好地实现了这些功能的分隔,从而大大增强了系统的安全性。
  • 租户可以全面控制服务器 CPU,并且可以充分利用这些服务器 CPU 的性能。
  • 基础设施工作负载达到峰值不会引发服务器 CPU 的性能问题,而这在传统数据中心架构模式下却是个日益严重的问题,如上面引用的统计数据所示。
  • CSP 可以通过将基础设施相关任务从 CPU 卸载到 IPU,将释放的服务器 CPU 周期用于处理能够创收的任务,以此大幅增加数据中心收益。 
  • 通过将基础设施相关任务卸载到 IPU,CSP 可以把自己的服务器 CPU 全部都租给客户。
  • 专门针对基础设施相关任务而非通用处理任务的 IPU 可以应用硬件加速和更为细致的计算调优来获得更好的性能和能效。
  • IPU 支持在云数据中心采用完全无盘的服务器架构。在传统的企业级数据中心架构中,每台服务器都有自己一套附加的磁盘驱动器和固态盘 (SSD) 用于存储。

由于很难逐一对租户的存储使用情况进行预测,因此每个服务器都需要额外多预配存储资源,用于应对传统数据中心架构下的存储负载峰值时刻。通过无盘服务器架构,中央存储服务可以为所有租户提供存储资源。下图展示了一种可能采用的无盘服务器架构。

与管理数据中心数十万台服务器的存储资源相比,管理一项中央存储服务要简单得多,高效得多。


数据中心的演进

近几年来,英特尔与包括微软、百度、京东和 VMware 在内的主要 CSP 进行合作,不断发展自己的数据中心产品。在 IPU 市场,我们凭借基于英特尔® 至强® D CPU、英特尔® FPGA 和以太网组件的拳头产品,成为销量大户。我们与超大规模合作伙伴共同设计的基于 FPGA 的第一代英特尔® IPU 平台,已经部署在多个 CSP 自有和运营的数据中心内。

在我们利用基于 FPGA 的产品开展 IPU 业务的五年中,我们观察到超大规模 CSP 在以下阶段实现了 IPU 的价值:
 

  • 第 1 阶段:网络加速——将虚拟交换机和防火墙功能等常见的网络任务从服务器 CPU 卸载到 IPU。将数据流查找和封装/解封装等用户平面功能 (UPF) 从 CPU 卸载到 IPU 可以释放 CPU 周期。
  • 第 2 阶段:存储加速——将存储堆栈从服务器 CPU 卸载到 IPU,在提高存储吞吐量的同时降低存储的复杂性、减少开销和管理工作。
  • 第 3 阶段:安全性提高——将加密/解密、压缩及其他安全功能卸载到 IPU,从而避免消耗服务器 CPU 周期。(这些安全功能常常与第 2 阶段卸载的存储功能配对)。此外,IPU 还可以启动主机系统的引导和配置。如此一来,就可以通过隔离安全功能并提供独立于 CPU 的信任根来进一步加强安全性。
  • 第 4 阶段:基础设施处理——这可能是最复杂的用法,会将系统管理程序服务管理功能从服务器 CPU 卸载到 IPU。

当前基于 FPGA 的英特尔® IPU 是英特尔® Stratix® 10 FPGA 与英特尔® 至强® D 处理器的结合。它将已优化的加速器(基于可配置的 FPGA 数据路径)与可以安全地加速和管理数据中心基础设施功能的软件可编程 CPU 结合在一起。这种混合 IPU 架构能以硬件的速度进网络管理,同时又具有软件的灵活性,可以更轻松地执行平面控制功能。使用 FPGA 板载资源的基于硬件的数据路径,与在 IPU 板载处理器上与基础设施操作系统堆栈一起运行的基于软件的控制平面,这二者的可编程性使这些 IPU 功能强大。IPU 与 SmartNIC 不同,它是一个安全、独立的控制点,租户工作负载不能直接访问。


英特尔的 IPU 和 SmartNIC 的未来

未来,我们会推出基于更先进的处理器、FPGA,甚至是集成 ASIC 的 IPU,同时在当前坚实的 IPU 软件基础之上继续研发,使云运营商和生态系统供应商能够打造出更强大的云编排软件。在本周的英特尔架构日上,我们推出了两个新的 IPU(Mount Evans 和 Oak Springs Canyon)及英特尔® N6000 加速开发平台 (原代号为 Arrow Creek)。

Oak Springs Canyon (OSC) 是此前大获成功的 Big Spring Canyon 平台的后续产品。它基于英特尔® Agilex™ FPGA,后者目前在性能、功耗和工作负载效率方面堪称 FPGA 行业的佼佼者2。OSC 与基于英特尔® 至强® CPU 的服务器协同工作,提供卸载 2x 100 G 网络工作负载所需的基础设施加速能力。OSC 拥有丰富的、已针对英特尔® CPU 进行优化的软件生态系统,其中包括英特尔® 开放式 FPGA 堆栈——一种可扩展、可访问源代码且能让我们的合作伙伴和客户创建定制解决方案的软硬件基础设施。对于将要采用 100 G 网络的下一波 CSP 部署来说,OSC 的能力和特性能够满足相关需求。

英特尔另一新开发的产品,英特尔® N6000 加速开发平台(原代号为 Arrow Creek),是一个基于 FPGA 的 SmartNIC 100 GbE 网络加速开发平台 (ADP)。它是站在英特尔® FPGA 可编程加速卡(英特尔® FPGA PAC)N3000 这个成功者的肩上打造而成的。后者目前在一些世界主流通信服务提供商 (CoSP) 运营的数据中心内都有部署。全新英特尔® N6000 加速开发平台基于英特尔® Agilex FPGA 和英特尔® 以太网控制器 E810,旨在与基于英特尔® 技术的服务器配合使用。它支持多种类型的基础设施相关任务,能够帮助电信提供商加速各种工作负载,如 Juniper Contrail、OVS 和 SRv6。

英特尔发布了自己首个与大型 CSP 合作设计的基于 ASIC 的 IPU,代号为 Mount Evans。Mount Evans IPU 以出色的数据包处理引擎为基础,在 ASIC 中进行实例化。该 ASIC 支持包括 vSwitch 卸载、防火墙和虚拟路由在内的许多现有用例,同时也为未来的用例提供了巨大的空间。通过利用和扩展英特尔® 傲腾™ NVMe 控制器,Mount Evans IPU 能以非常高的 IOPS 速率模拟 NVMe 设备。在基于 FPGA 的 IPU 上运行的英特尔® 基础设施操作系统同样也可以在 Mount Evans 上运行。

Mount Evans IPU 的其他技术创新包括我们与 CSP 合作伙伴共同创新的成果——可靠的新一代传输协议,以及我们先进的加密和压缩加速器。

IPU:为 CSP 量身打造的新型战略资源

IPU 是英特尔云战略中重要的战略元素。我们相信,我们出色的 IPU 产品组合会为云客户提供通用基础设施的基石,让他们在不久的将来能够在异构数据中心架构中充分利用自己的通用计算、XPU 和加速资源。这些功能的融合与当前微服务的开发趋势非常契合,并且为构建基于功能、经过优化且与高速硬件网络组件和通用软件框架相匹配的基础设施提供了独特的机遇。IPU 为 CSP 提供机会重新思考数据中心架构、加速云计算,以及在数据中心每个服务器 CPU 上托管更多创收服务(即,在虚拟机上运行的租户应用)。

由于能够提高性能、降低成本、提供更好的云数据中心架构,我们认为 IPU 将成为未来数据中心设计的战略组成部分。
 

关于 Patricia Kummrow

Patty Kummrow 是英特尔网络与边缘事业部的副总裁,也是英特尔公司以太网产品事业部的总经理。她负责领导英特尔® 以太网网络适配器、控制器和 IPU 的战略、架构、开发、制造和营销工作,为加速实现数据中心网络、存储和网络安全的新一代解决方案提供支持。Kummrow 在 CPU 设计和技术领导力方面有着二十年的经验,曾带领多个团队开发面向数据中心、网络、存储和自动驾驶应用的英特尔® 处理器。她拥有德克萨斯大学电气工程学士学位和瓦尔登大学技术管理硕士学位。

浏览 Patricia Kummrow 的所有文章

一般提示和法律声明

实际性能受使用情况、配置和其他因素的差异影响。更多信息请见 www.Intel.cn/PerformanceIndex。

英特尔技术可能需要启用硬件、软件或激活服务。没有任何产品或组件是绝对安全的。具体成本和结果可能不同。

英特尔并不控制或审计第三方数据。请您审查该内容,咨询其他来源,并确认提及数据是否准确。

英特尔使用代号来识别正在开发且未公开的产品、技术或服务。这些代号并非 “商用” 名称,不能作为商标使用。

本文中的表述是关于未来计划或期望的前瞻性表述。该表述基于当前预期,且存在许多风险和不确定因素可能造成实际结果与本表述明示或默示的结果有实质性不同。详见英特尔在美国证券交易委员会的备案文件,可见于 www.intc.cn

© 英特尔公司版权所有。英特尔、英特尔标识以及其他英特尔商标是英特尔公司或其子公司的商标。其他的名称和品牌可能是其他所有者的资产。

产品和性能信息

1 Akshitha Sriramam 和 Abhishek Dhanotia, “Accelerometer: Understanding Acceleration Opportunities for Data Center Overheads at Hyperscale”(Accelerometer:了解超大规模数据中心开销方面的加速机会),第 25 届编程语言和操作系统架构支持国际会议 (ASPLOS XXV):https://dl.acm.org/action/showFmPdf?doi=10.1145%2F3373376
2 Steven Leibson, “Breakthrough FPGA News from Intel”(英特尔关于 FPGA 重大突破的新闻):https://blogs.intel.com/psg/breakthrough-fpga-news-from-intel/