公有云:电信行业面临的机遇和挑战

作者:Petar Torre

author-image

作者

通信服务提供商 (CoSP) 投资 5G 领域之后,纷纷开始考虑他们可以如何利用公有云取得成功。

多家 CoSP 已经与公有云服务提供商建立合作关系。CoSP 把企业应用托管在云端,将超大规模云服务提供商的产品和服务用于其软件开发项目和面向公众的网站。但目前的问题在于,公有云在网络服务中能起到什么作用?

CoSP 已开始着手进行网络虚拟化,并采纳软件定义网络。与使用专用硬件设备相比,他们在新部署中选择在通用服务器上运行软件。同时,他们还在转向云原生技术。这一策略使 CoSP 获得了 “电信云”。电信云既具备公有云的弹性和可扩展性,但又部署在 CoSP 私有的集中式数据中心和边缘位置。

虚拟化是各行各业的企业工作负载迈向云端的基石,因为虚拟机几乎可以在任何地方运行。那么电信云中的虚拟网络功能 (VNF) 能否迁移到公有云呢?


策略考量

首先,CoSP 必须明确自己的策略意图。

CoSP 可谓肩负重任。他们必须确保其关键基础设施在极端条件下也能运行,才能满足客户和监管者的要求。在把功能托管到公有云之前,他们必须从云服务提供商处找到极为出色的服务级别协议 (SLA)。

此外,CoSP 还要控制成本。他们需要以一种具备成本效益的方式开展 5G 基础设施部署,并扩展边缘计算用于新服务。他们需要云化的环境以及端到端网络自动化来保障服务交付。而云服务提供商在网络规模领域很有实力,却未必有能力为消费者提供全套的电信服务。这就意味着云服务提供商和 CoSP 有机会形成一套协作模式,从而结合前者在云方面的经验和后者在网络方面的经验。

很多 CoSP 已经在公有云上运行其业务支持系统 (BSS),因为他们的 BSS 对时延没那么敏感,而且公有云也有利于削减成本。但如果 CoSP 想要更严密地控制那些涉及计费和财务的系统,便不会毫无顾虑地将 BSS 部署在公有云。相比数据平面功能,控制平面功能迁移到公有云可能更容易,但控制平面也与 CoSP 的收入来源密切相关。部分 CoSP 对于将控制平面托管到公有云会有所迟疑。


财务考量

将 VNF 迁移到公有云同样要考虑财务方面的合理性。公有云的吸引力在于:客户(本文中即 CoSP)不必投资构建自己的硬件和数据中心基础设施,而是通过 “随用随付” 的模式将资本支出转为了运营成本 (OPEX)。当然,OPEX 成本累加起来也可能很高。云服务提供商对于流出流量的收费较高,因此数据密集型 VNF 产生的费用可能很快就会非常昂贵。

迁移项目也是大工程。原本基于在运营商级服务器上运行而设计的 VNF 需要调整才能在公有云服务器上运行。独立软件供应商 (ISV) 和 CoSP 可能需要进行大量投资才能使当前的 VNF 在公有云上运行。


技术考量

更重要的是,哪些 VNF 在公有云上运行是可行的?

以无线接入网络 (RAN) 为例,此工作负载有着严格的时延要求,基带处理必须在蜂窝基站所在地或附近进行。超大规模云服务提供商现有的数据中心网络粒度不够,因此在公有云上运行 RAN 工作负载反而会产生更多挑战。云服务提供商在一个国家覆盖的区域有限,不太可能以较低成本建成满足 RAN 要求的临近范围内的边缘设施。

此外,RAN 工作负载往往受益于英特尔® vRAN 专用加速器 ACC100 等加速器。该加速器使通用处理器能够将前向纠错进程分流到专用硬件,从而充分释放 CPU 内核以提高通道容量。类似地,英特尔® QuickAssist 技术(英特尔® QAT)可用于为 S1 接口加速 IPsec 网关。而这些加速器在主要采用同构硬件的公有云上可能无法使用。

虽然 VNF 也在通用服务器上运行,但这些服务器已经面向电信协议进行充分调优。公有云服务器不太可能完全还原 CoSP 目前用于网络工作负载的服务器。因此,这类服务器对于部分 VNF 而言可能性能不足。公有云平台是面向 IT 工作负载设计的,并未面向包处理进行优化。公有云也不提供 CoSP 调优平台及优化现有 VNF 性能所需的细粒度服务器遥测技术

我们创建了电信工作负载布局和偏好模型 (Telecom Workload Placement and Affinity Model) 来帮助 CoSP 确定哪些网络功能可以在公有云上运行。 我们考虑了以下因素:
•    就吞吐量和时延要求而言,物理位置对于 VNF 的重要性。要求高吞吐量和低时延的工作负载迁移到公有云就比较困难。
•    对 VNF 的集成要求。第三代合作伙伴计划 (3GPP) 移动服务相关功能的集成要求要高于固定服务相关功能。高度集成在 CoSP 自身架构内更容易实现。
•    对 VNF 的安全要求。归属用户服务器 (HSS) 和归属位置寄存器 (HLR) 等功能涉及敏感客户数据,而且对于网络运行也至关重要。在公有云上保护 VNF 会更困难,数据主权要求也更难满足。
•    VNF 的性能要求。例如,相比信号功能,数据平面功能对性能的要求更高,因此就不适宜在公有云目前的实例上运行。

我们对上述各项因素进行了平等的打分。CoSP 赋予每项因素的权重可能是不同的。在某些情况中,某一个参数的阈值可能就要求工作负载托管在电信云,而 HSS/HLR 这类负载就位于模型中间。如果安全性的权重更高,CoSP 可能认为这些工作负载必须在电信云中才能确保安全。

模型右边的 VNF,包括虚拟 RAN (vRAN)、虚拟化深度包检测 (vDPI) 和宽带网络网关 (BNG),就与电信云非常匹配。这些工作负载在公有云上运行就会面临很多挑战。而软件定义广域网 (SD-WAN)、统一通信即服务 (UCAAS) 和通用客户端设备 (uCPE) 等工作负载则现在已经在公有云上运行。

如能满足性能、安全和集成要求,处于模型中间的这些功能从技术角度来说可能对公有云的偏好更高。

在混合模式中,部分功能将保留在电信云,而部分功能则迁移到公有云。这种情况下,平台所有权将相应地划分给 CoSP 和云服务提供商,但可能出现技术问题或端到端性能减弱问题。

今年,我们预计 CoSP 会就如何开展网络合作进一步与云服务提供商沟通。别忘了,公有云刚兴起时,很多企业对其持怀疑态度,即使是今天已经稳定运行在公有云上的那些企业工作负载,他们也是将信将疑。电信行业对性能和距离有特殊要求,因此他们对于在公有云上运行网络工作负载的犹豫是合理且可以理解的。但如果 CoSP 的需求足够大,我们预计超大规模云服务提供商未来会调优其平台并提供更多本地数据中心。


转向边缘

当下,CoSP 和云服务提供商可以开展合作的一个场景是网络边缘。5G 在降低时延的同时增加了带宽,可为物联网等应用提供大规模连接。边缘计算解决了回传到云端所产生的时延和成本问题,有助于充分利用 5G 技术。 
云服务提供商和 CoSP 在边缘各有优势,但都没有单独提供完整的解决方案:
 

  • CoSP 拥有网络连接,能够在保证性能的前提下在网络上托管工作负载。但很多 CoSP 没有软件堆栈等边缘计算基础设施,而这些构建起来成本又十分高昂。
  • 超大规模云服务提供商拥有开发者熟悉的软件堆栈,但没有在全国运营高带宽低时延的网络基础设施。

超大规模云服务提供商目前正基于专用硬件向 CoSP 提供其云堆栈,或基于 OEM 的入门级服务器硬件把云堆栈作为软件平台提供给 CoSP。上述硬件可以托管在 CoSP 的网络数据中心。

由此,CoSP 可在自身网络内提供基于云的服务。开发者无需采用新的软件堆栈:他们可以使用公有云基础设施和自己熟悉的服务,并享受只有 CoSP 才能提供的低时延。

AWS Wavelength Zone 是一系列基础设施部署,CoSP 借助这些部署可以在自己的数据中心托管 AWS 服务器。AWS 在美国、日本和韩国分别与 Verizon、KDDI 和 SKT 展开了合作。微软面向运营商的 Azure Edge Zone 也是一种类似的服务,该服务已经由微软与 AT&T 在美国联合推出。谷歌的运营商版 Anthos 是一个软件平台,可以简化网络边缘的混合云环境构建。

针对此类基础设施,CoSP 有多种业务模式可以选择。鉴于云服务提供商现有的客户群,他们可以单纯地在网络内托管云堆栈。或者,CoSP 也可以建立自己的基础设施来运行云服务提供商的平台服务,或向开发人员提供自己的 “平台即服务”。

CoSP 也可以在云堆栈上提供面向用户的服务。例如,他们可以提供计算机视觉软件许可,在网络内的云平台上运行该软件,从而提供基于计算机视觉的服务。终端用户不会知道解决方案采用的是什么平台,而 CoSP 却可以享受有着丰富选择的现成软件和开发人员生态系统。在边缘运行软件有利于支持新的时间敏感型用例,同时为用户维持公有云 “即服务” 型的简单体验。

CoSP 提供这些服务需要承担新的 SLA 责任。超大规模云服务提供商云堆栈的 SLA 并没有那么严格,有时甚至没有 SLA(当数据中心、网络连接和数据中心管理人员在超大规模云服务提供商控制权限以外时)。CoSP 在满足 SLA 方面经验丰富,因此完全能够胜任满足新 SLA 的责任。

长此以往,CoSP 会发现他们需要与多个云服务提供商合作,以在边缘交付不同的云堆栈。混合云如今已是多数企业的常态,平均每家企业或机构拥有 3.4 个公有云,其中 2.2 个用于生产1。企业或机构可根据不同的功能和应用选择不同的云堆栈。如果不需要为不同的云服务提供商重构平台,那么将应用迁移到网络边缘会是更方便的选择。

在数据中心托管公有云基础设施的 CoSP 也能在该基础设施上运行自己的工作负载。这样,在高需求的情况下,他们便能更容易地将需求导向公有云。这种方式可能需要进行大量软件开发,因此第一步就是进行严格的成本分析。

在多个位置拥有相同的云基础设施硬件实例可以大幅减少应用迁移、验证和支持混合云环境所需的工作量,一致的硬件也会让运维更加容易。针对云和边缘实施的特殊要求,英特尔推出了出色的产品组合。我们还支持包括 Linux 和 Kubernetes 在内的开源生态系统,便于开发人员利用此类新技术。


展望未来

我们预计未来几年里云服务提供商和 CoSP 之间的合作会越来越多。云平台的性能会不断提升,以满足网络工作负载的严苛要求。云服务提供商和 CoSP 将共同助力推动云计算的发展,使客户充分享受 5G 的速度、带宽和大规模连接。


了解更多
 


致谢

感谢英特尔的 Mitch Koyama、Jay Vincent 和 Paul Mannion 以及戴尔的 Anit Lohtia 和 Rowland Shaw 为本篇博客文章提供意见。“电信工作负载布局和偏好模型” 由 Eslam Kandiel、Ahmed Ibrahim 与 Petar Torre 共同编制。