阿里云

四代至强® 提供强劲加速,阿里云ECS性能一路“狂飙”

概述

  • 阿里云推出搭载第四代英特尔® 至强® 可扩展处理器的第八代企业级弹性计算实例规格族 ECS g8i,在四代至强® 可扩展处理器全面提升的性能及内置加速器的支持下,g8i 全核睿频 p0n 达到 3.2GHz,性能相比上一代实例最大提升 60%,通用与场景化性能双双狂飙,同时构建出了更高安全等级的数据保护能力和云上可信运行环境。

author-image

作者

与“狂飙”成为热词一道,AIGC 大行其道让算力需求高企成为大势,驱动着为新型基础设施乃至经济社会发展提供关键支撑的云计算通过技术创新,为持续提升的性能提供再“加速”,满足 AI 大模型训练等面向未来的工作负载之需。

在这一进程中,英特尔® 至强® 可扩展平台为广泛的云服务提供了坚实的算力底座。英特尔公司首席执行官帕特 · 格尔辛格在 2023 英特尔可持续发展高峰论坛还强调指出,英特尔正在通过专门的加速器为用例提供增强,以推动人工智能众创,支持可持续发展。

2023 年 1 月发布的最新一代,也就是第四代英特尔® 至强® 可扩展处理器,贯彻以结果为导向、工作负载至上的策略,通过集成高性能核、更多内核数量、业内高需求的数据中心工作负载的相关加速器,以及业界领先的 DDR5、CXL1.1、PCIe 5.0,让加速无所不在,助力解决客户在 AI、分析、网络、安全、存储和科学计算领域面临的重大计算挑战。与前一代相比,其通过内置加速器将目标工作负载的平均每瓦性能提升 2.9 倍,同时能只在对工作负载性能产生极低影响的情况下,通过优化电源模式为每个 CPU 节能高达 70 瓦,并降低 52% 到 66% 的总体拥有成本(TCO)1

第四代英特尔® 至强® 可扩展处理器性能全面提升

阿里云快人一步,仅仅隔了 2 个月之后,就推出了搭载第四代英特尔® 至强® 可扩展处理器的第八代企业级弹性计算实例规格族 ECS g8i,且早在芯片设计阶段,双方就已开启深度合作。

基于全新升级的第四代英特尔® 至强® 可扩展平台及其内置的丰富加速器,阿里云第八代 ECS 实例通用与场景化性能双双狂飙,同时构建出了更高安全等级的数据保护能力和云上可信运行环境。

第四代英特尔® 至强® 可扩展处理器内置七大算力神器

第四代至强® 可扩展处理器加持,g8i通用算力彪悍提升

g8i 实例采用 CIPU+飞天技术架构,搭载第四代英特尔® 至强® 可扩展处理器,网络性能及存储 I/O 均实现大幅演进。尤其可圈可点的是,g8i 还标配阿里云自研 eRDMA 大规模加速能力,标志着 eRDMA 能力的全面商业化。阿里云 CIPU 所独有的 eRDMA 可让网络时延低至 8 微秒2,且可依托 RDMA 协议栈的高性能、低开销特性,将 CPU 负载更多释放出来,使其更专注于业务处理。

这些独具的优势,在第四代英特尔® 至强® 可扩展处理器具备的 DDR5、CXL1.1、PCIe 5.0 等全新特性及内置加速器的支持下,使得 g8i 更加如虎添翼,全核睿频 p0n 达到 3.2GHz,性能相比上一代实例最大提升 60%,在计算、网络、存储、安全等方面均有炸裂般表现。

多项至强® 内置加速器加持,g8i 场景化性能狂飙

在通用算力彪悍提升的基础上,g8i 实例还依托第四代英特尔® 至强® 可扩展处理器内置的丰富硬件加速器,实现了场景化性能的狂飙,其中在深度学习训练场景性能提升 2 倍以上,推理性能提升 4 倍,加解密、压缩/解压缩等场景性能提升 4 倍以上,使得阿里云在统一技术架构下可获得更好的场景化性能扩展,为用户提供更高的性价比。

g8i 实例场景化性能全面提(数据及图片援引自:http://news.sohu.com/a/659794618_115128

英特尔® 高级矩阵扩展(英特尔® AMX)为例,其不仅可以大幅提升深度学习、训练、推理的性能,而且集成调优功能,可支持中小型深度学习训练模型,进一步提升基于 CPU 的深度学习与训练能力,将 PyTorch 实时推理和训练性能提升 10 倍,将大型语言模型的处理速度提升多达 20 倍2。面向云实例,英特尔和阿里云深度合作,将这一能力透传到上层的虚拟机,成功在 g8i 融入 AMX 能力。经国内某大型社交平台在搜推广场景的应用表明,这一创新方案通过 CPU 和 GPU 协同,大幅提升了运行效率。

再比如,英特尔® 数据保护与压缩加速技术(英特尔® QAT)可通过卸载加密、解密和压缩释放处理器内核,降低系统资源消耗,让系统支持更多客户端运行。此前,如果用户有加解密、压缩/解压缩诉求,简单粗暴的方案就是单独买一个 QAT 加速卡放到服务器,阿里云也确有用户曾提出能不能在实例上给“插个卡”,但业界尽知,在公有云实例单独“插个卡”,其挑战较高,且如果规模不够大的话,很难提供一致性、弹性和吞吐能力。而运用第四代至强® 可扩展处理器内置的英特尔® QAT,g8i 无需额外插卡,在极限情况下压缩/解压缩性能可提升高达 70 倍2

另外,英特尔® 存内分析加速器(英特尔® IAA)、英特尔® 数据流加速器(英特尔® DSA)对 g8i 实例性能提升也功莫大焉,助力阿里云在逻辑推理推广、大数据、数据库等多种场景,拥有了更强劲的能力和更热辣的表现。

英特尔® 安全引擎,助阿里云构建全方位防护

作为亚太地区最早部署机密计算的云厂商,阿里云一直在持续推广可信与机密计算技术,以便为客户数据提供更好保护。贯彻这一理念,g8i 实例在性能飙升之外,还以立体化、业界领先的计算安全防护体系,构建出又一特色优势,而英特尔® 安全引擎(英特尔® Security Engine)在其中功不可没。

g8i 实例场景化性能全面提升(图片援引自:http://news.sohu.com/a/659794618_115128

ECS g8i 全量搭载安全芯片 TPM 作为硬件可信根,实现服务器可信启动,确保零篡改;在虚拟化层面,g8i 支持虚拟可信能力 vTPM,提供实例启动过程核心组件的校验能力。在实例可信的基础上,配合英特尔® 软件防护扩展(英特尔® SGX)提供的基于硬件的可信执行环境(TEE)和英特尔® 内存加密技术 (英特尔® TME),以及阿里云自研的加密计算隔离环境 enclave,g8i 进一步强化了数据可用不可见。

同时,g8i 实例还启动了机密虚拟机能力,也即英特尔® TDX(Intel® Trusted Domain Extension)的邀测,让用户无需二次开发即可将现有应用迁移至受TDX保护的实例,实现数据可用不可见。这也是经由阿里云和英特尔在 TDX 的架构设计、功能验证、安全分析和性能优化等方面紧密合作,实现了 TDX 技术全球首发。阿里云认为,该技术有助于机密计算通用化和平民化,将与可信技术一起,成为未来云上服务器的标准能力,为大型互联网、新金融、医疗保健、知识产权等广泛业务场景提供更高安全等级数据保护能力和云上可信运行环境。

持续技术创新,共享科技红利

欣慰于搭载第四代英特尔® 至强® 可扩展处理器,g8i 实例获得的通用算力和场景化性能提升及全方位的计算安全防护体系,阿里云弹性计算产品线负责人张献涛直言,在阿里云 CIPU+飞天的技术架构与第四代英特尔® 至强® 可扩展处理器的强强联合下,阿里云第八代企业级实例 g8i 规格族性能提升了 60%,并实现了机密虚拟机 TDX 在云上的首次实践,相信在双方的持续紧密合作之下,将会给更多各行业的客户带来更具性价比的技术红利2

如大咖感言,随云计算成为互联网时代的重要基础设施,ECS 作为云计算的算力底座,也承载着阿里云对用户服务稳定、安全、高性能,以及高性价比的服务承诺。搭载第四代英特尔® 至强® 可扩展处理器,并在其多款加速器的加持下,g8i 正以强劲的性能和高效用比,支持阿里云面向快速到来的智能时代进一步提升服务能力,不断降低用户上云用云的成本和门槛,托举千行百业的用户在丰富的真实应用场景下,直接感受阿里云采用新引擎带来的彪悍实力和更安全的计算环境,加快关键业务云化和智能化。