加速数据传输, 助力企业更快获取洞察

加速数据传输, 助力企业更快获取洞察

英特尔® 至强® 可扩展处理器

英特尔® 数据流加速器(英特尔® DSA

概述

  • 英特尔® DSA 可通过从 CPU 卸载数据传输操作来加速工作负载,从而加速存储、网络和数据分析。内置英特尔® DSA 的第五代英特尔® 至强® 可扩展处理器可将大数据包顺序读工作负载的性能提升高达 2.26 倍,每瓦性能提升高达 2.15 倍。利用内置英特尔® DSA 的第四代和第五代至强® 可扩展处理器,企业和机构能以更少的服务器满足性能需求,降低 TCO。

author-image

作者

内置英特尔® 数据流加速器(英特尔® DSA)的全新第四代和第五代英特尔® 至强® 可扩展处理器可助力企业加速高性能数据复制和转换操作。

加速存储和网络

与开箱即用的软件相比,第五代 英特尔® 至强® 可扩展处理器可将大数据包顺序读工作负载的性能提升高达 2.26 ,每瓦性能提升高达 2.15 1

企业需要快速获取洞察,方能做出更明智的决策。而快速获取洞察的前提是数据能在服务器内部以及服务器之间高效传输。数据中心架构师和开发人员可以利用内置英特尔® 数据流加速器(Intel® Data Streaming Accelerator,英特尔® DSA)的全新第四代和第五代英特尔® 至强® 可扩展处理器,加速存储、网络和数据分析,让企业保持高效运转。

英特尔® DSA 通过从 CPU 卸载数据传输操作来加速工作负载。例如,当处理器以 10 Gb 连接速度接收数据时,仅复制数据就会消耗大量 CPU 周期。如果将这类任务卸载到英特尔® DSA,处理器就能更快地运行其他任务。英特尔提供的工具和实施资源可以帮助开发人员和架构师优化新应用和现有企业工作负载中的数据传输,从而以更低的成本助力改善业务成果。

英特尔® DSA 的用例

英特尔® DSA 支持多种不同用例,包括数据中心、存储、网络和虚拟机 (VM)。

简化集成

对于开发人员和架构师来说,寻找适合实施新的硬件组件的库和软件往往是一项具有挑战性的任务。英特尔简化了英特尔® DSA 的集成流程,因为各种所需的工具及相关文档都能够很方便地为大家所用。英特尔与开源社区有着深厚的合作,共同推出了多方面的优化和安全技术,有助于更充分地释放基础设施的潜力。

促进可持续发展

内置英特尔® DSA 的英特尔® 至强® 可扩展处理器可提升每瓦性能水平,帮助企业和机构实现可持续发展目标。如图 1 所示,与支持 NVM Express (NVMe) over TCP 的存储性能开发套件 (SPDK) 中的开箱即用操作系统 (OS) 相比,内置英特尔® DSA 的第四代英特尔® 至强® 可扩展处理器在转换大型媒体文件时可将每瓦性能提升高达 3.18 倍,执行数据库请求时可将每瓦性能提升高达 1.92 倍2

图 1. 能效更出色的服务器架构3

降低 TCO

与基于第三代英特尔® 至强® 可扩展处理器的服务器相比,利用基于内置英特尔® DSA 的全新第四代和第五代英特尔® 至强® 可扩展处理器的服务器优化工作负载,可使企业和机构部署更少的服务器来满足相同的性能需求。这有助于降低企业和机构的总体拥有成本 (TCO)。例如,如图 2 所示,使用 SPDK 处理大型媒体文件请求需要 15 台基于内置英特尔® DSA 的第四代英特尔® 至强® 可扩展处理器的服务器,而要达到相同性能水平则需要 50 台基于第三代英特尔® 至强® 可扩展处理器的服务器4。与基于上一代英特尔® 至强® 可扩展处理器的服务器相比,内置英特尔® DSA 的第四代英特尔® 至强® 可扩展处理器出色的服务器效率可带来高达 60% 的 TCO 降幅5

图 2. 更具成本效益的服务器架构6

实现出色性能

开发人员可以借助英特尔提供的多种资源实施英特尔® DSA,以实现出色性能。英特尔的库包括英特尔® Data Mover Library(英特尔® DML),这一开源库提供了基于英特尔® CPU 的高性能数据操作方法,可用于提高数据库、通信以及科学或技术应用的性能。了解如何利用英特尔® Query Processing Library(英特尔® QPL)和英特尔® DML 优化数据操作和处理

将英特尔® DML 与英特尔® DSA 结合使用,开发人员可将使用 NVMe over TCP 时的每秒输入/输出操作次数 (IOPS) 提升高达 60%, 大数据包顺序读任务的时延降低高达 37%7

英特尔® DSA 的架构

英特尔® DSA 旨在加速数据传输操作和转换操作。

数据传输操作

当需要高效的数据传输来支持存储和网络等工作负载时,架构师和开发人员可选用英特尔® DSA。内存复制就是其一项常见的数据传输功能。图 3 展示了英特尔® DSA(利用英特尔® DML 启用)是如何通过内存复制来降低时延和提升内存传输性能的。

图 3. 启用英特尔® DSA 前后的内存复制情况对比

开发人员可以构建使用英特尔® DSA 的企业应用,以加速往返易失性内存、持久内存、内存映射输入/输出 (I/O) 的数据传输。他们还可通过片上系统 (SoC) 中的非透明桥 (NTB) 加速数据传输,使数据能在一个集群内不同节点上的内存之间更快传输。

数据转换操作

架构师和开发人员还可利用英特尔® DSA 在内存上执行更高级别的数据转换操作。例如,英特尔® DSA 可以在内存区域生成和测试循环冗余校验 (CRC) 或数据完整性字段 (DIF),以支持存储和网络应用。此外,此加速器还支持内存相等性比较操作,生成增量 (Delta) 记录,并将增量记录应用到缓冲区。开发人员可以在虚拟机迁移、虚拟机快速检查点和软件管理的内存去重等应用中使用增量记录。

针对英特尔® DSA 的其他开发工具

除了英特尔® DML 以外,英特尔还提供了一系列工具,帮助开发人员构建新应用:
 

针对关键工作负载启用英特尔® DSA

开发人员和架构师可以利用以下资源和工具着手使用英特尔® DSA,在现有解决方案中更轻松地实施英特尔® DSA:
 

加速企业工作负载

以下场景展示了内置英特尔® DSA 的全新第四代和第五代英特尔® 至强® 可扩展处理器如何加速网络存储应用、软件定义网络 (SDN) 和视频流。下文还提供了针对特定工作负载的资源。

网络存储应用

借助英特尔® DSA 利用 SPDK NVMe 构建需要高速存储的应用,包括数据库或虚拟化存储,或创建数据缓存等软件组件。

使用内置英特尔® DSA 的第四代英特尔® 至强® 可扩展处理器的优势:
•  与第三代英特尔® 至强® 可扩展处理器相比,使用通过 SPDK NVMe 实施的英特尔® DSA,可在相同性能水平下将 TCO 降低高达 60%6

使用内置英特尔® DSA 的英特尔® 至强® 铂金 8592+ 处理器的优势:
•  与开箱即用 (OOB) 的软件相比,可将大数据包顺序读任务的性能提升高达 2.26 倍,每瓦性能提升高达 2.15 倍1

实施和采用资源

代码资源

软件定义网络

软件定义网络可实现更快的数据包处理。将 Project Calico 和矢量数据包处理 (VPP) 与英特尔® DSA 搭配使用,创建网络功能更出色的应用,从而加快服务交付。

使用内置英特尔® DSA 的第四代英特尔® 至强® 可扩展处理器的优势:
 

  • 与基于软件的内存复制相比,可将单核吞吐量提升高达 2.33 倍(1,500 MTU,1,500 B)和 2.63 倍(9,000 MTU, 2,400 B)8

实施和采用资源

代码资源

视频流

ST-2110 标准视频流协议、数据平面开发套件 (DPDK) 库以及英特尔® 以太网网络适配器 E810 与英特尔® DSA 结合使用,加速视频流。这种协同作用可提高内核效率和系统扩展能力,使该协议能够用于加速广播工作流程,提升体育广播、音乐会和新闻报道质量,并为专业视频制作提供支持。

英特尔® DSA 通过从全新第四代和第五代英特尔® 至强® 可扩展处理器卸载数据包复制操作,提高了视频流用例的性能。

实施和采用资源

容器详情

代码资源

加速获取洞察

借助内置英特尔® DSA 的全新第四代和第五代英特尔® 至强® 可扩展处理器,优化数据传输和转换操作。在服务器内部和服务器之间高效传输数据,以加速存储、网络和数据分析。加速数据传输则可以更快获取数据洞察,实现更好的业务成果。

进一步了解第四代英特尔® 至强® 可扩展处理器第五代英特尔® 至强® 可扩展处理器英特尔® 加速引擎,立即启用英特尔® DSA,开始开发工作。