如今,工作负载正被持续推近数据源点,这对边缘计算提出了要求。要充分利用网络边缘使用模式,以获得低延迟和降低回程带宽成本等优势,关键是满足功耗和空间限制,同时提供性能和安全性。针对边缘计算和其他分布式环境进行优化的高级系统架构支持将数据中心资源向外推送,用于以下实施和用例:
- 网络:包括网关和路由器、安全设备和存储
- 5G 拓扑:包括 C-RAN 和 D-RAN 架构
- 安全性:包括安全访问服务边缘 (SASE)
- 物联网:包括智能运营
如今,已无需再部署固定功能设备来满足相应需求。基于英特尔架构的通用开放标准系统提供了灵活、经济高效的基础,可用于新一代边缘,包括边缘设备中的人工智能 (AI)。
英特尔® 至强® D-2700 和 D-1700 处理器简介
英特尔® 至强® D-2700 和 D-1700 处理器专为在边缘配置密集计算而设计,可在高计算吞吐量和低热设计功耗 (TDP) 之间取得平衡。它具有卓越的单核性能、高级安全功能以及内置硬件加速,可以实现加密、AI 和压缩,可以在满足密度优化的平台内满足严苛的工作负载要求。高度集成的设计被封装为基于球栅阵列 (BGA) 封装的片上系统 (SoC),以便于
设计和提高能效。
高度集成的设计,辅之以刚刚扩大的工作温度范围,非常适合开发在室内、室外和恶劣环境部署的紧凑型解决方案。该 SoC 还与前几代英特尔至强处理器的软件和 API 以及其它英特尔架构和解决方案完全兼容。由此可以给设计、开发和在现有英特尔解决方案中的集成带来便利,从而降低总拥有成本并缩短更新产品的上市时间。
计算性能
解决方案采用英特尔® 至强® D-2700 和 D-1700 处理器内置的一系列硬件技术,以加速工作负载,包括:
- 英特尔® 深度学习加速(英特尔® DL Boost)通过消除计算中的非必要精度来加速 AI 工作负载,从而加快完成速度。
- 英特尔® AES New Instructions(英特尔® AES-NI)加速硬件中 AES 加密算法的资源密集型部分。
- 英特尔® Advanced Vector Extensions 512(英特尔® AVX-512)通过超宽 512 位矢量运算提高性能,以满足 AI 和 5G 工作负载等严苛要求,与此前的技术相比,每个时钟周期可处理更多数据。
- 具有内联 IPSec 支持的英特尔® 通信加速技术(英特尔® QAT)可加速加密和压缩;该平台能够支持高达 100 Gbps 加密和 70 Gbps 压缩。加密功能还包括内联 IPSec,客户能够使用该功能为其他应用释放重要的计算核心。
硬件级安全创新
除了英特尔 AES-NI 和英特尔 QAT 的加密加速之外,英特尔® 至强® D-2700 和 D-1700 处理器还为解决方案提供商提供硬件内置的尖端安全功能,包括:
- 英特尔® Software Guard Extensions(英特尔® SGX)通过创建被称为安全执行隔区的专用、孤立内存区域来保护使用中的数据,在这些隔区中可以操作未加密的数据,不受软件和用户的约束且不考虑其权限级别如何。
- 内存加密无需修改即可支持现有软件,同时使用 NIST AES XTS 加密标准和硬件生成的密钥(来自在芯片中实现的强化随机数生成器)来保护内存免受硬件攻击。
高级集成式以太网连接
集成式以太网提供高达 100 Gbps 的吞吐量,连接选项可提供从 1 GbE 到 100 GbE 的链路。对于存储网络,SoC 平台可提供远程直接内存访问 (RDMA),用于绕过操作系统进行系统之间的内存传输,从而提高吞吐量并降低处理器开销和延迟。RDMA 功能包括对互联网广域 RDMA 协议 (iWARP) 和 RoCEv2(基于融合增强型以太网的 RDMA)提供支持。这种传输协议具有一定的灵活性,可以支持存储架构师选择拓扑结构。
集成式 NIC 支持动态设备个性化 (DDP),以提供多个配置文件,每个配置文件都为特定流量类型指定优化和数据包处理参数,以提高吞吐量和流量优先级。借助应用设备队列 (ADQ),特定应用可保留任意数量的专用以太网硬件队列,从而帮助确保可预测的性能。
集成式以太网功能还包括一个名为网络加速复合体 (NAC) 的增强型数据包处理器组件。NAC 是数据包处理和交换加速发展的未来;它集成了以下内容:
- 具有增强型调度程序的网络接口:提供高达 100 Gbps 的主机吞吐量
- 灵活的数据包处理器和交换机:可加速内联数据包处理
- 灵活连接,多达 8 个端口,速率为 25 Gbps、10 Gbps 或 1 Gbps
实施灵活性:一个架构,两种封装选项
为了拓宽使用模式的范围,英特尔® 至强® SoC 提供两种不同的封装:高核心数量的英特尔® 至强® D-2700 处理器和英特尔® 至强® D-1700 处理器,前者进行了性能优化,后者进行了成本和功耗优化。这两个选项为各种使用模式的高密度计算和网络部署提供了灵活性。
高级封装(高核心数量):英特尔® 至强® D-2700 处理器
使用英特尔® 至强® D-2700 处理器的高级 SoC 封装采用 4-20 个核心,适用于要求严苛的工作负载,例如处理高数据面吞吐量。与英特尔® 至强® D-1700 处理器相比,它的 TDP 更高,并具有更高的内存性能和容量、更多的 PCI Express 通道、带宽更高的加密功能以及通过英特尔 QAT 加速器实现的压缩功能。此外,英特尔® 至强® D-2700 处理器支持具有内联 IPSec 的 NAC。
标准封装(低核心数量):英特尔® 至强® D-1700 处理器
使用英特尔® 至强® D-1700 处理器的标准 SoC 封装具有 2-10 个核心,具体取决于特定的 SKU,该封装通常用于控制平面功能以及客户端设备等低吞吐量用途。
前代英特尔® 至强® D 处理器的升级路径
英特尔® 至强® D-2700 处理器是英特尔® 至强® D-2100 处理器的后续产品,而英特尔® 至强® D-1700 处理器则取代了英特尔® 至强® D-1500 和 D-1600 处理器。在所有情况下,升级都能在计算、内存和 I/O 方面提供显著、均衡且具有成本效益的改进。
边缘工作负载的优势
在边缘计算方面,英特尔® 至强® D-2700 和 D-1700 处理器较之前代产品更具成本效益,并且扩展性和安全性也得以提升。
代际性能提升1
信令和用户平面吞吐量提升:通过高级微架构实现
数据面开发工具套件 (DPDK) 优势:通过全新的英特尔® AVX-512 指令和内置加速器提供
采用高级安全连接的集成式高吞吐量网络
- 多达 8 个以太网端口:具有高达 100 Gbps 的数据包处理能力,且具有内联 IPSec
- 确保支持线路速率要求:同时通过附加服务和功能特性,增加更多价值
降低总拥有成本
- 增加了 I/O 带宽:由 PCIe 4.0 提供 (16 GT/s),具有多达 32 条通道
- 增加了每个节点的订户工作负载:以经济高效地部署高级服务
集成式加密和 AI 加速器
- 改进了英特尔 QAT:相较于前代产品,提供了更好的加速功能
- 面向 AI 的新指令:加速了 AI/深度学习工作负载
可扩展至多达 20 个核心
- 单一标准架构:适用于 NFV 产品组合,包括英特尔® 至强® 可扩展处理器
- 减少了平台总投资:通过应用、控制和数据面工作负载整合实现,具有软件向后兼容性
面向边缘部署的高级功能特性
不断扩大的使用范围和重要性对在边缘配置的计算资源提出了越来越高的要求,以实现性能、可管理性和数据保护。英特尔® 至强® D 处理器提供基于硬件的新技术,可加速工作负载,简化维护并增强安全性。
新型技术 | 优势 | |
---|---|---|
核心加速 | 矢量字节操作指令 (VBMI) | 用于内存数据库工作负载的核内压缩/解压缩加速 |
VPMADD52 指令 | 公钥加密生成 – SSL 前端 Web 服务器加速 | |
全新 SHA 扩展 | 加速哈希、SSL、TLS、IPsec、重复数据删除、区块链 | |
矢量 AES | 数据库工作负载加速 | |
性能调优和管理 | 英特尔® 资源调配技术(英特尔® RDT) | 监控内存和最后一级高速缓存的使用情况 |
灵活的全核睿频频率2和优先基频2 | 所有核心都处于活动状态,同时部分核心频率更高,以管理应用级性能 | |
英特尔 Speed Select2 | 降低核心数量,提高基频,实现动态 SKU 分类 | |
内部端子块接地 | 功耗优化的子细分市场 SKU 分类 | |
虚拟化改进 | 增强 NFV 工作负载的性能 | |
异步 DRAM 刷新 (ADR) | 具有增强型备用电池的 ADR 显著降低了对电池尺寸的要求 | |
安全性 | 英特尔® SGX-Trusted Environment Mode(英特尔® SGX-TEM) | 通过内存中的应用隔离进行细粒度数据保护 |
英特尔® Total Memory Encryption – Multi-Tenant(英特尔® TME-MT) | 面向多租户平台的虚拟机容器隔离 | |
英特尔® Platform Firmware Resilience(英特尔® PFR) | 保护、检测和纠正传输、启动和运行时的安全威胁 | |
第 3 代英特尔® 通信加速技术中的新算法 | 新增 SHA3、SM3、SM4、ChachaPoly 以加速 IPsec、TLS 和 DTLS 工作负载 | |
人工智能 (AI) | 英特尔® 高级矢量扩展指令集 512(英特尔® AVX-512) | 加速 AI/深度学习、科学模拟和金融分析等计算密集型工作负载的性能 |
矢量神经网络指令集 (VNNI) | 通过使用单一矢量指令集显著实现深度学习加速和节能 |
封装规格:高级与标准
英特尔® 至强® D-2700 和 D-1700 处理器在设计上相似,但在物理外形、核心数量、总设计功耗和其他功能特性方面有所不同。借助这些规格上的差异,SoC 可与具有相应性能、成本、空间和功耗要求和限制的用途相匹配。
插槽 | SoC:倒装芯片球栅阵列 (FCBGA) 52.5 毫米 x 45 毫米 | SoC:45 mm x 45 mm 触发芯片球栅阵列 (FCBGA) |
内核数 | 4-20 个,采用英特尔® 超线程技术 | 2-10 个,采用英特尔® 超线程技术 |
高速缓存 | LLC:1.5 MB/核(最大 30 MB) MLC:1.25 MB/核 | LLC:1.5 MB/核(最大 15 MB) MLC:1.25 MB/核 |
热设计功耗 (TDP) | 64-125 瓦 | 25-85 瓦 |
内存 | 4 通道 DDR4(2933 MT/s:每通道 2 个 DIMM,3200 MT/s:每通道 1 个 DIMM),8 Gb 和 16 Gb 密度,RDIMM 容量高达 512 GB3 | 2 通道或 3 通道 DDR4,至高可达 2933 MT/s,每通道 1 个和 2 个 DIMM,8 Gb 和 16 Gb 密度,RDIMM 容量高达 384 GB3 |
集成英特尔® 以太网 | 至高可达 100 Gbps 的吞吐量选项 连接性:1 GbE、2.5 GbE、10 GbE、25 GbE、40 GbE、50 GbE、100 GbE,使用 RDMA(iWARP 和 RoCE v2)4 | 至高可达 100 Gbps 的吞吐量选项 连接性:1 GbE、2.5 GbE、10 GbE、25 GbE、40 GbE,使用 RDMA(iWARP 和 RoCE v2)4 |
集成式英特尔® 通信加速技术 | 第 3 代英特尔® QAT:加密速率至高可达 100 Gbps,压缩速率至高可达 70 Gbps 80kOps PKE RSA 2K | 第 2 代英特尔® QAT:加密速率至高可达 20 Gbps,压缩速率至高可达 15 Gbps,20kOps PKE RSA 2K |
PCI Express | 共 56 条通道,32 条 PCIe 4.0 通道与 24 条 HSIO PCIe 3.0 通道配合使用,32 条通道为来自 CPU 复合体的 PCIe 4.0 全带宽专用通道(8 个根端口) 分叉:16 个、8 个、4 个 采用 PCI 4.0 通道的 NTB:16 个、8 个 | 共 40 条通道,16 条 PCIe 4.0 通道与 24 条 HSIO PCIe 3.0 通道配合使用,16 条通道为来自 CPU 复合体的 PCIe 4.0 全带宽专用通道(4 个根端口) 分叉:16 个、8 个、4 个 采用 PCI 4.0 通道的 NTB:16 个、8 个 |
支持 SATA | 通过 HSIO 提供多达 24 条 SATA 3.0 通道 | |
高速灵活的 I/O | 24 条高速灵活的 I/O 通道,配置为 PCIe/SATA/USB 多达 24 条 PCIe 3.0 通道(2.5 GT/s、5 GT/s、8 GT/s,分叉支持:8 个、4 个、2 个;12 个根端口) 或多达 24 条 SATA 3.0 通道,或多达 4 个 USB 3.0 端口 组合 HSIO 带宽限制为相当于 16 条 PCIe 3.0 通道的流量 |
|
其它功能 | UART、LPC、SPI、eMMC 5.1、2 条 USB 2.0 通道、英特尔® 管理引擎、SGX、TME-MT、PFR |
面向边缘计算的英特尔处理器产品组合
借助采用英特尔® 处理器构建的开放式系统,架构师可根据所需的计算和性能水平定制解决方案,同时实现实施所需的空间和功耗限制。英特尔® 至强® D 处理器已加入广泛的英特尔边缘处理器产品组合,其中还包括英特尔® 至强® 可扩展处理器和英特尔凌动® C3000 处理器。这些处理器家族可满足所有边缘计算要求,并在整个产品组合中具有完全的软件兼容性。