多样化的架构,促进卓越创新
前所未有的架构选择,能够解决任何计算需求。
跨整个计算领域的领导地位
今天的计算机应用领域无比多样化 — 特别是随着数据、边缘计算和人工智能的激增,还在愈演愈烈。然而,不同的工作负载需要不同类型的计算。
英特尔独特的优势,使其能够提供多种标量、矢量、矩阵和空间架构结合的解决方案,广泛部署在 CPU、GPU、加速器和 FPGA 插槽中。这使我们的客户能够做到因地制宜,将最合适的计算类型应用到有需要的地方。结合可扩展的互连和单个软件抽象,英特尔的多种架构可以在整个计算领域内发挥领导作用,从而为以数据为中心的世界提供动力。
- 标量架构 一般是指 CPU 上最佳的工作负载类型,其中一个指令流以通常由 CPU 时钟周期驱动的给定速率运行。从系统启动和生产力应用程序,到密码学和人工智能等高级工作负载,基于标量的 CPU 可以在广泛的拓扑结构中工作,并具有一致、可预测的性能。
- 向量架构最适合工作负载,可分为指令向量或数据元素向量。GPU 和 VPU 提供基于矢量的并行处理,以加速游戏、富媒体、分析及深度学习训练和推理的图形渲染。通过从客户端、数据中心和边缘扩展矢量架构,我们可以将并行处理性能从 gigaFLOPS 提升到 teraFLOPS、petaFLOPS 和 exaFLOPS。
- 矩阵架构的名称源自于通常为人工智能工作负载(矩阵乘法)执行的常见操作。虽然其他架构可以执行矩阵乘法代码,但传统上 ASIC 在实施人工智能推理和训练(包括矩阵乘法)通常所需的操作类型方面已经达到了最佳性能。
- 空间架构是一种特殊的架构,一般与 FPGA 相关联。此时,数据流经芯片,对数据元素进行的计算操作基于数据在设备中的物理位置。编程到 FPGA 中的特定数据转换算法。
标量架构的优势:多功能、通用
从系统引导到高效工作应用程序,再到加密技术和人工智能等高级工作负载,大多数计算需求都可以通过基于标量的中央处理器 (CPU) 来满足。CPU 以一致、可预测的性能跨广范围的拓扑工作。
英特尔为 CPU 提供了两种世界一流的微架构,即高效内核微架构和性能内核微架构。从低 TDP 移动设备到基于至强® 的强大数据中心,这些微架构是英特尔各个 CPU 产品系列的核心所在。我们可扩展的 CPU 选项有助于客户找到性能、能效和成本之间的平衡。
向量架构的优势:高度并行处理
图形处理器,又叫 GPU,能提供基于矢量的并行处理,用于加速诸如游戏图形实时渲染等工作负载。由于 GPU 擅长并行计算,因此它们也是加速深度学习和其他计算密集型工作负载的理想选择。
英特尔的集成 GPU 为成百上千万台电脑带来超凡的视觉效果。借助 Xe 架构,我们扩大了 GPU IP 产品组合,以覆盖离散客户端和数据中心应用。在包括富媒体、图形和分析等快速增长的领域提供更多功能。
我们当前的 GPU IP 产品组合将实现从 teraFLOPS 到 petaFLOPS 再到 exaFLOPS 的并行处理性能。 它包括 3 种微架构:
- 适合于高效显卡的 Xe LP
- 适合于高性能显卡的 Xe HPG
- 适合于高性能计算的 Xe HPC
Xe HPG 和 Xe HPC 微架构搭载了称为 Xe-内核的新计算块。Xe 内核集成了一套矢量引擎,可以针对不同的工作负载和细分市场进行优化,特别是增加了 Xe 矩阵扩展 (XMX) 以加速人工智能训练和推理。
Alchemist 系列 GPU 将采用搭载了 XMX 的 Xe HPG 微架构,并提供针对 DirectX 12 Ultimate 优化的高级图形功能。
Ponte Vecchio GPU 专为数据中心而设计,并具有增强的扩展、计算和 XMX 功能。
矩阵架构的优势:加速器和新的 CPU 指令
从数据中心到边缘设备,人工智能继续渗透到计算领域的各个方面。为此,我们已开发专用加速器,并在 CPU 中添加了微架构增强机制,借助新指令来加速人工智能工作负载。
专用集成电路 (ASIC) 是一种从新构建,适合于精确用途的处理器。在大多数情况下,ASIC 将为其设计支持的矩阵计算工作负载提供一流的性能。
英特尔正在使用专门构建的 ASIC 来扩展平台,为矩阵应用提供巨大的性能飞跃。其中包括 Habana 人工智能处理器和采用新 XMX(Xe 矩阵扩展)技术的 Ponte Vecchio 高性能计算 GPU。每个 XMX 引擎都构建有深度脉动阵列,使 Ponte Vecchio 能够在单个设备中拥有丰富的矢量和矩阵能力。
此外,在第三代智能英特尔® 至强® 可扩展处理器和第十代智能英特尔® 酷睿™ 处理器上提供英特尔® 深度学习加速技术,增加了用于加速矢量神经网络指令 (VNNI) 的架构扩展。为了显着增加人工智能应用程序的每时钟指令数 (IPC),我们引入了一项名为 Intel® AMX(高级矩阵扩展)的新技术。这项技术将首先应用于我们下一代的 Sapphire Rapids 架构,以显著提供矩阵类型的运算。
英特尔® Xe Matrix Extensions(英特尔® XMX)
深度脉动阵列
英特尔® Advanced Matrix Extensions(英特尔® AMX)
平铺矩阵相乘加速器
空间架构的优势:可重复编程的 FPGA
现场可编程逻辑门阵列,又名 FPGA,是一种集成电路,能够以物理方式控制逻辑门如何开启和关闭。FPGA 芯片中的电路并未经过硬蚀刻,可以根据需要对其进行重新编程。
英特尔® FPGA 提供可完全自定义的硬件加速,同时保留了灵活性,以适应快速变化的计算需求。像空白、可修改的画布一样,它们的用途和能力能够一而再、再而三地轻松作出调整。
英特尔® Agilex™ FPGA 和 SoC
英特尔® Agilex™ FPGA 家族利用异构 3D 系统级封装 (SiP) 技术集成了英特尔的首款基于 10 纳米工艺技术构建的 FPGA 结构。
英特尔® Stratix® 10 NX FPGA
英特尔® Stratix® 10 NX FPGA 是经过人工智能优化的 FPGA,适用于高带宽、低延迟、人工智能 (AI) 加速应用。英特尔® Stratix® 10 NX FPGA 通过针对人工智能优化的计算模块提供加速的人工智能计算解决方案,INT81 吞吐量比标准英特尔® Stratix® 10 FPGA DSP 模块最多高 15 倍。
下一代架构
在英特尔,我们通过研究和开发下一代计算,对未来的架构进行规划。其中包括量子和神经形态架构。
使用 OneAPI 的统一编程
我们的 oneAPI 计划将会定义多架构世界的编程方式。它将为开发人员提供统一和开放的编程体验,使他们能够根据自己选择的体系结构进行编程,从而消除相互独立的代码库、编程语言、工具和工作流造成的复杂性。
通知和免责声明2 3 4
产品和性能信息
根据英特尔内部估算。
所有产品计划和路线图可能随时更改,恕不另行通知。 本网页上提及的关于未来计划或预期的陈述属于前瞻性陈述。这些陈述基于当前的期望,并且涉及许多风险和不确定性,可能导致实际结果与此类陈述中明示或暗示的结果大不相同。有关可能导致实际结果出现重大差异的因素的更多信息,请访问 www.intc.com,查阅我们最新的营收公告和证券交易委员会备案文件。
英特尔使用代号来标识正在开发且未公开的产品、技术或服务。这些并非“商用”名称,也不会被用作商标。
这里提到的所有信息如有更改,恕不另行通知。