人工智能框架
通过嵌入式英特尔® 优化,将流行的深度学习和机器学习框架的性能提升高达 10 倍到 100 倍。
AI 框架通过高级编程接口为数据科学家、AI 开发人员和研究人员提供构建、训练、验证和部署模型的构建块。深度学习和经典机器学习的所有主要框架都通过使用 oneAPI 库进行了优化,这些库可提供跨英特尔® CPU 和 XPU 的最佳性能。这些英特尔® 软件优化有助于提供比相同框架的常用实现高几个数量级的性能提升。作为框架用户,您可以通过直接加速获得所有性能和工作效率优势,而无需学习新的 API 或低级基础库。
深度学习框架
英特尔® Optimization for TensorFlow*
TensorFlow* 是一种广泛使用的深度学习框架,它基于 Python*。它专为现代深度神经网络的灵活实现和可扩展性而设计。
英特尔正在与 Google* 合作,以优化其在基于英特尔® 至强® 处理器的平台上的性能。这些平台使用英特尔® oneAPI Deep Neural Network Library (oneDNN),这是一个用于深度学习应用的开源跨平台性能库。这些优化直接上传并通过简单的标志更新在官方 TensorFlow 版本中提供,这使开发人员能够无缝地从英特尔® 优化中受益。
最新版本的英特尔® TensorFlow* 优化作为英特尔® oneAPI AI Analytics Toolkit (AI 套件) 的一部分包含其中。该套件提供了一套全面且可互操作的 AI 软件库,以加速端到端数据科学和机器学习工作流程。
英特尔® Optimization for PyTorch*
PyTorch* for Python* 软件包提供了最快的动态神经网络实施之一,以实现速度和灵活性。英特尔和 Facebook* 广泛合作以:
- 在这个流行的框架中包含许多英特尔优化
- 在英特尔® 架构(尤其是英特尔® 至强® 可扩展处理器)上提供卓越的 PyTorch 性能
优化是使用 oneDNN 进行构建的,以提供跨平台支持和加速。
英特尔还为 PyTorch* 提供英特尔® 扩展,以获得更多尚未上传的功能,包括:
- 支持自动混合精度
- 自定义运算符
- 融合模式
此优化添加了与英特尔® oneAPI Collective Communications Library (oneCCL) 的绑定以实现高效的分布式训练,并且是一个整合包。它提供了最佳的开箱即用体验,可以从 PyTorch 中获得所有性能优势。该软件包具有以下最新版本:
- 采用英特尔® 优化的常用 PyTorch
- 英特尔 Extension for PyTorch
- oneCCL
英特尔® Optimization for Pytorch* 作为 AI 套件的一部分提供,该套件提供了一套全面且可互操作的 AI 软件库,以加速端到端数据科学和机器学习工作流程。
机器学习框架
英特尔® Extension for Scikit-learn*
Scikit-learn* 是用于数据科学和机器学习的最广泛使用的 Python 软件包之一。英特尔通过英特尔® Extension for Scikit-learn* 提供了一种无缝方式来加速英特尔® CPU 和 GPU 上的许多 scikit-learn 算法。此扩展包动态修补 scikit-learn 估算器以使用英特尔® oneAPI Data Analytics Library (oneDAL) 作为底层求解器。它实现了单节点和多节点英特尔l® 架构上机器学习算法的加速。
最新版本的英特尔 Extension for Scikit-learn 也包含在 AI 套件中。它提供了一套全面且可互操作的 AI 软件库,以加速端到端数据科学和机器学习工作流程。
英特尔优化的 XGBoost
这是一个著名的梯度提升决策树机器学习包。它包括针对英特尔® 架构的无缝插入式加速,可显著加快模型训练速度并提高准确度以进行更好的预测。通过与 XGBoost 社区合作,英特尔一直在直接上传许多优化,以在英特尔® CPU 上提供卓越的性能。
英特尔优化的最新版 XGBoost 包含在 AI 套件中。它提供了一套全面且可互操作的 AI 软件库,以加速端到端数据科学和机器学习工作流程。