借助搭载第二代智能英特尔 至强可扩展处理器的 Amazon EC2 M5n 实例,使用高达 1.72 倍的 Apache Spark 工作负载吞吐量分析更多数据

Apache Spark

  • 用 1.57 倍的小型实例吞吐量分析更多数据。

  • 中型实例的吞吐量是 1.42 倍。

  • 大型实例的吞吐量是 1.72 倍。

author-image

作者

Amazon Web Services M5n 系列实例功能英特尔® 至强®可扩展处理器

使用 Amazon EC2 M5n 系列实例第二代智能英特尔 至强可扩展处理器提高机器学习的吞吐量

随着大数据的持续增长,组织必须找到方法来进行排序,并充分利用从这些数据收集到的课程,以在市场中保持敏捷性。在云中运行数据分析会在预装管理上遇到麻烦,但是使得选择实例会对复杂数据分析工作负载的性能造成的影响变得困难。对于 Amazon EC2 上的 Apache Spark 工作负载,选择由第二代英特尔 至强可扩展处理器启用的 M5n 实例可以提供更高的吞吐量,以一次排序更多数据,从而更快地为您提供洞察。

在对两种机器学习实施的测试中比较 Amazon EC2 实例,由第二代英特尔 至强提供支持的更新的 M5n 系列实例。

可扩展处理器的性能优于搭载英特尔 至强 E5 v4 处理器的旧版 M4 系列实例,高达 Apache Spark 工作负载数据吞吐量的 1.72 倍。

无论您的机器学习工作负载需要,中小型还是大型实例大小,在较早的 M4 实例中选择采用第二代英特尔 至强 可扩展处理器的 M5n 系列实例可以更快地分析更多数据并提供可行的洞察。

缩短对小型实例进行洞察的时间

组织收集的所有数据只有在能够迅速对其有意义时才是有价值的。例如,客户偏好预测和类似推理必须实时工作,以产生业务影响,这需要更新的技术来更快地交付结果。

图 1。Nave Bayesian 分类的小型实例 (8 vCPU/32GB RAM) 的相对吞吐量比较,以及 HiBench 基准套件中的 k-means集群工作负载。

测试比较了 8 个 vPU 的小型实例,显示选择搭载第二代英特尔® 至强® 可扩展处理器的 Amazon EC2 M5n 实例可使采用 英特尔 至强 E5 v4 处理器的 M4 系列实例的 Apache Spark 机器学习工作负载吞吐量提升高达 1.57 倍。

缩短对中等实例进行洞察的时间

与小型实例一样,对比带有 16 个 vPU 的中型实例的测试表明,搭载第二代英特尔® 至强® 可扩展处理器的 Amazon EC2 M5n 实例改进了 Apache Spark 上的两种机器学习实现,在这种情况下,可提供多达 1.42 倍的旧 M4 实例吞吐量。

图 2。Naéve Bayesian 分类的中等实例 (16 vCPU/64GB RAM) 的相对吞吐量比较,以及 HiBench 基准套件中的 k-means集群工作负载。

缩短对大型实例进行洞察的时间

测试表明,大型实例(64 vCPU)的机器学习性能增长最为显著,可将 M4 系列实例的吞吐量提升高达 1.72 倍,用于 k-Means 群集工作负载。

图 3。Naéve Bayesian 分类和 HiBench 基准套件中 k-means 集群工作负载的相对吞吐量比较(64 vCPU/256GB RAM)。

这意味着,无论所需的实例大小,希望从数据中快速获得可行洞察的组织都可以从选择由第二代英特尔 至强可扩展处理器启用的升级 Amazon EC2 M5n 实例中获益。

了解更多信息

要使用第二代智能英特尔 至强可扩展处理器在 Amazon EC2 M5n 系列实例上开始 Apache Spark 部署,请访问 http://intel.com/AWS

有关更多测试详细信息,请访问 http://facts.pt/3Kjn66x

本页面上的内容是原始英文内容的人工翻译与计算机翻译的组合。我们提供此内容是为了您的便利并且仅供参考,未必完整或准确。如果本页面的英文版与翻译版之间存在任何冲突,应以英文版为准。 查看此页面的英语版本。