使用搭载第二代智能英特尔® 至强® 可扩展处理器的 Amazon® R5d 实例,运行 Datab英特尔® 至强® 查询可减少多达 76% 的时间并降低成本

Datab 就这些数据:

  • 借助搭载第二代智能英特尔 至强 可扩展处理器(启用 Photon)的 r5d.2xlarge 实例,运行决策支持查询的时间减少了多达 76%。

  • 使用搭载第二代智能英特尔 至强可扩展处理器(启用 Photon)的 r5d.2xlarge 实例,在运行决策支持查询时花费最多减少 51% 。

author-image

作者

由于启用了光子矢量化查询引擎,这些实例在决策支持工作负载上采用 AMD EPYC™ 处理器的 r5a.2xlarge 实例的性能更高,并提供了更好的价值

许多组织都依靠 Datab Lakehouse Platform 来存储和分析数据,包括结构化和非结构化数据。要快速运行您的决策支持查询,选择有强大硬件支持的云实例是很重要的。但是确定哪些实例符合此条件可能是一项挑战。

我们进行了测试,帮助那些购买云实例处理决策支持工作负载的公司。具体来说,我们查看了 AWS 实例系列:采用 AMD EPYC 处理器的第二代英特尔® 至强®可扩展处理器和 R5a 实例支持的 R5d 实例。我们创建了这两种实例类型的 Databbbcs Runtime 9.0 集群,以运行决策支持工作负载。在 R5d 集群上,我们使用 VM 实现了一个称为 Photon 的矢量化查询引擎,旨在提高 SQL 查询性能。在进行此测试时,R5a 实例不支持 Datab感的光子引擎。

R5d 实例在更短的时间内完成决策支持工作负载

我们使用决策支持基准测试了两个 AWS 实例,该基准性能测试生成了一个较低是更好的分数,反映执行给定一组查询所需的时间。选择一个实例时间更少、对贵公司有两种方法帮助:第一种方法是更快、第二种方式获得有价值的信息,缩短实例正常运行时间并降低相关成本,这有助于您减少支出。如 图 1 所示,与搭载 AMD EPYC 处理器的 r5d.2xlarge 实例相比,在 1 TB 数据集上启用了第二 代英特尔 至强可扩展处理器和以光子技术完成的查询的时间减少了 74%。与 r5a.2xlarge 实例相比。通过 10TB 数据集,r5d.2xlarge 集群的查询完成时间比 r5a.2xlarge 集群缩短了 76%。

图 1。在搭载第二 代智能英特尔 至强可扩展处理器和在 1TB 和 10TB 数据集上搭载 AMD EPYC 处理器的 r5a.2xlarge 数据集上,相对处理时间完成一组基于光子技术的 r5d.2xlarge 实例集群中的基准性能测试查询。

如何缩短查询时间有助于获得利润

如同贵公司在其中投资的任何资源一样,以物美价比优先。我们计算了一家公司执行我们在上一页讨论的测试场景需要花费多少成本。我们在测试时使用每个实例、存储和 Databandroids DBU 每小时的价格以及图 1 中的时间来确定所有四种场景的每 TB 价格。如 图 2 所示,如果公司在启用 Photon 的 r5d.2xlarge 实例上运行决策支持工作负载,他们将花费更少的开支。对于 1TB 数据集,第二代英特尔® 至强® 可扩展处理器支持的 r5d.2xlarge 集群可以提供比搭载 AMD EPYC 处理器的 r5a.2xlarge 群集低 46% 的价格/性能。对于 10TB 数据集,启用 Photon 的 r5d.2xlarge 群集将性价比成本降低 51%。

图 2。将价格/性能标准化,以便在启用 Photon 的 Amazon r5d.2xlarge 实例上对比在 1TB 和 10TB 数据集上的 r5a.2xlarge 实例运行决策支持工作负载。

结论

我们测量了在搭载第二代英特尔 至强可扩展处理器和搭载 AMD EPYC 处理器的搭载第二代英特尔 至强可扩展处理器和 r5a.2xlarge 实例上,针对基于光子技术的 AWS r5d.2xlarge 实例完成一组 Databbbcs 查询的时间。r5d.2xlarge 实例完成的查询集时间减少了多达 76%。当我们将这两个实例的小时定价结合起来,发现 r5d.2xlarge 实例执行相同数量的工作的成本要低得多,而成本节约高达 51%。如果您的公司希望尽早获得可行的见解并减少对 AWS 实例的支出,选择采用第二代英特尔 至强可扩展处理器、支持 Photon 的 r5d.2xlarge 实例。

了解更多信息

要在启用了 Photon 的 Amazon R5d 实例上使用第二代英特尔 至强 可扩展处理器开始运行 Datab英特尔 至强 群集,请访问 https://aws.amazon.com/quickstart/architecture/databricks/

要了解有关 Datab https://databricks.com/product/photon 光端矢量化查询引擎的更多信息,请访问 https://databricks.com/product/photonhttps://docs.databricks.com/runtime/photon.html

针对本报告中的所有结果,我们使用的是来自 TPC-DS 的决策支持工作负载。所有测试均于 2021 年 12 月在美国 - 东 1 AWS 地区进行。所有测试均使用 20 节点集群,包括 Ubuntu 18.04.1、内核版本 5.4.0-1059-AWS、Databuits 9.0、Apache Spark 3.1.2、Scala 2.12。这两种实例类型都有 8 个 vCPU 和 64 GB RAM。r5d.2xlarge 有一个 300 GB NVMe 固态盘、10 Gbps 网络 BW 和 4,750 Mbps 存储 BW。r5a.2xlarge 实例有 250GB EBS 卷、10Gbps 网络 BW 和 2,880 Mbps 存储 BW。

本页面上的内容是原始英文内容的人工翻译与计算机翻译的组合。我们提供此内容是为了您的便利并且仅供参考,未必完整或准确。如果本页面的英文版与翻译版之间存在任何冲突,应以英文版为准。 查看此页面的英语版本。