要点综述
HLRN 超级计算机已被 100 多所大学和 120 多家研究机构所使用,以此探索科学研究的许多前沿领域,帮助开启更美好的未来。经过详细测试并找到最佳解决方案之后,选择了英特尔最新的处理器技术来为下一代 HLRN 超级计算机提供支持。教授.廷根大学的 Ramin Yahyapour 教授解释说:“对 HLRN 超级计算机的期望是为新实验大幅提升计算机性能。“
挑战
Ramin Yahyapour 教授说:“总体而言,科学正变得越来越需要大量计算和数据。这意味着科学家拥有更大的系统就有能力做得更好。这就是 HLRN 对科学研究至关重要的原因。”
HLRN 声称自己是一个非常苛刻的客户 — HLRN 先前部署了 3 个超级计算机系统,因此拥有丰富的专业知识。教授.Zusu 研究所的 Alexander Reinefeld 教授强调说:”我们期望所有基准性能测试应用程序都具有最高的性能。我们精心选择了基准性能测试套件,这样每个代码都给系统的特定部分带来了挑战,比如 CPU、通信网络和并行 I/O。我们并不是在寻求最佳的理论性能,而是需要真实的系统性能,这会使供应商为我们的应用程序优化基础设施变得更加复杂。这就意味着我们选择合适的处理器和正确的互连方式对于整体性能至关重要。”
与当今的大多数研究一样,对计算机实际能力的更多需求源于这样的现实,即各种各样的模拟对于研究人员来说非常关键。更快的计算机主要用于增加模拟的大小和分辨率,以期找到新的发现。
“我们需要真实的系统性能……这就意味着我们选择合适的处理器和正确的互连方式对于整体性能至关重要。”— Reinefeld 教授
解决方案
HLRN 购买了一台新的超级计算机,其内核数量不足 25 万个。英特尔® 至强® 铂金 9200 处理器(来自第二代英特尔® 至强® 可扩展处理器家族)将作为”合适的处理器“为 HLRN 提供服务。对于“正确的互连方式”,HLRN 选择了 Cornelis Networks (英文) 公司。该系统由 Atos(前身为 Bull Computing)打造,并将在物理上由柏林 Zuse 研究所 (ZIB) 和哥廷根大学分开使用。这些站点以前使用过这个拆分系统模型,并且在柏林与哥廷根之间部署了 170 多英里专用的冗余 10 千兆光纤电缆。
ZIB 的研究人员将 HLRN-IV 用于流体动力学,包括为飞机机翼开发湍流模型。
结果
HLRN 宣布新系统 HLRN-IV 的速度大约是以前系统的 6 倍,可提供 16 PetaFLOP/s 的性能。2研究人员的兴奋显而易见,而正在开展的研究清单也令人难以置信。教授 教授激动地说:“这是一个很棒的系统。我们的用户将直接从这个功能更强大的系统中受益,而无需更改其代码。第二代英特尔® 至强® 可扩展处理器的同类架构将提供真正的性能可移植性,这对于我们的研究人员来说是至关重要的一个方面,他们因此可以迅速地从更强大的新系统中受益。“
HLRN 的主要研究领域包括:
- 地球系统科学— 其中包括气候变化方面的研究。学科包括海洋、雨林、冰川、南极浮游植物(微藻)、矿物尘埃循环和平流层的动力学。
- 流体动力学 - 其中包括用于船舶涡轮机、风力涡轮机和飞机机翼的湍流模型。这些模型因需要巨大的计算能力而臭名昭著 — HLRN-IV 将使大型系统能够运行更细粒度的湍流模拟,例如穿过城市的风或穿过涡轮机叶片的风。通过对完整城市进行建模,可以研究新建筑如何改变风量以及影响城市内各种微气候的其他因素。这可能会激发新的设计思路,从而改善城市生活。有些研究人员希望能够理解这些思路,为未来的高升力商用飞机铺平道路。另一些研究人员则希望通过研究固体散装货物(例如铁矿石或镍矿石)的液化来挽救生命和船只。由于未能妥善处理这一问题,在过去 10 年中,全球至少损失了 7 艘船。
- 医疗保健 - 这是一个广泛的研究领域,HLRN 研究人员希望能以多种方式提供帮助,其中包括改善家庭医疗服务。更好地了解疾病和疾病的治疗,将对我们所有人产生影响。研究包括药物功效、相互作用和副作用的模拟。巨大的计算能力可使这些领域的先锋研究人员开始探索这些模拟的“个人医学”方面,而不仅仅是对普通人群的平均影响。
在哥廷根大学,研究领域包括细胞和分子机器的合作项目。
跨多种研究的高性能
在科学界,HLRN 必须为其诸多研究人员提供所有类型的工作负载支持。因此,HLRN 系统需要具有通用系统的特性,但仍具有最高的性能。他们最终选择没有加速器。
“尽管我们在采购过程中考虑了包括 GPU 在内的加速器,但在系统中使用 GPU 或其他加速器时所获得最高性能并没有优势。”— ZIB 超级计算主管 Thomas Steinke 博士
HLRN 的基准性能测试是开放的,其中包括可以利用 GPU 的基准性能测试。HLRN 发现,在考虑减少通用计算能力或所涉及的额外成本时,某些工作负载的性能优势尚显不足。基于第二代英特尔® 至强® 可扩展处理器的同类系统,证明了自己是满足 HLRN 科学家和研究人员多样化需求的最佳选择。
击败阿姆达尔定律
Thomas Steinke 博士始终铭记阿姆达尔定律,特别强调将快速算法用于快速计算机。他认为:“由于第二代英特尔® 至强® 可扩展处理器具有较高的实际性能,所以与以前的多核架构相比,优化代码以在节点上进行扩展的压力减小了。“
第二代英特尔® 至强® 可扩展处理器家族为高性能计算 (HPC) 提供了出色的选择,并帮助程序员应对阿姆达尔定律。
”我们的用户将直接从这个功能更强大的系统中受益,而无需更改其代码。”— Reinefeld 教授
AI 在 HPC 领域的未来
AI 和机器学习将影响 HLRN 研究的所有领域。人们感兴趣的一个热门领域是机器学习和 AI 技术与传统模拟功能的融合。尽管已经获得一些鼓舞人心的成果,但仍有许多工作要做。对算法的探索可能会带给研究人员多个方向,而对灵活性的需求是 HLRN 选择第二代英特尔® 至强® 可扩展处理器来支持其下一代研究的原因之一。
避免数据移动
Yahyapour 教授强调:“CPU 对于人工智能和机器学习非常有用。这是我们看到我们的研究人员有更多需求的一个领域。传统上,研究人员并不多么忙于数据密集型工作,但是我们认为这是新系统的一个新趋势,也将引起特别关注。”
事实证明,英特尔®高级矢量扩展 512 (英特尔® AVX-512 )是明智的选择,它有助于提高 HLRN 的计算能力,并且通过添加英特尔® 深度学习加速(英特尔® DL Boost)来增强 AVX-512,从而为 HPC 应用的新领域提供出色的性能。
对于所有类型的算法,计算数据的能力决定了数据移动的规模。这代表了计算能力的提高,能源浪费的减少。一个双赢的结果!
在探索新算法和新应用技术时,最重要的就是系统的灵活性。第二代英特尔® 至强® 可扩展处理器可提供高性能,以及应对未来挑战所需的灵活性。