可视化的一大重要作用在于让复杂数据可被直观理解,因此,建筑设计、科学研究、娱乐和工程等各个行业都需要可视化。但是,随着这些行业的数据量呈指数级增长以及受当下图形处理硬件所限制,大型数据集的可视化挑战日益严峻。由于高质量的图像保真度对于可视化至关重要,使得这一挑战愈加严峻。对科学精确的模型进行可视化处理有助于更好地洞察所研究的问题,但如果模型的分辨率或保真度受损,则可能会引起误解,从而阻碍分析和发现过程。
除了有关图像保真度的处理密集型需求之外,科学家和研究人员越来越多地要求在可视化环境中实现交互性。交互式可视计算支持用户在计算过程中动态地修改参数并实时操控数据的可视表示形式,有助于推动更多的科学发现。但是,交互性对处理性能有很高的要求,可能会显著地降低可视化系统的速度,对于大型数据集尤其如此。
迄今为止,用于实现可视化和交互性的技术解决方案都未能在性能、视觉保真度和成本之间达到适当的平衡。例如,基于图形专用硬件的光栅化技术有时能够更快地渲染小型 3D 模型,但达不到更高的保真度。另一个例子是,光线跟踪技术虽然能为可视化提供最高的保真度,但光线跟踪算法在图形硬件上的性能表现一直不尽如人意。图形处理单元(GPU)的内在架构以光栅处理为中心,再加上内存和输入/输出(I/O)资源很有限,因此无法为光线跟踪算法提供足够的性能。
尽管并非广为人知,但事实上,英特尔® 并行处理器高度灵活的处理能力和直接访问内存的功能,可为基于光栅(OpenGL*)和光线跟踪的可视化技术提供兼具高性能和交互性的卓越平台。英特尔® 并行处理器可渲染大型数据集,而 GPU 则受到内存的限制。
软件定义的可视化
面向专业可视化的英特尔® 精选解决方案( I n t e l ® S e l e c t Solution)的基础是英特尔的软件定义可视化库。这些库提供基于 CPU 的软件,可提供灵活、高性能、可扩展、低成本、高能效的可视化解决方案,包括基于 GPU 的解决方案无法实现的大型 3D 数据(超过 1 TB)可视化处理。在基于 CPU 的硬件上运行这些软件库无需使用独立的 GPU,这使得科学家、工程师和数据艺术家可使用一个整体的平台来实现仿真和可视化。基于CPU 的解决方案的另一个优势在于,可以根据需要跨集群节点或在计算云内部进行扩展,以满足性能或内存容量的需求。不同于基于 GPU 的可视化解决方案,基于 CPU 的解决方案在扩展时无需依靠技巧或技术将数据“装入”受限制的内存中进行分析。此外,在可视化过程中,在英特尔® CPU 上运行的软件定义可视化技术可提供加速交互操作所需的性能。英特尔的软件定义可视化库提供一系列优化的开源功能,使高性能、高保真度的可视化应用能够在英特尔® 平台上运行。这些库可在诸如高性能计算(HPC)集群或云基础设施等并行处理环境中进行扩展。这些库包括:
• Embree*:针对 CPU 优化的光线跟踪内核库
• OSPRay*:基于 Embree 的集群渲染引擎
• OpenSWR*:高性能的 Mesa* OpenGL CPU 光栅化库
面向专业可视化的英特尔® 精选解决方案
面向专业可视化的英特尔® 精选解决方案为购买和部署集群以支持可视化工作负载提供了一条捷径,同时还可避免基于 GPU 的解决方案所面临的成本、限制和系统等方面的难题。面向专业可视化的英特尔® 精选解决方案包含经过预先验证的精选软件和硬件组件,旨在满足高性能计算和包含可视化工作流程的企业应用的需求。这些系统也提供相应功能和敏捷性,从而无需使用多个单一功能系统。此外,对于面向专业可视化的英特尔® 精选解决方案而言,关键系统特性的表现已在节点和集群层面经过验证。
为专业可视化技术精选的硬件
面向专业可视化的英特尔® 精选解决方案是经过验证的解决方案,该方案将英特尔® 至强® 可扩展处理器、英特尔® 可扩展系统框架(英特尔® SSF)以及其他英特尔技术融为一体,无需进行漫长的研究即可确定恰当的硬件来最大限度发挥仿真和可视化功能。这些解决方案可为英特尔® SSF 中注册的专业可视化应用程序提供最佳性能。通过在解决方案中使用英特尔® Cluster Checker,软件环境的技术支持能力也得到提升,该工具可为管理员提供专家系统建议,让集群保持良好运行。
经过基准测试验证的性能
所有英特尔® 精选解决方案均经过验证,已达到指定的最低级别的工作负载优化性能。面向专业可视化的英特尔® 精选解决方案定义了相应的性能标准,展示了针对高性能计算和可视化应用而优化的功能。经过验证的解决方案已达到或超过相关设计和测试标准,其中包括两个侧重于可视化的基准、两个知名的计算应用基准以及三个知名的行业计算微基准,涵盖了一系列重要的系统方面并显示了潜在的纵向扩展和横向扩展性能。
可视化基准
为了对可视化性能进行建模和调节,使用了 OSPRay 光线跟踪性能基准来测量和测试单个节点的系统功能以及光线跟踪渲染的多节点扩展能力。此解决方案还通过一组 ParaView* 基准,针对更广泛的一系列可视化工作负载进行了测试和优化,这些基准侧重于 OpenSWR、OSPRay 和 Embree 性能(已集成到Kitware 公司最受欢迎的 ParaView 应用中)。
高性能计算基准
为了确保将计算操作快速转换为可视结果,包括快速兴起的“原地”可视化工作流程(计算和可视化连续执行,以便即时转换成可视结果),面向专业可视化的英特尔® 精选解决方案还针对计算密集型工作负载进行了优化。有两个流行的高性能计算基准用来对各种常见计算应用进行表示和建模,并验证其是否具备高性能。高性能 LINPACK*(HPL*)基准可解决分布式内存中双精度算术计算中的密集型线性系统。高性能共轭梯度*(HPCG*)基准可对真实应用的数据访问模式进行建模,例如稀疏矩阵计算、测试用内存子系统和内部互连。使用 HPL 和 HPCG 基准还可测量单个节点性能以及整个系统的综合性能。
系统基准
最后,英特尔还使用另外三个微基准来测量一些重要系统特性,以便让鲁棒计算与可视化实现最佳匹配。这些基准可测量计算能力、内存带宽和互连网络的性能。DGEMM* 是一个双精度通用矩阵乘法工作负载,可测量处理器和内存的计算能力。STREAM* 可测量简单矢量内核的可持续内存带宽和相应计算速率。IMB PingPong* 可测量点对点跨互连网络传送单条消息的速度和延迟。
基础配置和增强配置
面向专业可视化的英特尔® 精选解决方案包括两种配置。基础配置指定了面向专业可视化的英特尔® 精选解决方案必须具备的最低性能。增强配置为系统制造商、系统集成商以及解决方案和服务提供商如何进一步优化以实现更高性能和能力提供了范例。
面向专业可视化的英特尔® 精选解决方案配置
表 1 显示了面向专业可视化的英特尔® 精选解决方案的两种硬件配置。要将解决方案冠以英特尔® 精选解决方案的名号,服务器供应商或数据中心解决方案提供商必须达到或超过所规定的最低配置以及所列出的最低基准性能参考阈值。面向专业可视化的英特尔® 精选解决方案对于主/头节点和计算节点分别有独立的规范。基础配置包括四个节点的集群(一个专用主/头节点和三个计算节点)。增强配置通过八个节点的集群(一个专用主/头节点和七个计算节点)展现了可扩展性。
表 1. 面向专业可视化的英特尔® 精选解决方案的基础配置和增强配置
面向专业可视化的英特尔® 精选解决方案的技术选择
除了表 1 所示的基于英特尔® 硬件的基础外,以下技术可进一步增强面向专业可视化的英特尔® 精选解决方案的性能:
• 英特尔® 高级矢量扩展指令集 512(英特尔® AVX-512):可提高性能,满足最苛刻的计算工作负载需求,与上一代英特尔®处理器相比,每时钟周期的每秒浮点运算速度(FLOPS)提高了一倍。
• 英特尔® Cluster Checker:可检查 100 多项与集群运行状况有关的特性。英特尔® Cluster Checker 在节点和集群两个层面检查系统,了解所有组件是否协同工作以实现最佳性能。它可评估固件、内核、存储和网络设置,并使用英特尔® MPI 库基准、STREAM、HPL 基准、HPCG 基准及其他基准对节点和网络性能进行高级测试。英特尔® Cluster Checker 可通过自定义测试进行扩展,其功能可嵌入到其它软件中。
• 英特尔® 集群运行时:为每个集群提供所需的关键软件运行时元素,确保为应用提供最佳性能路径。英特尔® 运行时性能库(包括英特尔® 数学核心函数库(英特尔® MKL)和英特尔®MPI 库)可为基于英特尔® 架构的集群提供优化的卓越性能。
• 适用于英特尔® 至强® 可扩展处理器和英特尔® 至强融核™ 处理器的融合式并行编程:支持创建包含强大技术、软件工具和函数库的高度集成的产品组合。英特尔® 至强® 可扩展处理器基于通用编程模型提供了出色的灵活框架,为跨人工智能(AI)框架的代码现代化举措提供支持。
• OpenHPC*:提供由社区驱动的开源软件栈,包括部署和管理Linux* 高性能计算集群所需的一些常见组件。该软件包中包含配置工具、资源管理、I/O 客户端、开发工具及各种科学库。
面向专业可视化的英特尔® 精选解决方案组件一览
面向专业可视化的英特尔® 精选解决方案包含几个关键的硬件和软件组件。基础配置和增强配置有助于确保面向不同环境提供适当规模的解决方案,以满足广泛多样的用户场景需求。两类配置都已优化至最佳性能。
计算
面向专业可视化的英特尔® 精选解决方案要求采用英特尔® 至强®金牌 6148 处理器或更高型号的英特尔® 至强® 可扩展处理器。英特尔® 至强® 金牌 6148 处理器双路平台包含 40 个内核,可为计算和数据密集型工作负载提供出色的性能。增强配置展示的英特尔® 至强® 铂金 8180 处理器双路平台包含 56 个内核,可满足最具挑战性的可视化和计算需求。英特尔® 至强® 可扩展处理器的性能显著增强,在 I/O、内存和网络结构集成方面都比前代处理器大幅改进,这将让可视化和计算应用受益匪浅。此外,该处理器还采用了英特尔® AVX-512,这是一个新的矢量运算指令集,能够为可视化和其他处理器密集型工作负载提升性能。
网络
英特尔® Omni-Path 架构(英特尔® OPA)为高性能计算集群提供了每秒 100 Gbps 的带宽和新一代的低延迟高带宽网络。与以往用于 InfiniBand* 网络的交换机设计相比,英特尔® OPA 的交换机设计能够提供更高的密度,可在解决方案扩展时减少所需的交换机数量。英特尔® OPA 还可以降低布线成本、功耗、空间要求,减少日常所需的系统维护。这些特点有助于降低网络结构成本。
英特尔® 可扩展系统框架(英特尔® SSF)
英特尔® SSF 技术规范融合了英特尔® 最新的计算、网络结构、内存、存储和软件技术,适用于新一代高性能系统。它具有基于标准的可编程性,使科学家、工程师、内容创建者、媒体专业人士以及其他人员能够在普及的通用基础设施上,运行各种各样的工作负载。英特尔® 可扩展系统框架使企业能够在确保高性能的同时,实现灵活性、可扩展性、均衡性和可移植性。
利用面向专业可视化的英特尔® 精选解决方案应对大数据的计算和可视化挑战
面向专业可视化的英特尔® 精选解决方案利用英特尔® 至强® 可扩展处理器、英特尔® Omni-Path 高带宽网络和英特尔® 软件定义可视化库的强大功能,可帮助研究机构、设计公司、数字内容创建者及其他各方更深入地了解数据,或者提供令人惊叹的照片般精细的图像。面向专业可视化的英特尔® 精选解决方案让高保真的照片级图像变为可能,即便数据集日益庞大、日趋复杂。
软件定义的可视化应用可运行在基于 CPU 的系统上,无需使用独立的 GPU。使用基于 CPU 的平台,机构可避免数据传输,且无需支出 GPU 设备费用或分散系统的费用。这样,面向专业可视化的英特尔® 精选解决方案既能帮助节省时间和资金,又可凭借其同时解决计算和建模问题的能力,帮助用户更快地获得所需结果。借助这些优势可实现更好、更快的洞察,从而解决最艰巨的问题。
请访问 intel.cn/selectsolutions 了解更多内容,并向您的基础设施供应商、系统集成商或解决方案提供商咨询英特尔® 精选解决方案。
什么是英特尔® 精选解决方案?
英特尔® 精选解决方案是一系列经过验证的硬件与软件堆栈,针对特定的软件工作负载进行了计算、存储和网络方面的优化。这些解决方案的开发源于英特尔与行业解决方案提供商的深入合作,以及与全球领先数据中心和服务提供商的广泛协作。
要符合英特尔® 精选解决方案的条件,解决方案提供商必须:
1. 遵循英特尔规定的软件与硬件堆栈要求
2. 达到或超越英特尔最低基准性能阈值
3. 提供资源、服务或文档以方便客户进行部署解决方案提供
了解更多信息
英特尔® 精选解决方案:intel.cn/selectsolutions
软件定义的可视化:https://software.intel.com/zh-cn/modern-code/tools/software-defined-visualization
英特尔® 至强® 可扩展处理器:intel.cn/xeonscalable
英特尔® 可扩展系统框架:https://www.intel.cn/content/www/cn/zh/analytics/high-performance-computing/overview.html
英特尔® 精选解决方案可通过英特尔® Builders 计划进行订购并获得技术支持:http://builders.intel.com。在 Twitter 上关注我们:#IntelBuilders