英特尔® 至强® 处理器英特尔® Data Center Diagnostic Tool

文档

维护与性能

000058107

2024 年 03 月 26 日

产品概述

英特尔® Data Center Diagnostic Tool 是一个用于验证 CPU 内核健康状况的工具。

当前版本是 603,于 2024 年 3 月 22 日发布。

环境

超大规模云提供商和企业数据中心的首要关注点始终是提供尽可能好的正常运行时间和可靠性。从历史上看,该行业做得相当不错,通常实现 >99.999% 的正常运行时间。然而,现代计算基础设施带来了用户对服务质量 (QoS) 和高可用性不断增长的期望。这些期望强调了对强大的软件工具的需求,这些工具可以帮助识别并最大限度地减少可能影响 QoS 或正常运行时间的意外系统故障。

在英特尔,我们构建并使用先进的组件级测试和验证工具,这些工具可显著减少产品中可能导致系统错误的缺陷。我们的超大规模客户及其供应商使用相同的英特尔开发的软件工具,在其系统的整个生命周期内保持计算机群的运行状况。他们认识到,随着时间的推移,对系统资产的密切监控可以提高整体机群弹性和客户 QoS。

英特尔认识到许多不同的客户可以从相同的功能中受益,而英特尔® Data Center Diagnostic Tool是该软件的简化版本,用于管理本地环境。

英特尔® ® Data Center Diagnostic Tool

英特尔® Data Center Diagnostic Tool(英特尔® DCDiag)专为 IT 经理设计,负责对数据中心设备群进行定期维护。英特尔® DCDiag 可用于任何规模的数据中心,以帮助确保最高水平的持续质量和可用性。此外,DCDiag 可用于前台(~45 分钟运行时间)或后台模式中的定期队列筛选,并且可以识别有故障的微处理器。运行定期系统维护有助于主动识别潜在问题,并使系统管理员能够更换这些微处理器。

英特尔® DCDiag 是一套有条不紊地检查大多数 SoC 功能(包括每个微处理器内核功能)的测试。通过验证每个 DCDIAG 计算是否正确,而不仅仅是确认测试是否正确完成执行,DCDIAG 能够检测多种类型的错误,包括表现为无记录数据错误的故障。

英特尔® DCDiag 通过多次测试检查处理器操作的正确结果来发现故障。

  • 运行多个代码循环,或在所有内核上运行相同的代码,并检查结果是否相同。
  • 检查高速缓存、内核到内核的通信,以及大多数处理器指令。

随机数据集用于测试指令和内核。报告是处理器上易于理解的通过/失败。未通过测试的处理器应退回给系统供应商或分销商进行更换。

How Does DCDIAG Work?

测试结果

DCDiag 测试结果设计为易于理解。诊断完成后,系统将返回以下消息之一:

  • 测试成功完成。未检测到问题。
  • 测试成功完成。发生一个或多个计算机检查错误。请查看系统日志。
  • 此工具版本不支持此处理器。
    • 检查 系统的处理器型号和版本。如果英特尔 Data Center Diagnostic Tool未检测到受支持处理器的生产版本,则会出现此消息。此工具不支持工程样品。

    • 查找有关识别处理器的帮助。

  • 测试完成。由于微代码版本过时,结果尚无定论。
    • 最新版本的微代码解决了已知问题。英特尔建议更新至最新版本。

  • 测试失败。请联系您的系统制造商或处理器供应商以获取支持。
    • 如果测试结果显示失败, 请检查 服务器节点的处理器是否仍在保修期内。

    • 如果您的盒装 英特尔® 至强® 处理器仍处于 3 年保修期内, 请联系 英特尔 Customer Support 寻求帮助。

    • 如果您有一个散装处理器, 请联系 您的系统或处理器供应商或购买处寻求帮助。

系统要求

英特尔® Data Center Diagnostic Tool该应用程序适用于 Linux* 和 Windows* 操作系统。该工具可以在许多当前的 Linux* 和 Windows* 发行版上安装和运行,请参阅 在 Linux* 和 Windows* 上安装。

从版本 558 开始,该工具可以使用提供的 MSI 安装程序安装在 Windows* 上,并在 Windows 10*、Windows Server 2016* 或微软目前支持的任何版本上运行。请参阅 Windows* Server 版本信息,以确定当前可用和支持哪些版本的 Windows* Server 系统。

为了获得最佳覆盖范围,请在服务器的根系统中运行应用程序。可以在容器或虚拟机中运行它,但请注意,某些功能可能会被禁用。

支持的处理器:

  • 第五代可扩展英特尔® 至强®处理器(原Emerald Rapids)
  • 第四代可扩展英特尔® 至强®处理器(原Sapphire Rapids)
  • 第三代可扩展英特尔® 至强®处理器(原Ice Lake 和 Cooper Lake)
  • 第二代英特尔® 至强®可扩展处理器(原Cascade Lake)
  • 第一代英特尔® 至强®可扩展处理器(以前称为 Skylake)
  • 英特尔® 至强® 处理器 E5 v4 家族(前身为 Broadwell)
  • 英特尔® 至强® 处理器 E7 v4 家族(前身为 Broadwell)

适用于 英特尔® 至强® 处理器上的 Windows 的 英特尔® Data Center Diagnostic Tool

英特尔® 至强® 处理器上的 Linux 英特尔® Data Center Diagnostic Tool

如何使用英特尔® Data Center Diagnostic Tool测试 英特尔® 至强® 处理器

注意:

对于开发人员:英特尔启动了开放数据中心诊断项目,该项目开放了英特尔的数据中心诊断框架并提供精选测试。这为开发人员提供了一个一致的测试开发框架,邀请开源社区的创造力通过开发独特的测试屏幕和其他创新解决方案来增强云集群管理。欲了解更多信息并访问此框架和测试。

版本历史记录

日期 版本 描述
2021 年 7 月 7 日 540 初始版本
2022 年 8 月 16 日 549 错误修复
2022 年 9 月 20 日 549 命令已更改以启用该工具并验证是否已启用
2023 年 1 月 10 日 550 包括第四代英特尔® 至强®处理器
2023 年 1 月 20 日 576 版本 576 发布
2023 年 12 月 14 日 594 版本 594 发布
2024 年 3 月 22 日 603 版本 603 版

*文中涉及的其它名称及品牌属于各自所有者资产。

相关主题
英特尔® 至强® 支持中心网站
英特尔®处理器保修指南
适用于 Windows* 英特尔® 至强® 处理器的 英特尔® Data Center Diagnostic Tool