英特尔® 至强® 处理器英特尔® Data Center Diagnostic Tool

文档

维护与性能

000058107

2023 年 12 月 18 日

介绍

英特尔® Data Center Diagnostic Tool是一种诊断软件工具,可在您的数据中心平台上运行,以:

  • 验证 英特尔® 至强®处理器内所有内核的功能。
  • 用作常规系统维护计划的一部分。

数据中心的高可靠性和可用性需要正确的工具并承担维护承诺。英特尔认为,在初始部署和定期测试中使用这类维护工具是一种行业最佳实践,可帮助确保最佳系统体验。

注意: 现代计算基础设施带来了对处理能力的不断增长的需求,以及企业对服务质量和高可用性(以及对一般服务水平协议 [SLA] 的保证)的期望。这些期望强调了对强大的软件工具的需求,这些工具可以帮助预测、识别和最小化可能影响服务质量或正常运行时间的意外系统故障。

系统要求

英特尔 Data Center Diagnostic Tool该应用程序适用于 Linux* 和 Windows* 操作系统。该工具可以在许多当前的 Linux* 和 Windows* 发行版上安装和运行,请参阅 安装

从版本 558 开始,该工具可以使用提供的 MSI 安装程序安装在 Windows* 上,并在微软当前支持的任何 Windows* 版本上运行。请参阅 Windows* Server 版本信息,以确定当前可用和支持哪些版本的 Windows* Server 系统。

为了获得最佳覆盖范围,请在服务器的根系统中 运行 应用程序。可以在容器或虚拟机中运行它,但请注意,某些功能可能会被禁用。

支持的处理器:

  • 第五代可扩展英特尔® 至强®处理器(原Emerald Rapids)
  • 第四代可扩展英特尔® 至强®处理器(原Sapphire Rapids)
  • 第三代可扩展英特尔® 至强®处理器(原Ice Lake 和 Cooper Lake)
  • 第二代英特尔® 至强®可扩展处理器(原Cascade Lake)
  • 第一代英特尔® 至强®可扩展处理器(以前称为 Skylake)
  • 英特尔® 至强® 处理器 E5 v4 家族(前身为 Broadwell)
  • 英特尔® 至强® 处理器 E7 v4 家族(前身为 Broadwell)
注意 对于开发人员:英特尔启动了开放数据中心诊断项目,该项目开放了英特尔的数据中心诊断框架并提供精选测试。这为开发人员提供了一个一致的测试开发框架,邀请开源社区的创造力通过开发独特的测试屏幕和其他创新解决方案来增强云集群管理。 欲了解更多信息并访问此框架和测试

安装

注意

有关更多详细信息,请参阅 /usr/share/doc/dcdiag/README.rst (Linux*) or C:\Program Files\Intel\Data Center Diagnostic Tool\README.rst (Windows*) file included in the installation.

我们建议使用以下部分中的步骤链接到存储库,以确保您获得最新版本的英特尔® Data Center Diagnostic Tool。但是,如果您需要可下载的二进制文件,请使用 RPM 文件或 DEB 文件,或 Windows* MSI 安装程序。

Debian*/Ubuntu*

要在基于 Debian* 的发行版上安装 英特尔® Data Center Diagnostic Tool 软件包,需要 添加 英特尔 软件软件包存储库 并 安装 相应的软件包。

在将+粘贴到主机之前,您可能需要运行 sudo ls and enter your password to prevent the commands from being consumed by the sudo password prompt:

设置密钥以验证包签名

sudo install -m 0755 -d /etc/apt/keyrings

curl https://repositories.intel.com/dcdt/dcdiag.pub | sudo gpg --dearmor -o /etc/apt/keyrings/dcdiag.gpg

sudo chmod a+r /etc/apt/keyrings/dcdiag.gpg

设置储存库

echo "deb [arch=amd64 signed-by=/etc/apt/keyrings/dcdiag.gpg] https://repositories.intel.com/dcdt/debian stable main" | sudo tee /etc/apt/sources.list.d/dcdiag.list > /dev/null

安装程序包

sudo apt-get update

sudo apt-get install dcdiag

Fedora*/CentOS*/RHEL*

要在基于 Fedora 的发行版上安装 英特尔® Data Center Diagnostic Tool 软件包,请 添加 英特尔 软件 软件包存储库并 安装 软件包。

首次安装时,YUM 或 DNF 将提示您接受签名密钥。 验证 指纹如下所示,然后 接受 它:
用户 ID: CN=释放密钥
指纹:0BB8 AB14 4859 FA36 ED39 4920 E2BC 49EF 349C 9B84

在将+粘贴到主机之前,您可能需要运行 sudo ls and enter your password to prevent the commands from being consumed by the sudo password prompt:

安装存储库文件

sudo yum install https://repositories.intel.com/dcdt/dcdiag-repo.rpm

安装程序包

sudo yum install dcdiag

OpenSUSE*/SUSE Linux Enterprise*:

安装存储库文件

sudo zypper ar https://repositories.intel.com/dcdt/dcdiag.repo

安装程序包

sudo zypper install dcdiag

系统将警告您 respond.xml is not signed. Respond yes to continue. You will be given another chance to verify the package signature. Verify that the fingerprint is as follows, and then accept it:

Repository: dcdiag
Key Fingerprint: 0BB8 AB14 4859 FA36 ED39 4920 E2BC 49EF 349C 9B84
Key Name: CN=Release Key
Key Algorithm: RSA 4096
Key Created: Wed Oct 11 06:43:01 2023
Key Expires: Sun Oct 11 06:43:01 2026
Rpm Name: gpg-pubkey-349c9b84-652643f5

Microsoft Windows*

下载 MSI 安装程序

英特尔® Data Center Diagnostic Tool安装程序文件下载到选定位置并 执行

适用于 Windows* 英特尔® 至强® 处理器的 英特尔® Data Center Diagnostic Tool - 版本 594*最新版本

安装程序包

使用图形用户界面或命令行而安装程序未提供其他选项时,将显示用户帐户控制提示,请求授权。 验证 安装程序是否已由Intel Corporation签名并授权对设备的更改。获得授权后,安装程序将继续在默认位置安装该工具,并退出。

静默安装

/quiet command line switch can be used to perform quiet installation. This type of installation does not require any user interaction, which makes it especially useful for remote installation.

请注意,静默安装不会激活用户访问控制提示,因此需要从管理员控制台运行安装程序。

使用 /help or /? command line switch to display all available command line options for the installer.

英特尔® Data Center Diagnostic Tool安装在默认位置:

C:\Program Files\Intel\Data Center Diagnostic Tool\

如何测试 英特尔® 至强® 处理器

在 Linux* 系统上,系统管理员可以启用英特尔® Data Center Diagnostic Tool以在后台执行。

您可以使用以下命令启用和启动英特尔® Data Center Diagnostic Tool:

# systemctl enable --now dcdiag

您可以使用以下命令验证此操作是否成功:

# systemctl status dcdiag

对命令的响应示例:

● dcdiag.service - Intel® Data Center Diagnostic Tool

Loaded: loaded (/usr/lib/systemd/system/dcdiag.service; enabled; vendor preset: disabled)

Active: active (running) since Fri 2021-02-19 11:24:17 MST;

Docs: file:///usr/share/doc/dcdiag/README.rst

Main PID: 8777 (dcdiag)

CGroup: /system.slice/dcdiag.service

└─8777 /usr/bin/dcdiag –service

如果在后台执行英特尔® Data Center Diagnostic Tool时检测到任何错误,该工具会将它们记录到系统日志中。该工具还可以使用 --query argument. 查询在后台扫描中是否检测到任何错误

# dcdiag --query
Intel® Data Center Diagnostic Tool Version 506
Test completed successfully. No issues detected.

该工具的 Windows* 版本当前不支持后台执行模式。

此工具也可以通过 Linux* 或 Windows* 命令提示符在前台手动运行:

# dcdiag

>"C:\Program Files\Intel\Data Center Diagnostic Tool\dcdiag.exe"

请注意,在 Windows* 中,英特尔® Data Center Diagnostic Tool安装程序不会自动更新系统的 PATH 变量,因此需要完整的绝对或相对路径来启动该工具。

手动测试运行约 45 分钟,并且具有较高的 CPU 利用率。

诊断完成后,系统将返回以下消息之一:

  • 测试成功完成。未检测到问题。
  • 测试成功完成。发生一个或多个计算机检查错误。请查看系统日志。
  • 此工具版本不支持此处理器。

    检查 系统的处理器型号和版本。如果英特尔 Data Center Diagnostic Tool未检测到受支持处理器的生产版本,则会出现此消息。此工具不支持工程样品。

    查找 有关识别处理器的帮助。
  • 测试完成。由于微代码版本过时,结果尚无定论。

    最新版本的微代码解决了已知问题。请更新。微代码更新通常由 Linux* 分发版供应商与各种组件的安全修复程序和其他固件更新一起提供。如果您的系统未启用这些更新,我们建议您启用它们。微代码会在每次启动时由 Linux* 内核自动加载,并可在运行时以 root 身份使用以下命令重新加载:

    echo 1 > /sys/devices/system/cpu/microcode

在 Windows* 上,微代码更新使用标准 Windows* 更新通道提供。如果您的系统未启用这些更新,我们建议您启用它们。

  • 测试完成。由于系统超出温度限制,结果尚无定论

    这可能是由于系统存在各种问题,即系统无法为 CPU 提供足够的冷却以使其在规定的温度限制内运行。我们建议您检查您的系统,以确保所需的冷却工作正常。这可能包括风扇故障、气流不正确或其他一些环境问题。
  • 测试完成。结果不确定,发生了一个或多个机器检查错误。

    检查 系统日志。
  • 测试失败。 请联系 您的系统制造商或处理器供应商以获取支持。
  • 如果测试结果显示失败, 请检查 服务器节点的处理器是否仍在保修期内:
    • 如果您的盒装 英特尔® 至强® 处理器仍处于 3 年保修期内, 请联系 英特尔 Customer Support 寻求帮助。
    • 如果您有一个散装处理器, 请联系 您的系统或处理器供应商或购买处,以检查该处理器是否仍在保修期内。
注意 散装处理器直接销售给系统制造商或英特尔授权分销商。除非散装处理器预装在英特尔® 数据中心模块 (英特尔® DCB) 服务器系统中,否则英特尔不向最终用户提供直接保修。除英特尔 DCB系统外,散装处理器的保修由处理器或系统的供应商或购买处提供(如果处理器已预装)。英特尔建议从英特尔授权分销商、英特尔 授权供应商英特尔®产品的经销商处采购。
  • 请注意,英特尔没有保修期外更换计划。
  • 测试失败。
  • 测试完成,但在包含/sys/devices/system/cpu/cpuXX.的物理处理器上检测到错误
  • 请联系 您的系统制造商或处理器供应商以获取支持。
  • 测试失败。
  • 测试无法确定导致故障的物理处理器。
  • 请联系 您的系统制造商或处理器供应商以获取支持。

文中涉及的其它名称及商标属于各自所有者资产。

版本历史记录

日期 版本 描述
2021 年 7 月 7 日 540 初始版本
2022 年 8 月 16 日 549 错误修复
2022 年 9 月 20 日 549 命令已更改以启用该工具并验证是否已启用
2023 年 1 月 10 日 550 包括第四代英特尔® 至强®处理器
2023 年 6 月 29 日 576 版本 576 发布
2023 年 12 月 14 日 594 版本 594 发布

相关主题
英特尔® 至强® 支持中心网站
英特尔®处理器保修指南
适用于 Windows* 英特尔® 至强® 处理器的 英特尔® Data Center Diagnostic Tool