文章 ID: 000087500 内容类型: 故障排除 上次审核日期: 2023 年 05 月 31 日

如何分离双列直插式内存模块 (DIMM) 故障与 英特尔® Server Board 产品家族上的主板 DIMM 插槽故障

BUILT IN - ARTICLE INTRO SECOND COMPONENT
总结

分离 DIMM 故障与 英特尔® Server Board 产品家族的 DIMM 插槽故障的步骤

说明

根据 英特尔® Server Board S2600WF,在多台服务器上报告有多个 DIMM 的可纠正 ECC 错误阈值

即使在多次 DIMM 更换之后,ECC 错误仍然存在。

解决方法

如果即使在多次 DIMM 更换之后仍存在 ECC 错误,则必须进行完整的测试以隔离 DIMM 故障与主板 DIMM 插槽故障。

重新排列内存以查看标记的 DIMM 是否仍呈现在其他插槽上的 ECC。这表明 DIMM 损坏或有轻微损坏。

如果在同一 DIMM 插槽上报告 ECC 错误,但 DIMM 插槽上安装了不同的 DIMM,请验证插槽中是否存在可能导致故障连接的杂物/灰尘。如果没有杂物/灰尘,则可能是主板 DIMM 插槽故障,需要更换 S2600WF 主板。

如果系统中有任何 DIMM 有轻微或潜在的故障,它将通过以下步骤检测到。这个过程可能会很慢,但可以辨别特定 DIMM 组件的潜在问题。

测试步骤:

  1. 移除 所有 DIMM。
  2. 按照《英特尔®服务器产品技术产品规格》的 DIMM 人口指南 部分操作,仅安装 1pc DIMM,而这些 DIMM 过去没有 ECC 错误。
  3. 使用 1pcs DIMM 启动 系统 ,并运行一段时间。 检查 是否有 ECC 错误
  4. 按照相同的指南操作,并安装过去没有 ECC 错误的第二个 DIMM
  5. 使用 2pcs DIMM 启动 系统 ,并运行一段时间。 检查 是否有 ECC 错误
  6. 遵循相同的指南,并安装过去没有 ECC 错误的第三个 DIMM
  7. 使用 3pcs DIMM 启动 系统 ,并运行一段时间。 检查 是否有 ECC 错误
  8. 按照 相同的指南 操作 ,并安装过去没有 ECC 错误 的第 4 个 DIMM
  9. 使用安装了 4pcs DIMM 启动 系统 ,并检查是否有 ECC 错误
  10. 每次按照相同的步骤安装一个 DIMM启动系统检查是否有 ECC 错误
  11. 执行测试,直至填充所有优秀的 DIMM。
  12. 按照同样的步骤安装报告 ECC 错误并启动系统的 DIMM检查是否有 ECC 错误

    现在,应填充和测试所有原始 DIMM 插槽。甚至带有 ECC 错误的原始 DIMM 插槽也已填充和测试。

相关产品

本文适用于 51 产品

英特尔® 服务器主板 S2600STK
英特尔® 服务器主板 S2600STS

本页面上的内容是原始英文内容的人工翻译与计算机翻译的组合。我们提供此内容是为了您的便利并且仅供参考,未必完整或准确。如果本页面的英文版与翻译版之间存在任何冲突,应以英文版为准。 查看此页面的英语版本。