如何从英特尔®服务器主板的内部错误 (IERR) 中恢复

文档

故障排除

000006043

2023 年 07 月 17 日

我看到的是什么?

IERR 是处理器报告的灾难性错误,但通常由处理器内核以外的设备(例如,内存、 PCIe)造成的。

  • 处理器执行通常由于处理器外部发生事件而停顿。
  • 此问题通常附带一个 CATERR 活动,该活动可以针对其他信息交叉引用。

如何解决:

按以下步骤操作:

  1. 查看 用于 纠错码 (ECC ) 事件的系统事件日志 (SEL)。有缺陷的内存会触发 IERR。
  2. 查看 任何 PCIe 活动的 SEL。PCIe 设备故障会触发 IERR。
  3. 确保 服务器以及最近添加的任何硬件设备的操作系统 (OS) 驱动程序是最新的。过期的操作系统驱动程序可以触发 IERR。
  4. 检查 操作系统日志以获取任何可能显示可能触发 IERR 的硬件故障的机器检查架构 (MCA) 条目。
  5. 确认 您拥有面向服务器系统 的最新 BIOS
  6. 到底板管理控制器 Web 控制台>配置>内存配置> PPR 类型,并将 PPR 设置 设置 为硬核。
  7. 如果日志确认有特定的内存模块可能导致此问题,请继续重新插槽内存模块,并监视服务器 24 小时

相关主题
我的服务器崩溃, 并显示这个错误 : 处理器 CPU 机器 Chk
固件更新和故障排除技巧
适用于英特尔®服务器主板的系统事件日志故障排除指南