如何从英特尔®服务器主板的内部错误 (IERR) 中恢复
我看到的是什么?
IERR 是处理器报告的灾难性错误,但通常由处理器内核以外的设备(例如,内存、 PCIe)造成的。
- 处理器执行通常由于处理器外部发生事件而停顿。
- 此问题通常附带一个 CATERR 活动,该活动可以针对其他信息交叉引用。
如何解决:
按以下步骤操作:
- 查看 用于 纠错码 (ECC ) 事件的系统事件日志 (SEL)。有缺陷的内存会触发 IERR。
- 查看 任何 PCIe 活动的 SEL。PCIe 设备故障会触发 IERR。
- 确保 服务器以及最近添加的任何硬件设备的操作系统 (OS) 驱动程序是最新的。过期的操作系统驱动程序可以触发 IERR。
- 检查 操作系统日志以获取任何可能显示可能触发 IERR 的硬件故障的机器检查架构 (MCA) 条目。
- 确认 您拥有面向服务器系统 的最新 BIOS 。
- 转 到底板管理控制器 Web 控制台>配置>内存配置> PPR 类型,并将 PPR 设置 设置 为硬核。
- 如果日志确认有特定的内存模块可能导致此问题,请继续重新插槽内存模块,并监视服务器 24 小时。
相关主题 |
我的服务器崩溃, 并显示这个错误 : 处理器 CPU 机器 Chk |
固件更新和故障排除技巧 |
适用于英特尔®服务器主板的系统事件日志故障排除指南 |