资讯公告
第2代AMD服务器芯片有一个崩溃错误
发布时间:2023-06-07 发布者:FebHost



半导体,尤其是CPU,是极其复杂的创造,都是在微观层面完成的。由于缺乏一个更好的词,没有更多的错误,这证明了这些芯片制造商为提供可靠的产品所做的努力。但是,偶尔也会有一些漏网之鱼。

AMD已经发出警告,一个旧的处理器系列有一个小错误。这个问题存在于三年前发布的代号为Rome的Epyc 7002生产线。这个错误首先在Reddit线程上被指出,运行罗马时代芯片的服务器将在1044天的正常运行时间或近三年后挂起。

除了重启之外,没有办法重置服务器。AMD说它不会修复这个问题。

"AMD公司已经成功地为第二代AMD EPYC处理器的一个孤立的挑战提供了补救措施,对于一些客户来说,如果持续运行很长一段时间,处理器内的一个核心可能会挂起,"该公司发言人通过电子邮件说。

该错误是在所谓的C6睡眠状态。为了在CPU闲置时节省能源,它可以进入低功耗模式。CPU有几种电源模式,统称为 "C-状态 "或 "C-模式"。英特尔在486处理器中首次引入了这种模式,因此这个想法并不新鲜。

这些C状态模式从C0开始,这是正常的CPU工作模式。C数字越高,CPU进入睡眠模式的程度就越深,关闭的信号也越多。睡眠状态越深,CPU需要更多的时间来完全唤醒。

有了这个错误,一旦CPU进入C6,超过1044天的标志,它就会被卡住,需要重启。修复方法是在三年期限之前重启服务器,或者禁用导致该错误的睡眠状态。

这个错误甚至浮出水面,证明了CPU的性能;三年不间断的正常运行时间是了不起的。

你可能会认为服务器的更新会要求沿途重启,但话说回来,Linux内核可以在不重启的情况下进行修补。

重大的CPU错误确实会发生,但不是很频繁,这当然不是其中之一。

文章相关标签: AMD
购物车