只有 CPU 和 板子是新的,其他都沿用舊的機器上的組件。
(之前 32 位元的機器跑起來沒有這種問題)
裡面裝了 amd64 的 debian sarge.
kernel 用的是 2.6.17.6
但是會不定時的出現以下 kernel panic :
cpu 0: machine check exception: 4 bank 4:b200000000070f0f
txc ce5002415
kernel panic: not syncing: machine check
去 google 找了一會兒,發現不是只有我一個人有這樣的困擾。
詭異的是,螢幕上的訊息都有 "bank 4:b200000000070f0f"
而且這些人也都是用 nvidia chipset 的板子。
網址
而且這個狀況不知道如何確切的重新產生,依據我的經驗,都是在 IO 很大的時候出現。
我也跑過 memtest all 數次了,沒有壞掉的情況。
在 kernel panic 的情形下我也沒辦法看 mcelog,也沒有 console 線接出來看 mcelog
我也試過在開機時的 kernel 選項加入 iommu=off nomce acpi=off,甚至 ide=nodma 都寫下去。還是會不定時出現。
amd74xx 和 sata_nv 我都有編進去 kernel
(會因為我的硬碟不是 sata 的關係嗎...)
不知道站上是否也有人有相同的情形發生呢?
實在很困擾,最近甚至在想乾脆再浪費錢把板子換成 via chipset 算了。(但是 nforce 又公認效能比較好...很掙扎...)