RAID5 會遇到的 Multi-disk failure 問題

How multi-disk failures happen」這篇畫了不少圖解釋在 RAID5 上面偶而會遇到的 Multi-disk failure 問題 (RAID6 也會,風險比較低而已)。

RAID 5

平常壞軌時,RAID 系統不一定會發現,直到 RAID rebuild 時讀過所有的磁區,系統才發現其他壞軌,造成第二顆被標為損壞... (推論到 RAID6 的情況就是再發生一次)

這在 I/O 比較頻繁的 RAID 比較不容易發生 (因為在量小的時候就容易偵測到)。

對於比較閒的系統,應該放個 cron 跑 dd if=/dev/XXX of=/dev/null 嗎?:p

3 thoughts on “RAID5 會遇到的 Multi-disk failure 問題”

  1. 一般RAID卡應該都會做patrol scan吧?不過軟體的實作可能會需要定期跑個dd(ZFS是有腳本定期做scrub的)。

  2. 十年前用過的幾張的確有遇過這種問題,後來換比較大廠的 RAID card,再用 RAID6 + 企業級硬碟後就沒遇過了...

  3. 現在新款卡都有 patrol scan,定期做一次 ,再來搭配 SMART 機制, 會把壞軌標記到Glist 去..
    Glist 滿或壞HSA 就Offline ,現在Raid Card 硬體機制可是很不錯的..Rebuild 也快..

Leave a Reply

Your email address will not be published. Required fields are marked *