實際的世界都是由 workaround 疊 workaround 解決問題的...
MySQL 資料庫一般都用 RAID 10,利用 RAID 1 的特性保護資料,並且利用 RAID 0 的特性提昇 IOPS 能力。
而這些 RAID 卡通常都會提供 cache,預設應該都會開 read cache,可以大幅增加 random read 的速度。而另外也可以打開 write cache (也就是 write-back),寫入時先寫到 cache 裡,RAID 卡馬上就會跟作業系統回報完成,藉以加速 random write 的速度。
但這樣就會有風險,當資料還沒寫入硬碟就斷電時就會遺失資料。所以在設定 write-back 的 RAID 卡上安裝電池就變成解法之一。
而電池會有壽命問題,所以配電池的 RAID 卡會每隔一陣子就放電測試電池可以撐多久,但在放電測試時,如果斷電就有可能造成資料遺失,於是又冒出很多方法解決。
也就是在「Learning to Deal With Learning」這篇提到 RAID 卡電池維護的事情。
每一層都是 workaround 想辦法解決問題,然後再用 workaround 解決前面造成的問題...
Anyway,有幾種解法,其中仍然對上層作業系統與應用程式透明的解法是:
- 雙電池架構,很明顯的可以一次只測一顆。
- 改用 NVRAM,就不需要電池了,不過速度以及成本會是另外一個問題。
另外,對上層作業系統與應用程式有影響的方式:
- 放電測試時將 write cache 關閉,切回 write-through。這點在原文裡也有提到,效能其實會受到蠻大的影響。
- 不放電測試了,但這樣的缺點就是拿安全性交換,當斷電時不知道能不撐過去。
- 或是自己控制放電測試的時間,這可以配合上面切回 write-through 的方式,挑負載比較輕的離峰時間做。
看了下來雙電池架構還不錯,增加的成本還算可以接受,而且因為效能不受到影響,也確保資料安全性,整體維護起來比較簡單。而之後在規模更大的時候,應該就會直接考慮跳到自己放電測試的方式來處理電池問題...