Etsy 用 SSD 的故事

EtsyLaurie Denness 對於 Etsy 使用各種品牌 SSD 的情況給出了他的經歷:「SSDs: A gift and a curse」。

重點在於開頭說的:

SSD firmware is buggy

可以看到當 SSD 配上 RAID controller 的時候,常常會需要找問題... (而且很難找)

Intel 的評價很不錯:

Okay, bad start, we’ve actually had no issues with Intel. This seems to be common across other companies we’ve spoken to.

OCZ 倒了,被 Toshiba 收購,而且 S.M.A.R.T. 資訊很差,很難預測什麼時候會掛掉 (有助於提前替換):

However, they had poor SMART info (none) so predicting failures was hard.

HP 是個大黑盒:

Unfortunately, HP have proprietary RAID controllers, and they don’t support SMART. Or rather, they refuse to talk to non-HP drives using off the shelf technology, they have their own methods.

Samsung 的評價不錯,C/P 值很高,而且有 S.M.A.R.T.:

Samsung saved the day and picked up from OCZ with a ludicrously cheap 960GB offering, the 840 EVO. A consumer drive, so very limited warranty, but for the price (~$400-500) you got great IOPS and they were reliable. They had better SMART info, and seemed to play nicely with our hardware.

不過 BB6Q 版的韌體搞爆了效能,雖然最後修好了:「Samsung Releases Firmware Update to Fix the SSD 840 EVO Read Performance Bug」。

LiteOn 則是掛在 GC 上 (RAID 裡同時掛掉兩顆以上):

The SSDs were having extended garbage collection periods, exacerbated by a smaller amount of SSDs with higher IO, in RAID6. This caused the controller to kick the drive out of the array… and unfortunately due to the write levelling across the drives, at least two of them were garbage collecting at the same time, destroying the array integrity.

不過後來 Dell 與 LiteOn 分別就 RAID controller 與 SSD 本身都跳下去修正,最後還是解決了:

Dell and LiteOn together identified and fixed weaknesses in their RAID controller, the backplane and the SSD firmware.

算是經驗分享,在 SSD 硬碟成熟的過程中間必經的道路 XD

SSD 硬碟的「寫到掛」測試

Slashdot 上的「Endurance Experiment Kills Six SSDs Over 18 Months, 2.4 Petabytes」看到的,針對萬元以下的 SSD 硬碟大量寫入測試 (算是家用級別?),在經過 18 個月後總算都掛光了...

報導出自「The SSD Endurance Experiment: They're all dead」:

最快死透的是 Intel 的,不過也到了 800TB 的寫入量才掛,如果以每天寫 1TB 的量來算也超過兩年了,看了一下我們家比較忙的 database server 也沒這個量啊,這幾年改善好多...

用 EBS-SSD 開機的 Ubuntu

前幾天 AWS 推出 EBS-SSD (參考「AWS 推出 SSD EBS」),然後今天看到「EBS-SSD Boot AMIs For Ubuntu On Amazon EC2」。

Canonical 正式的說明在「[ubuntu-cloud] Amazon SSD backed EBS volumes」這邊可以看到,而「Amazon EC2 AMI Locator」上也新增了 EBS-SSD 的部份。

SSD 的壽命

Slashdot 看到對 SSD 硬碟壽命的分析:「Endurance Experiment Writes One Petabyte To Six Consumer SSDs」。原文出自「The SSD Endurance Experiment: Casualties on the way to a petabyte」。

測試的對象包括了:

  • Corsair Neutron GTX 240GB
  • Intel 335 Series 240GB
  • Samsung 840 Series 250GB
  • Samsung 840 Pro 256GB
  • 2 * Kingston HyperX 3K 240GB

寫入 1PB 的資料後,看硬碟的壽命... 然後這三顆還活著:

That's an astounding total for consumer-grade drives, and the Corsair Neutron GTX, Samsung 840 Pro, and compressible Kingston HyperX 3K are still going!

很有趣的測試,不知道這是不是代表現在的 SSD 硬碟比較神猛了?

這些測試都是消費級的 SSD,不知道伺服器用的又是如何 :o (想到之前拿去跑 MySQL 的好慘啊...)

Linode 提昇規格,並提供 SSD 方案...

Linode 宣佈了規格提昇 (記憶體與流量) 以及 SSD 方案:「The New Linode Cloud: SSDs, Double RAM & much more」。

那個 Linode 2G 的方案流量不是 2TB 而是 3TB,明顯是針對 DigitalOcean 的同等級方案而設計的...

不過既有的客戶並不是馬上就有得用,要再等一陣子:

CPU 與網路頻寬的提昇也是本次有提到的項目。CPU 將會是 Ivy Bridge E5-2680.v2,而每台 Linode host server 變成用 40Gbps 接到骨幹了。

這幾波動作累積下來,似乎趕上 DigitalOcean 不少?

Digital Ocean 的成長速度跟 Amazon Web Services 有拼...

Netcraft 這篇「DigitalOcean now growing faster than Amazon」說 Digital Ocean 的成長速度超越 AWS,不過因為 Netcraft 主要是看 web 的部份,我是覺得講得有點誇大...

不過比較可以確定的是,Digital Ocean 的確成長很快。氣勢上已經掩蓋掉 Linode...

Linode 的 SSD 計畫...

Zite 上面看到 Linode 開始測試 SSD 了:「Linode SSD (beta)」。

依照公告,目前只有 Newark 機房有提供測試,同時也說明在 beta 階段不保證資料安全性。

在討論區除了官方有提供數據外,也有人有貼出測試結果。看起來有改善,但好像沒想像中多... XD

AWS 歷史上第一台 RAM 比儲存空間多的 instance...

看到 AWS 推出新的 EC2 instance:「EC2 for In-Memory Computing - The High Memory Cluster Eight Extra Large Instance」,看完這個 instance 的規格笑了出來 XDDD

120GB SSD 兩顆 (所以是 240GB),加上 244GB RAM,結果記憶體比 SSD 空間大,應用程式一定得分層利用... XDDD

Colin Percival 開了台 FreeBSD 9.1 起來測試,可以順便看到一些硬體資訊。

目前還沒有 Reserved Instances 可以買,所以依照目前的價錢 USD$3.50/hour,一年大約是 90 萬新台幣,而這金額差不多可以直接買一台了... 所以這個 instance 的定位是在非長期的大量運算?不過依照 AWS 的慣例,過陣子應該還是會出 Reserved Instances 讓需要的人買...

不過這也是目前記憶體最多的機器,如果下次看到有文章寫「因為資料超過 244GB,所以資料庫效能炸掉」的訊息,就知道發生什麼事情了 XDDD

AWS 推出高速 I/O 的 EC2 instance

早上就看到 AWS EC2 推出 hi1.4xlarge 的消息:「New High I/O EC2 Instance Type - hi1.4xlarge - 2 TB of SSD-Backed Storage」(官方 blog)、「Expanding The Cloud – High Performance I/O Instances for Amazon EC2」(CTO Werner Vogels 的 blog)。

幾個比較重要的特性:

  • 60.5GB 記憶體
  • 10Gbps 網路
  • 1TB 的 SSD volume 兩個

前面兩個不會太意外,因為需要高速 I/O 的服務通常也都很需要用大量記憶體當作 cache 降低 I/O,也需要大量頻寬提供服務。用 SSD 也在預期的範圍內,不過提供的 SSD 空間居然這麼大...

當然,價位也不便宜,美東就要 USD$3.10/hour,冰島愛爾蘭則是 USD$3.41/hour (目前只有這兩區有提供)。如果以美東一個月 720hours 計算是 USD$2232,約台幣六萬六千多?