這兩天跟 XDite 聊 Amazon EC2,除了拿來跑 apache、MySQL、memcached 外,也有人拿來作為其他的用途。
其中一個比較有名的例子是去年十一月的時候,紐約時報的 Derek Gottfrid 寫了一篇文章,說明了把 1851 年至 1922 年的 TimeSelect 與 The New York Times 轉成 PDF 的過程。
他們已經有 TIFF 格式的圖檔,現在想要轉成 PDF 檔,但原始 TIFF 檔有 4TB,如果在短時間內要轉成 PDF,需要投資不少設備。
由於他之前使用過 Amazon S3,覺得 S3 是一個還不錯的服務,所以他決定嘗試 Amazon EC2。首先先把 4TB 的圖檔傳到 S3 上。再用 Amazon EC2 跑 Hadoop,在上面開 100 台 EC2 instance 轉檔,只花了一整天就把 4TB 的 TIFF 轉完並產生 1.5TB 的 PDF。(Self-service, Prorated Super Computing Fun!)
如果計算 S3 與 EC2 所花掉的費用 (包括 storage、bandwidth、running time),可以在 USD$3000 內解決,總共只花了兩到三天的時間。這是一個還蠻有趣的例子,拿 Amazon EC2 來跑這種需要大量 CPU resource 的工作。