Amazon EC2

這兩天跟 XDiteAmazon EC2,除了拿來跑 apacheMySQLmemcached 外,也有人拿來作為其他的用途。

其中一個比較有名的例子是去年十一月的時候,紐約時報的 Derek Gottfrid 寫了一篇文章,說明了把 1851 年至 1922 年的 TimeSelect 與 The New York Times 轉成 PDF 的過程。

他們已經有 TIFF 格式的圖檔,現在想要轉成 PDF 檔,但原始 TIFF 檔有 4TB,如果在短時間內要轉成 PDF,需要投資不少設備。

由於他之前使用過 Amazon S3,覺得 S3 是一個還不錯的服務,所以他決定嘗試 Amazon EC2。首先先把 4TB 的圖檔傳到 S3 上。再用 Amazon EC2 跑 Hadoop,在上面開 100 台 EC2 instance 轉檔,只花了一整天就把 4TB 的 TIFF 轉完並產生 1.5TB 的 PDF。(Self-service, Prorated Super Computing Fun!)

如果計算 S3 與 EC2 所花掉的費用 (包括 storage、bandwidth、running time),可以在 USD$3000 內解決,總共只花了兩到三天的時間。這是一個還蠻有趣的例子,拿 Amazon EC2 來跑這種需要大量 CPU resource 的工作。

4 thoughts on “Amazon EC2”

  1. 您好,打擾了,我是研究所的學生,因為我負責了一個雲端計算的報告,而我的主題剛好是Amazon EC2,所以想徵得您的同意可否在報告中會援引您blog中一些關於EC2的資料。如果能得到您同意,將會對我的相關資料庫有莫大的助益。謝謝您。

Leave a Reply

Your email address will not be published. Required fields are marked *