「分散式系統」(Distributed System) 是個老詞彙,但跟最近當紅詞彙「雲」、「NoSQL」常常相關。也因此「雲」與「NoSQL」常常遇到的都是分散式系統遇到 (並且討論過) 的問題...
而「Notes on Distributed Systems for Young Bloods」這篇寫的好血淚 XDDD 除了講理論面的東西以外,也把實務面會遇到的問題拿出來講...
首先要先知道「Fallacies of Distributed Computing」,在分散式系統裡,能假設的事情實在太少,要處理的事情太多。而「CAP theorem」也是個必讀的主題,從 Amazon 丟出「Dynamo: Amazon's Highly Available Key-value Store」這篇經典的 paper 後讓更多人知道這個理論。
熟悉上面兩個主題後,接下來就是血淚史... XD
garbage collection pauses make masters “disappear”
啊,GC 讓 master 不見... (NameNode... XDDD)
Writing robust distributed systems costs more than writing robust single-machine systems.
Robust, open source distributed systems are much less common than robust, single-machine systems.
這兩條... XD
Oh, and Paxos really is very hard to implement
Paxos... XD
If you can fit your problem in memory, it’s probably trivial.
(噴飯)
“It’s slow” is the hardest problem you’ll ever debug.
連問題都找不到嗎... XD
撇開這些碎碎念的部份,就算對 distributed system 沒那麼熟,這篇文章也提到了很多「解決的方向」以及「關鍵字」讓你找資料,對於實際操作時會有很大的幫助。