jazz 寫:
MapReduce 是 Share Nothing Programming Model
因此執行上不能強制先後順序(因為排程還有資源分配的關係)、要共享變數或做參數傳遞都會遇到問題。
目前聽過的方式是用第三方的方法來解決,例如:使用資料庫、使用 Message Queue、使用 HDFS 存放共享變數。
- Jazz
感謝大大回答!!
再請問我再分解程式的時候 我是看reduce工作的時候是key1做完 再過來是key2 過來key3...key4...key5
我是在eclipse上用"偽分佈模式"
因為只有一台電腦 所以在看Console他都是一個key1做完 再過來是key2 過來key3...key4...key5
可是如果照正常的分布模式他因該是有五台電腦分別處理key
所以不會有key1做完 再過來是key2 過來key3...key4...key5的結果是嗎???
想問這個問題是因為我的程式理面有一個資料結構是會key1存取完 key2也可以用key1剛剛存取的資料 讓我有點疑惑
想說那這樣不就是key1做完才換key2 這樣是否就失去MapReduce的意義呢...還是我誤解..
原始碼連結:http://hadooptutorial.wikispaces.com/file/view/MST.java