AndyTsai 寫:
最近想在國網中心測試一下我的東西,
結果不知道要怎麼上傳檔案,可以給我一個完整的教學嗎
我只為在國網中心的建立檔案,如果我要上傳input的檔案就一直失敗,我的語法
hadoop fs -put c:/10node.txt /user/h4506/MST/
MST是我建立的目錄
我在C槽放入10node.txt檔案要上傳,打這語法一直出錯
請大大門指點 ,我因該怎麼做
MapReduce的jar檔 也是要上傳到hdfs上在執行嗎??
ㄜ....如果您用的是 Windoop, 那因為版本不同( hadoop.nchc.org.tw 是 Hadoop 0.20 版本, Windoop 不是這個版本 )
總之,習慣上我們的作法是用 Filezilla 或 WinSCP 將檔案上傳到 hadoop.nchc.org.tw
然後 SSH 登入 hadoop.nchc.org.tw
在 hadoop.nchc.org.tw 的 SSH 視窗中下 hadoop fs -put 10node.txt MST/.
如果要直接從 Windows 上傳的話,會遇到幾個問題
(1) 帳號 - Windows 帳號為 user, 可是遠端帳號為 h4506,是沒有權限可以上傳的。變成要在 Windows 上建立 h4506 的帳號,用該帳號才能上傳
(2) 版本 - 要用 Cygwin + Hadoop 0.20 的版本,並將 hadoop/conf 底下的 core-site.xml 跟 mapred-site.xml 設定成
代碼:
<property>
<name>fs.default.name</name>
<value>hdfs://140.110.134.1:8020</value>
</property>
代碼:
<property>
<name>mapred.job.tracker</name>
<value>140.110.134.1:8021</value>
</property>
可以做得到,只是設定上如果觀念不清楚,會傳不上去。
至於透過 Windoop 的 Hadoop Eclipse Plugin ,一樣會遇到 Eclipse Plugin 的 Hadoop 版本不相容問題。
所以即使 Windoop 的 Hadoop Eclipse Plugin 可以設定 NameNode 是 140.110.134.1:8020 ,JobTracker 是 140.110.134.1:8021
但連線時 Eclipse Plugin 就會報錯了~
- Jazz