Taiwan Hadoop Forum

台灣 Hadoop 技術討論區
現在的時間是 2022-06-29, 03:22

所有顯示的時間為 UTC + 8 小時




發表新文章 回覆主題  [ 2 篇文章 ] 
發表人 內容
 文章主題 : TextInputFormat 輸入字元的編碼問題
文章發表於 : 2014-07-02, 12:50 
離線

註冊時間: 2014-04-29, 22:54
文章: 3
我的Intput Data 是有包含ASSCII碼超過127的話

我使用TextInputFormat 很多字元處理起來會是亂碼,所以程式會錯誤

我想請問我這種Intput Data是不是無法使用TextInputFormat?

那我該用何種InputFormat? 或是有其他解法?

新手發問,多多指教 :P


回頂端
 個人資料 E-mail  
 
 文章主題 : Re: TextInputFormat 輸入字元的編碼問題
文章發表於 : 2014-12-08, 00:09 
離線

註冊時間: 2009-11-09, 19:52
文章: 2897
kd12 寫:
我的Intput Data 是有包含ASSCII碼超過127的話
我使用TextInputFormat 很多字元處理起來會是亂碼,所以程式會錯誤
我想請問我這種Intput Data是不是無法使用TextInputFormat?
那我該用何種InputFormat? 或是有其他解法?
新手發問,多多指教 :P


感覺跟字集有關,因為牽涉的範圍有點廣,
建議您查一下 TextInputFormat unicode 相關的討論。

- Jazz


回頂端
 個人資料 E-mail  
 
顯示文章 :  排序  
發表新文章 回覆主題  [ 2 篇文章 ] 

所有顯示的時間為 UTC + 8 小時


誰在線上

正在瀏覽這個版面的使用者:沒有註冊會員 和 1 位訪客


不能 在這個版面發表主題
不能 在這個版面回覆主題
不能 在這個版面編輯您的文章
不能 在這個版面刪除您的文章
不能 在這個版面上傳附加檔案

搜尋:
前往 :  
cron
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
正體中文語系由 竹貓星球 維護製作