GGG 寫:
不是很懂,
意思是業界匯入表時,都會放棄columns的名字嗎?
因為若沒有columns的名字,怎麼得知該欄內的值意義為何?
不知意義為何,該如何進行下一步的分析資料呢?
搜哩~傳達不清,
麻煩大大了。
實際上並沒有「放棄」column name,實務上比較怕的是多個表格有相同的 column name 吧?
有一些 CSV 第一行會有 header 提供 column name
代碼:
solt_id, w0001_s1, w0001_s2, ....., w1508_s1, w1508_s3
20160409157432,5031.89, 7342.88, ........, 1604.50, 4516.07
這樣也可以用程式把 header 轉成 HiveQL 的 create table 語法啊~
況且,column name 也不是每一家都會用可以直接理解的命名方式。
以前看過某 ERP 軟體的 Table 都是 MX001, TA001 這種
鐵定要搭配其他資訊來說明那一欄是甚麼意義,那叫做 water_temperature 跟命名為 col_050 有差嗎?
只要知道 col_050 是水溫, 那還是可以作分析啊。
- Jazz