Fighter 寫:
請問一下HADOOP要如何使用在BI上或是說要用在哪一方面
能說個大概讓我了解一下~~~感恩
在形成商業智慧之前,首先必需要做資訊系統整合。
因此會需要資料倉儲(Datawarehouse),像架構在 Hadoop 之上的 Hive 就是其中一種。
Hive 這種資料倉儲想做的事情,是統合不同來源的資料庫。
如維基百科上的圖:

有了資料倉儲之後,資料存在 Hadoop 的 HDFS,而當進行 Hive Query 時,
則透過 Hadoop 的 MapReduce 去作運算。大抵這就是為何 Hadoop 會用在商業智慧的系統中。
至於商業智慧是甚麽?每個公司裡面都有 ERP (金流)、CRM (客戶關係,人流)、
自動倉儲系統(AS/RS)等資訊系統,背後都會有自己的一套資料庫,也許有的是 MS SQL、
Oracle、Access、MySQL等。當今天老闆想要知道哪個客戶(要從 CRM 找)過去五年內,
下的訂單(要從 ERP 找),扣除物料成本(要從 AS/RS 甚至資材系統找),淨利高達 25%
的排行榜前五名是哪幾間?這通常要透過大量數據分析、能夠精算到每個產品的成本與淨利,
才有辦法得到的答案。這也是為何 Hadoop 這幾年在商業智慧中扮演重要角色的原因,因為
處理海量資料是它的強項。
- Jazz