[學習]對於大數據資料分析的三個階段

上上禮拜在學校的BigData Summer School聽資策會前瞻科技所所長 林蔚君博士提了現階段大數據分析的研究趨勢與應用,所以特別在此紀錄一下

1.Exploratory Data
此階段的資料大多是半結構化或未結構化的資料,如文字。使用者必須透過文字分析等Exploration Sandbox的方法從資料中找到資料中的脈絡(pattern),通常會配合Batch System如Hadoop,使用機器學習的方法來得到結果。

2.Purposeful Diagnostic
得到Pattern之後,就可以建立Data Warehouse,並做出有目的性的決策,在此也會用上最佳化(或OR)的概念來找到最佳解。

3.Real-time
最後一個階段是建立即時處理及分析的系統,應付源源不斷的資料,會使用到Stream Computing的技術。

以上

發表留言