摘要
本課程將以實際的巨量資料為核心,讓學生接觸實際的巨量資料計畫,並學習相關的方法與技術。 課 程會就資料的背景、來源、要解決的問題及相關的domain knowledge做說明。 接著,針對以下四個主題:1.資料搜集、儲存與整理;2.模型建立與分析方法;3.結果呈現、說明與視覺化; 4.分析流程自動化軟體的雛型製作, 講述相關既存的概念、方法與實作工具,接著針對新穎方法進行討論。
授課教師
姜自強
資訊管理學系 副教授
課程進度表
1 巨量資料分析簡介與R 語言的基本操作及應用。 實體面授 3
2 資料探勘與視覺化基礎-資料前處理 遠距教學 3
3 你的資料會說話–資料視覺化 1 遠距教學3
4 與資料共舞–資料視覺化 2 遠距教學3
5 巨量資料描述性分析 遠距教學3
6 UCI商業問題與資料探勘任務集 實體面授3
7 機率/統計基礎與迴歸模型與邏輯斯模型 遠距教學3
8 監督式機器學習應用於商業與金融資料實務 遠距教學3
9 期中考 實體面授 3
10 樹狀模型–決策樹、分類樹、迴歸樹與模型樹 遠距教學3
11 非監督式機器學習 遠距教學3
12 商業與金融資料-集群分析 遠距教學3
13 關聯規則探勘 遠距教學3
14 商業與金融資料 實體面授3
15 資料實務專題個案分析討論
16 政府開放式資料open data案例實戰與分析(1) 遠距教學3
17 政府開放式資料open data案例實戰與分析(2) 遠距教學3
18 期末報告 實體面授 3
評分標準
Ø 期中考30%
Ø 期末考40%
Ø 作業40%
主要參考書籍/資料
無