課程 > 2018暑期課程 > (10) 非結構化資料

(10) 非結構化資料

第十單元:非結構化資料、文字分析技術


預習影片:
◆ 第十單元 :非結構化資料、文字分析技術 預習影片 (YouTube)

內容大綱:
◆ MIT第五單元內容
。 非結構化資料 Unstructured Data (Twitter)
。 人工智慧 Artificial Intelligence (IBM Watson)
。 文字分析 Text Analysis (Enron Case)
◆ 補充內容:文字分析的應用與高階工具
。 資料收集:爬蟲程式 Web Crawler
。 文字雲工具 Word Cloud
。 情緒分析套件、工具軟體 Sentiment Analysis
。 主題分析 Topic Analysis
。 社會網絡監聽 Social Listening

案例分析:
◆ 課堂筆記 :
。Twitter情緒分析 (AS10-0A)
。文字分析的法務應用 (AS10-0B)
◆ 作業筆記:
。誰是來亂的? (AS10-1)
。論文篩選 (AS10-2)
。垃圾郵件偵測 (AS10-3)

內容下載:
◆ 第十單元 雲端資料夾
◆ 第十單元 課程預習投影片 (PPT)
◆ 第十單元 課程投影片 (PPT)
◆ 第十單元 資料、程式、課堂筆記、參考作業筆記 (ZIP)

線上模擬:
模擬預測機率分佈 與 模型準性指標

參考連結:
Harvard Data Science
Data Science: Visualization
Data Science: Wrangling
MIT Analytics Edge
DataCamp
課程社群連結
中山管院大數據平台入口網站
R:資料分析與基礎統計 線上自學地圖

上課錄影:
◆ 第十單元 上課錄影 (YouTube)