10. 相關性與線性回歸

第十單元 相關性與線性回歸


單元大綱:
■ 資料分析的基本觀念
§ 資料分析、商業策略
§ 商業資料分析的層次和重點
§ 廣義、狹義的模型
§ 方法參數、模型係數
§ 準確性、複雜度
■ 相關性:變數之間的關係
§ 連續變數的相關性(係數) Correlation
§ 類別變數之間的關聯性 Association
§ 類別與連續變數之間的關係
§ 類別與連續變數的各種可能關係圖示
■ 簡單線性回歸 Simple Linear Regression
§ 用R做線性回歸 – lm()
§ Model Summary 功能
§ 畫出回歸線
§ 變異數分析 Analysis of Variance (ANOVA)
■ 多元線性回歸
§ 係數的隨機變數(機率分布函數)
§ 變數之間的相關性、複回歸的共線性問題
§ 模型選擇、挑選變數
§ 誤差與準確性指標

課堂與作業筆記
◆ 課堂筆記 UNIT10A:相關性,變數之間的關係 (Github)
◆ 課堂筆記 UNIT10B:簡單線性回歸 (Github)
◆ 課堂筆記 UNIT10C:多重線性回歸 (Github)

檔案下載:
◆ 第十單元 雲端資料夾 【10相關性與線性回歸
◆ 第十單元 課程單元投影片 (unit10.pttx)
◆ 第十單元 課堂與作業筆記 (unit10.zip)

第十周小組作業 準備期中報告: 期限 11/20 (三) 16:00
◆ DataCamp: Correlation and Regression in R
◆ 以檔名:”學號_Corr.pdf” (e.g., M0010001_Corr.pdf)
◆ 上傳到:【~/certificates/AS10A_Corr

影片連結:
◆ 第十單元 上課錄影

參考連結:
◆  中山管院大數據平台 入口網站
◆  R:資料分析與基礎統計 線上課程自學地圖
◆  John Hopkins: R Programming 線上課程
◆  John Hopkins: R Programming eBook
◆  Harvard: Data Science 線上課程
◆  Harvard: Data Science 課堂筆記
◆  Probability Cheat Sheet (pdf)
◆ Intro. Probability and Statistics Using R (IPSUR)
◆ Statistical Analysis Using R, UCLA (URL)
◆ CLUSTER ANALYSIS IN R: PRACTICAL GUIDE (URL)
◆ Principal Component Methods in R: Practical Guide (URL)