10. 相關與迴歸

第十單元 相關性與線性回歸


單元大綱:
■ 資料分析的基本觀念
§ 資料分析、商業策略
§ 商業資料分析的層次和重點
§ 廣義、狹義的模型
§ 方法參數、模型係數
§ 準確性、複雜度
■ 相關性:變數之間的關係
§ 連續變數的相關性(係數) Correlation
§ 類別變數之間的關聯性 Association
§ 類別與連續變數之間的關係
§ 類別與連續變數的各種可能關係圖示
■ 簡單線性回歸 Simple Linear Regression
§ 用R做線性回歸 – lm()
§ Model Summary 功能
§ 畫出回歸線
§ 變異數分析 Analysis of Variance (ANOVA)
■ 多元線性回歸
§ 係數的隨機變數(機率分布函數)
§ 變數之間的相關性、複回歸的共線性問題
§ 模型選擇、挑選變數
§ 誤差與準確性指標

課堂與作業筆記
◆ 課堂筆記 UNIT10A:相關性,變數之間的關係 (unit10A.html)
◆ 課堂筆記 UNIT10B:簡單線性回歸 (unit10B.html)
◆ 課堂筆記 UNIT10C:多重線性回歸 (unit10C.html)

檔案下載:
◆ 第十單元 雲端資料夾 【10相關與回歸
◆ 第十單元 課程單元投影片 (10相關與迴歸.pttx)
◆ 第十單元 課堂與作業筆記 (10相關與迴歸.zip)

第十周小組作業: 期限 05/11 (一) 12:00
◆ 完成DataCamp: Correlation and Regression in R
◆ 將認證以檔名:”姓名_Corr.pdf”   上傳到:【~/認證/Corr_Reg/

影片連結:
◆ 第十單元 上課錄影

參考連結:
◆  中山管院大數據平台 入口網站
◆  R:資料分析與基礎統計 線上課程自學地圖
◆  John Hopkins: R Programming 線上課程
◆  John Hopkins: R Programming eBook
◆  Harvard: Data Science 線上課程
◆  Harvard: Data Science 課堂筆記
◆  Probability Cheat Sheet (pdf)
◆ Intro. Probability and Statistics Using R (IPSUR)
◆ Statistical Analysis Using R, UCLA (URL)
◆ CLUSTER ANALYSIS IN R: PRACTICAL GUIDE (URL)
◆ Principal Component Methods in R: Practical Guide (URL)