4. 敘述統計與簡單探索 (109.2)

第四單元 敘述統計與簡單探索


單元大綱:
◆ 資料處理套件 dplyr
◆ 繪圖套件 ggplot2
◆ 描述資料(敘述性統計)
□ 統計值:`mean()`, `mediam()`, `min()`, `max()`, …
□ 分佈:`hist()`, `table %>% barplot`
□ 變數之間的關係:`cor()`, `plot(x, y)`
◆ 簡單資料探索(分類比較)
□ 分類計數
□ 分類統計
□ 分類分佈
□ 分類關係

課堂與作業筆記
◆ 課堂筆記:unit04A  簡單資料探索  (unit4A.html)
◆ 課堂筆記:unit04B  互動視覺化與資料探索  (unit4B.html)
◆ 課堂筆記:unit04C  資料探索,類別變數  (unit4C.html)
◆ 課堂筆記:unit04D  資料探索,連續變數  (unit4D.html)

檔案下載:  🌻 從分享硬碟下載檔案前, 請先登入你的G-Suite帳號  🌻
◆ 第四單元 雲端資料夾 【04資料處理與繪圖套件
◆ 第四單元 課程單元投影片  (04敘述統計與簡單探索.pptx)
◆ 第四單元 課堂與作業筆記  (unit04.zip)

第四周作業:截止時間 3/23 (二) 23:59
◆ 小組作業:完成小組作業筆記,依以下的檔名格式上傳到指定資料夾
檔案 → ~/小組作業/G##/G##_AS4D.html      (*G##代表組名,如G01、G12)
◆ 課前預習:跟隨教學影片的指引操作使用『老忠實噴泉』這一個互動模擬程式,先了解機率分布的基本概念

參考連結:
◆  資料視覺化參考網站 From Data to Viz
◆  中山管院大數據平台 入口網站
◆  R:資料分析與基礎統計 線上課程自學地圖
◆  John Hopkins: R Programming 線上課程
◆  John Hopkins: R Programming eBook
◆  Harvard: Data Science 線上課程
◆  Harvard: Data Science 課堂筆記

影片連結:
◆ 第四單元 上課錄影