4. 敘述統計與簡單探索 (109.1)

第四單元 敘述統計與簡單探索


單元大綱:
◆ 資料處理套件 dplyr
□ filter:選取紀錄
□ select:選取欄位
□ group:建立群組
□ mutate:建立新欄位
□ summarise:資料彙總
◆ 繪圖套件 ggplot2
□ 繪圖語法:資料與繪圖元件屬性的對應關係
□ data:資料框
□ geom_{…} :圖形種類、繪圖元件
□ aes:欄位與繪圖元件屬性的對應關係
◆ 描述資料(敘述性統計)
□ 統計值:`mean()`, `mediam()`, `min()`, `max()`, …
□ 分布:`hist()`, `table %>% barplot`
□ 變數之間的關係:`cor()`, `plot(x, y)`
◆ 簡單資料探索(分類比較)
□ 分類計數
□ 分類統計
□ 分類分布
□ 分類關係

課堂與作業筆記
◆ 課堂筆記:unit04A  資料整理與繪圖套件  (unit4A.html)

檔案下載:  🌻 從分享硬碟下載檔案前, 請先登入你的G-Suite帳號  🌻
◆ 第四單元 雲端資料夾 【04資料處理與繪圖套件
◆ 第四單元 課程單元投影片  (04敘述統計與簡單探索.pptx)
◆ 第四單元 課堂與作業筆記  (unit04.zip)

第四周作業:截止時間 10/06 (二) 23:59
◆ 小組作業:完成小組作業筆記,依以下的檔名格式上傳到指定資料夾
檔案 → ~/小組作業/G##/G##_unit04A.html      (*G##代表組名,如G01、G12)
◆ 個人作業:完成DataCamp線上課程: Exploratory Data Analysis in R
將認證上傳到指定資料夾, 檔名: 學號_EDA.pdf  →【個人作業/認證04A_EDA/
請大家一定要用以上指定的資料夾和檔案名稱,連大小寫都要完全一樣!
◆ 課前預習:跟隨教學影片的指引操作使用『老忠實噴泉』這一個互動模擬程式,先了解機率分布的基本概念
🌻   本周的作業比較多,請大家互相幫助、一起加油  🌻

參考連結:
◆  資料視覺化參考網站 From Data to Viz
◆  中山管院大數據平台 入口網站
◆  R:資料分析與基礎統計 線上課程自學地圖
◆  John Hopkins: R Programming 線上課程
◆  John Hopkins: R Programming eBook
◆  Harvard: Data Science 線上課程
◆  Harvard: Data Science 課堂筆記

影片連結:
◆ 第四單元 上課錄影