安裝、載入一些基本的套件

if(!require(dplyr)) install.packages("dplyr")
if(!require(tidyr)) install.packages("tidyr")
if(!require(ggplot2)) install.packages("ggplot2")
if(!require(plotly)) install.packages("plotly")
if(!require(babynames)) install.packages("babynames")

【Chapter-4】Case Study: US Babynames

檢視資料

Classes 'tbl_df', 'tbl' and 'data.frame':   1924665 obs. of  5 variables:
 $ year: num  1880 1880 1880 1880 1880 1880 1880 1880 1880 1880 ...
 $ sex : chr  "F" "F" "F" "F" ...
 $ name: chr  "Mary" "Anna" "Emma" "Elizabeth" ...
 $ n   : int  7065 2604 2003 1939 1746 1578 1472 1414 1320 1288 ...
 $ prop: num  0.0724 0.0267 0.0205 0.0199 0.0179 ...


篩選出男生資料


某些男生名字的『數量』


某些男生名字的『比例』


簡化程式


熱門男生名字的『比例』


熱門女生名字的『比例』




💡 學習重點:
  ■ 每一份資料都是一個物件:名稱、值、種類、結構
  ■ 每一行程式都是一個運算式:物件、運算符號與功能的組合
  ■ 所謂寫程式:使用運算式定義新物件或改變既有物件的過程
  ■ dplyr套件:提供一套方便『整理資料』的…
    § 物件:tibble
    § 運算符號:%>%
    § 功能:
      。select: 依名稱選擇欄位
      。filter: 依條件選取紀錄
      。mutate: 運算新欄位
      。summarise: 欄位統計
      。group_by: 資料分群
      。…