(4C)單元摘要: 使用台灣各級行政區的資料來練習

資料來源社會經濟資訊服務平台


載入套件和資料

Sys.setlocale(category="LC_ALL", locale="cht")
pacman::p_load(dplyr,tibble,GGally,plotly,ggpubr)
rm(list=ls(all=T))
load("data/villages.rdata")


【A】 檢視、彙整資料

[1] 39073
Rows: 39,073
Columns: 166
$ COUNTY_ID                              <chr> "63000", "63000", "63000", "...
$ COUNTY                                 <chr> "臺北市", "臺北市", "臺北市", "臺北市", ...
$ TOWN_ID                                <chr> "63000010", "63000010", "630...
$ TOWN                                   <chr> "松山區", "松山區", "松山區", "松山區", ...
$ V_ID                                   <chr> "63000010-002", "63000010-00...
$ VILLAGE                                <chr> "莊敬里", "東榮里", "三民里", "新益里", ...
$ 戶數                                   <dbl> 2079, 3003, 2918, 1851, 2128, ...
$ 人口數                                 <dbl> 5656, 8472, 7153, 4878, 5455, 5...
$ 男性人口數                             <dbl> 2749, 3953, 3280, 2326, 2511, 247...
$ 女性人口數                             <dbl> 2907, 4519, 3873, 2552, 2944, 270...
$ 性比例                                 <dbl> 94.56, 87.48, 84.69, 91.14, 85....
$ 戶量                                   <dbl> 2.72, 2.82, 2.45, 2.64, 2.56, ...
$ 人口密度                               <dbl> 4302.1, 32903.7, 54159.0, 42245....
$ 扶養比                                 <dbl> 42.04, 49.73, 48.03, 40.41, 43....
$ 扶幼比                                 <dbl> 17.05, 24.00, 19.87, 16.44, 19....
$ 扶老比                                 <dbl> 24.99, 25.73, 28.17, 23.98, 23....
$ 老化指數                               <dbl> 146.54, 107.22, 141.77, 145.88, ...
$ `0-4歲人口數`                          <dbl> 288, 400, 367, 242, 305, 292, 28...
$ `5-9歲人口數`                          <dbl> 171, 418, 293, 147, 217, 223, 21...
$ `10-14歲人口數`                        <dbl> 220, 540, 300, 182, 220, 206, 19...
$ `15-19歲人口數`                        <dbl> 287, 520, 346, 234, 283, 281, 25...
$ `20-24歲人口數`                        <dbl> 301, 447, 339, 269, 269, 248, 23...
$ `25-29歲人口數`                        <dbl> 299, 389, 347, 258, 344, 275, 22...
$ `30-34歲人口數`                        <dbl> 433, 526, 474, 429, 395, 406, 31...
$ `35-39歲人口數`                        <dbl> 552, 630, 567, 463, 471, 495, 44...
$ `40-44歲人口數`                        <dbl> 458, 637, 567, 388, 415, 385, 43...
$ `45-49歲人口數`                        <dbl> 417, 630, 624, 358, 360, 379, 41...
$ `50-54歲人口數`                        <dbl> 419, 606, 512, 341, 407, 373, 35...
$ `55-59歲人口數`                        <dbl> 400, 599, 533, 341, 414, 375, 36...
$ `60-64歲人口數`                        <dbl> 416, 674, 523, 393, 445, 421, 35...
$ `65-69歲人口數`                        <dbl> 357, 519, 450, 308, 354, 333, 27...
$ `70-74歲人口數`                        <dbl> 238, 369, 336, 194, 202, 195, 19...
$ `75-79歲人口數`                        <dbl> 153, 233, 233, 139, 161, 135, 15...
$ `80-84歲人口數`                        <dbl> 118, 164, 151, 86, 96, 79, 103, ...
$ `85-89歲人口數`                        <dbl> 93, 110, 113, 68, 72, 54, 70, 58...
$ `90-94歲人口數`                        <dbl> 29, 50, 56, 31, 22, 17, 37, 34, ...
$ `95-99歲人口數`                        <dbl> 7, 11, 16, 5, 3, 7, 4, 8, 11, 16...
$ `100歲以上人口數`                      <dbl> 0, 0, 6, 2, 0, 1, 0, 1, 1, 3, 3, 1...
$ `0-14歲人口數`                         <dbl> 679, 1358, 960, 571, 742, 721, 6...
$ `15-64歲人口數`                        <dbl> 3982, 5658, 4832, 3474, 3803, 36...
$ `65歲以上人口數`                       <dbl> 995, 1456, 1361, 833, 910, 821, 83...
$ `0-5歲兒童人口數`                      <dbl> 330, 480, 440, 268, 355, 337, 329,...
$ `6-11歲兒童人口數`                     <dbl> 205, 559, 316, 186, 236, 254, 236,...
$ `12-17歲少年人口數`                    <dbl> 317, 643, 408, 256, 314, 281, 271,...
$ `15歲以上博士人口數`                   <dbl> 44, 143, 90, 48, 66, 57, 53, 79, 94,...
$ `15歲以上碩士人口數`                   <dbl> 401, 1087, 796, 430, 579, 463, 569, ...
$ `15歲以上大學院校人口數`               <dbl> 1607, 2984, 2557, 1577, 1874, 1571, 16...
$ `15歲以上專科人口數`                   <dbl> 719, 1014, 953, 632, 691, 747, 645, ...
$ `15歲以上高中職人口數`                 <dbl> 1300, 1349, 1204, 1007, 989, 1043, 89...
$ `15歲以上國中初職人口數`               <dbl> 383, 307, 309, 272, 267, 276, 207, 203...
$ `15歲以上小學人口數`                   <dbl> 488, 219, 262, 310, 236, 287, 162, 1...
$ `15歲以上自修人口數`                   <dbl> 10, 4, 8, 9, 3, 4, 7, 4, 4, 7, 3, 3,...
$ `15歲以上不識字人口數`                 <dbl> 25, 7, 14, 22, 8, 11, 6, 7, 9, 19, 19...
$ `15歲以上未婚人口數`                   <dbl> 2301, 3627, 2900, 1989, 2333, 2160, ...
$ `15歲以上有偶人口數`                   <dbl> 2640, 4149, 3450, 2370, 2546, 2478, ...
$ `15歲以上離婚人口數`                   <dbl> 393, 328, 425, 269, 310, 294, 316, 2...
$ `15歲以上喪偶人口數`                   <dbl> 322, 368, 378, 250, 266, 248, 228, 2...
$ 出生數                                 <dbl> 61, 64, 63, 59, 58, 53, 48, 38,...
$ 婚生人數                               <dbl> 59, 64, 61, 59, 57, 52, 47, 38, ...
$ 非婚生已認領人數                       <dbl> 1, 0, 1, 0, 0, 0, 0, 0, 0, 0, 1, 0, ...
$ 非婚生未認領人數                       <dbl> 1, 0, 1, 0, 1, 0, 1, 0, 0, 2, 1, 1, ...
$ 棄嬰或無依兒童人數                     <dbl> 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0...
$ 本國籍生母之嬰兒出生數                 <dbl> 60, 63, 61, 54, 55, 50, 46, 34, 36, 65,...
$ 非本國籍生母之嬰兒出生數               <dbl> 1, 1, 2, 5, 3, 3, 2, 4, 3, 7, 0, 0, 0, 1...
$ 死亡數                                 <dbl> 34, 42, 58, 23, 25, 21, 18, 26,...
$ 結婚對數                               <dbl> 44, 47, 44, 43, 33, 46, 24, 23, ...
$ `結婚登記中外(含大陸港澳配偶)聯姻人數` <dbl> 4, 11, 9, 4, 6, 5, 5, 4, 5, 9, 9, 4, 3, 12, 1...
$ 離婚對數                               <dbl> 9, 8, 10, 13, 9, 13, 10, 5, 16, ...
$ 自然增加人數                           <dbl> 27, 22, 5, 36, 33, 32, 30, 12, 8, ...
$ 社會增加人數                           <dbl> -38, -118, -1, -24, -35, -54, -51,...
$ 總增加人數                             <dbl> -11, -96, 4, 12, -2, -22, -21, -8...
$ 遷入人口數                             <dbl> 260, 376, 362, 191, 252, 236, 201...
$ 遷出人口數                             <dbl> 318, 485, 364, 217, 278, 276, 243...
$ 鄉鎮區內住址變更之遷入人口數           <dbl> 137, 264, 279, 138, 140, 153, 166, 127, 10...
$ 鄉鎮區內住址變更之遷出人口數           <dbl> 117, 273, 278, 136, 149, 167, 175, 188, 13...
$ 粗出生率                               <dbl> 10.80, 7.55, 8.81, 12.16, 10.63,...
$ 粗死亡率                               <dbl> 6.02, 4.96, 8.11, 4.74, 4.58, 4....
$ 自然增加率                             <dbl> 4.78, 2.60, 0.70, 7.42, 6.05, 6.1...
$ 社會增加率                             <dbl> -6.73, -13.92, -0.14, -4.95, -6.4...
$ 粗結婚率                               <dbl> 7.79, 5.55, 6.16, 8.86, 6.05, 8....
$ 粗離婚率                               <dbl> 1.59, 0.94, 1.40, 2.68, 1.65, 2....
$ `出生登記-性比率`                     <dbl> 84.85, 88.24, 162.50, 90.32, 100.00,...
$ 原住民人口比率                         <dbl> 0.95, 0.14, 0.31, 0.33, 0.29, 0.25,...
$ 原住民人口扶養比                       <dbl> 45.95, 71.43, 46.67, 6.67, 14.29, 30...
$ 原住民人口扶幼比                       <dbl> 29.73, 42.86, 40.00, 6.67, 14.29, 20...
$ 原住民人口扶老比                       <dbl> 16.22, 28.57, 6.67, 0.00, 0.00, 10.0...
$ 原住民人口老化指數                     <dbl> 54.55, 66.67, 16.67, 0.00, 0.00, 50.0...
$ 原住民人口數                           <dbl> 54, 12, 22, 16, 16, 13, 22, 11, 6,...
$ 平地原住民人口數                       <dbl> 22, 6, 16, 9, 10, 5, 11, 8, 4, 14, 1...
$ 山地原住民人口數                       <dbl> 32, 6, 6, 7, 6, 8, 11, 3, 2, 8, 18, ...
$ 非原住民人口數                         <dbl> 5602, 8460, 7131, 4862, 5439, 5167,...
$ 原住民戶數                             <dbl> 18, 7, 11, 6, 9, 7, 8, 4, 4, 10, ...
$ 平地原住民戶數                         <dbl> 9, 4, 9, 4, 6, 4, 5, 4, 2, 6, 6, 3,...
$ 山地原住民戶數                         <dbl> 9, 3, 2, 2, 3, 3, 3, 0, 2, 4, 9, 1,...
$ `原住民0-9歲人口數`                    <dbl> 7, 3, 5, 0, 0, 1, 10, 0, 1, 4, 5, 4...
$ `原住民10-19歲人口數`                  <dbl> 10, 0, 3, 2, 7, 3, 3, 0, 1, 3, 6, 5...
$ `原住民20-29歲人口數`                  <dbl> 7, 1, 4, 2, 2, 2, 2, 2, 0, 4, 2, 3,...
$ `原住民30-39歲人口數`                  <dbl> 13, 3, 2, 6, 3, 1, 5, 7, 1, 4, 4, 2...
$ `原住民40-49歲人口數`                  <dbl> 5, 2, 6, 4, 1, 5, 0, 1, 2, 4, 8, 1,...
$ `原住民50-59歲人口數`                  <dbl> 5, 1, 1, 1, 2, 0, 2, 1, 0, 2, 2, 2,...
$ `原住民60-69歲人口數`                  <dbl> 6, 0, 1, 1, 1, 0, 0, 0, 1, 0, 2, 0,...
$ `原住民70-79歲人口數`                  <dbl> 0, 2, 0, 0, 0, 1, 0, 0, 0, 1, 1, 0,...
$ `原住民80-89歲人口數`                  <dbl> 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,...
$ `原住民90-99歲人口數`                  <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,...
$ 原住民100歲以上人口數                  <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0...
$ 老年人戶數                             <dbl> 711, 993, 1002, 597, 665, 599, 61...
$ 戶長平均年齡                           <dbl> 56, 56, 56, 55, 55, 54, 54, 55, 56...
$ 戶長男性人數                           <dbl> 1154, 1551, 1429, 971, 1088, 1024,...
$ 戶長女性人數                           <dbl> 924, 1451, 1488, 879, 1040, 972, 1...
$ 總戶數                                 <dbl> 2079, 3003, 2918, 1851, 2128, 1...
$ 共同生活戶數                           <dbl> 1431, 2284, 1895, 1279, 1403, 1327...
$ 共同事業戶數                           <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0...
$ 單獨生活戶數                           <dbl> 648, 719, 1023, 572, 725, 671, 758...
$ `0歲學齡人口數`                        <dbl> 71, 54, 69, 47, 65, 52, 46, 49, 41...
$ `1歲學齡人口數`                        <dbl> 61, 80, 73, 46, 56, 65, 56, 48, 60...
$ `2歲學齡人口數`                        <dbl> 46, 95, 70, 32, 65, 63, 59, 47, 56...
$ `3歲學齡人口數`                        <dbl> 63, 85, 70, 50, 62, 61, 70, 59, 60...
$ `4歲學齡人口數`                        <dbl> 50, 66, 65, 53, 54, 50, 50, 44, 49...
$ `5歲學齡人口數`                        <dbl> 34, 93, 65, 25, 49, 48, 57, 71, 45...
$ `6歲學齡人口數`                        <dbl> 23, 86, 74, 22, 49, 62, 53, 48, 33...
$ `7歲學齡人口數`                        <dbl> 33, 76, 63, 30, 39, 43, 40, 53, 64...
$ `8歲學齡人口數`                        <dbl> 25, 80, 53, 28, 41, 42, 36, 57, 53...
$ `9歲學齡人口數`                        <dbl> 39, 103, 51, 24, 43, 44, 33, 59, 5...
$ `10歲學齡人口數`                       <dbl> 33, 96, 51, 26, 30, 39, 37, 79, 68...
$ `11歲學齡人口數`                       <dbl> 43, 119, 47, 33, 40, 32, 30, 86, 5...
$ `12歲學齡人口數`                       <dbl> 48, 155, 60, 43, 48, 48, 41, 89, 6...
$ `13歲學齡人口數`                       <dbl> 58, 101, 69, 40, 56, 37, 52, 69, 5...
$ `14歲學齡人口數`                       <dbl> 44, 113, 82, 57, 59, 56, 48, 92, 7...
$ `15歲學齡人口數`                       <dbl> 72, 118, 77, 46, 59, 51, 51, 67, 6...
$ `16歲學齡人口數`                       <dbl> 47, 99, 57, 41, 48, 50, 51, 53, 62...
$ `17歲學齡人口數`                       <dbl> 56, 95, 80, 42, 58, 45, 46, 53, 59...
$ `18歲學齡人口數`                       <dbl> 58, 99, 73, 52, 52, 72, 53, 55, 53...
$ `19歲學齡人口數`                       <dbl> 67, 106, 55, 50, 63, 59, 54, 46, 6...
$ `20歲學齡人口數`                       <dbl> 58, 94, 72, 49, 57, 48, 48, 68, 42...
$ `21歲學齡人口數`                       <dbl> 85, 92, 66, 49, 54, 42, 64, 38, 37...
$ `22歲學齡人口數`                       <dbl> 52, 92, 72, 57, 47, 58, 33, 45, 47...
$ `23歲學齡人口數`                       <dbl> 53, 83, 54, 48, 60, 59, 44, 38, 43...
$ `24歲學齡人口數`                       <dbl> 49, 83, 72, 58, 63, 44, 51, 38, 40...
$ `25歲學齡人口數`                       <dbl> 59, 74, 80, 57, 79, 54, 51, 48, 50...
$ `26歲學齡人口數`                       <dbl> 70, 93, 61, 43, 63, 60, 40, 43, 45...
$ 綜合所得稅所得總額申報納稅單位         <dbl> 1720, 2932, 2517, 1705, 1887, 1775, 1699, 1...
$ 綜合所得總額                           <dbl> 1739626, 5371988, 3541304, 1845934...
$ 綜合所得平均數                         <dbl> 1011, 1832, 1407, 1083, 1436, 1136,...
$ 綜合所得中位數                         <dbl> 725, 925, 802, 724, 797, 780, 814, ...
$ 綜合所得第一分位數                     <dbl> 414, 436, 404, 385, 404, 397, 409, 45...
$ 綜合所得第三分位數                     <dbl> 1314, 1990, 1587, 1406, 1541, 1417, 1...
$ 綜合所得標準差                         <dbl> 1028.4, 4628.4, 3531.6, 1202.1, 586...
$ 綜合所得變異係數                       <dbl> 101.68, 252.62, 251.01, 111.03, 408....
$ 綜合所得稅各類所得納稅單位             <dbl> 1720, 2932, 2517, 1705, 1887, 1775, 1699,...
$ 各類所得金額合計                       <dbl> 1739643, 5372639, 3541620, 1845942, ...
$ 各類所得金額營利所得                   <dbl> 3681, 24475, 20805, 10127, 6741, 8383,...
$ 各類所得金額執行業務所得               <dbl> 21292, 236271, 52275, 26373, 33442, 2610...
$ 各類所得金額薪資所得                   <dbl> 1431701, 3159699, 2336165, 1393643, 17...
$ 各類所得金額利息所得                   <dbl> 94218, 311667, 211695, 101384, 142537,...
$ 各類所得金額租賃及權利金               <dbl> 36794, 240400, 122595, 42455, 86588, 653...
$ 各類所得金額財產交易所得               <dbl> 3230, 33008, 13519, 2349, 6874, 4964, 93...
$ 各類所得金額機會中獎所得               <dbl> 1626, 6185, 3228, 1918, 2180, 2000, 2070...
$ 各類所得金額股利所得                   <dbl> 118257, 1220050, 685404, 223511, 63057...
$ 各類所得金額退職所得                   <dbl> 1520, 16083, 9081, 3792, 5654, 7548, 1...
$ 各類所得金額其他所得                   <dbl> 13672, 55408, 48323, 24661, 29727, 210...
$ 各類所得金額稿費所得                   <dbl> 128, 4798, 1403, 1059, 2073, 919, 759,...
$ 各類所得金額申報大於歸戶               <dbl> 13525, 64593, 37127, 14669, 25213, 11718...
$ 薪資淨所得                             <dbl> 1179392, 2776747, 2005785, 115687...
$ 按薪資淨所得計算之綜合所得             <dbl> 1487318, 4989036, 3211261, 1609169, 24525...
$ 稿費收入                               <dbl> 2132, 15755, 8529, 4822, 7272, 4...
$ year                                   <chr> "104Y", "104Y", "104Y", "104...
      
       宜蘭縣 花蓮縣 金門縣 南投縣 屏東縣 苗栗縣 桃園市 高雄市 基隆市 連江縣
  104Y    233    177     37    262    464    274    495    891    157     22
  105Y    233    177     37    262    464    274    495    891    157     22
  106Y    233    177     37    262    463    274    495    891    157     22
  107Y    233    176     37    262    463    275    504    891    157     22
  108Y    233    176     37    262    463    275    504    891    157     22
      
       雲林縣 新北市 新竹市 新竹縣 嘉義市 嘉義縣 彰化縣 臺中市 臺北市 臺東縣
  104Y    388   1032    122    191     84    357    589    625    456    147
  105Y    388   1032    122    191     84    357    589    625    456    147
  106Y    388   1032    122    192     84    357    589    625    456    147
  107Y    391   1032    122    192     84    357    589    625    456    147
  108Y    391   1032    122    192     84    357    589    625    456    147
      
       臺南市 澎湖縣
  104Y    752     96
  105Y    752     96
  106Y    752     96
  107Y    649     96
  108Y    649     96

106年村里級資料 (Vill,7851)

[1] 7851
# A tibble: 5 x 2
  REGION     n
* <fct>  <int>
1 北      2728
2 中      1864
3 南      2547
4 東       557
5 離       155
# A tibble: 22 x 2
   COUNTY     n
   <chr>  <int>
 1 新北市  1032
 2 高雄市   891
 3 臺南市   752
 4 臺中市   625
 5 彰化縣   589
 6 桃園市   495
 7 屏東縣   463
 8 臺北市   456
 9 雲林縣   388
10 嘉義縣   357
# ... with 12 more rows

106年鄉鎮區級資料 (Town,368)

             COUNTY   TOWN 人口總數 老化指數 人均應稅所得 METRO REGION
宜蘭縣三星鄉 宜蘭縣 三星鄉    21467  233.516      388.296  縣市     東
宜蘭縣大同鄉 宜蘭縣 大同鄉     6102   59.205      898.713  縣市     東
宜蘭縣五結鄉 宜蘭縣 五結鄉    39673  177.578       46.979  縣市     東
宜蘭縣冬山鄉 宜蘭縣 冬山鄉    53289  151.442      132.619  縣市     東
宜蘭縣壯圍鄉 宜蘭縣 壯圍鄉    24250  182.206      863.482  縣市     東
宜蘭縣宜蘭市 宜蘭縣 宜蘭市    95918  109.740      232.244  縣市     東
[1] 368



【B】 資料摘要 summary()

summary() 可以看到:

    COUNTY              TOWN              人口總數         老化指數    
 Length:368         Length:368         Min.   :   685   Min.   : 36.5  
 Class :character   Class :character   1st Qu.: 14548   1st Qu.:100.6  
 Mode  :character   Mode  :character   Median : 30782   Median :144.6  
                                       Mean   : 64052   Mean   :161.8  
                                       3rd Qu.: 77849   3rd Qu.:205.1  
                                       Max.   :551480   Max.   :592.4  
  人均應稅所得     METRO     REGION  
 Min.   :  20.1   六都:158   北: 95  
 1st Qu.: 123.6   縣市:210   中: 88  
 Median : 189.6              南:128  
 Mean   : 263.1              東: 41  
 3rd Qu.: 291.8              離: 16  
 Max.   :3267.1                      

💡 學習重點:分佈(Distribution)、機率(Probability)
  ■ 分佈 是一種描述 變數 的方式
  ■ 分佈變數 的值出現的 頻率
  ■ 分佈 可以用出現 次數 或出現 比率 來呈現
  ■ 類別變數的 出現比率 :從族群中隨機抽取一點時,抽種某一類別的 機率





【C】 單一類別變數的分佈




【D】 兩類別變數的聯合分佈(Joint Distribution)

聯合分佈可以用出現次數表示 (列連表,Contingent Table)

      
       北 中 南 東 離
  六都 54 29 75  0  0
  縣市 41 59 53 41 16

也可以用機率表示

聯合機率

      
             北       中       南       東       離
  六都 0.146739 0.078804 0.203804 0.000000 0.000000
  縣市 0.111413 0.160326 0.144022 0.111413 0.043478
邊際機率

   六都    縣市 
0.42935 0.57065 

      北       中       南       東       離 
0.258152 0.239130 0.347826 0.111413 0.043478 
條件機率
      
            北      中      南      東      離
  六都 0.34177 0.18354 0.47468 0.00000 0.00000
  縣市 0.19524 0.28095 0.25238 0.19524 0.07619

從六都中隨機抽一個區,抽中的區在北部的機率是: 從縣市中隨機抽一個鄉鎮區,抽中的鄉鎮區在離島的機率是:

      
            北      中      南      東      離
  六都 0.56842 0.32955 0.58594 0.00000 0.00000
  縣市 0.43158 0.67045 0.41406 1.00000 1.00000

從全國隨機抽一個鄉鎮區,當抽到南部時,該鄉鎮區坐落在都會區的機率是: 從全國隨機抽一個鄉鎮區,當抽到東部時,該鄉鎮區坐落在都會區的機率是: