R程式語言、機率統計與商業實務 (2019春)

Programming, Statistics and Business Practices
2019/02/20~2019/06/19  每周三下午 13:10~16:00  管3051教室 + 圖資地下室PC02教室
課號:CM502 (107.2)   教師:卓雍然   tonychuo@mail.nsysu.edu.tw
Instructor: Yung-Jan Cho   tonychuo@mail.nsysu.edu.tw

【 YouTube頻道 】◇【 Facebook群組 】◇ 【 G-Suite檔案分享 】◇ 【 Github Repo. 】◇ 【 教學團隊 】
◇ 互助學習時間(1):周三下午 16:00~18:00 管3051教室 ◇
★  Featuring DataCamp Online Training Courses  ★



課程簡介

本課程是【智慧創新跨域人才培育計畫】之下三個微學程的第一個共同課程,這個計畫不限系所招收對智慧創新有興趣,願意投入大量時間學習程式設計和商業數據分析的同學,中山大學所有系所大三以上的在校生都可以參加;對於沒寫過程式的同學,在這一個課程之中妳將學會在R語言的環境之下實際操作各種分析方法,並依據分析的結果來做商業決策;對於資工、資管科系的同學,你將學會如何將你的資訊專長應用到財務會計、人力資源、產品規劃 、定價與競爭等等,這一些公司層級的策略管理活動上面,讓你有更多的機會從機房走進辦公室,從系統管理員晉升為高階經理人。這一個課程同時也為商業大數據分析數位行銷與電子商務金融科技與服務創新這三個微學程奠定基礎,為學習大數據、雲端運算、機器學習和人工智慧這一些先進技術和它們的商業應用做好準備。

選修條件

這是一個內容份量相當重的課程,每一週上課之前妳需要先做課前預習(YouTube預習影片或Readings),聽完指定的線上課程單元,每一單元上完課都會有好幾份程式要寫,隨著課程的進度會有一系列的線上測驗和認證,妳常會需要在助教時間到教室來跟大家一起討論才能完成,期中、期末的小組專案作業的份量也會很重,整個學期妳需要跟不同系所的同學(我們會強制跨系所分組)分工合作、互補專長、互助學習,才會有好的成績;取決於妳原來對程式語言和機率統計的熟悉程度,平均每一週妳會需要預留9到12個小時(含上課)的時間在這個課程裡面,所以雖然我們沒有限修條件,我們希望妳詳細考慮過妳的時間安排之後再來選修。No Pain, No Gain! 不論妳原來的背景和基礎,只要妳付出足夠多的時間,妳就能夠在這一系列課程之中學會程式設計、機率統計、大數據、雲端運算、人工智慧以及它們的商業實務應用,增加妳在數位社會之中的價值、提高妳在就業市場的競爭力。

課程安排

考慮到在學程剛開始的時候,可能部分的同學還不會寫程式或沒有受過足夠的機率統計訓練,所以,課程一開始我們會先協助同學根據我們預先編制的R語言與基礎統計自學地圖,以互(自)助學習的方式先上完在DataCamp上面的一系列課程並取得線上認證,之後我們將仿造哈佛大學(Data Science, Harvard 2018)的作法,使用R語言帶同學複習基本的機率統計,然後我們會分別從ESSEC和Accenture(Strategic Business Analytics Specialization)以及哥倫比亞大學(Business Analytics)這兩個學校的線上課程裡面挑出一些比較基本的案例,讓同學做商業數據分析的實務練習。

做一個入門的課程,本課程最主要的學習目標是先要幫助同學們克服程式語言的進入障礙,對非資訊背景的同學而言,我們認為像DataCamp這樣「手把手教你寫程式」的自助學習是最容易上手的學習方式,依據我們暑期課程的經驗,對完全沒有寫過程式的同學來說,定期在每一周安排助教時間,讓同學一起過來互相一起討論功課,也是非常有效的方法。事實上,我們確實有一位從沒寫過程式的企管系女同學,在參加過我們的暑期課程之後,到11月份就組隊贏得國泰大數據競賽首獎(20萬台幣),這樣令人振奮的成功案例。

此外,我們也發現大多數國內企業之所以不能有效的利用數據,其癥結未必在於數據的大小,換句話說,多數國內企業之所以不能使用「大」數據,往往是因為他們連「小」數據都不太會用。以往國內的商管教育並不特別重視資料分析,而資訊人員又很少涉獵資訊科技以外的知識,企業之中沒有人可以看到程式語言、機率統計和商管知識三者之間強大的綜效,商業數據分析的威力也就很難發揮出來。因此,在每一個學程的第一個課程,在我們正式介紹大數據相關的技術之前,我們將藉由一系列的真實商業資料案例讓同學們體驗程式語言、機率統計和商管知識這三者之間的綜效,我們希望讓同學們體會,當我們能夠使用程式語言來模擬商業邏輯的時候,即使只是使用基本的機率統計方法,也能夠做出很有效的商業數據分析

教學目標

基於以上考量,本課程的首要目標是(1)幫助非資訊領域的同學跨越程式語言的進入障礙,我們認為學習程式語言的重點在於實作,所以簡單介紹完R語言之後,我們會(2)在R語言的環境下幫同學複習基本的機率與統計分析方法,然後我們會使用實際的資料案例,讓同學們(3)學習如何使用程式語言和機率統計來幫助我們處理重要的商業實務,如:市場區隔、品牌定位、價量關係、定價策略、產品設計、市場競爭等等。在我們正式介紹大數據相關的技術之前,我們計畫透過這一系列的資料案例讓同學們親身(4)體驗程式語言、機率統計和商管知識這三者之間的強大綜效


課程大綱

PART-I 程式語言與機率統計 Programming & Statistics
  • R語言與基本程式設計 Intro. R Language
    • R語言簡介 Intro. R & RStudio
    • 資料整理與資料探索 Data Manipulation & Exploration
    • 資料視覺化 Data Visualization
  • 基礎機率與統計 Probability & Statistics
    • 機率概論 Fundamental Probability
    • 推論統計與模型 Inferential Statistics & Model
    • 尺度縮減與集群分析 Dimension & Cluster
    • 線性回歸與邏輯式回歸 Linear & Logistics Regression
PART-II 商業數據分析實務 Business Analytics Practices
  • 市場區隔與品牌定位
    • 市場(消費者)區隔 Market/Consumer Segmentation
    • 集群分析 Cluster Analysis
    • 產品定位、品牌定位 Product & Brand Positioning
    • 尺度縮減 Dimension Reduction
    • 互動式品牌情緒圖  Interactive Perception Map
  • 價量關係與定價策略 Price & Quantity Analysis
    • 願付價格、價格彈性 WTP and Price Elasticity
    • 最適定價 Price Optimization
    • 產品價值模型  Model of Product Value
    • 消費者選擇模型  Model of Consumers’ Choice
    • 客製化定價  Distinctive Price
    • 多元選擇模型  Multi-Nominal Choice Model
  • 產品設計與市場競爭  Product Design and Market Competition
    • 聯合分析  Conjoint Analysis
    • 市場區隔與差別訂價  Segmentation & Pricing
    • 單一產品設計  Individual Product Design
    • 產品線設計   Product Line Design
    • 多產品市場(競爭策略)  Market Competition
    • 新產品的銷售量估計  New Product Design

自製教材

本課程不使用教科書,我們將以過去的自製教材為基礎,依據課程需要重新編製教材,教材項目包括:

  • 課程網站:整合自製教材與線上資源,促進互助學習 (HTML)
  • 導讀影片:幫助同學了解線上預習內容(線上課程原文教學影片)
  • 講義:每一單元的講義投影片 (PPT)
  • 課堂筆記:每一單元的課堂所使用的程式碼(R-Notebook)
  • 作業筆記:每一單元的作業(R-Notebook)
  • 線上模擬程式:以互動模擬的方式幫助同學了解比較複雜的概念 (R:Shiny)
  • 上課錄影: 方便同學複習或補課 (YouTube)

請透過以上網路連結審閱我們的自製教材範例。


線上課程

我們會利用DataCamp for Classroom的這個機制,根據我們事先編好的R語言自學地圖,要求並審核每一位同學確實完成以下線上自學課程:

我們也會參考以下線上課程(MOOC’s):

從其中截取合適的教學單元、作業習題或資料案例,直接引用為預習教材、參考教材,或以其作為自編教材的素材。


參考書目

本課程以自製教材為主,原則上不使用教科書,參考書目暫定如下:

  1. Field, A., Miles, J. & Field, Z. (2012). Discovering Statistics Using R. SAGE Publications Ltd.
  2. Kabacoff, R. (2015). R in Action: Data Analysis and Graphics with R. Manning Publications
  3. Peng, R., R Programming for Data Science. The Lean Publishing (pdf)
  4. Venkatesan, R., Farris, P., & Wilcox, R. T. (2015). Cutting-edge marketing analytics: real world cases and data sets for hands on learning. Pearson Education.
  5. Wickham, H. & Grolemund, G. (2017). R for Data Science: Import, Tidy, Transform, Visualize, and Model Data. O’Reilly Media.