巨量資料視覺化創新研究

 

請洽臉書社群  國立中山大學_巨量資料視覺化創新研究,時間:每週四 14:30 – 16:00, 地點:管院 CM4091-1
【 臉書社團 】◇ 【  】◇【 

召集人:郭上暐
組員人數上限:少於10人
會費:免費
指導老師:卓雍然
報名方式:請洽 臉書社群 

主旨:
       數據分析為現今重要的議題,商管領域也致力於數據分析的應用,將資料視覺化並寫成shiny app,供使用者依自身需求查看結果。不同於一般的數據分析,大數據分析因資料量龐大,背後的運算相對複雜,在製作shiny app時受到許多限制,如:app開啟的速度較慢等,造成使用者的不便。
因此,本學習小組成立的目的在於透過小組成員間針對相關議題的分享、討論及共同研究,結合各自具備的專長與技能,使用yelp評論文集資料完成以大數據為基礎的app,解決製作大數據app時的諸多限制。
       而讓迴歸複雜化的意義在於讓我們能在複雜的現實中,能用一條函數更容易了解變數間的關係,因此這個讀書會成立希望可以藉由線上資源以及老師的幫助,來了解資料特性、處理模型前置作業、追蹤資料、混合模型、時間序列以及空間序列的模型變化,以助於同學論文研究與共同成長。

線上教材分享區: 主要學習教材:

AGENDA:
◆ 以PTT/Yelp評論文集為基礎,搭配線上課程,以專案型式進行大數據App製作
◆ 應用提案 (一週)
◆ 決定APP,分配工作 (一週)
◆ APP Prototype   (三週)
◆ Text Analysis in Spark Cluster   (三週)
◆ APP & Interactive Scheme Design (三週)
◆ 心得分享 (一週)

主要(線上)學習材料:
◆ Yelp Open Dataset[URL]
◆ Building Dashboards with shinydashboard [datacamp]
◆ Building Web Applications with Shiny in R [datacamp]
◆ Building Dashboards with flexdashboard [datacamp]
◆ Case Studies: Building Web Applications with Shiny in R [datacamp]
◆ sparklyr: R interface for Apache Spark [eBook]
◆ Manipulating Data with dplyr [eBook]
◆ Spark Machine Learning Library (MLlib) [eBook]
◆ Distributing R Computations [eBook]
◆ Text mining with Spark & sparklyr [eBook]

 


學期成果:
◆ Yelp文集 網路評論內容分析 [ShinyApp]
◆ Yelp文集 商業類別文字雲 [ShinyApp]
◆ Yelp文集 類別比較文字雲 [yelp_app.Rmd]