第一天

自我介紹

這個練習是這個工作坊讓你先建立「書寫出意義才是核心、資料分析是其次」的重要觀念。請用這一段來聊聊你為什麼會來參加這個工作坊以及你的期待。請刪掉這段文字後,寫下你自己的話。

思考與書寫

挑戰一

請舉至少一個例子,說說你的觀察,有什麼情形是消費者的行為跟企業所預期的不一樣?
我想要舉的例子是…

挑戰二

有位知名大學的校長認為現在技術會愈來愈平民化,「人人都能成為資料科學家」因此,企業應鼓勵員工參與校調AI(透過學習和調整逐漸最佳化),珍視自己的公司員工,透過他們這些領域專家來嗅出無意義的推論。你覺得這樣的論點如何?  我認為…

挑戰三

以下是給準備要拿中山大學110學年度第一學期「厚資料與意義探勘」課程的同學的題目,若你尚未取得並初步閱讀《演算法下的行銷優勢 》(Sensemaking: The Power of the Humanities in the Age of the Algorithm)這本書,請務必在工作坊結束後的一週內(截止於9/3 17:00) 將這題完成。你的出席佔學期得分的40%;兩天的全部作業佔60%。
為什麼非技術導向的專家在大數據時代會覺得自己使不上力?你看完這本書後給自己的定位為何?並請你指出那些觀念對你最有啟發,或你最想挑戰作者的那些觀念(評論時請加上書中的頁碼)。

我想要問老師的問題

把你來到這個工作坊心中的問題寫下,或是指明想問那位老師什麼問題,助教將會收集後先傳給老師,在工作坊進行期間回答。

第二天

思考與書寫

挑戰四

請點開這個連結,看看圖,然後簡要的回答以下幾個問題(圖的下方文章不必看)。 1.請簡單寫下你從圖上第一眼看到的資訊。

2.寫下你從圖中得到的第一個(想說出來的)靈感

3.寫下你在這靈感中喜歡的部份、不喜歡的部份,以及你希望這個圖中呈現什麼你想看的?

4.寫下三個你想改變的部份並說說看為什麼。

5.試試看:用文字勾勒一下你想呈現什麼樣的圖像,並再試著挑出自己所勾勒圖像的缺失。

動手分析與解讀

挑戰五

有一班研究生爭論著關於中秋烤肉還流不流行。請看著這個網調資料,分析你覺得可能說的故事與意義。

探索式分析:MCA

# 在這個階段你只需要能製出這個變數關聯分析圖,並就圖上的跡象進行分析與解讀。
# 若有興趣學習這個方法,請見《民意調查資料分析的R實戰手冊》第六章細講。

load("BBQ.rda")
library(dplyr)
library(FactoMineR)
library(factoextra)

bbqMCA <- select(bbq, V44r, V18r, V20r, V21r, V23r, V27r, V45r, V48r) 
bbqMCA.nona <- na.omit(bbqMCA)
nrow(bbqMCA.nona) 
## [1] 645
names(bbqMCA.nona) 
## [1] "V44r" "V18r" "V20r" "V21r" "V23r" "V27r" "V45r" "V48r"
res<-MCA(bbqMCA.nona, ncp=10, graph= F) 
fviz_screeplot(res, ncp=10) 

# 變數類別關係圖
plot(res, axes=c(1, 2), new.plot=TRUE, 
     col.var="red", col.ind="black", col.ind.sup="black",
     col.quali.sup="darkgreen", col.quanti.sup="blue",
     label=c("var"), cex=0.8, 
     selectMod = "cos2",
     invisible=c("ind", "quali.sup"), 
     autoLab = "yes",
     title="") 

變數相關性的確認與解讀

# 接下來,我們使用卡方檢定來進一步確認變數可能的關聯。
library(sjPlot)
## Registered S3 methods overwritten by 'lme4':
##   method                          from
##   cooks.distance.influence.merMod car 
##   influence.merMod                car 
##   dfbeta.influence.merMod         car 
##   dfbetas.influence.merMod        car
## #refugeeswelcome
sjt.xtab(bbq$V37r, bbq$V45r, 
         show.row.prc = TRUE, # 顯示列百分比
         show.col.prc = TRUE  # 顯示欄百分比
         )
## Warning in sprintf(" <td class=\"summary tdata\" colspan=\"%i\">%s=%.3f &middot;
## df=%i &middot; %s=%.3f &middot; %s=%.3f</td>", : one argument not used by format
## ' <td class="summary tdata" colspan="%i">%s=%.3f &middot; df=%i &middot; %s=%.3f
## &middot; %s=%.3f</td>'
最後,我們來談談節慶與團聚。
請問您覺得一天之內自己可以自由支配的時間(用來做自己想做的事)大約有多少?
平時用社群媒體(Line,
Facebook等)與家人聯繫感情。您覺得夠不夠?
Total
不常見面不要緊 見面是必要的
足夠 173
39.1 %
73.9 %
269
60.9 %
65.5 %
442
100 %
68.5 %
不夠 61
30 %
26.1 %
142
70 %
34.5 %
203
100 %
31.5 %
Total 234
36.3 %
100 %
411
63.7 %
100 %
645
100 %
100 %
χ2=4.588 · df=1 · φ=0.088 · p=0.032
# 下面的框外,請你就這個結果說出你心中的意義。
# 並請你調跟據上面的變數類別關係圖,做至少一個你要檢證的相關性並在框外說明你的發現與想法。
# 提示:將上述的sjt.xtab()語法照貼在本框內的下方,改動$後頭的變數為你有興趣的,就可以產生分析結果。

確認式分析

這個階段不一定要做到,因為工作坊重點放在潛在關聯的確認。若你已有基本的統計或計量課程的基礎,你可以操作看看,在R中如何輕易的進行建模與假設檢證。也歡迎你繼續嘗試,挑戰看看自己的直覺!

## 請你就以下例子中所使用的八個變數,試著做出你自己版本的假設,並將你的分析與解讀寫在語法框外。

# 假設一:對烤肉的新鮮感不再(V18r)會降低明年烤肉的意願(V44r)
# 假設二:覺得烤肉影響健康(V20r)便會降低明年烤肉的意願
# 假設三:覺得烤肉花費造成負擔(V21r)便會降低明年烤肉的意願
# 假設四:覺得烤肉麻煩(V23r)便會降低明年烤肉的意願
# 假設五:覺得烤肉影響環境(V27r)便會降低明年烤肉的意願
# 假設六:覺得不必要見面就能聯絡感情(V45r)會降低明年烤肉的意願
# 假設七:認為烤肉不是聯絡感情的首選(V48r)便會降低明年烤肉的意願

load("BBQ.rda")

## 二元勝算對數模型
mod.1 <- glm(V44r~ V18r+V20r+V21r+V23r+V27r+V45r+V48r, 
             data=bbq, family=binomial)
summary(mod.1) 
## 
## Call:
## glm(formula = V44r ~ V18r + V20r + V21r + V23r + V27r + V45r + 
##     V48r, family = binomial, data = bbq)
## 
## Deviance Residuals: 
##    Min      1Q  Median      3Q     Max  
## -2.154  -0.916   0.455   0.819   2.202  
## 
## Coefficients:
##             Estimate Std. Error z value Pr(>|z|)    
## (Intercept)   -0.103      0.261   -0.39  0.69368    
## V18r1         -0.932      0.259   -3.59  0.00033 ***
## V20r1         -0.230      0.203   -1.13  0.25797    
## V21r1         -0.254      0.205   -1.24  0.21426    
## V23r1         -0.701      0.232   -3.01  0.00257 ** 
## V27r1         -0.111      0.206   -0.54  0.59075    
## V45r1          0.517      0.192    2.70  0.00701 ** 
## V48r1          1.803      0.187    9.64  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 892.04  on 644  degrees of freedom
## Residual deviance: 710.49  on 637  degrees of freedom
##   (5 observations deleted due to missingness)
## AIC: 726.5
## 
## Number of Fisher Scoring iterations: 4
# 假設一、四、六、七得到支持--「對烤肉的新鮮感不再」(假設一)、「覺得烤肉麻煩」(假設四)、「覺得不必要見面就能聯絡感情」(假設六)、「認為烤肉不是聯絡感情的首選」(假設七)會影響烤肉的意願。

我的假設是… 我的解讀是…