這個練習是這個工作坊讓你先建立「書寫出意義才是核心、資料分析是其次」的重要觀念。請用這一段來聊聊你為什麼會來參加這個工作坊以及你的期待。請刪掉這段文字後,寫下你自己的話。
請舉至少一個例子,說說你的觀察,有什麼情形是消費者的行為跟企業所預期的不一樣?
我想要舉的例子是…
有位知名大學的校長認為現在技術會愈來愈平民化,「人人都能成為資料科學家」因此,企業應鼓勵員工參與校調AI(透過學習和調整逐漸最佳化),珍視自己的公司員工,透過他們這些領域專家來嗅出無意義的推論。你覺得這樣的論點如何? 我認為…
以下是給準備要拿中山大學110學年度第一學期「厚資料與意義探勘」課程的同學的題目,若你尚未取得並初步閱讀《演算法下的行銷優勢 》(Sensemaking: The Power of the Humanities in the Age of the Algorithm)這本書,請務必在工作坊結束後的一週內(截止於9/3 17:00) 將這題完成。你的出席佔學期得分的40%;兩天的全部作業佔60%。
為什麼非技術導向的專家在大數據時代會覺得自己使不上力?你看完這本書後給自己的定位為何?並請你指出那些觀念對你最有啟發,或你最想挑戰作者的那些觀念(評論時請加上書中的頁碼)。
把你來到這個工作坊心中的問題寫下,或是指明想問那位老師什麼問題,助教將會收集後先傳給老師,在工作坊進行期間回答。
請點開這個連結,看看圖,然後簡要的回答以下幾個問題(圖的下方文章不必看)。 1.請簡單寫下你從圖上第一眼看到的資訊。
2.寫下你從圖中得到的第一個(想說出來的)靈感
3.寫下你在這靈感中喜歡的部份、不喜歡的部份,以及你希望這個圖中呈現什麼你想看的?
4.寫下三個你想改變的部份並說說看為什麼。
5.試試看:用文字勾勒一下你想呈現什麼樣的圖像,並再試著挑出自己所勾勒圖像的缺失。
有一班研究生爭論著關於中秋烤肉還流不流行。請看著這個網調資料,分析你覺得可能說的故事與意義。
# 在這個階段你只需要能製出這個變數關聯分析圖,並就圖上的跡象進行分析與解讀。
# 若有興趣學習這個方法,請見《民意調查資料分析的R實戰手冊》第六章細講。
load("BBQ.rda")
library(dplyr)
library(FactoMineR)
library(factoextra)
bbqMCA <- select(bbq, V44r, V18r, V20r, V21r, V23r, V27r, V45r, V48r)
bbqMCA.nona <- na.omit(bbqMCA)
nrow(bbqMCA.nona)
## [1] 645
names(bbqMCA.nona)
## [1] "V44r" "V18r" "V20r" "V21r" "V23r" "V27r" "V45r" "V48r"
res<-MCA(bbqMCA.nona, ncp=10, graph= F)
fviz_screeplot(res, ncp=10)
# 變數類別關係圖
plot(res, axes=c(1, 2), new.plot=TRUE,
col.var="red", col.ind="black", col.ind.sup="black",
col.quali.sup="darkgreen", col.quanti.sup="blue",
label=c("var"), cex=0.8,
selectMod = "cos2",
invisible=c("ind", "quali.sup"),
autoLab = "yes",
title="")
# 接下來,我們使用卡方檢定來進一步確認變數可能的關聯。
library(sjPlot)
## Registered S3 methods overwritten by 'lme4':
## method from
## cooks.distance.influence.merMod car
## influence.merMod car
## dfbeta.influence.merMod car
## dfbetas.influence.merMod car
## #refugeeswelcome
sjt.xtab(bbq$V37r, bbq$V45r,
show.row.prc = TRUE, # 顯示列百分比
show.col.prc = TRUE # 顯示欄百分比
)
## Warning in sprintf(" <td class=\"summary tdata\" colspan=\"%i\">%s=%.3f ·
## df=%i · %s=%.3f · %s=%.3f</td>", : one argument not used by format
## ' <td class="summary tdata" colspan="%i">%s=%.3f · df=%i · %s=%.3f
## · %s=%.3f</td>'
|
最後,我們來談談節慶與團聚。 請問您覺得一天之內自己可以自由支配的時間(用來做自己想做的事)大約有多少? |
平時用社群媒體(Line, Facebook等)與家人聯繫感情。您覺得夠不夠? |
Total | |
|---|---|---|---|
| 不常見面不要緊 | 見面是必要的 | ||
| 足夠 |
173 39.1 % 73.9 % |
269 60.9 % 65.5 % |
442 100 % 68.5 % |
| 不夠 |
61 30 % 26.1 % |
142 70 % 34.5 % |
203 100 % 31.5 % |
| Total |
234 36.3 % 100 % |
411 63.7 % 100 % |
645 100 % 100 % |
χ2=4.588 · df=1 · φ=0.088 · p=0.032 |
# 下面的框外,請你就這個結果說出你心中的意義。
# 並請你調跟據上面的變數類別關係圖,做至少一個你要檢證的相關性並在框外說明你的發現與想法。
# 提示:將上述的sjt.xtab()語法照貼在本框內的下方,改動$後頭的變數為你有興趣的,就可以產生分析結果。
這個階段不一定要做到,因為工作坊重點放在潛在關聯的確認。若你已有基本的統計或計量課程的基礎,你可以操作看看,在R中如何輕易的進行建模與假設檢證。也歡迎你繼續嘗試,挑戰看看自己的直覺!
## 請你就以下例子中所使用的八個變數,試著做出你自己版本的假設,並將你的分析與解讀寫在語法框外。
# 假設一:對烤肉的新鮮感不再(V18r)會降低明年烤肉的意願(V44r)
# 假設二:覺得烤肉影響健康(V20r)便會降低明年烤肉的意願
# 假設三:覺得烤肉花費造成負擔(V21r)便會降低明年烤肉的意願
# 假設四:覺得烤肉麻煩(V23r)便會降低明年烤肉的意願
# 假設五:覺得烤肉影響環境(V27r)便會降低明年烤肉的意願
# 假設六:覺得不必要見面就能聯絡感情(V45r)會降低明年烤肉的意願
# 假設七:認為烤肉不是聯絡感情的首選(V48r)便會降低明年烤肉的意願
load("BBQ.rda")
## 二元勝算對數模型
mod.1 <- glm(V44r~ V18r+V20r+V21r+V23r+V27r+V45r+V48r,
data=bbq, family=binomial)
summary(mod.1)
##
## Call:
## glm(formula = V44r ~ V18r + V20r + V21r + V23r + V27r + V45r +
## V48r, family = binomial, data = bbq)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -2.154 -0.916 0.455 0.819 2.202
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -0.103 0.261 -0.39 0.69368
## V18r1 -0.932 0.259 -3.59 0.00033 ***
## V20r1 -0.230 0.203 -1.13 0.25797
## V21r1 -0.254 0.205 -1.24 0.21426
## V23r1 -0.701 0.232 -3.01 0.00257 **
## V27r1 -0.111 0.206 -0.54 0.59075
## V45r1 0.517 0.192 2.70 0.00701 **
## V48r1 1.803 0.187 9.64 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 892.04 on 644 degrees of freedom
## Residual deviance: 710.49 on 637 degrees of freedom
## (5 observations deleted due to missingness)
## AIC: 726.5
##
## Number of Fisher Scoring iterations: 4
# 假設一、四、六、七得到支持--「對烤肉的新鮮感不再」(假設一)、「覺得烤肉麻煩」(假設四)、「覺得不必要見面就能聯絡感情」(假設六)、「認為烤肉不是聯絡感情的首選」(假設七)會影響烤肉的意願。
我的假設是… 我的解讀是…