這個練習的資料,是個來自兩波網路調查。這是個依受訪者id合併之後的「定群追蹤資料」(panel data)。由smilepoll.tw提供。第一筆(代號B)是「統獨意見大調查」,調查時間: 2018. 10.22~2018. 11.13,N=886(完成率86.7%);第二筆(代號D)是「2018地方選舉選後心情札記」,調查時間:2019.01.21~2019.02.19,N=1,297 (完成率78%)。
請開啟一個新的專案,將語法檔及資料檔(dataBD.rda)都放入該專案資料夾內。
## #refugeeswelcome
## 性別 (x) <categorical>
## # total N=579 valid N=576 mean=0.43 sd=0.50
##
## Value | Label | N | Raw % | Valid % | Cum. %
## ----------------------------------------------
## 0 | 女 | 329 | 56.82 | 57.12 | 57.12
## 1 | 男 | 247 | 42.66 | 42.88 | 100.00
## <NA> | <NA> | 3 | 0.52 | <NA> | <NA>
## x <numeric>
## # total N=579 valid N=579 mean=34.95 sd=11.40
##
## Value | N | Raw % | Valid % | Cum. %
## -------------------------------------
## 15 | 2 | 0.35 | 0.35 | 0.35
## 17 | 4 | 0.69 | 0.69 | 1.04
## 18 | 4 | 0.69 | 0.69 | 1.73
## 19 | 12 | 2.07 | 2.07 | 3.80
## 20 | 11 | 1.90 | 1.90 | 5.70
## 21 | 13 | 2.25 | 2.25 | 7.94
## 22 | 13 | 2.25 | 2.25 | 10.19
## 23 | 21 | 3.63 | 3.63 | 13.82
## 24 | 20 | 3.45 | 3.45 | 17.27
## 25 | 23 | 3.97 | 3.97 | 21.24
## 26 | 29 | 5.01 | 5.01 | 26.25
## 27 | 17 | 2.94 | 2.94 | 29.19
## 28 | 21 | 3.63 | 3.63 | 32.82
## 29 | 13 | 2.25 | 2.25 | 35.06
## 30 | 26 | 4.49 | 4.49 | 39.55
## 31 | 25 | 4.32 | 4.32 | 43.87
## 32 | 17 | 2.94 | 2.94 | 46.80
## 33 | 31 | 5.35 | 5.35 | 52.16
## 34 | 22 | 3.80 | 3.80 | 55.96
## 35 | 25 | 4.32 | 4.32 | 60.28
## 36 | 24 | 4.15 | 4.15 | 64.42
## 37 | 15 | 2.59 | 2.59 | 67.01
## 38 | 14 | 2.42 | 2.42 | 69.43
## 39 | 13 | 2.25 | 2.25 | 71.68
## 40 | 11 | 1.90 | 1.90 | 73.58
## 41 | 12 | 2.07 | 2.07 | 75.65
## 42 | 11 | 1.90 | 1.90 | 77.55
## 43 | 9 | 1.55 | 1.55 | 79.10
## 44 | 6 | 1.04 | 1.04 | 80.14
## 45 | 16 | 2.76 | 2.76 | 82.90
## 46 | 8 | 1.38 | 1.38 | 84.28
## 47 | 12 | 2.07 | 2.07 | 86.36
## 48 | 9 | 1.55 | 1.55 | 87.91
## 49 | 6 | 1.04 | 1.04 | 88.95
## 50 | 6 | 1.04 | 1.04 | 89.98
## 51 | 4 | 0.69 | 0.69 | 90.67
## 52 | 7 | 1.21 | 1.21 | 91.88
## 53 | 5 | 0.86 | 0.86 | 92.75
## 54 | 5 | 0.86 | 0.86 | 93.61
## 55 | 4 | 0.69 | 0.69 | 94.30
## 56 | 2 | 0.35 | 0.35 | 94.65
## 57 | 4 | 0.69 | 0.69 | 95.34
## 58 | 4 | 0.69 | 0.69 | 96.03
## 60 | 2 | 0.35 | 0.35 | 96.37
## 61 | 1 | 0.17 | 0.17 | 96.55
## 62 | 3 | 0.52 | 0.52 | 97.06
## 63 | 8 | 1.38 | 1.38 | 98.45
## 64 | 1 | 0.17 | 0.17 | 98.62
## 66 | 3 | 0.52 | 0.52 | 99.14
## 68 | 1 | 0.17 | 0.17 | 99.31
## 74 | 1 | 0.17 | 0.17 | 99.48
## 78 | 1 | 0.17 | 0.17 | 99.65
## 79 | 1 | 0.17 | 0.17 | 99.83
## 90 | 1 | 0.17 | 0.17 | 100.00
## <NA> | 0 | 0.00 | <NA> | <NA>
## Warning: `stat(density)` was deprecated in ggplot2 3.4.0.
## ℹ Please use `after_stat(density)` instead.
## ℹ The deprecated feature was likely used in the sjPlot package.
## Please report the issue at <https://github.com/strengejacke/sjPlot/issues>.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
## 教育程度 (x) <categorical>
## # total N=579 valid N=572 mean=2.03 sd=0.53
##
## Value | Label | N | Raw % | Valid % | Cum. %
## -------------------------------------------------
## 1 | 大專以下 | 72 | 12.44 | 12.59 | 12.59
## 2 | 大專 | 408 | 70.47 | 71.33 | 83.92
## 3 | 研究所 | 92 | 15.89 | 16.08 | 100.00
## <NA> | <NA> | 7 | 1.21 | <NA> | <NA>
## 居住地 (x) <categorical>
## # total N=579 valid N=558 mean=7.98 sd=5.58
##
## Value | Label | N | Raw % | Valid % | Cum. %
## -------------------------------------------------------------------
## 1 | 台北市 | 56 | 9.67 | 10.04 | 10.04
## 2 | 新北市 | 120 | 20.73 | 21.51 | 68.64
## 3 | 基隆市 | 5 | 0.86 | 0.90 | 70.07
## 4 | 桃園市 | 42 | 7.25 | 7.53 | 77.60
## 5 | 新竹市 | 13 | 2.25 | 2.33 | 79.93
## 6 | 新竹縣 | 12 | 2.07 | 2.15 | 82.08
## 7 | 苗栗縣 | 8 | 1.38 | 1.43 | 83.51
## 8 | 台中市 | 73 | 12.61 | 13.08 | 96.59
## 9 | 彰化縣 | 19 | 3.28 | 3.41 | 100.00
## 10 | 南投縣 | 5 | 0.86 | 0.90 | 10.93
## 11 | 雲林縣 | 18 | 3.11 | 3.23 | 14.16
## 12 | 嘉義市 | 5 | 0.86 | 0.90 | 15.05
## 13 | 嘉義縣 | 13 | 2.25 | 2.33 | 17.38
## 14 | 台南市 | 45 | 7.77 | 8.06 | 25.45
## 15 | 高雄市 | 99 | 17.10 | 17.74 | 43.19
## 16 | 屏東縣 | 14 | 2.42 | 2.51 | 45.70
## 17 | 台東縣 | 0 | 0.00 | 0.00 | 45.70
## 18 | 花蓮縣 | 5 | 0.86 | 0.90 | 46.59
## 19 | 宜蘭縣 | 3 | 0.52 | 0.54 | 47.13
## 20 | 澎湖縣 | 2 | 0.35 | 0.36 | 69.00
## 21 | 金門縣 | 1 | 0.17 | 0.18 | 69.18
## 22 | 連江縣 | 0 | 0.00 | 0.00 | 69.18
## 23 | 中國大陸(含香港、澳門)地區 | 0 | 0.00 | 0.00 | 69.18
## 24 | 其他 | 0 | 0.00 | 0.00 | 69.18
## <NA> | <NA> | 21 | 3.63 | <NA> | <NA>
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
## Loading required package: ggplot2
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
## [1] 564
## [1] "Gender" "college" "B23r" "B25r" "B29r" "B33r" "B39r"
## [8] "B42r" "B46r" "B47r" "B51r" "B53r" "B54r" "B56r"
## [15] "B57r" "D25r" "D52r" "D58r" "D61r" "D81r" "D99r"
## [22] "D146r" "D147r"
#前30個重要的選項類別
plot(resBD, axes=c(1, 2), new.plot=TRUE,
col.var="black", col.ind="black", col.ind.sup="black",
col.quali.sup="darkgreen", col.quanti.sup="blue",
label=c("var"), cex=0.7,
selectMod = "cos2 80", # 試試看,將20調為更高的數字,你會看到更多的變數類別
invisible=c("ind", "quali.sup"),
autoLab = "yes",
xlim=c(-1, 1.5), ylim=c(-1.3, 1.5),
title="")
## Warning: Removed 1 rows containing missing values (`geom_point()`).
## Warning: Removed 1 rows containing missing values (`geom_text_repel()`).
## Warning: ggrepel: 10 unlabeled data points (too many overlaps). Consider
## increasing max.overlaps
# 受訪者分佈圖
plot(resBD, axes=c(1, 2), new.plot=TRUE,
col.var="red", col.ind="brown", col.ind.sup="black",
col.quali.sup="darkgreen", col.quanti.sup="blue",
label=c("var"), cex=0.8,
selectMod = "cos2",
invisible=c("var", "quali.sup"),
xlim=c(-1, 1.5),
title="")
## 用卡方檢定確認具潛在關聯的變數之間的相關性
library(sjPlot)
library(sjmisc)
## 發現一、B46r2(被統後民生不會變好)跟D81r1(不管什麼情況民主政治都是最好的體制)的距離很接近
## H0: 受訪者對於民主政治的態度與他們對於被統後民生的想像沒有關聯性。
## H1: 受訪者對於民主政治的態度與他們對於被統後民生的想像有關聯性。
## D81的問題是「不管什麼情況民主政治都是最好的體制」,編碼1代表認同,編碼0代表不認同以上說法。
## B46的問題是「被統後民生會變好/不好/不確定」,編碼1代表會變好,編碼2代表會變不好,編碼3代表不確定。
## 發現一的卡方檢定,從右圖可以看出來,p = 0.016,由於p數值少於0.05,所以受訪者對於民主政治的態度(不論民主政治是不是最好的體制),與他們對於被統後民生的想像有關聯性。
## 有超過一半不認同「不管什麼情況民主政治都是最好的體制」的受訪者,都認為「被統後民生會變不好」。另外,有超過七成認同「不管什麼情況民主政治都是最好的體制」的受訪者,都認為「被統後民生會變不好」。由此可見,不論受訪者對民主的態度如何,對於被統後的民生都不大樂觀。
sjt.xtab(dataBD$B46r, dataBD$D81r, ## 請把這兩個變數換成你想要檢視變數
show.row.prc = TRUE, # 顯示列百分比
show.col.prc = TRUE # 顯示欄百分比
)
| B46r | D81r | Total | |
|---|---|---|---|
| 0 | 1 | ||
| 1 |
95 84.8 % 21.4 % |
17 15.2 % 12.5 % |
112 100 % 19.3 % |
| 2 |
264 72.7 % 59.6 % |
99 27.3 % 72.8 % |
363 100 % 62.7 % |
| 3 |
84 80.8 % 19 % |
20 19.2 % 14.7 % |
104 100 % 18 % |
| Total |
443 76.5 % 100 % |
136 23.5 % 100 % |
579 100 % 100 % |
χ2=8.245 · df=2 · Cramer’s V=0.119 · p=0.016 |
#想檢視多組關係,請把上一段複製貼上,調整變數,多做幾次吧!
## 用卡方檢定確認具潛在關聯的變數之間的相關性
library(sjPlot)
library(sjmisc)
## 發現二、B54r1(統獨需要去談)跟D58r1(覺得自己也有影響政治的能力)的距離很接近
## H0:認為統獨需要去談的受訪者與覺得自己有沒有能力影響政治沒有關聯性。
## H1: 認為統獨需要去談的受訪者與覺得自己有沒有能力影響政治有關聯性。
##D58的問題是覺得自己也有影響政治的能力,編碼1代表認同以上說法,編碼0代表不認同。
##B54的問題是「統獨需要去談/不需談/以後再談或其他」,編碼1代表會需要去談,編碼2代表不需談,編碼3以後再談或其他。
##發現二的卡方檢定,從右圖可以看出來,p = 0.001,由於p數值少於0.05,認為統獨需要去談的受訪者與覺得自己有沒有態力影響政治有關聯性。
##另外,有超過一半不認同「自己也有影響政治的能力」的受訪者,都認為「統獨不需談」。與之相後,亦有超過一半認同「自己也有影響政治的能力」的受訪者,認為「統獨需要去談」。由此可見,受訪者對於自己沒有沒能力影響政治,會影響他們對於討論統獨的態度。
sjt.xtab(dataBD$B54r, dataBD$D58r, ## 請把這兩個變數換成你想要檢視變數
show.row.prc = TRUE, # 顯示列百分比
show.col.prc = TRUE # 顯示欄百分比
)
| B54r | D58r | Total | |
|---|---|---|---|
| 0 | 1 | ||
| 1 |
171 68.1 % 39.1 % |
80 31.9 % 56.3 % |
251 100 % 43.4 % |
| 2 |
246 82 % 56.3 % |
54 18 % 38 % |
300 100 % 51.8 % |
| 3 |
20 71.4 % 4.6 % |
8 28.6 % 5.6 % |
28 100 % 4.8 % |
| Total |
437 75.5 % 100 % |
142 24.5 % 100 % |
579 100 % 100 % |
χ2=14.469 · df=2 · Cramer’s V=0.158 · p=0.001 |
## 用卡方檢定確認具潛在關聯的變數之間的相關性
library(sjPlot)
library(sjmisc)
## 發現三、B56r1(統獨是假議題)跟B33r2(和家人一致偏獨)的距離很接近
## H0: 認為統獨是假議題的受訪者與其和家人對統獨立是否一致沒有關聯性。
## H1: 認為統獨是假議題的受訪者與其和家人對統獨立是否一致有關聯性。
## B33的問題是「和家人的統獨立場」,編碼1代表一致偏統,編碼2代表偏獨,編碼3代表 偏中間或多元。
## B56的問題是認為「統獨是一個假議題」,在問卷中的假議題是指無關痛癢、難影響現實情況的話題。編碼1代表同意是一個假議題,編碼2代表認為不算是一個假議題,編碼3代表不確定是不是一個假議題。
## 發現三的卡方檢定,從右圖可以看出來,p = 0.000,由於p數值少於0.05,認為統獨是假認為統獨是假議題的受訪者與其和家人對統獨立是否一致有關聯性。
##從數據上否以發現,有約43%和家人一致偏統的受訪者認為,統獨不算是一個假議題。與之相反,亦有約44%與家人一致偏獨的受訪者認為,統獨是一個假議題。最後,有約34%和家人的統獨立場偏中間或多元的受訪者,表示不確定統獨是不是一個假議題。
sjt.xtab(dataBD$B56r, dataBD$B33r, ## 請把這兩個變數換成你想要檢視變數
show.row.prc = TRUE, # 顯示列百分比
show.col.prc = TRUE # 顯示欄百分比
)
| B56r | B33r | Total | ||
|---|---|---|---|---|
| 1 | 2 | 3 | ||
| 1 |
77 30.8 % 39.1 % |
118 47.2 % 44.5 % |
55 22 % 47 % |
250 100 % 43.2 % |
| 2 |
85 48.9 % 43.1 % |
67 38.5 % 25.3 % |
22 12.6 % 18.8 % |
174 100 % 30.1 % |
| 3 |
35 22.6 % 17.8 % |
80 51.6 % 30.2 % |
40 25.8 % 34.2 % |
155 100 % 26.8 % |
| Total |
197 34 % 100 % |
265 45.8 % 100 % |
117 20.2 % 100 % |
579 100 % 100 % |
χ2=28.974 · df=4 · Cramer’s V=0.158 · p=0.000 |