關於資料來源

這個練習的資料,是個來自兩波網路調查。這是個依受訪者id合併之後的「定群追蹤資料」(panel data)。由smilepoll.tw提供。第一筆(代號B)是「統獨意見大調查」,調查時間: 2018. 10.22~2018. 11.13,N=886(完成率86.7%);第二筆(代號D)是「2018地方選舉選後心情札記」,調查時間:2019.01.21~2019.02.19,N=1,297 (完成率78%)。

專案準備

請開啟一個新的專案,將語法檔及資料檔(dataBD.rda)都放入該專案資料夾內。

讀入資料與變數觀察

## Learn more about sjPlot with 'browseVignettes("sjPlot")'.
## 性別 (x) <categorical> 
## # total N=579 valid N=576 mean=0.43 sd=0.50
## 
## Value | Label |   N | Raw % | Valid % | Cum. %
## ----------------------------------------------
##     0 |    女 | 329 | 56.82 |   57.12 |  57.12
##     1 |    男 | 247 | 42.66 |   42.88 | 100.00
##  <NA> |  <NA> |   3 |  0.52 |    <NA> |   <NA>

## x <numeric> 
## # total N=579 valid N=579 mean=34.95 sd=11.40
## 
## Value |  N | Raw % | Valid % | Cum. %
## -------------------------------------
##    15 |  2 |  0.35 |    0.35 |   0.35
##    17 |  4 |  0.69 |    0.69 |   1.04
##    18 |  4 |  0.69 |    0.69 |   1.73
##    19 | 12 |  2.07 |    2.07 |   3.80
##    20 | 11 |  1.90 |    1.90 |   5.70
##    21 | 13 |  2.25 |    2.25 |   7.94
##    22 | 13 |  2.25 |    2.25 |  10.19
##    23 | 21 |  3.63 |    3.63 |  13.82
##    24 | 20 |  3.45 |    3.45 |  17.27
##    25 | 23 |  3.97 |    3.97 |  21.24
##    26 | 29 |  5.01 |    5.01 |  26.25
##    27 | 17 |  2.94 |    2.94 |  29.19
##    28 | 21 |  3.63 |    3.63 |  32.82
##    29 | 13 |  2.25 |    2.25 |  35.06
##    30 | 26 |  4.49 |    4.49 |  39.55
##    31 | 25 |  4.32 |    4.32 |  43.87
##    32 | 17 |  2.94 |    2.94 |  46.80
##    33 | 31 |  5.35 |    5.35 |  52.16
##    34 | 22 |  3.80 |    3.80 |  55.96
##    35 | 25 |  4.32 |    4.32 |  60.28
##    36 | 24 |  4.15 |    4.15 |  64.42
##    37 | 15 |  2.59 |    2.59 |  67.01
##    38 | 14 |  2.42 |    2.42 |  69.43
##    39 | 13 |  2.25 |    2.25 |  71.68
##    40 | 11 |  1.90 |    1.90 |  73.58
##    41 | 12 |  2.07 |    2.07 |  75.65
##    42 | 11 |  1.90 |    1.90 |  77.55
##    43 |  9 |  1.55 |    1.55 |  79.10
##    44 |  6 |  1.04 |    1.04 |  80.14
##    45 | 16 |  2.76 |    2.76 |  82.90
##    46 |  8 |  1.38 |    1.38 |  84.28
##    47 | 12 |  2.07 |    2.07 |  86.36
##    48 |  9 |  1.55 |    1.55 |  87.91
##    49 |  6 |  1.04 |    1.04 |  88.95
##    50 |  6 |  1.04 |    1.04 |  89.98
##    51 |  4 |  0.69 |    0.69 |  90.67
##    52 |  7 |  1.21 |    1.21 |  91.88
##    53 |  5 |  0.86 |    0.86 |  92.75
##    54 |  5 |  0.86 |    0.86 |  93.61
##    55 |  4 |  0.69 |    0.69 |  94.30
##    56 |  2 |  0.35 |    0.35 |  94.65
##    57 |  4 |  0.69 |    0.69 |  95.34
##    58 |  4 |  0.69 |    0.69 |  96.03
##    60 |  2 |  0.35 |    0.35 |  96.37
##    61 |  1 |  0.17 |    0.17 |  96.55
##    62 |  3 |  0.52 |    0.52 |  97.06
##    63 |  8 |  1.38 |    1.38 |  98.45
##    64 |  1 |  0.17 |    0.17 |  98.62
##    66 |  3 |  0.52 |    0.52 |  99.14
##    68 |  1 |  0.17 |    0.17 |  99.31
##    74 |  1 |  0.17 |    0.17 |  99.48
##    78 |  1 |  0.17 |    0.17 |  99.65
##    79 |  1 |  0.17 |    0.17 |  99.83
##    90 |  1 |  0.17 |    0.17 | 100.00
##  <NA> |  0 |  0.00 |    <NA> |   <NA>
## Warning: `stat(density)` was deprecated in ggplot2 3.4.0.
## ℹ Please use `after_stat(density)` instead.
## ℹ The deprecated feature was likely used in the sjPlot package.
##   Please report the issue at <https://github.com/strengejacke/sjPlot/issues>.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

## 教育程度 (x) <categorical> 
## # total N=579 valid N=572 mean=2.03 sd=0.53
## 
## Value |    Label |   N | Raw % | Valid % | Cum. %
## -------------------------------------------------
##     1 | 大專以下 |  72 | 12.44 |   12.59 |  12.59
##     2 |     大專 | 408 | 70.47 |   71.33 |  83.92
##     3 |   研究所 |  92 | 15.89 |   16.08 | 100.00
##  <NA> |     <NA> |   7 |  1.21 |    <NA> |   <NA>

## 居住地 (x) <categorical> 
## # total N=579 valid N=558 mean=7.98 sd=5.58
## 
## Value |                      Label |   N | Raw % | Valid % | Cum. %
## -------------------------------------------------------------------
##     1 |                     台北市 |  56 |  9.67 |   10.04 |  10.04
##     2 |                     新北市 | 120 | 20.73 |   21.51 |  68.64
##     3 |                     基隆市 |   5 |  0.86 |    0.90 |  70.07
##     4 |                     桃園市 |  42 |  7.25 |    7.53 |  77.60
##     5 |                     新竹市 |  13 |  2.25 |    2.33 |  79.93
##     6 |                     新竹縣 |  12 |  2.07 |    2.15 |  82.08
##     7 |                     苗栗縣 |   8 |  1.38 |    1.43 |  83.51
##     8 |                     台中市 |  73 | 12.61 |   13.08 |  96.59
##     9 |                     彰化縣 |  19 |  3.28 |    3.41 | 100.00
##    10 |                     南投縣 |   5 |  0.86 |    0.90 |  10.93
##    11 |                     雲林縣 |  18 |  3.11 |    3.23 |  14.16
##    12 |                     嘉義市 |   5 |  0.86 |    0.90 |  15.05
##    13 |                     嘉義縣 |  13 |  2.25 |    2.33 |  17.38
##    14 |                     台南市 |  45 |  7.77 |    8.06 |  25.45
##    15 |                     高雄市 |  99 | 17.10 |   17.74 |  43.19
##    16 |                     屏東縣 |  14 |  2.42 |    2.51 |  45.70
##    17 |                     台東縣 |   0 |  0.00 |    0.00 |  45.70
##    18 |                     花蓮縣 |   5 |  0.86 |    0.90 |  46.59
##    19 |                     宜蘭縣 |   3 |  0.52 |    0.54 |  47.13
##    20 |                     澎湖縣 |   2 |  0.35 |    0.36 |  69.00
##    21 |                     金門縣 |   1 |  0.17 |    0.18 |  69.18
##    22 |                     連江縣 |   0 |  0.00 |    0.00 |  69.18
##    23 | 中國大陸(含香港、澳門)地區 |   0 |  0.00 |    0.00 |  69.18
##    24 |                       其他 |   0 |  0.00 |    0.00 |  69.18
##  <NA> |                       <NA> |  21 |  3.63 |    <NA> |   <NA>

請依你圖表上的資訊,在此寫下你對這筆資料的基本印象及看法:

變數選取與MCA分析

## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
## Loading required package: ggplot2
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
## [1] 564
##  [1] "Gender"  "college" "B23r"    "B25r"    "B29r"    "B33r"    "B39r"   
##  [8] "B42r"    "B46r"    "B47r"    "B51r"    "B53r"    "B54r"    "B56r"   
## [15] "B57r"    "D25r"    "D52r"    "D58r"    "D61r"    "D81r"    "D99r"   
## [22] "D146r"   "D147r"

探索

#前30個重要的選項類別
plot(resBD, axes=c(1, 2), new.plot=TRUE, 
     col.var="black", col.ind="black", col.ind.sup="black",
     col.quali.sup="darkgreen", col.quanti.sup="blue",
     label=c("var"), cex=0.7, 
     selectMod = "cos2 80",   # 試試看,將20調為更高的數字,你會看到更多的變數類別
     invisible=c("ind", "quali.sup"), 
     autoLab = "yes",
     xlim=c(-1, 1.5), ylim=c(-1.3, 1.5),
     title="") 
## Warning: Removed 1 rows containing missing values (`geom_point()`).
## Warning: Removed 1 rows containing missing values (`geom_text_repel()`).
## Warning: ggrepel: 10 unlabeled data points (too many overlaps). Consider
## increasing max.overlaps

# 受訪者分佈圖
plot(resBD, axes=c(1, 2), new.plot=TRUE,
     col.var="red", col.ind="brown", col.ind.sup="black",
     col.quali.sup="darkgreen", col.quanti.sup="blue",
     label=c("var"), cex=0.8,
     selectMod = "cos2",
     invisible=c("var", "quali.sup"),
     xlim=c(-1, 1.5),
     title="")

大膽假設

現在,請你依圖找到你覺得有趣的、有相關的問卷題,將你的假設寫下。

發現一、B46r2(被統後民生不會變好)跟D81r1(不管什麼情況民主政治都是最好的體制)的距離很接近

H0: 受訪者對於民主政治的態度與他們對於被統後民生的想像沒有關聯性。

H1: 受訪者對於民主政治的態度與他們對於被統後民生的想像有關聯性。

D81的問題是「不管什麼情況民主政治都是最好的體制」,編碼1代表認同,編碼0代表不認同以上說法。

B46的問題是「被統後民生會變好/不好/不確定」,編碼1代表會變好,編碼2代表會變不好,編碼3代表不確定。

發現一的卡方檢定,從右圖可以看出來,p = 0.016,由於p數值少於0.05,所以受訪者對於民主政治的態度(不論民主政治是不是最好的體制),與他們對於被統後民生的想像有關聯性。 有超過一半不認同「不管什麼情況民主政治都是最好的體制」的受訪者,都認為「被統後民生會變不好」。另外,有超過七成認同「不管什麼情況民主政治都是最好的體制」的受訪者,都認為「被統後民生會變不好」。由此可見,不論受訪者對民主的態度如何,對於被統後的民生都不大樂觀。

## 用卡方檢定確認具潛在關聯的變數之間的相關性 

library(sjPlot)
library(sjmisc)


sjt.xtab(dataBD$B46r, dataBD$D81r, ## 請把這兩個變數換成你想要檢視變數
         show.row.prc = TRUE, # 顯示列百分比
         show.col.prc = TRUE  # 顯示欄百分比

)
B46r D81r Total
0 1
1 95
84.8 %
21.4 %
17
15.2 %
12.5 %
112
100 %
19.3 %
2 264
72.7 %
59.6 %
99
27.3 %
72.8 %
363
100 %
62.7 %
3 84
80.8 %
19 %
20
19.2 %
14.7 %
104
100 %
18 %
Total 443
76.5 %
100 %
136
23.5 %
100 %
579
100 %
100 %
χ2=8.245 · df=2 · Cramer’s V=0.119 · p=0.016

發現二、B54r1(統獨需要去談)跟D58r1(覺得自己也有影響政治的能力)的距離很接近

H0:認為統獨需要去談的受訪者與覺得自己有沒有能力影響政治沒有關聯性。

H1: 認為統獨需要去談的受訪者與覺得自己有沒有能力影響政治有關聯性。

D58的問題是覺得自己也有影響政治的能力,編碼0代表不認同,編碼1代表認同以上說法。

B54的問題是「統獨需要去談/不需談/以後再談或其他」,編碼1代表會需要去談,編碼2代表不需談,編碼3以後再談或其他。

發現二的卡方檢定,從右圖可以看出來,p = 0.001,由於p數值少於0.05,認為統獨需要去談的受訪者與覺得自己有沒有態力影響政治有關聯性。

另外,有超過一半不認同「自己也有影響政治的能力」的受訪者,都認為「統獨不需談」。與之相後,亦有超過一半認同「自己也有影響政治的能力」的受訪者,認為「統獨需要去談」。由此可見,受訪者對於自己沒有沒能力影響政治,會影響他們對於討論統獨的態度。

## 用卡方檢定確認具潛在關聯的變數之間的相關性 

library(sjPlot)
library(sjmisc)


sjt.xtab(dataBD$B54r, dataBD$D58r, ## 請把這兩個變數換成你想要檢視變數 
         show.row.prc = TRUE, # 顯示列百分比 
         show.col.prc = TRUE # 顯示欄百分比
)
B54r D58r Total
0 1
1 171
68.1 %
39.1 %
80
31.9 %
56.3 %
251
100 %
43.4 %
2 246
82 %
56.3 %
54
18 %
38 %
300
100 %
51.8 %
3 20
71.4 %
4.6 %
8
28.6 %
5.6 %
28
100 %
4.8 %
Total 437
75.5 %
100 %
142
24.5 %
100 %
579
100 %
100 %
χ2=14.469 · df=2 · Cramer’s V=0.158 · p=0.001

用卡方檢定確認具潛在關聯的變數之間的相關性

發現三、B56r1(統獨是假議題)跟B33r2(和家人一致偏獨)的距離很接近

H0: 認為統獨是假議題的受訪者與其和家人對統獨立是否一致沒有關聯性。

H1: 認為統獨是假議題的受訪者與其和家人對統獨立是否一致有關聯性。

B33的問題是「和家人的統獨立場」,編碼1代表一致偏統,編碼2代表偏獨,編碼3代表 偏中間或多元。

B56的問題是認為「統獨是一個假議題」,在問卷中的假議題是指無關痛癢、難影響現實情況的話題。編碼1代表同意是一個假議題,編碼2代表認為不算是一個假議題,編碼3代表不確定是不是一個假議題。

發現三的卡方檢定,從右圖可以看出來,p = 0.000,由於p數值少於0.05,認為「統獨是否一個假議題」與受訪者「和家人對統獨立是否一致」有關聯性

從數據上否以發現,有約43%和家人一致偏統的受訪者認為,統獨不算是一個假議題。與之相反,亦有約44%與家人一致偏獨的受訪者認為,統獨是一個假議題。最後,有約34%和家人的統獨立場偏中間或多元的受訪者,亦表示統獨是一個假議題。

## 用卡方檢定確認具潛在關聯的變數之間的相關性

library(sjPlot) 
library(sjmisc)

sjt.xtab(dataBD$B56r, dataBD$B33r, ## 請把這兩個變數換成你想要檢視變數 
         show.row.prc = TRUE, # 顯示列百分比 
         show.col.prc = TRUE # 顯示欄百分比

) 
B56r B33r Total
1 2 3
1 77
30.8 %
39.1 %
118
47.2 %
44.5 %
55
22 %
47 %
250
100 %
43.2 %
2 85
48.9 %
43.1 %
67
38.5 %
25.3 %
22
12.6 %
18.8 %
174
100 %
30.1 %
3 35
22.6 %
17.8 %
80
51.6 %
30.2 %
40
25.8 %
34.2 %
155
100 %
26.8 %
Total 197
34 %
100 %
265
45.8 %
100 %
117
20.2 %
100 %
579
100 %
100 %
χ2=28.974 · df=4 · Cramer’s V=0.158 · p=0.000

再來,請你寫下經過你驗證後的、非常可能相關的一組組變數(請寫下最多三組有趣的即可)

編譯出你專屬的作品