옥스포드 행복 설문지 실험결과를 분석한다. 이 실험에는 두 가지 목적이 있다. 첫째는 있는 그대로 옥스포드 행복 설문지로 측정하는 여러분의 행복 수준은 어느 정도인지, 둘째는 영문판으로 응답할 때와 국문판으로 응답할 때 어떤 차이가 있는지, 특히 응답에 소요되는 시간을 측정해 보았다.

Red, Black을 잘못 표시한 사람들

랜덤화출석부에 있는 Red, Black 과 실제 구글설문에 올린 Red, Black 이 다른 사람들이 있어서 파악해 보았습니다. 랜덤화 효과는 여기서도 작동하고 있는 걸 알 수 있습니다. Red를 Black 이라고 한 사람의 수효(4명)과 Black을 Red 라고 한 사람의 수효(3명)이 비슷합니다 group 을 잘못 기억하고 있는 사람들의 수효조차 Red, Black 에 비슷하게 나뉘었습니다. 굳이 학번까지 올린 이유는 그 다음 구글예습퀴즈부터라도 제대로 올려주길 바라서입니다.

  Red(옥스포드행복설문지) Black(옥스포드행복설문지)
Red(랜덤화출석부) 487 4
Black(랜덤화출석부) 3 481

행복 점수 비교

국문 설문지와 영문 설문지의 행복점수를 비교한다. 행복점수 단계별로 비교했을 때나 기초통계로 비교했을 때나 국문 설문지로 작성한 그룹 (Red)의 행복점수가 높게 나온다. 이는 통계적으로 매우 매우 유의한 수준이다.

summary()

  • 국문:

    Min. 1st Qu. Median Mean 3rd Qu. Max.
    2.103 3.586 4.069 4.085 4.586 5.69
  • 영문:

    Min. 1st Qu. Median Mean 3rd Qu. Max.
    1.862 3.483 3.828 3.903 4.31 5.448

table()

  행복하지 않다 다소 행복하지 않다 그저 그렇다 꽤 행복하다 매우 행복하다
국문 0 22 200 221 47 490
영문 1 13 276 176 19 485
1 35 476 397 66 975
Pearson’s Chi-squared test with simulated p-value (based on 2000 replicates): .
Test statistic df P value
31.39 NA 0.0004998 * * *

백분율(%)

행복하지 않다 다소 행복하지 않다 그저 그렇다 꽤 행복하다 매우 행복하다
0.1 3.6 48.8 40.7 6.8 100.0

geom_boxplot()

t.test() on means

Welch Two Sample t-test: Scores by Group
Test statistic df P value Alternative hypothesis mean in group 국문 mean in group 영문
4.489 952.7 4.013e-06 * * * greater 4.085 3.903

소요시간 비교

초 단위로 측정한 소요시간에서는 오전, 오후를 잘못 쓴다거나 시작 시간이 제출 시간보다 늦게 입력한 사람들이 있고, 과도하게 (한 시간) 이상 소요된 것으로 나오는 사람들이 있어서 일일이 찾아서 수정하였고, 한 시간 이상은 사실상 설문지를 작성하다가 다른 일을 하고 다시 돌아와 마치는 과정을 의미하는 것으로 판단하여 NA 로 처리하였다. 소요 시간에 있어서도 국문과 영문에는 통계적으로 매우 유의한 수준의 차이가 관찰되었다.

평균적으로 95.3초, 즉 1분 35초정도 국문 질문지에 더 빨리 응답한다. 소요시간의 중위값을 비교해 보면 80 초, 약 1분 20초 만큼 국문 질문지에 더 빨리 응답하지만 통계적으로 유의한 수준은 아니다.

summary()

  • 국문:

    Min. 1st Qu. Median Mean 3rd Qu. Max. NA’s
    12 142.5 190 275 279 3158 31
  • 영문:

    Min. 1st Qu. Median Mean 3rd Qu. Max. NA’s
    11 132 270 370.3 443 3337 32

geom_boxplot()

t.test() on means

Welch Two Sample t-test: as.numeric(Duration) by Group
Test statistic df P value Alternative hypothesis mean in group 국문 mean in group 영문
-3.904 887.2 0.0001017 * * * two.sided 275 370.3

일 단위 마감 시간으로부터 제출 시간의 분포

일 단위
  [0,1] (1,2] (2,3] (3,4] (4,5] (5,6] (6,7] (7,8] (8,9] (9,10] (10,11] (11,12] (12,13] (13,14]
Red 174 33 17 12 9 9 7 30 22 26 19 33 34 66
Black 196 30 22 15 10 9 4 20 14 23 19 29 45 48
Pearson’s Chi-squared test: .
Test statistic df P value
11.84 13 0.5408