Red, Black을 잘못 표시한 사람들

랜덤화출석부에 있는 Red, Black 과 실제 구글예습퀴즈에 올린 Red, Black 이 여전히 다른 사람들이 있어서 파악해 보았습니다. 이번에는 인원이 워낙 적어서 랜덤화 효과 얘기가 적절치 않습니다. Red를 Black 이라고 한 사람의 수효(2명)와 Black을 Red 라고 한 사람의 수효(7명)에 차이가 많이 나는 것처럼 보이지만 9명이 동전을 던져서 2명 이하가 앞면이 나올 확률은 0.09입니다. 양쪽 꼬리를 감안하면 18%이니까 p-value가 0.05를 훨씬 넘습니다. 인원이 너무 적기 때문에 나타나는 현상입니다. 굳이 학번까지 올린 이유는 그 다음 구글예습퀴즈부터라도 제대로 올려주길 바라서입니다.

학번 랜덤화출석부 구글예습퀴즈
20182942 Black Red
20183403 Black Red
20196413 Red Black
20212759 Black Red
20214150 Black Red
20226113 Black Red
20226132 Black Red
20226170 Black Red
20226212 Red Black
  Red(구글예습퀴즈) Black(구글예습퀴즈)
Red(랜덤화출석부) 514 2
Black(랜덤화출석부) 7 504

퀴즈 응답 비교

Q1. 춘추전국시대에 국가통계관리의 중요성 강조

관자(집계표)

  공자 맹자 관자 노자 장자
Red 119 40 323 25 14 521
Black 119 35 318 20 14 506
238 75 641 45 28 1027
Pearson’s Chi-squared test with simulated p-value (based on 2000 replicates): .
Test statistic df P value
0.709 NA 0.955

관자(%)

공자 맹자 관자 노자 장자
23.2 7.3 62.4 4.4 2.7 100.0

Q2. 국가정책을 수립하는 데 통계의 역할

통계의 중요성(집계표)

  절대로 중요하지 않다 거의 중요하지 않다 보통이다 상당히 중요하다 절대적으로 중요하다
Red 3 5 9 250 254 521
Black 0 3 14 257 232 506
3 8 23 507 486 1027
Pearson’s Chi-squared test with simulated p-value (based on 2000 replicates): .
Test statistic df P value
2.081 NA 0.3628

통계의 중요성(%)

절대로 중요하지 않다 거의 중요하지 않다 보통이다 상당히 중요하다 절대적으로 중요하다
0.29 0.78 2.24 49.37 47.32 100.00

Q3. 우리나라 생산가능인구 감소 시기

생산가능인구 감소 시기(집계표)

  2012 2017 2022 2027
Red 102 364 40 15 521
Black 85 385 24 12 506
187 749 64 27 1027
Pearson’s Chi-squared test: .
Test statistic df P value
6.25 3 0.1001

생산가능인구 감소 시기(%)

2012 2017 2022 2027
18.2 72.9 6.2 2.6 100.0

Cheating Charts

Q4. 눈속임 그래프

지난 학기까지 앞에 나오는 선지를 고르기 쉽다는 1번효과에 대한 질문을 만들어서 테스트해 왔지만 효과를 검증하기 어려워 문제를 바꿔 보았습니다. 언론방송에서 가끔 원형그래프나 막대그래프를 제시하면서 숫자와 그림이 맞지 않는 경우를 볼 수 있습니다. 여러분들은 그런 경우에 어떻게 인식하는 지 Red 에는 눈속임 그래프, Black 에는 제대로 된 그래프를 보여주면서 다른 응답을 기대했지만 1번효과 와 마찬가지로 통계적으로 유의하지 않은 결과를 얻었습니다. Red 와 같은 엉터리 그래프를 보고도 대부분 제대로 판단을 하고 있었고, Black 에 대해서 다소 많다고 응답한 사람들이나 모름/응답없음에 답한 사람들은 왜 그렇게 응답한 건지 궁금해 집니다.

Red

Black

집계표

  압도적으로 많다 다소 많다 모름/응답거절
Red 425 69 27 521
Black 396 81 29 506
821 150 56 1027
Pearson’s Chi-squared test: .
Test statistic df P value
1.837 2 0.3991

% 비교

  압도적으로 많다 다소 많다 모름/응답거절
Red 81.6 13.2 5.2 100.0
Black 78.3 16.0 5.7 100.0

합산

Red 와 Black의 응답에 유의한 차이가 관찰되지 않았기 때문에 두 집단을 합쳐 보는 것이 타당합니다. 두 집단을 합해서 집계해 보면

집계

  압도적으로 많다 다소 많다 모름/응답거절
821 150 56 1027

%

  압도적으로 많다 다소 많다 모름/응답거절
79.9 14.6 5.5 100.0

Mosaic Plot

제출 시간의 분포

과제 제출이 제출 기간 마지막 날에 몰린다는 것을 시각적으로 보여주고 싶어서 하나 추가하였습니다. 아직은 학기초라 덜 한데, 중반 이후가 되면 마지막 날, 그것도 오후2시부터 몰리는 현상을 관찰할 수 있습니다. 여기서조차 랜덤화 효과를 관찰할 수 있네요. p-value 에 유의해 주세요. 제출시간과 관련한 두 가지 현상에 대해서도 여러분의 생각을 들어보고 싶습니다. 첫째, 랜덤화 효과. 둘쨰, 마감날에 몰리는 현상.

일 단위 마감 시간으로부터 제출 시간의 분포

일 단위
  [0,1] (1,2] (2,3] (3,4] (4,5] (5,6] (6,7] (7,8] (8,9] (9,10] (10,11] (11,12] (12,13] (13,14]
Red 91 48 33 34 20 28 17 45 20 31 27 36 34 57
Black 107 45 38 20 20 20 16 46 23 17 30 30 39 55
Pearson’s Chi-squared test: .
Test statistic df P value
11.9 13 0.5356