Red, Black을 잘못 표시한 사람들

랜덤화출석부에 있는 Red, Black 과 실제 구글예습퀴즈에 올린 Red, Black 이 여전히 다른 사람들이 있어서 파악해 보았습니다. Red를 Black 이라고 한 사람의 수효(23명)과 Black을 Red 라고 한 사람의 수효(24명)이 놀라울 정도로 닮았습니다. 랜덤화의 효과로 볼 수 있습니다.

  Red(구글예습퀴즈) Black(구글예습퀴즈)
Red(랜덤화출석부) 376 23
Black(랜덤화출석부) 24 367

퀴즈 응답 비교

Q1. 춘추전국시대에 국가통계관리의 중요성 강조

관자(집계표)

  공자 맹자 관자 노자 장자
Red 85 22 269 14 10 400
Black 65 25 269 21 10 390
150 47 538 35 20 790
Pearson’s Chi-squared test: .
Test statistic df P value
4.132 4 0.3884

관자(%)

공자 맹자 관자 노자 장자
19.0 5.9 68.1 4.4 2.5 100.0

Q2. 국가정책을 수립하는 데 통계의 역할

통계의 중요성(집계표)

  절대로 중요하지 않다 거의 중요하지 않다 보통이다 상당히 중요하다 절대적으로 중요하다
Red 0 3 12 184 201 400
Black 2 4 7 155 222 390
2 7 19 339 423 790
Pearson’s Chi-squared test with simulated p-value (based on 2000 replicates): .
Test statistic df P value
4.624 NA 0.1004

통계의 중요성(%)

절대로 중요하지 않다 거의 중요하지 않다 보통이다 상당히 중요하다 절대적으로 중요하다
0.25 0.89 2.41 42.91 53.54 100.00

Q3. 우리나라 생산가능인구 감소 시기

생산가능인구 감소 시기(집계표)

  2012 2017 2022 2027
Red 37 325 35 3 400
Black 34 321 31 4 390
71 646 66 7 790
Pearson’s Chi-squared test with simulated p-value (based on 2000 replicates): .
Test statistic df P value
0.4103 NA 0.9405

생산가능인구 감소 시기(%)

2012 2017 2022 2027
8.99 81.77 8.35 0.89 100.00

Q4. 우리나라 총인구 최대 시기

총인구 최대 시기(집계표)

  2018 2019 2020 2021
Red 85 50 241 24 400
Black 77 45 249 19 390
162 95 490 43 790
Pearson’s Chi-squared test: .
Test statistic df P value
1.244 3 0.7425

총인구 최대 시기(%)

2018 2019 2020 2021
20.5 12.0 62.0 5.4 100.0

Q5. 소멸위험 단계 개선 지역

소멸위험 단계 개선 지역(집계표)

  서울 경기 세종 제주
Red 17 30 329 24 400
Black 19 43 303 25 390
36 73 632 49 790
Pearson’s Chi-squared test: .
Test statistic df P value
3.39 3 0.3353

소멸위험 단계 개선 지역(%)

서울 경기 세종 제주
4.6 9.2 80.0 6.2 100.0

Q6. 조출생률과 합계출산율

조출생률과 합계출산율(집계표)

  합계출산율 A : 0.5, B : 0.125, C : 0.25 합계출산율 A : 0.25, B : 0.125, C : 0.5 합계출산율 A : 0.125, B : 0.5, C : 0.25 합계출산율 A : 0.5, B : 0.25, C : 0.125
Red 217 68 72 43 400
Black 214 63 71 42 390
431 131 143 85 790
Pearson’s Chi-squared test: .
Test statistic df P value
0.1039 3 0.9914

조출생률과 합계출산율(%)

합계출산율 A : 0.5, B : 0.125, C : 0.25 합계출산율 A : 0.25, B : 0.125, C : 0.5 합계출산율 A : 0.125, B : 0.5, C : 0.25 합계출산율 A : 0.5, B : 0.25, C : 0.125
54.6 16.6 18.1 10.8 100.0

Cheating Charts

Q7. 눈속임 그래프

지난 학기까지 앞에 나오는 선지를 고르기 쉽다는 1번효과에 대한 질문을 만들어서 테스트해 왔지만 효과를 검증하기 어려워 문제를 바꿔 보았습니다. 언론방송에서 가끔 원형그래프나 막대그래프를 제시하면서 숫자와 그림이 맞지 않는 경우를 볼 수 있습니다. 여러분들은 그런 경우에 어떻게 인식하는 지 Red 와 Black 에 언론기관에서 발표한 눈속임 그래프를 보여주면서 어떤 응답이 나올지 살펴보았습니다. 여러분들은 대부분 눈속임 그래프에 속지 않고 있습니다. 언론기관들이 왜 이런 짓들을 하는지 궁금해집니다.

집계표

  제대로 보여주고 있다 제대로 보여주고 있지 않다 모름/응답거절
Red(김영란법 국회통과) 94 239 67 400
Black(고위공직자 범죄수사처 설립) 128 189 73 390
222 428 140 790
Pearson’s Chi-squared test: .
Test statistic df P value
11.18 2 0.003734 * *

% 비교

  제대로 보여주고 있다 제대로 보여주고 있지 않다 모름/응답거절
Red(김영란법 국회통과) 23.5 59.8 16.8 100.0
Black(고위공직자 범죄수사처 설립) 32.8 48.5 18.7 100.0

Mosaic Plot

제출 시간의 분포

과제 제출이 제출 기간 마지막 날에 몰린다는 것을 시각적으로 보여주고 싶어서 하나 추가하였습니다. 아직은 학기초라 덜 한데, 중반 이후가 되면 마지막 날, 그것도 오후2시부터 몰리는 현상을 관찰할 수 있습니다. 여기서조차 랜덤화 효과를 관찰할 수 있네요. p-value 에 유의해 주세요. 제출시간과 관련한 두 가지 현상에 대해서도 여러분의 생각을 들어보고 싶습니다. 첫째, 랜덤화 효과. 둘쨰, 마감날에 몰리는 현상.

일 단위 마감 시간으로부터 제출 시간의 분포

분포표 (Red, Black 은 닮았는가?)

일 단위
  [0,1] (1,2] (2,3] (3,4] (4,5] (5,6] (6,7] (7,8] (8,9] (9,10] (10,11] (11,12] (12,13]
Red 73 28 17 22 21 12 15 48 36 34 48 26 20
Black 58 34 22 28 17 15 9 48 50 26 36 27 20
Pearson’s Chi-squared test: .
Test statistic df P value
10.87 12 0.5403

막대그래프

Mosaic Plot