Red, Black을 잘못 표시한 사람들

랜덤화출석부에 있는 Red, Black 과 실제 구글예습퀴즈에 올린 Red, Black 이 여전히 다른 사람들이 있어서 파악해 보았습니다. Red를 Black 이라고 한 사람의 수효(27명)과 Black을 Red 라고 한 사람의 수효(22명)는 기대인원으로부터 표준오차 범위 내에 잘 들어가는 수준입니다. 랜덤화의 효과로 볼 수 있습니다.

  Red(구글예습퀴즈) Black(구글예습퀴즈)
Red(랜덤화출석부) 346 27
Black(랜덤화출석부) 22 338

퀴즈 응답 비교

Q1. 춘추전국시대에 국가통계관리의 중요성 강조

관자(집계표)

  공자 맹자 관자 노자 장자
Red 57 24 265 15 7 368
Black 65 31 248 15 6 365
122 55 513 30 13 733
Pearson’s Chi-squared test: .
Test statistic df P value
2.044 4 0.7278

관자(%)

공자 맹자 관자 노자 장자
16.6 7.5 70.0 4.1 1.8 100.0

Q2. 국가정책을 수립하는 데 통계의 역할

통계의 중요성(집계표)

  절대로 중요하지 않다 거의 중요하지 않다 보통이다 상당히 중요하다 절대적으로 중요하다
Red 2 2 14 146 204 368
Black 3 1 8 154 199 365
5 3 22 300 403 733
Pearson’s Chi-squared test: .
Test statistic df P value
1.899 2 0.3869

통계의 중요성(%)

절대로 중요하지 않다 거의 중요하지 않다 보통이다 상당히 중요하다 절대적으로 중요하다
0.68 0.41 3.00 40.93 54.98 100.00

Q3. 우리나라 생산가능인구 감소 시기

생산가능인구 감소 시기(집계표)

  2012 2017 2022 2027
Red 37 296 30 5 368
Black 30 304 27 4 365
67 600 57 9 733
## Warning in chisq.test(., simulate.p.value = FALSE): Chi-squared approximation may be incorrect
Pearson’s Chi-squared test: .
Test statistic df P value
1.095 3 0.7783

생산가능인구 감소 시기(%)

2012 2017 2022 2027
9.1 81.9 7.8 1.2 100.0

Q4. 우리나라 총인구 최대 시기

총인구 최대 시기(집계표)

  2018 2019 2020 2021
Red 73 29 247 19 368
Black 84 30 233 18 365
157 59 480 37 733
Pearson’s Chi-squared test: .
Test statistic df P value
1.211 3 0.7504

총인구 최대 시기(%)

2018 2019 2020 2021
21.4 8.0 65.5 5.0 100.0

Q5. 소멸위험 단계 개선 지역

소멸위험 단계 개선 지역(집계표)

  서울 경기 세종 제주
Red 18 21 299 30 368
Black 20 25 299 21 365
38 46 598 51 733
Pearson’s Chi-squared test: .
Test statistic df P value
2.029 3 0.5664

소멸위험 단계 개선 지역(%)

서울 경기 세종 제주
5.2 6.3 81.6 7.0 100.0

Q6. 조출생률과 합계출산율

조출생률과 합계출산율(집계표)

  합계출산율 A : 0.5, B : 0.125, C : 0.25 합계출산율 A : 0.25, B : 0.125, C : 0.5 합계출산율 A : 0.125, B : 0.5, C : 0.25 합계출산율 A : 0.5, B : 0.25, C : 0.125
Red 192 60 76 40 368
Black 187 53 84 41 365
379 113 160 81 733
Pearson’s Chi-squared test: .
Test statistic df P value
0.8997 3 0.8255

조출생률과 합계출산율(%)

합계출산율 A : 0.5, B : 0.125, C : 0.25 합계출산율 A : 0.25, B : 0.125, C : 0.5 합계출산율 A : 0.125, B : 0.5, C : 0.25 합계출산율 A : 0.5, B : 0.25, C : 0.125
51.7 15.4 21.8 11.1 100.0

Cheating Charts

Q7. 눈속임 그래프

지난 학기까지 앞에 나오는 선지를 고르기 쉽다는 1번효과에 대한 질문을 만들어서 테스트해 왔지만 효과를 검증하기 어려워 문제를 바꿔 보았습니다. 언론방송에서 가끔 원형그래프나 막대그래프를 제시하면서 숫자와 그림이 맞지 않는 경우를 볼 수 있습니다. 여러분들은 그런 경우에 어떻게 인식하는 지 Red 와 Black 에 언론기관에서 발표한 눈속임 그래프를 보여주면서 어떤 응답이 나올지 살펴보았습니다. 여러분들은 대부분 눈속임 그래프에 속지 않고 있습니다. 언론기관들이 왜 이런 짓들을 하는지 궁금해집니다.

집계표

  제대로 보여주고 있다 제대로 보여주고 있지 않다 모름/응답거절
Red(김영란법 국회통과) 81 228 59 368
Black(고위공직자 범죄수사처 설립) 120 173 72 365
201 401 131 733
Pearson’s Chi-squared test: .
Test statistic df P value
16.39 2 0.0002762 * * *

% 비교

  제대로 보여주고 있다 제대로 보여주고 있지 않다 모름/응답거절
Red(김영란법 국회통과) 22.0 62.0 16.0 100.0
Black(고위공직자 범죄수사처 설립) 32.9 47.4 19.7 100.0

Mosaic Plot

제출 시간의 분포

과제 제출이 제출 기간 마지막 날에 몰린다는 것을 시각적으로 보여주고 싶어서 하나 추가하였습니다. 아직은 학기초라 덜 한데, 중반 이후가 되면 마지막 날, 그것도 오후2시부터 몰리는 현상을 관찰할 수 있습니다. 여기서조차 랜덤화 효과를 관찰할 수 있네요. p-value 에 유의해 주세요. 제출시간과 관련한 두 가지 현상에 대해서도 여러분의 생각을 들어보고 싶습니다. 첫째, 랜덤화 효과. 둘쨰, 마감날에 몰리는 현상.

일 단위 마감 시간으로부터 제출 시간의 분포

분포표 (Red, Black 은 닮았는가?)

일 단위
  [0,1] (1,2] (2,3] (3,4] (4,5] (5,6] (6,7] (7,8] (8,9] (9,10] (10,11] (11,12] (12,13] (13,14]
Red 62 29 8 19 10 7 7 49 28 34 27 35 18 35
Black 52 22 14 13 7 5 7 55 32 29 24 33 32 40
Pearson’s Chi-squared test: .
Test statistic df P value
10.95 13 0.6152

막대그래프

Mosaic Plot