Red, Black을 잘못 표시한 사람들

랜덤화출석부에 있는 Red, Black 과 실제 구글예습퀴즈에 올린 Red, Black 이 여전히 다른 사람들이 있어서 파악해 보았습니다. 이번에는 인원이 워낙 적어서 랜덤화 효과 얘기가 적절치 않습니다. Red를 Black 이라고 한 사람의 수효(2명)와 Black을 Red 라고 한 사람의 수효(7명)에 차이가 많이 나는 것처럼 보이지만 9명이 동전을 던져서 2명 이하가 앞면이 나올 확률은 0.09입니다. 양쪽 꼬리를 감안하면 18%이니까 p-value가 0.05를 훨씬 넘습니다. 인원이 너무 적기 때문에 나타나는 현상입니다. 굳이 학번까지 올린 이유는 그 다음 구글예습퀴즈부터라도 제대로 올려주길 바라서입니다.

  학번 랜덤화출석부 구글예습퀴즈
14 20236145 Black Red
17 20132720 Red Black
45 20182740 Black Red
47 20203614 Red Black
82 20222413 Red Black
95 20232714 Black Red
129 20201532 Red Black
161 20203539 Red Black
171 20234115 Black Red
195 20191537 Red Black
210 20234132 Red Black
214 20222542 Red Black
216 20236769 Red Black
219 20203349 Red Black
222 20182946 Red Black
247 20221607 Red Black
254 20206615 Black Red
255 20226176 Black Red
293 20203822 Black Red
350 20232304 Red Black
374 20236104 Red Black
378 20203916 Red Black
388 20236150 Red Black
398 20236703 Black Red
413 20213929 Red Black
422 20222742 Red Black
425 20203329 Red Black
439 20206611 Red Black
445 20233001 Black Red
456 20232540 Black Red
463 20171091 Red Black
467 20233832 Red Black
484 20232903 Red Black
492 20221531 Black Red
496 20231099 Black Red
551 20222722 Red Black
577 20182881 Red Black
584 20222760 Red Black
586 20223522 Black Red
587 20191011 Red Black
595 20183716 Red Black
607 20222231 Black Red
616 20233533 Red Black
620 20215114 Red Black
622 20202541 Red Black
623 20236147 Black Red
644 20233636 Black Red
692 20221526 Red Black
701 20221073 Black Red
738 20221097 Black Red
749 20232619 Black Red
796 20236137 Red Black
797 20236165 Black Red
851 20213424 Red Black
869 20217043 Black Red
878 20221523 Red Black
898 20232603 Black Red
900 20217092 Black Red
903 20222226 Black Red
926 20225252 Black Red
  Red(구글예습퀴즈) Black(구글예습퀴즈)
Red(랜덤화출석부) 430 35
Black(랜덤화출석부) 25 434

퀴즈 응답 비교

Q1. 춘추전국시대에 국가통계관리의 중요성 강조

관자(집계표)

  공자 맹자 관자 노자 장자
Red 93 30 310 15 8 456
Black 95 29 311 19 16 470
188 59 621 34 24 926
Pearson’s Chi-squared test with simulated p-value (based on 2000 replicates): .
Test statistic df P value
2.966 NA 0.5657

관자(%)

공자 맹자 관자 노자 장자
20.3 6.4 67.1 3.7 2.6 100.0

Q2. 국가정책을 수립하는 데 통계의 역할

통계의 중요성(집계표)

  절대로 중요하지 않다 거의 중요하지 않다 보통이다 상당히 중요하다 절대적으로 중요하다
Red 2 6 17 191 240 456
Black 6 6 12 191 255 470
8 12 29 382 495 926
Pearson’s Chi-squared test with simulated p-value (based on 2000 replicates): .
Test statistic df P value
1.206 NA 0.5402

통계의 중요성(%)

절대로 중요하지 않다 거의 중요하지 않다 보통이다 상당히 중요하다 절대적으로 중요하다
0.86 1.30 3.13 41.25 53.46 100.00

Q3. 우리나라 생산가능인구 감소 시기

생산가능인구 감소 시기(집계표)

  2012 2017 2022 2027
Red 69 347 37 3 456
Black 67 363 33 7 470
136 710 70 10 926
Pearson’s Chi-squared test with simulated p-value (based on 2000 replicates): .
Test statistic df P value
2.007 NA 0.5727

생산가능인구 감소 시기(%)

2012 2017 2022 2027
14.7 76.7 7.6 1.1 100.0

Q4. 우리나라 총인구 최대 시기

총인구 최대 시기(집계표)

  2018 2019 2020 2021
Red 116 77 240 23 456
Black 139 70 242 19 470
255 147 482 42 926
Pearson’s Chi-squared test: .
Test statistic df P value
2.586 3 0.4599

총인구 최대 시기(%)

2018 2019 2020 2021
27.5 15.9 52.1 4.5 100.0

Q5. 소멸위험 단계 개선 지역

소멸위험 단계 개선 지역(집계표)

  서울 경기 세종 제주
Red 30 49 334 43 456
Black 33 55 347 35 470
63 104 681 78 926
Pearson’s Chi-squared test: .
Test statistic df P value
1.346 3 0.7182

소멸위험 단계 개선 지역(%)

서울 경기 세종 제주
6.8 11.2 73.5 8.4 100.0

Q6. 조출생률과 합계출산율

조출생률과 합계출산율(집계표)

  합계출산율 A : 0.5, B : 0.125, C : 0.25 합계출산율 A : 0.25, B : 0.125, C : 0.5 합계출산율 A : 0.125, B : 0.5, C : 0.25 합계출산율 A : 0.5, B : 0.25, C : 0.125
Red 230 80 94 52 456
Black 235 81 111 43 470
465 161 205 95 926
Pearson’s Chi-squared test: .
Test statistic df P value
2.111 3 0.5497

조출생률과 합계출산율(%)

합계출산율 A : 0.5, B : 0.125, C : 0.25 합계출산율 A : 0.25, B : 0.125, C : 0.5 합계출산율 A : 0.125, B : 0.5, C : 0.25 합계출산율 A : 0.5, B : 0.25, C : 0.125
50.2 17.4 22.1 10.3 100.0

Cheating Charts

Q7. 눈속임 그래프

지난 학기까지 앞에 나오는 선지를 고르기 쉽다는 1번효과에 대한 질문을 만들어서 테스트해 왔지만 효과를 검증하기 어려워 문제를 바꿔 보았습니다. 언론방송에서 가끔 원형그래프나 막대그래프를 제시하면서 숫자와 그림이 맞지 않는 경우를 볼 수 있습니다. 여러분들은 그런 경우에 어떻게 인식하는 지 Red 와 Black 에 언론기관에서 발표한 눈속임 그래프를 보여주면서 어떤 응답이 나올지 살펴보았습니다. 여러분들은 대부분 눈속임 그래프에 속지 않고 있습니다. 언론기관들이 왜 이런 짓들을 하는지 궁금해집니다.

Red

Black

집계표

  부정적 응답 >> 긍정적 응답 부정적 응답 ≈ 긍정적 응답 모름/응답거절
Red(김영란법 국회통과) 363 46 47 456
Black(고위공직자 범죄수사처 설립) 430 15 25 470
793 61 72 926
Pearson’s Chi-squared test: .
Test statistic df P value
27.93 2 8.604e-07 * * *

% 비교

  부정적 응답 >> 긍정적 응답 부정적 응답 ≈ 긍정적 응답 모름/응답거절
Red(김영란법 국회통과) 79.6 10.1 10.3 100.0
Black(고위공직자 범죄수사처 설립) 91.5 3.2 5.3 100.0

Mosaic Plot

제출 시간의 분포

과제 제출이 제출 기간 마지막 날에 몰린다는 것을 시각적으로 보여주고 싶어서 하나 추가하였습니다. 아직은 학기초라 덜 한데, 중반 이후가 되면 마지막 날, 그것도 오후2시부터 몰리는 현상을 관찰할 수 있습니다. 여기서조차 랜덤화 효과를 관찰할 수 있네요. p-value 에 유의해 주세요. 제출시간과 관련한 두 가지 현상에 대해서도 여러분의 생각을 들어보고 싶습니다. 첫째, 랜덤화 효과. 둘쨰, 마감날에 몰리는 현상.

일 단위 마감 시간으로부터 제출 시간의 분포

일 단위
  [0,1] (1,2] (2,3] (3,4] (4,5] (5,6] (6,7] (7,8] (8,9] (9,10] (10,11] (11,12] (12,13] (13,14]
Red 82 41 20 12 13 13 18 42 52 55 24 24 25 34
Black 69 30 31 20 14 13 14 37 59 32 42 28 31 50
Pearson’s Chi-squared test: .
Test statistic df P value
23.24 13 0.03887 *