Red, Black을 잘못 표시한 사람들

랜덤화출석부(8월 24일 기준)에 있는 Red, Black 과 실제 구글예습설문지에 올린 Red, Black 이 다른 사람들의 분포를 파악해 보았습니다. 랜덤화 효과는 여기서도 작동하고 있는 걸 알 수 있습니다. Red를 Black 이라고 한 사람의 수효(9명)과 Black을 Red 라고 한 사람의 수효(8명)가 상당히 비슷합니다. group 을 잘못 기억하고 있는 사람들의 수효조차 Red, Black 에 비슷하게 나뉘었습니다.

  Red(구글예습퀴즈) Black(구글예습퀴즈)
Red(랜덤화출석부) 386 9
Black(랜덤화출석부) 8 373

Quiz 응답 비교

Q1. Dewey as good as elected, statistics convince Roper

Roper(Counts)

  통계학 통계 자료 통계청 정보
Red 38 323 23 6 4 394
Black 42 298 20 14 8 382
80 621 43 20 12 776
Pearson’s Chi-squared test: .
Test statistic df P value
5.765 4 0.2174

Roper(%)

통계학 통계 자료 통계청 정보
10.3 80.0 5.5 2.6 1.5 100.0

Q2. Statistics is the science of learning from data, …

ASA(Counts)

  통계학 통계 자료 통계청 정보
Red 344 34 10 2 4 394
Black 322 43 11 5 1 382
666 77 21 7 5 776
Pearson’s Chi-squared test with simulated p-value (based on 2000 replicates): .
Test statistic df P value
4.728 NA 0.3298

ASA(%)

통계학 통계 자료 통계청 정보
85.8 9.9 2.7 0.9 0.6 100.0

Q3. How to lie with statistics

D.Huff(Counts)

  통계학 통계 자료 통계청 정보
Red 25 286 42 15 26 394
Black 25 268 44 13 32 382
50 554 86 28 58 776
Pearson’s Chi-squared test: .
Test statistic df P value
1.21 4 0.8765

D.Huff(%)

통계학 통계 자료 통계청 정보
6.4 71.4 11.1 3.6 7.5 100.0

Q4. 종부세

질문지 선택지에 부연설명

집계

바람직한 논의이다라는 선택지에 부연설명을 붙이거나(Red), 부적절한 논의이다라는 선택지에 부연설명을 붙였을 때(Black), 부연설명의 여부에 따라 응답이 달라지는 지 살펴본 결과 기대한 바와 같이 양 집단에 통계적으로 유의한 수준의 차이가 났습니다. 전체적으로 부적절한 논의라는 응답이 주류를 이루는 가운데에도 부적절한 논의의 근거를 추가한 Black 집단에서 훨씬 높은 비율로 부적절한 논의라는 응답이 나왔습니다. 앞에서 본 바와 같이 Red, Black 두 집단은 출석부의 다섯 변수에 있어서 매우 닮은 집단이어서 Q1, Q2, Q3의 응답 결과에서 본 바와 같이 그 응답이 매우 닮게 나오는데 만약 부연설명이 효과가 없다면 Q4에서의 응답도 닮게 나왔을 것입니다. 그러지 못한 이유를 따져보면 바로 부연설명을 붙였다는 데서 차이가 난다고 결론을 내릴 수 있는 것입니다.

  바람직한 논의이다 부적절한 논의이다 모름/무응답
Red(바람직한 논의에 부연설명) 139 152 103 394
Black(부적절한 논의에 부연설명) 84 215 83 382
223 367 186 776
Pearson’s Chi-squared test: .
Test statistic df P value
26.35 2 1.896e-06 * * *

% 비교.

  바람직한 논의이다 부적절한 논의이다 모름/무응답
Red(바람직한 논의에 부연설명) 35.3 38.6 26.1 100.0
Black(부적절한 논의에 부연설명) 22.0 56.3 21.7 100.0

Mosaic Plot

제출 시간의 분포

과제 제출이 제출 기간 마지막 날에 몰린다는 것을 시각적으로 보여주고 싶어서 하나 추가하였습니다. 아직은 학기초라 덜 한데, 중반 이후가 되면 마지막 날, 그것도 오후2시부터 몰리는 현상을 관찰할 수 있습니다. 여기서조차 랜덤화 효과를 관찰할 수 있네요. p-value 에 유의해 주세요. 제출시간과 관련한 두 가지 현상에 대해서도 여러분의 생각을 들어보고 싶습니다. 첫째, 랜덤화 효과. 둘쨰, 마감날에 몰리는 현상.

일 단위 마감 시간으로부터 제출 시간의 분포

분포표 (Red, Black 은 닮았는가?)

일 단위
  [0,1] (1,2] (2,3] (3,4] (4,5] (5,6] (6,7] (7,8] (8,9] (9,10] (10,11] (11,12] (12,13] (13,14]
Red 51 14 8 5 17 16 21 39 38 28 27 41 43 45
Black 37 17 4 8 10 6 20 59 33 39 23 39 40 45
Pearson’s Chi-squared test: .
Test statistic df P value
17.43 13 0.1803

막대그래프

Mosaic Plot