Red, Black을 잘못 표시한 사람들
랜덤화출석부(8월 24일 기준)에 있는 Red, Black 과 실제
구글예습설문지에 올린 Red, Black 이 다른 사람들의 분포를 파악해
보았습니다. 랜덤화 효과는 여기서도 작동하고 있는 걸 알 수 있습니다.
Red를 Black 이라고 한 사람의 수효(9명)과 Black을 Red 라고 한 사람의
수효(8명)가 상당히 비슷합니다. group 을 잘못 기억하고 있는 사람들의
수효조차 Red, Black 에 비슷하게 나뉘었습니다.
Red(랜덤화출석부) |
386 |
9 |
Black(랜덤화출석부) |
8 |
373 |
Quiz 응답 비교
Q1. Dewey as good as elected, statistics convince Roper

Roper(Counts)
Red |
38 |
323 |
23 |
6 |
4 |
394 |
Black |
42 |
298 |
20 |
14 |
8 |
382 |
계 |
80 |
621 |
43 |
20 |
12 |
776 |
Pearson’s Chi-squared test: .
5.765 |
4 |
0.2174 |
Roper(%)
10.3 |
80.0 |
5.5 |
2.6 |
1.5 |
100.0 |
Q2. Statistics is the science of learning from data, …

ASA(Counts)
Red |
344 |
34 |
10 |
2 |
4 |
394 |
Black |
322 |
43 |
11 |
5 |
1 |
382 |
계 |
666 |
77 |
21 |
7 |
5 |
776 |
Pearson’s Chi-squared test with simulated p-value (based on
2000 replicates): .
4.728 |
NA |
0.3298 |
ASA(%)
85.8 |
9.9 |
2.7 |
0.9 |
0.6 |
100.0 |
Q3. How to lie with statistics

D.Huff(Counts)
Red |
25 |
286 |
42 |
15 |
26 |
394 |
Black |
25 |
268 |
44 |
13 |
32 |
382 |
계 |
50 |
554 |
86 |
28 |
58 |
776 |
Pearson’s Chi-squared test: .
1.21 |
4 |
0.8765 |
D.Huff(%)
6.4 |
71.4 |
11.1 |
3.6 |
7.5 |
100.0 |
Q4. 종부세
질문지 선택지에 부연설명


집계
바람직한 논의이다라는 선택지에 부연설명을 붙이거나(Red), 부적절한
논의이다라는 선택지에 부연설명을 붙였을 때(Black), 부연설명의 여부에
따라 응답이 달라지는 지 살펴본 결과 기대한 바와 같이 양 집단에
통계적으로 유의한 수준의 차이가 났습니다. 전체적으로 부적절한 논의라는
응답이 주류를 이루는 가운데에도 부적절한 논의의 근거를 추가한 Black
집단에서 훨씬 높은 비율로 부적절한 논의라는 응답이 나왔습니다. 앞에서 본
바와 같이 Red, Black 두 집단은 출석부의 다섯 변수에 있어서 매우 닮은
집단이어서 Q1, Q2, Q3의 응답 결과에서 본 바와 같이 그 응답이 매우 닮게
나오는데 만약 부연설명이 효과가 없다면 Q4에서의 응답도 닮게 나왔을
것입니다. 그러지 못한 이유를 따져보면 바로 부연설명을 붙였다는 데서
차이가 난다고 결론을 내릴 수 있는 것입니다.
Red(바람직한 논의에 부연설명) |
139 |
152 |
103 |
394 |
Black(부적절한 논의에 부연설명) |
84 |
215 |
83 |
382 |
계 |
223 |
367 |
186 |
776 |
Pearson’s Chi-squared test: .
26.35 |
2 |
1.896e-06 * * * |
% 비교.
Red(바람직한 논의에 부연설명) |
35.3 |
38.6 |
26.1 |
100.0 |
Black(부적절한 논의에 부연설명) |
22.0 |
56.3 |
21.7 |
100.0 |
Mosaic Plot

제출 시간의 분포
과제 제출이 제출 기간 마지막 날에 몰린다는 것을 시각적으로 보여주고
싶어서 하나 추가하였습니다. 아직은 학기초라 덜 한데, 중반 이후가 되면
마지막 날, 그것도 오후2시부터 몰리는 현상을 관찰할 수 있습니다.
여기서조차 랜덤화 효과를 관찰할 수 있네요. p-value 에 유의해 주세요.
제출시간과 관련한 두 가지 현상에 대해서도 여러분의 생각을 들어보고
싶습니다. 첫째, 랜덤화 효과. 둘쨰, 마감날에 몰리는 현상.
일 단위 마감 시간으로부터 제출 시간의 분포
분포표 (Red, Black 은 닮았는가?)
일 단위
Red |
51 |
14 |
8 |
5 |
17 |
16 |
21 |
39 |
38 |
28 |
27 |
41 |
43 |
45 |
Black |
37 |
17 |
4 |
8 |
10 |
6 |
20 |
59 |
33 |
39 |
23 |
39 |
40 |
45 |
Pearson’s Chi-squared test: .
17.43 |
13 |
0.1803 |
막대그래프

Mosaic Plot
