Red, Black을 잘못 표시한 사람들
랜덤화출석부에 있는 Red, Black 과 실제 구글예습퀴즈에 올린 Red, Black
이 다른 사람들이 있어서 파악해 보았습니다. 랜덤화 효과를 논하기에는 아주
적은 인원이 관찰되었습니다. Red를 Black 이라고 한 사람이 2명, Black 을
Red 라고 한 사람이 1명 관찰되었습니다.
Red(랜덤화출석부) |
400 |
2 |
Black(랜덤화출석부) |
1 |
401 |
퀴즈 응답
Birthday Problem
어느 날에 몇 명씩 생일이 같은가?
01월01일 |
3 |
01월02일 |
2 |
01월03일 |
6 |
01월04일 |
2 |
01월06일 |
2 |
01월08일 |
2 |
01월09일 |
2 |
01월10일 |
3 |
01월13일 |
6 |
01월14일 |
5 |
01월15일 |
3 |
01월17일 |
3 |
01월18일 |
3 |
01월19일 |
6 |
01월21일 |
3 |
01월22일 |
5 |
01월24일 |
2 |
01월25일 |
2 |
01월28일 |
4 |
01월29일 |
3 |
01월31일 |
2 |
02월01일 |
2 |
02월02일 |
2 |
02월05일 |
3 |
02월06일 |
4 |
02월07일 |
5 |
02월08일 |
3 |
02월09일 |
3 |
02월10일 |
2 |
02월11일 |
2 |
02월13일 |
3 |
02월15일 |
2 |
02월16일 |
4 |
02월17일 |
3 |
02월18일 |
4 |
02월19일 |
5 |
02월21일 |
4 |
02월22일 |
2 |
02월23일 |
3 |
02월24일 |
2 |
02월25일 |
2 |
02월26일 |
4 |
02월27일 |
6 |
03월01일 |
3 |
03월02일 |
4 |
03월04일 |
4 |
03월05일 |
4 |
03월06일 |
2 |
03월08일 |
5 |
03월10일 |
5 |
03월11일 |
4 |
03월12일 |
5 |
03월14일 |
4 |
03월15일 |
2 |
03월16일 |
2 |
03월18일 |
2 |
03월19일 |
2 |
03월20일 |
3 |
03월22일 |
4 |
03월23일 |
5 |
03월24일 |
5 |
03월25일 |
4 |
03월26일 |
3 |
03월27일 |
3 |
03월29일 |
2 |
04월01일 |
2 |
04월02일 |
2 |
04월03일 |
5 |
04월04일 |
3 |
04월05일 |
2 |
04월06일 |
3 |
04월07일 |
3 |
04월09일 |
2 |
04월10일 |
5 |
04월12일 |
4 |
04월13일 |
4 |
04월14일 |
3 |
04월15일 |
2 |
04월20일 |
3 |
04월22일 |
6 |
04월23일 |
2 |
04월24일 |
5 |
04월26일 |
2 |
04월28일 |
3 |
04월29일 |
4 |
05월01일 |
4 |
05월03일 |
5 |
05월05일 |
3 |
05월06일 |
5 |
05월07일 |
5 |
05월09일 |
2 |
05월10일 |
5 |
05월12일 |
4 |
05월14일 |
2 |
05월15일 |
3 |
05월16일 |
2 |
05월18일 |
2 |
05월22일 |
2 |
05월23일 |
2 |
05월26일 |
2 |
05월27일 |
4 |
05월29일 |
2 |
05월31일 |
2 |
06월01일 |
2 |
06월02일 |
5 |
06월07일 |
2 |
06월08일 |
3 |
06월11일 |
2 |
06월12일 |
2 |
06월13일 |
2 |
06월17일 |
2 |
06월18일 |
4 |
06월19일 |
4 |
06월20일 |
3 |
06월22일 |
5 |
06월24일 |
4 |
06월25일 |
3 |
06월28일 |
3 |
07월05일 |
2 |
07월06일 |
2 |
07월07일 |
2 |
07월11일 |
4 |
07월12일 |
2 |
07월15일 |
2 |
07월16일 |
2 |
07월17일 |
3 |
07월19일 |
3 |
07월21일 |
2 |
07월22일 |
2 |
07월23일 |
3 |
07월25일 |
2 |
07월28일 |
2 |
07월29일 |
4 |
07월31일 |
2 |
08월02일 |
6 |
08월03일 |
3 |
08월04일 |
2 |
08월07일 |
4 |
08월08일 |
2 |
08월09일 |
3 |
08월10일 |
5 |
08월12일 |
3 |
08월13일 |
6 |
08월15일 |
3 |
08월17일 |
5 |
08월18일 |
3 |
08월19일 |
3 |
08월20일 |
6 |
08월21일 |
2 |
08월22일 |
3 |
08월24일 |
5 |
08월25일 |
2 |
08월28일 |
2 |
08월30일 |
5 |
08월31일 |
2 |
09월02일 |
2 |
09월03일 |
2 |
09월05일 |
2 |
09월06일 |
3 |
09월08일 |
2 |
09월12일 |
2 |
09월13일 |
2 |
09월15일 |
2 |
09월16일 |
6 |
09월17일 |
3 |
09월18일 |
3 |
09월20일 |
4 |
09월21일 |
5 |
09월22일 |
3 |
09월23일 |
3 |
09월26일 |
2 |
09월27일 |
3 |
09월28일 |
2 |
10월01일 |
3 |
10월04일 |
4 |
10월06일 |
3 |
10월07일 |
2 |
10월08일 |
6 |
10월10일 |
5 |
10월11일 |
2 |
10월13일 |
2 |
10월14일 |
3 |
10월15일 |
2 |
10월17일 |
2 |
10월18일 |
6 |
10월19일 |
2 |
10월20일 |
6 |
10월21일 |
3 |
10월24일 |
2 |
10월25일 |
3 |
10월26일 |
3 |
10월28일 |
4 |
10월29일 |
3 |
10월30일 |
4 |
10월31일 |
2 |
11월02일 |
2 |
11월05일 |
5 |
11월06일 |
3 |
11월07일 |
2 |
11월09일 |
2 |
11월11일 |
2 |
11월12일 |
2 |
11월13일 |
4 |
11월16일 |
2 |
11월17일 |
2 |
11월18일 |
5 |
11월19일 |
2 |
11월22일 |
2 |
11월25일 |
3 |
11월28일 |
2 |
12월02일 |
2 |
12월04일 |
5 |
12월05일 |
4 |
12월06일 |
2 |
12월07일 |
2 |
12월09일 |
2 |
12월13일 |
4 |
12월14일 |
5 |
12월16일 |
2 |
12월17일 |
6 |
12월18일 |
2 |
12월21일 |
3 |
12월23일 |
4 |
12월24일 |
4 |
12월29일 |
2 |
12월30일 |
2 |
계 |
711 |
생일이 같은 사람은 몇 명 정도 기대되는가?
생일이 같은 날은 226 일 이다. \(N\)을 전체 인원이라 할 때, 기대 인원은
\(N\times\{1-
(\frac{364}{365})^{N-1}\}\), 분산은 \(N\times\{1- (\frac{364}{365})^{N-1}\} +
N\times(N-1)\times\{1-(\frac{363}{365})^{N-2}\}\)로 계산된다.
무응답이거나 결석한 학생을 제외한 응답 인원 804명에 대하여 기대인원을
계산하면 715.2명, 표준오차는 26.7명으로 계산되어 관찰된 값이 그 범위에
잘 들어감을 알 수 있다.
태어난 달의 분포는?
Red |
33 |
39 |
40 |
37 |
27 |
27 |
24 |
43 |
28 |
44 |
32 |
27 |
401 |
Black |
42 |
36 |
43 |
37 |
37 |
32 |
23 |
40 |
28 |
33 |
19 |
33 |
403 |
계 |
75 |
75 |
83 |
74 |
64 |
59 |
47 |
83 |
56 |
77 |
51 |
60 |
804 |
랜덤화 효과
Pearson’s Chi-squared test: .
8.905 |
11 |
0.6307 |
월별로 고르게 출생하였는가?
Chi-squared test for given probabilities:
.
25.19 |
11 |
0.008539 * * |
Matching Problem

응답 분포
Urian Heep |
251 |
274 |
173 |
106 |
804 |
Leonard Cohen |
350 |
152 |
225 |
77 |
804 |
Joan Baez |
135 |
171 |
321 |
177 |
804 |
Marmalade |
68 |
207 |
85 |
444 |
804 |
계 |
804 |
804 |
804 |
804 |
3216 |
응답분포(가수별 %)
Urian Heep (Rain) |
31.2 |
34.1 |
21.5 |
13.2 |
100 |
Leonard Cohen (Chelsea Hotel II) |
43.5 |
18.9 |
28 |
9.6 |
100 |
Joan Baez (Geordie) |
16.8 |
21.3 |
39.9 |
22 |
100 |
Marmalade (Life is) |
8.5 |
25.7 |
10.6 |
55.2 |
100 |
정답갯수의 분포
Red |
130 |
199 |
67 |
5 |
401 |
Black |
128 |
203 |
66 |
6 |
403 |
계 |
258 |
402 |
133 |
11 |
804 |
랜덤화 효과
Pearson’s Chi-squared test: .
0.1488 |
3 |
0.9854 |
Observed vs Expected
랜덤하게 골랐다면, 각각의 확률은 9/24, 8/24, 6/24, 1/24 입니다.
응답인원 804명을 각 확률에 곱해보면 이론적으로 기대되는 인원이
계산됩니다. 확률분포로부터 기대하는 값과 관찰된 값이 벗어나는 것을
관찰할 수 있습니다. 인터넷 검색금지를 거의 지키지 않은 것 같습니다. 지난
학기와 비교해 보십시요. 한 가지, 기대값과 표준편차가 다 1이라고 해서 1개
맞추는 사람들이 가장 많은 게 아닙니다.
Observed vs Expected
Observed |
258.0 |
402.0 |
133.0 |
11.0 |
804.0 |
Expected |
301.5 |
268.0 |
201.0 |
33.5 |
804.0 |
Difference |
-43.5 |
134.0 |
-68.0 |
-22.5 |
0.0 |
매칭 모델 카이제곱 적합도 테스트
Chi-squared test for given probabilities:
.
111.4 |
3 |
5.502e-24 * * * |
직관과 어긋나는 용어
연비

1,200 킬로미터룰 주행한다고 해 봅시다. ’가’는 120리터에서 100리터로
20리터를 절감하고, ’나’는 40리터에서 30리터로 10리터를 절감하게 됩니다.
따라서 ’가’운전자가 이전보다 더 절감합니다. 연비라는 용어가 주는
직관과는 잘 맞지 않다는 것을 여러분의 응답에서 잘 알 수 있습니다. 연비
높은 차량으로 바꾸는 것이 더 절감할 것이라는 응답이 무려 60%를 넘고
있습니다. 악마는 디테일에 있습니다.
집계
Red |
170 |
231 |
401 |
Black |
119 |
284 |
403 |
계 |
289 |
515 |
804 |
Chi-squared test for given probabilities:
.
0.004975 |
1 |
0.9438 |
Monty Hall 문제
문항 배열 효과?
Red

Black

염소가 들어있는 문을 보여줌으로써 다른 문에 자동차가 들어 있을 확률은
2/3로 늘어나므로 바꾸는 것이 적절한 판단임. Red와 Black의 차이는
“바꾼다”와 “고수한다”의 순서를 바꾼 것으로 “바꾼다”를 앞에 놓은 Black
집단에서 바꾼다는 응답이 다소 높게 나왔으나 통계적으로 유의한 수준은
아님.
집계
Red |
261 |
140 |
401 |
Black |
247 |
156 |
403 |
계 |
508 |
296 |
804 |
Pearson’s Chi-squared test with Yates’ continuity correction:
.
1.088 |
1 |
0.2969 |
% 비교.
Red |
65.1 |
34.9 |
100.0 |
Black |
61.3 |
38.7 |
100.0 |
Mosaic Plot

일 단위 마감 시간으로부터 제출 시간의 분포
분포표
일 단위
Red |
130 |
14 |
15 |
8 |
11 |
10 |
11 |
53 |
30 |
21 |
12 |
18 |
23 |
45 |
Black |
126 |
27 |
12 |
9 |
12 |
9 |
7 |
48 |
22 |
28 |
21 |
16 |
29 |
37 |
Pearson’s Chi-squared test with simulated p-value (based on
2000 replicates): .
12.08 |
NA |
0.5407 |
막대그래프
Mosaic Plot

제출 시간 분포의 변화
