Red, Black을 잘못 표시한 사람들

랜덤화출석부에 있는 Red, Black 과 실제 구글예습퀴즈에 올린 Red, Black 이 다른 사람들이 있어서 파악해 보았습니다. 랜덤화 효과를 논하기에는 아주 적은 인원이 관찰되었습니다. Red를 Black 이라고 한 사람이 1명, Black 을 Red 라고 한 사람이 1명 관찰되었습니다.

  Red(구글예습퀴즈) Black(구글예습퀴즈)
Red(랜덤화출석부) 343 1
Black(랜덤화출석부) 1 357

퀴즈 응답

Q1. Birthday Problem

어느 날에 몇 명씩 생일이 같은가?

01월01일 2
01월02일 3
01월03일 2
01월04일 2
01월05일 3
01월06일 5
01월07일 2
01월09일 2
01월11일 2
01월12일 2
01월13일 4
01월15일 2
01월16일 4
01월17일 3
01월18일 2
01월19일 3
01월21일 3
01월22일 2
01월24일 5
01월25일 5
01월27일 2
01월29일 4
02월01일 3
02월02일 3
02월04일 3
02월06일 2
02월07일 2
02월08일 3
02월10일 3
02월13일 4
02월15일 2
02월16일 2
02월19일 2
02월20일 4
02월23일 2
02월24일 2
02월27일 3
02월28일 2
03월02일 2
03월04일 6
03월05일 3
03월08일 2
03월09일 2
03월10일 3
03월12일 2
03월13일 4
03월15일 3
03월16일 3
03월18일 4
03월19일 2
03월21일 4
03월22일 4
03월23일 3
03월27일 2
03월28일 3
03월29일 2
03월30일 4
03월31일 3
04월02일 2
04월03일 3
04월04일 4
04월06일 2
04월07일 3
04월08일 2
04월10일 3
04월12일 2
04월14일 3
04월15일 2
04월19일 5
04월20일 2
04월21일 3
04월22일 5
04월24일 2
04월26일 2
04월27일 4
04월28일 5
04월29일 3
04월30일 2
05월02일 2
05월03일 3
05월06일 4
05월07일 2
05월08일 4
05월10일 3
05월13일 2
05월15일 2
05월17일 2
05월18일 4
05월19일 2
05월20일 2
05월21일 3
05월22일 3
05월23일 3
05월24일 4
05월25일 4
05월27일 3
05월28일 3
06월01일 2
06월02일 3
06월05일 3
06월06일 2
06월12일 3
06월14일 2
06월17일 2
06월19일 3
06월21일 3
06월25일 2
06월27일 4
06월28일 2
06월29일 4
06월30일 2
07월03일 2
07월04일 3
07월06일 2
07월07일 3
07월08일 2
07월10일 2
07월11일 2
07월12일 2
07월13일 2
07월14일 2
07월15일 2
07월18일 2
07월20일 4
07월21일 4
07월22일 3
07월23일 3
07월24일 2
07월25일 2
07월26일 4
07월28일 3
07월30일 2
07월31일 4
08월04일 2
08월06일 3
08월08일 2
08월09일 2
08월13일 4
08월14일 2
08월15일 2
08월16일 3
08월18일 2
08월21일 3
08월24일 2
08월25일 2
08월26일 3
08월27일 3
08월29일 2
08월30일 4
08월31일 3
09월01일 3
09월02일 2
09월03일 2
09월06일 3
09월07일 3
09월08일 2
09월10일 2
09월13일 2
09월14일 4
09월15일 2
09월16일 2
09월17일 3
09월18일 2
09월20일 2
09월21일 3
09월22일 4
09월24일 4
09월25일 2
09월26일 2
09월29일 2
09월30일 2
10월01일 2
10월02일 3
10월05일 5
10월10일 2
10월12일 4
10월15일 3
10월19일 3
10월20일 2
10월25일 3
10월26일 3
10월27일 4
10월28일 5
10월29일 4
10월30일 2
11월03일 4
11월04일 2
11월05일 6
11월07일 3
11월09일 2
11월10일 2
11월12일 5
11월13일 2
11월14일 2
11월16일 4
11월17일 4
11월19일 2
11월20일 4
11월21일 3
11월22일 5
11월24일 2
11월25일 5
11월28일 2
11월29일 3
11월30일 2
12월01일 3
12월04일 2
12월06일 4
12월12일 2
12월13일 2
12월16일 3
12월20일 2
12월24일 2
12월25일 2
12월26일 2
12월27일 2
12월30일 2
12월31일 2
611

생일이 같은 사람은 몇 명 정도 기대되는가?

생일이 같은 날은 218 일 이다. \(N\)을 전체 인원이라 할 때, 기대 인원은 \(N\times\{1- (\frac{364}{365})^{N-1}\}\), 분산은 \(N\times\{1- (\frac{364}{365})^{N-1}\} + N\times(N-1)\times\{1-(\frac{363}{365})^{N-2}\}\)로 계산된다.

무응답이거나 결석한 학생을 제외한 응답 인원 702명에 대하여 기대인원을 계산하면 599.4명, 표준오차는 24.5명으로 계산되어 관찰된 값이 그 범위에 잘 들어감을 알 수 있다.

기대되는 인원

## [1] 599.4

표준오차

## [1] 24.5

태어난 달의 분포는?

1월 2월 3월 4월 5월 6월 7월 8월 9월 10월 11월 12월
Red 37 27 26 31 34 20 29 28 33 26 27 26 344
Black 35 22 45 32 26 29 32 26 24 29 42 16 358
72 49 71 63 60 49 61 54 57 55 69 42 702

월별로 고르게 출생하였는가?

Chi-squared test for given probabilities: .
Test statistic df P value
16.5 11 0.1237

Red and Black

Pearson’s Chi-squared test: .
Test statistic df P value
15.56 11 0.1582

Q2. Matching Problem

응답 분포

  Cruel War Famous Blue Raincoat And Yours is Piece of Mine Rain
Urian Heep 113 241 227 121 702
Leonard Cohen 219 125 275 83 702
Peter, Paul and Mary 280 156 140 126 702
Marmalade 90 180 60 372 702
702 702 702 702 2808

응답분포(가수별 %)

  Cruel War Famous Blue Raincoat And Yours is Piece of Mine Rain
Urian Heep (Rain) 16.1 34.3 32.3 17.2 100
Leonard Cohen (Famous Blue Raincoat) 31.2 17.8 39.2 11.8 100
Peter, Paul and Mary (Cruel War) 39.9 22.2 19.9 17.9 100
Marmalade (And Yours is Piece of Mine) 12.8 25.6 8.5 53 100

정답갯수의 분포

  0개 1개 2개 4개
Red 118 169 50 7 344
Black 105 183 59 11 358
223 352 109 18 702

Observed vs Expected

랜덤하게 골랐다면, 각각의 확률은 9/24, 8/24, 6/24, 1/24 입니다. 응답인원 702명을 각 확률에 곱해보면 이론적으로 기대되는 인원이 계산됩니다. 확률분포로부터 기대하는 값과 관찰된 값이 벗어나는 것을 관찰할 수 있습니다. 특히 1개 맞춘 사람들의 수효과 기대값보다 훨씬 많이 관찰되었는데 1 개 정도 인터넷 검색을 한 사람들이 많다는 뜻일까요? 지난 학기와 비교해 보십시요. 한 가지, 기대값과 표준편차가 다 1이라고 해서 1개 맞추는 사람들이 가장 많은 게 아닙니다.

Observed vs Expected
  0개 1개 2개 4개
Observed 223.0 352.0 109.0 18.0 702.0
Expected 263.2 234.0 175.5 29.2 702.0
Difference -40.2 118.0 -66.5 -11.2 0.0

매칭 모델 카이제곱 적합도 테스트

Chi-squared test for given probabilities: .
Test statistic df P value
95.18 3 1.686e-20 * * *

Red and Black

Pearson’s Chi-squared test: .
Test statistic df P value
2.669 3 0.4456

Q3.직관과 어긋나는 용어

연비

1,200 킬로미터룰 주행한다고 해 봅시다. ’가’는 120리터에서 100리터로 20리터를 절감하고, ’나’는 40리터에서 30리터로 10리터를 절감하게 됩니다. 따라서 ’가’운전자가 이전보다 더 절감합니다. 연비라는 용어가 주는 직관과는 잘 맞지 않다는 것을 여러분의 응답에서 잘 알 수 있습니다. 연비 높은 차량으로 바꾸는 것이 더 절감할 것이라는 응답이 무려 60%를 넘고 있습니다. 악마는 디테일에 있습니다.

집계

연비 10 => 12 연비 30 => 40
Red 133 211 344
Black 124 234 358
257 445 702
Chi-squared test for given probabilities: .
Test statistic df P value
0.2792 1 0.5972

% 비교.

연비 10 => 12 연비 30 => 40
36.6 63.4 100.0

Q4. Monty Hall 문제

문항 배열 효과?

염소가 들어있는 문을 보여줌으로써 다른 문에 자동차가 들어 있을 확률은 2/3로 늘어나므로 바꾸는 것이 적절한 판단임. Red와 Black의 차이는 “바꾼다”와 “고수한다”의 순서를 바꾼 것으로 “바꾼다”를 앞에 놓은 Black 집단에서 바꾼다는 응답이 다소 높게 나왔으나 통계적으로 유의한 수준은 아님.

집계

  고수한다 바꾼다
Red 223 121 344
Black 228 130 358
451 251 702
Pearson’s Chi-squared test with Yates’ continuity correction: .
Test statistic df P value
0.05562 1 0.8136

% 비교.

  고수한다 바꾼다
Red 64.8 35.2 100.0
Black 63.7 36.3 100.0

합산(%)

  고수한다 바꾼다
64.2 35.8 100.0

Mosaic Plot

일 단위 마감 시간으로부터 제출 시간의 분포

분포표

일 단위
  [0,1] (1,2] (2,3] (3,4] (4,5] (5,6] (6,7] (7,8] (8,9] (9,10] (10,11] (11,12] (12,13] (13,14]
Red 120 22 23 16 13 4 8 42 15 18 18 20 5 20
Black 130 21 14 17 15 6 11 34 17 24 19 16 14 20
Pearson’s Chi-squared test: .
Test statistic df P value
9.943 13 0.6986

막대그래프

Mosaic Plot

제출 시간 분포의 변화