퀴즈 응답

Birthday Problem

어느 날에 몇 명씩 생일이 같은가?

01월02일 01월06일 01월07일 01월10일 01월16일 01월17일 01월20일 01월23일 01월25일 01월28일 01월30일 01월31일 02월01일 02월02일 02월04일 02월05일 02월07일 02월13일 02월16일 02월18일 02월20일 02월21일 02월23일 02월25일 03월03일 03월04일 03월05일 03월06일 03월07일 03월08일 03월09일 03월12일 03월13일 03월15일 03월16일 03월17일 03월18일 03월20일 03월21일 03월23일 03월24일 03월25일 03월28일 03월29일 03월31일 04월02일 04월03일 04월06일 04월12일 04월13일 04월14일 04월15일 04월16일 04월18일 04월19일 04월20일 04월25일 04월28일 04월30일 05월02일 05월04일 05월07일 05월08일 05월12일 05월16일 05월18일 05월21일 05월23일 05월24일 05월28일 05월29일 06월01일 06월02일 06월03일 06월07일 06월08일 06월15일 06월17일 06월18일 06월19일 06월24일 06월25일 06월26일 06월27일 06월29일 07월01일 07월02일 07월04일 07월05일 07월07일 07월11일 07월15일 07월18일 07월20일 07월21일 07월27일 07월31일 08월02일 08월03일 08월05일 08월06일 08월11일 08월13일 08월16일 08월17일 08월18일 08월22일 08월25일 08월26일 08월29일 09월01일 09월02일 09월03일 09월05일 09월13일 09월14일 09월16일 09월18일 09월19일 09월21일 09월22일 09월28일 09월29일 09월30일 10월01일 10월02일 10월06일 10월09일 10월10일 10월12일 10월15일 10월18일 10월20일 10월21일 10월27일 10월29일 10월30일 11월01일 11월05일 11월08일 11월09일 11월10일 11월14일 11월15일 11월21일 11월22일 11월24일 11월26일 11월29일 11월30일 12월02일 12월03일 12월05일 12월07일 12월09일 12월10일 12월12일 12월19일 12월21일 12월22일 12월23일 12월24일 12월25일 12월27일 12월28일 12월29일
3 4 2 3 2 2 2 2 2 4 3 2 4 2 2 3 4 2 2 2 5 4 3 2 3 2 3 2 2 2 3 2 3 2 2 2 2 4 2 4 5 2 2 4 2 2 2 3 2 3 3 3 2 2 3 3 5 2 2 3 5 2 3 2 2 2 2 2 2 3 2 2 2 2 4 3 3 2 5 3 3 2 2 2 2 2 2 2 4 3 2 3 3 2 2 3 2 2 2 3 3 2 2 2 3 2 2 3 3 2 2 4 3 3 3 3 3 2 5 2 2 3 5 3 2 2 2 3 2 2 3 4 2 2 2 3 3 2 3 6 4 2 3 2 3 2 3 2 2 2 2 2 3 2 2 2 2 3 3 3 2 4 2 2 2 2 435

생일이 같은 날은 모두 며칠인가?

## [1] 166

생일이 같은 사람은 몇 명 정도 기대되는가?

\(N\)을 전체 인원이라 할 때, 기대 인원은 \(N\times\{1- (\frac{364}{365})^{N-1}\}\), 분산은 \(N\times\{1- (\frac{364}{365})^{N-1}\} + N\times(N-1)\times\{1-(\frac{363}{365})^{N-2}\}\)로 계산됩니다.

무응답이거나 결석한 학생을 제외한 응답 인원 541명에 대하여 기대인원을 계산하면 418명, 표준오차는 20.4명으로 계산되어 관찰된 값이 그 범위에 잘 들어감을 알 수 있다.

기대되는 인원

## [1] 418

표준오차

## [1] 20.4

태어난 달의 분포는?

1월 2월 3월 4월 5월 6월 7월 8월 9월 10월 11월 12월
Red 20 22 24 21 26 23 19 21 31 20 26 22 275
Black 22 22 35 23 17 19 22 16 21 22 22 25 266
42 44 59 44 43 42 41 37 52 42 48 47 541

랜덤화 효과

Pearson’s Chi-squared test with simulated p-value (based on 2000 replicates): .
Test statistic df P value
7.792 NA 0.7391

월별로 고르게 출생하였는가?

Chi-squared test for given probabilities: .
Test statistic df P value
8.227 11 0.6928

Matching Problem

정답갯수의 분포

0개 1개 2개 4개
Red 86 125 53 11 275
Black 86 128 39 13 266
172 253 92 24 541

Observed vs Expected

랜덤하게 골랐다면, 각각의 확률은 9/24, 8/24, 6/24, 1/24임. 응답인원 541명을 각 확률에 곱해보면 이론적으로 기대되는 인원이 계산됩니다. 확률분포로부터 기대하는 값과 관찰된 값이 벗어나는 것을 관찰할 수 있습니다. 인터넷 검색금지를 일부만 지킨 것 같습니다. 지지난 학기와 비교해 보십시요. 한 가지, 기대값과 표준편차가 다 1이라고 해서 1개 맞추는 사람들이 가장 많은 게 아닙니다.

0개 1개 2개 4개
Observed 172.0 253.0 92.0 24.0 541.0
Expected 202.9 180.3 135.2 22.5 541.0
Difference -30.9 72.7 -43.2 1.5 0.0

카이제곱 테스트

Chi-squared test for given probabilities: .
Test statistic df P value
47.91 3 2.231e-10 * * *

직관과 어긋나는 용어

연비

1,200 킬로미터룰 주행한다고 해 봅시다. ’가’는 120리터에서 100리터로 20리터를 절감하고, ’나’는 40리터에서 30리터 10리터를 절감하게 됩니다. 따라서 ’가’운전자가 이전보다 더 절감합니다. 연비라는 용어가 주는 직관과는 잘 맞지 않다는 것을 여러분의 응답에서 잘 알 수 있습니다. 연비 높은 차량으로 바꾸는 것이 더 절감할 것이라는 응답이 무려 60%에 가깝습니다. 악마는 디테일에 있습니다.

집계

연비 10 => 12 연비 30 => 40
Red 102 173 275
Black 80 186 266
182 359 541
Chi-squared test for given probabilities with simulated p-value (based on 20000 replicates): .
Test statistic df P value
0.1497 NA 0.7302

% 비교.

연비 10 => 12 연비 30 => 40
33.6 66.4 100.0

Monty Hall 문제

문항 배열 효과?

Red

Black

염소가 들어있는 문을 보여줌으로써 다른 문에 자동차가 들어 있을 확률은 2/3로 늘어나므로 바꾸는 것이 적절한 판단임. Red와 Black의 차이는 “바꾼다”와 “고수한다”의 순서를 바꾼 것으로 “바꾼다”를 앞에 놓은 Black 집단에서 바꾼다는 응답이 다소 높게 나왔으나 통계적으로 유의한 수준은 아님.

집계

  고수한다 바꾼다
Red 171 104 275
Black 141 125 266
312 229 541
Pearson’s Chi-squared test with Yates’ continuity correction: .
Test statistic df P value
4.294 1 0.03825 *

% 비교.

  고수한다 바꾼다
Red 62.2 37.8 100.0
Black 53.0 47.0 100.0

합산(%)

  고수한다 바꾼다
57.7 42.3 100.0