4주차 데이터 실험 집계

실험의 목적

4주차 구글 예습 설문지 집계결과를 분석합니다.

Q1~Q6에서는 랜덤화의 효과로 Red, Black 이 얼마나 닮았는지 알아봅니다.

Q7에서는 부연설명을 어느 쪽에 붙이느냐에 따라서 Red 와 Black 의 응답이 달라지는 것을 알아봅니다.

끝으로 제출시간의 분포가 날마다 고른지, Red, Black 간에는 닮았는지 알아봅니다.

Red, Black을 잘못 표시한 사람들

  Red(구글예습퀴즈) Black(구글예습퀴즈)
Red(랜덤화출석부) 275 1
Black(랜덤화출석부) 3 285
278 286

랜덤화출석부에 있는 Red, Black 과 실제 구글설문에 올린 Red, Black 이 다른 사람들의 수효는 4명입니다.

Red를 Black 이라고 한 사람이 1명, Black 을 Red 라고 한 사람이 3명입니다.

두 가지 방법으로 분석합니다.

우선 Red, Black 을 잘못 선택한 4명을 랜덤하게 둘로 나누면 어느 한 쪽 집단에 들어갈 기대인원은 4명을 둘로 나눈 2(명)이고, 표준오차는 4의 제곱근에 1/2을 곱해 준 1명이 됩니다.

실제로 Red를 Black 이라고 한 사람수, 1명이나 Black 을 Red 라고 한 사람수, 3명은 기대인원으로부터 표준오차 범위, 혹은 표준오차 두 배 범위에는 잘 들어갑니다.

두 번째 분석 방법은 확률을 계산해 보는 것입니다.

Red, Black 을 잘못 선택한 4명을 랜덤하게 둘로 나눌 때, 실제로 관찰된 3명 이상이나 1명이하로 잘못 선택한 사람수가 나올 가능성은 얼마나 되는가 입니다.

이 경우 공평한 동전던지기를 확률 법칙으로 표현한 이항분포로부터 계산할 수 있습니다.

시행횟수가 4이고 한 번 시행에서 성공확률이 1/2 인 이항분포에서 성공횟수가 1이하이거나 3이상을 관찰할 확률은 0.625입니다.

공평한 동전 던지기에서 앞면이 1개 이하 나오는 확률은 3개 이상 나오는 확률과 같기 때문에 사실상 한쪽만 계산해서 2배 해 주면 됩니다.

이 값을 p-value 라고 하는데, p-value가 0.05보다 작을 때 통계적으로 유의한 차이를 관찰하였다고 말합니다.

즉, 공평한 동전을 던지는 것과 같은 과정이라고 가정하였을 때 실제로 관찰된 값들이 가정으로부터 얼마나 떨어져 있는지를 표현한 것입니다.

0.05는 이런 실험을 스무 번 정도 반복하면 1번 나올 정도로 드문 사건을 의미합니다.

즉 가정이 잘못되었다는 것입니다.

그런데 Red, Black 을 잘못 표시한 사람들의 분포에서 관찰된 p-value 는 0.05와는 비교도 안될 정도로 큰 값입니다.

따라서 두 집단이 랜덤화 효과가 작동하여 통계적으로 유의한 차이를 보이지 않는다고 할 수 있습니다.

응답인원의 Red, Black

Red 로 응답한 인원은 278명, Black 에 응답한 인원은 286명입니다.

전체 응답인원 564 명을 랜덤하게 둘로 나눌 때 어느 한 쪽의 기대인원은 전체 응답인원의 절반인 282명이고, 표준오차는 전체 응답인원의 제곱근에 1/2을 곱해 준 11.9 명입니다.

따라서 Red, Black 각 그룹에 관찰된 인원은 기대인원으로부터 표준오차 범위, 혹은 2배의 표준오차 범위 안에 들어갑니다.

Q1. 세종대왕 시대 조세제도

조선초기 조세제도

  과전법 체제에서 전국 토지를 세 등급으로 나누고 실제 수확량을 확인하여 징수하였다. ’조(租)’는 공전(公田)의 경작자가 국고에 상납하는 지대 또는 사전(私田)의 경작자가 전주에게 바치는 지대를 뜻한다. ’세(稅)’는 사전의 소유자가 국가에 상납하는 지세를 뜻한다. 실제로 현장에 나가서 수확량을 파악하고 등급을 매기는 답험(踏驗)을 하였다. 등급에 따라 일정한 비율로 세금을 감면해 주는 대동(大同)법을 실시하였다.
Red 22 28 26 22 180 278
Black 17 30 17 19 203 286
39 58 43 41 383 564
Pearson’s Chi-squared test: .
Test statistic df P value
4.082 4 0.3951

Q1의 집계 결과가 Red, Black 간에 통계적으로 유의한 차이가 있는지 알아보기 위하여 카이제곱 테스트를 수행하였습니다.

그 결과 카이제곱 통계량은 4.08, 자유도는 4 , p-value 는 0.3951이므로 Red, Black 간에 통계적으로 유의한 차이를 보이지 않습니다.

실제로 닮은 게 느껴집니까?

조선초기 조세제도(%)

과전법 체제에서 전국 토지를 세 등급으로 나누고 실제 수확량을 확인하여 징수하였다. ’조(租)’는 공전(公田)의 경작자가 국고에 상납하는 지대 또는 사전(私田)의 경작자가 전주에게 바치는 지대를 뜻한다. ’세(稅)’는 사전의 소유자가 국가에 상납하는 지세를 뜻한다. 실제로 현장에 나가서 수확량을 파악하고 등급을 매기는 답험(踏驗)을 하였다. 등급에 따라 일정한 비율로 세금을 감면해 주는 대동(大同)법을 실시하였다.
6.9 10.3 7.6 7.3 67.9 100.0

정답률은 Red, Black 을 합하여 계산하는데, 67.9(%) 입니다.

Q2. 공법도입에 대한 대신들의 찬성율

공법도입과 대신들(집계표)

  10% 30% 50% 70% 90%
Red 153 54 28 27 16 278
Black 160 46 26 32 22 286
313 100 54 59 38 564
Pearson’s Chi-squared test: .
Test statistic df P value
2.129 4 0.7121

Q2의 집계 결과가 Red, Black 간에 통계적으로 유의한 차이가 있는지 알아보기 위하여 카이제곱 테스트를 수행하였습니다.

그 결과 카이제곱 통계량은 2.129, 자유도는 4, p-value 는 0.7121이므로 Red, Black 간에 통계적으로 유의한 차이를 보이지 않습니다.

실제로 닮은 게 느껴집니까?

공법도입과 대신들(%)

10% 30% 50% 70% 90%
55.5 17.7 9.6 10.5 6.7 100.0

정답률은 Red, Black 을 합하여 계산하는데, 55.5(%) 입니다.

Q3. 공법도입과 품관촌민들의 찬반

품관촌민들의 찬반(집계표)

  7:3 6:4 5:5 4:6 3:7
Red 48 159 25 22 24 278
Black 62 162 25 18 19 286
110 321 50 40 43 564
Pearson’s Chi-squared test: .
Test statistic df P value
2.678 4 0.613

Q3의 집계 결과가 Red, Black 간에 통계적으로 유의한 차이가 있는지 알아보기 위하여 카이제곱 테스트를 수행하였습니다.

그 결과 카이제곱 통계량은 2.678, 자유도는 4, p-value 는 0.6130이므로 Red, Black 간에 통계적으로 유의한 차이를 보이지 않습니다.

실제로 닮은 게 느껴집니까?

품관촌민들의 찬반(%)

7:3 6:4 5:5 4:6 3:7
19.5 56.9 8.9 7.1 7.6 100.0

정답률은 Red, Black 을 합하여 계산하는데, 56.9(%) 입니다.

Q4. 공법

기본세율

  1/10 1/15 1/20 1/30
Red 84 47 132 15 278
Black 88 29 154 15 286
172 76 286 30 564
Pearson’s Chi-squared test: .
Test statistic df P value
5.936 3 0.1148

Q4의 집계 결과가 Red, Black 간에 통계적으로 유의한 차이가 있는지 알아보기 위하여 카이제곱 테스트를 수행하였습니다.

그 결과 카이제곱 통계량은 5.936, 자유도는 3, p-value 는 0.1148이므로 Red, Black 간에 통계적으로 유의한 차이를 보이지 않습니다.

실제로 닮은 게 느껴집니까?

기본세율(%)

1/10 1/15 1/20 1/30
30.5 13.5 50.7 5.3 100.0

정답률은 Red, Black 을 합하여 계산하는데, 30.5(%) 입니다.

Q5. 1423년 조선시대 호구와 인구

호구와 인구

  15만호 20만호 44만호 130만호
Red 11 164 87 16 278
Black 22 151 105 8 286
33 315 192 24 564
Pearson’s Chi-squared test: .
Test statistic df P value
8.446 3 0.03765 *

Q5의 집계 결과가 Red, Black 간에 통계적으로 유의한 차이가 있는지 알아보기 위하여 카이제곱 테스트를 수행하였습니다.

그 결과 카이제곱 통계량은 8.446, 자유도는 3, p-value 는 0.0376이므로 Red, Black 간에 통계적으로 유의한 차이를 보이고 있습니다.

호구와 인구(%)

15만호 20만호 44만호 130만호
5.9 55.9 34.0 4.3 100.0

정답률은 Red, Black 을 합하여 계산하는데, 55.9(%) 입니다.

Q6. 지방관료와 품관촌민

찬반이 반대인 곳(집계표)

  경기 평안 전라 경상 충청
Red 25 39 44 40 130 278
Black 25 37 51 43 130 286
50 76 95 83 260 564
Pearson’s Chi-squared test: .
Test statistic df P value
0.5635 4 0.967

Q6의 집계 결과가 Red, Black 간에 통계적으로 유의한 차이가 있는지 알아보기 위하여 카이제곱 테스트를 수행하였습니다.

그 결과 카이제곱 통계량은 0.563, 자유도는 4, p-value 는 0.9670이므로 Red, Black 간에 통계적으로 유의한 차이를 보이지 않습니다.

실제로 닮은 게 느껴집니까?

찬반이 반대인 곳(%)

경기 평안 전라 경상 충청
8.9 13.5 16.8 14.7 46.1 100.0

정답률은 Red, Black 을 합하여 계산하는데, 46.1(%) 입니다.

Q7. 부연설명의 효과 : 주당 근로 69시간제 도입 찬반

부연설명을 찬성 쪽에 붙이는가(Red), 또는 반대 쪽에 붙이는가(Black)에 따라 응답이 영향을 받는 것으로 관찰됩니다.

찬반여부에 대한 카이제곱테스트의 p-value를 놓고 볼 때 그 차이가 통계적으로 매우 유의합니다.

집계

  찬성한다. 반대한다. 모름/무응답
Red(찬성한다에 부연설명) 132 78 68 278
Black(반대한다에 부연설명) 85 146 55 286
217 224 123 564
Pearson’s Chi-squared test: .
Test statistic df P value
32.09 2 1.076e-07 * * *

Q7의 Red는 주당 근로 69시간제의 도입에 찬반을 묻는 질문 중 찬성을 유도하는 부연설명을 붙였을 때 278명이 응답한 가운데 132명이 “찬성한다”는 반응을 보이고, 78명이 “반대한다”는 반응을 보입니다.

Black은 같은 상황에서 반대를 유도하는 부연설명을 붙였을 떄 286명이 응답한 가운데 85명이 “찬성한다”는 반응을 보이고, 146명이 “반대한다”는 반응을 보입니다.

그리고 “모름/무응답”에 답한 인원은 Red에 68명, Black 에 55명이 응답하였습니다.

카이제곱 테스트는 이와 같은 상황에서 찬성을 유도하는 부연설명을 붙인 경우와 반대를 유도하는 부연설명을 붙인 경우에 그 응답의 차이가 통계적으로 유의하다는 것을 보여 줍니다.

카이제곱 통계량은 32.090, 자유도는 2, p-value 는 1.1e-07으로 부연설명을 어디에 붙이느냐에 따라 그 차이가 통계적으로 유의한 것으로 나왔습니다.

여기서 부연설명이 응답에 영향을 끼치지 않는다고 가정해 봅시다.

그렇다면 Red, Black 의 응답은 대부분의 Q1 ~ Q6 에서와 같이 랜덤화 효과에 의하여 통계적으로 유의한 차이를 보이지 않을 것입니다.

그런데 실제로 관찰된 카이제곱 통계값은 통계적으로 유의한 차이를 보여 주고 있습니다.

따라서 부연설명이 영향을 끼치지 않는다는 가정은 티당치 않은 것으로 볼 수밖에 없습니다.

이러한 논증 방식을 귀류법이라 합니다.

% 비교

  찬성한다. 반대한다. 모름/무응답
Red(찬성한다에 부연설명) 47.5 28.1 24.5 100.0
Black(반대한다에 부연설명) 29.7 51.0 19.2 100.0

찬성을 유도하는 부연설명을 붙인 Red에서 “찬성한다”고 응답하는사람들의 백분율, 47.5(%)은 “반대한다”고 응답하는 사람들의 백분율, 28.1(%) 보다 높습니다.

반면 반대를 유도하는 부연설명을 붙인 Black에서 “찬성한다”고 응답하는 사람들의 백분율, 29.7(%)은 “반대한다”고 응답하는 사람들의 백분율, 51.0(%) 보다 훨씬 적습니다.

찬성을 유도하는 부연설명을 붙이느냐, 반대를 유도하는 부연설명을 붙이느냐에 따라 반응이 달라진다는 것을 잘 알 수 있습니다.

Red 와 Black 이 워낙 차이가 나지만 전체적으로 어느 정도가 “찬성한다”하고 어느 정도가 “반대한다”고 응답하였는지 합쳐 보겠습니다.

% 합계

찬성한다. 반대한다. 모름/무응답
38.5 39.7 21.8 100.0

“찬성한다”고 응답한 백분율은 Red, Black 합쳐서 38.5(%)(으)로 ’반대한다”고 응답한 백분율, 39.7(%) 과 약간 적습니다.

그리고, 모름/무응답이 21.8(%)로 적지 않습니다.

Mosaic Plot

Mosaic Plot 은 이 집계결과를 시각적으로 잘 보여줍니다.

찬성을 유도하는 부연설명을 붙인 Red 에서 “찬성한다”고 응답한 백분율이 높고, 반대를 유도하는 부연설명을 붙인 Black 에서 “반대한다”고 응답한 백분율이 월등히 높은 것을 시각적으로 알 수 있습니다.

마감 시간으로부터 제출 시간의 분포

분포표

일 단위
  [0,1] (1,2] (2,3] (3,4] (4,5] (5,6] (6,7] (7,8] (8,9] (9,10] (10,11] (11,12] (12,13] (13,14]
Red 71 15 13 4 10 3 6 46 20 22 14 20 16 18 278
Black 71 14 7 7 11 4 6 50 20 14 12 24 17 29 286
142 29 20 11 21 7 12 96 40 36 26 44 33 47 564

분포표로부터 두 가지 문제를 살펴보겠습니다.

첫째, 날마다 고르게 제출하는가?

둘째, Red, Black 간에 통게적으로 유의한 차이가 있는가?

각 문제를 살펴보기 위해서는 분포표의 일부분을 대상으로 카이제곱 테스트를 수행합니다.

날마다 고르게 제출하는가?

[0,1] (1,2] (2,3] (3,4] (4,5] (5,6] (6,7] (7,8] (8,9] (9,10] (10,11] (11,12] (12,13] (13,14]
142 29 20 11 21 7 12 96 40 36 26 44 33 47
Chi-squared test for given probabilities: .
Test statistic df P value
433.4 13 1.915e-84 * * *

날마다 고르게 제출하는지 알아 보았습니다.

분포표의 “계”행에서 ’계’열을 제외하고 카이제곱테스트를 수행합니다.

분포표 만으로도 쉽게 파악할 수 있지만 카이제곱테스트가 명확히 해 줍니다.

카이제곱 통계량은 433.43, 자유도는 13.00, p-value 는 1.9e-84 이므로 결코 고르게 제출한다고 말할 수 없습니다.

막대그래프로 살펴 보겠습니다.

막대그래프

막대그래프는 총 제출인원 564(명) 중에 142(명), 25(%)가 마감일에 몰리는 것을 명확히 보여주고 있습니다.

Red, Black 간에 닮았는가?

  [0,1] (1,2] (2,3] (3,4] (4,5] (5,6] (6,7] (7,8] (8,9] (9,10] (10,11] (11,12] (12,13] (13,14]
Red 71 15 13 4 10 3 6 46 20 22 14 20 16 18
Black 71 14 7 7 11 4 6 50 20 14 12 24 17 29
Pearson’s Chi-squared test: .
Test statistic df P value
7.798 13 0.8565

제출시간의 분포가 Red, Black 간에 닮았는지 알아 보았습니다.

이번에는 분포표의 첫번째와 두번째 행, ’계’열을 제외한 나머지 열에 대해서 카이제곱테스트를 수행합니다.

카이제곱 통계량은 7.798, 자유도는 13, p-value 는 0.8565 이므로 제출 시간의 분포는 Red, Black 간에 통계적으로 유의한 차이가 관찰되지 않습니다.

이 사실을 Mosaic Plot 을 이용하여 시각적으로 살펴보겠습니다.

닮았다고 느껴지나요?

Mosaic Plot