12주차 구글 예습 설문지 집계결과를 분석합니다.
Q1~Q6에서는 랜덤화의 효과로 Red, Black 이 얼마나 닮았는지 알아봅니다.
Q7에서는 Framing Effects 를 알아 보기 위하여 동일한 내용을 Red에서는 생존을 프레임으로 프로그램을 비교하고, Black에서는 사망을 프레임으로 프로그램을 비교할 때 생존 프레임에서는 확실한 생존 인원을 선호하고, 사망 프레임에서는 운에 기대어 모두 사망하지 않는 프로그램을 선호한다는 것을 보여 줍니다.
그리고, 제출시간의 분포가 날마다 고른지, Red, Black 간에는 닮았는지 알아봅니다.
Red(구글예습퀴즈) | Black(구글예습퀴즈) | |
---|---|---|
Red(랜덤화출석부) | 282 | 0 |
Black(랜덤화출석부) | 0 | 284 |
계 | 282 | 284 |
Red 로 응답한 인원은 282명, Black 에 응답한 인원은 284명입니다.
전체 응답인원 566 명을 랜덤하게 둘로 나눌 때 어느 한 쪽의 기대인원은 전체 응답인원의 절반인 283명이고, 표준오차는 전체 응답인원의 제곱근에 1/2을 곱해 준 11.9 명입니다.
따라서 Red, Black 각 그룹에 관찰된 인원은 기대인원으로부터 표준오차 범위 안에 들어갑니다.
열에 한명 | 열에 세명 | 열에 다섯명 | 열에 여덟명 | 계 | |
---|---|---|---|---|---|
Red | 173 | 71 | 29 | 9 | 282 |
Black | 165 | 72 | 37 | 10 | 284 |
계 | 338 | 143 | 66 | 19 | 566 |
Test statistic | df | P value |
---|---|---|
1.212 | 3 | 0.7502 |
Q1의 집계 결과가 Red, Black 간에 통계적으로 유의한 차이가 있는지 알아보기 위하여 카이제곱 테스트를 수행하였습니다.
그 결과 카이제곱 통계량은 1.212, 자유도는 3 , p-value 는 0.7502이므로 Red, Black 간에 통계적으로 유의한 차이를 보이지 않습니다.
실제로 닮은 게 느껴집니까?
열에 한명 | 열에 세명 | 열에 다섯명 | 열에 여덟명 | 계 |
---|---|---|---|---|
59.7 | 25.3 | 11.7 | 3.4 | 100.0 |
정답률은 Red, Black 을 합하여 계산하는데, 59.7(%) 입니다.
15% | 25% | 45% | 65% | 계 | |
---|---|---|---|---|---|
Red | 12 | 43 | 212 | 15 | 282 |
Black | 13 | 43 | 216 | 12 | 284 |
계 | 25 | 86 | 428 | 27 | 566 |
Test statistic | df | P value |
---|---|---|
0.4037 | 3 | 0.9395 |
Q2의 집계 결과가 Red, Black 간에 통계적으로 유의한 차이가 있는지 알아보기 위하여 카이제곱 테스트를 수행하였습니다.
그 결과 카이제곱 통계량은 0.404, 자유도는 3, p-value 는 0.9395이므로 Red, Black 간에 통계적으로 유의한 차이를 보이지 않습니다.
실제로 닮은 게 느껴집니까?
15% | 25% | 45% | 65% | 계 |
---|---|---|---|---|
4.4 | 15.2 | 75.6 | 4.8 | 100.0 |
정답률은 Red, Black 을 합하여 계산하는데, 75.6(%) 입니다.
1명 | 2명 | 3명 | 4명 | 계 | |
---|---|---|---|---|---|
Red | 32 | 40 | 42 | 168 | 282 |
Black | 20 | 39 | 45 | 180 | 284 |
계 | 52 | 79 | 87 | 348 | 566 |
Test statistic | df | P value |
---|---|---|
3.292 | 3 | 0.3487 |
Q3의 집계 결과가 Red, Black 간에 통계적으로 유의한 차이가 있는지 알아보기 위하여 카이제곱 테스트를 수행하였습니다.
그 결과 카이제곱 통계량은 3.292, 자유도는 3, p-value 는 0.3487이므로 Red, Black 간에 통계적으로 유의한 차이를 보이지 않습니다.
실제로 닮은 게 느껴집니까?
1명 | 2명 | 3명 | 4명 | 계 |
---|---|---|---|---|
9.2 | 14.0 | 15.4 | 61.5 | 100.0 |
정답률은 Red, Black 을 합하여 계산하는데, 61.5(%) 입니다.
0 | 1 | 2 | 3 | 5 | 계 | |
---|---|---|---|---|---|---|
Red | 17 | 38 | 19 | 26 | 182 | 282 |
Black | 18 | 31 | 20 | 36 | 179 | 284 |
계 | 35 | 69 | 39 | 62 | 361 | 566 |
Test statistic | df | P value |
---|---|---|
2.395 | 4 | 0.6635 |
Q4의 집계 결과가 Red, Black 간에 통계적으로 유의한 차이가 있는지 알아보기 위하여 카이제곱 테스트를 수행하였습니다.
그 결과 카이제곱 통계량은 2.395, 자유도는 4, p-value 는 0.6635이므로 Red, Black 간에 통계적으로 유의한 차이를 보이지 않습니다.
실제로 닮은 게 느껴집니까?
0 | 1 | 2 | 3 | 5 | 계 |
---|---|---|---|---|---|
6.2 | 12.2 | 6.9 | 11.0 | 63.8 | 100.0 |
모두 맞춘 사람들의 백분율은 63.8(%) 입니다.
0 | 1 | 2 | 3 | 4 | 5 | 6 | 8 | 계 | |
---|---|---|---|---|---|---|---|---|---|
Red | 29 | 11 | 6 | 4 | 10 | 9 | 56 | 157 | 282 |
Black | 15 | 13 | 11 | 6 | 11 | 9 | 53 | 166 | 284 |
계 | 44 | 24 | 17 | 10 | 21 | 18 | 109 | 323 | 566 |
Test statistic | df | P value |
---|---|---|
6.866 | 7 | 0.443 |
Q5의 집계 결과가 Red, Black 간에 통계적으로 유의한 차이가 있는지 알아보기 위하여 카이제곱 테스트를 수행하였습니다.
그 결과 카이제곱 통계량은 6.866, 자유도는 7, p-value 는 0.4430이므로 Red, Black 간에 통계적으로 유의한 차이를 보이지 않습니다.
실제로 닮은 게 느껴집니까?
0 | 1 | 2 | 3 | 4 | 5 | 6 | 8 | 계 |
---|---|---|---|---|---|---|---|---|
7.8 | 4.2 | 3.0 | 1.8 | 3.7 | 3.2 | 19.3 | 57.1 | 100.0 |
모두 맞춘 사람들의 백분율은 57.1(%) 입니다.
언어 | 논리수학 | 인간친화 | 자기성찰 | 자연친화 | 계 | |
---|---|---|---|---|---|---|
Red | 20 | 18 | 39 | 198 | 7 | 282 |
Black | 23 | 15 | 46 | 196 | 4 | 284 |
계 | 43 | 33 | 85 | 394 | 11 | 566 |
Test statistic | df | P value |
---|---|---|
1.88 | 4 | 0.7579 |
Q6의 집계 결과가 Red, Black 간에 통계적으로 유의한 차이가 있는지 알아보기 위하여 카이제곱 테스트를 수행하였습니다.
그 결과 카이제곱 통계량은 1.880, 자유도는 4, p-value 는 0.7579이므로 Red, Black 간에 통계적으로 유의한 차이를 (보이고 있습니다.) 보이지 않습니다.
실제로 닮은 게 느껴집니까?
언어 | 논리수학 | 인간친화 | 자기성찰 | 자연친화 | 계 |
---|---|---|---|---|---|
7.6 | 5.8 | 15.0 | 69.6 | 1.9 | 100.0 |
정답률은 Red, Black 을 합하여 계산하는데, 69.6(%) 입니다.
이 질문은 프레임을 어떻게 설정하느냐에 따라 반응이 확연하게 달라진다는 Framing effects를 보여 줍니다.
600명 중 200명이 사는 거나 400명이 죽는 것, 모두 살리는 거나 모두 죽지 않는 것이나 같은 내용임에도 반응이 다르게 나타납니다.
생존 프레임에서는 확실한 생존자 수효를 보장하는 프로그램을 선호하고, 사망 프레임에서는 모두 사망하지 않기를 운에 기대는 프로그램을 선호하는 반응이 많다는 것을 확인합니다.
확실히 | 확률적으로 | 계 | |
---|---|---|---|
생존 프레임 | 179 | 103 | 282 |
사망 프레임 | 100 | 184 | 284 |
계 | 279 | 287 | 566 |
Test statistic | df | P value |
---|---|---|
44.1 | 1 | 3.121e-11 * * * |
Q7의 Red는 생존 프레임으로 600명 중 200명을 확실히 살리는 프로그램하고 600명 모두 살릴 확률은 1/3이고 모두 사망 확률은 2/3로 사실상 살릴 수 있는 기대인원은 200명으로 같지만 확실히 살린다는 프로그램을 더 선호하고, Black은 사망 프레임으로 Red 와 동일한 프로그램임에도 설명하기를 600명 중 400명이 확실히 죽는 프로그램하고 모두 사망하지 않을 확률은 1/3이고, 모두 사망할 확률은 2/3인 프로그램 중에서 선택하라고 했을 때 사망 프레임이 씌워져 있는 프로그램 중에서는 그나마 운에 기댈 수 있는 프로그램을 더 선호한다는 것을 명확히 보여 줍니다.
모두 살린다는 것이나 모두 사망하지 않는다는 것은 같은 말입니다.
그 결과 Red, Black 의 차이를 분석하기 위한 카이제곱 통계량은 44.100, 자유도는 1, p-value 는 3.1e-11 으로 프레임의 차이가 통계적으로 유의함을 보여 줍니다.
즉, Framing Effects가 확실히 영향을 주고 있는 것으로 파악됩니다.
확실히 | 확률적으로 | 계 | |
---|---|---|---|
생존 프레임 | 63.5 | 36.5 | 100.0 |
사망 프레임 | 35.2 | 64.8 | 100.0 |
이를 백분율로 살펴보면 생존 프레임인 Red에서 확실히 200명을 살리는 프로그램을 선호하는 백분율, 63.5(%)(은)는 운에 기대어 모두 살리는 프로그램을 선호하는 백분율, 36.5(%) 보다 높고, 사망 프레임인 Black에서 확실히 400명이 사망한다는 프로그램을 선호하는 백분율, 35.2(%)(은)는 운에 기대어 모두 사망하지 않을 프로그램을 선호하는 백분율, 64.8(%)보다 낮다는 것을 알 수 있습니다.
Mosaic Plot 은 이 집계결과를 시각적으로 잘 보여줍니다.
생존 프레임과 사망 프레임에 따라 프로그램의 선호가 달라짐을 명확히 보여줍니다.
[0,1] | (1,2] | (2,3] | (3,4] | (4,5] | (5,6] | (6,7] | (7,8] | (8,9] | (9,10] | (10,11] | (11,12] | (12,13] | (13,14] | 계 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Red | 128 | 19 | 9 | 6 | 4 | 3 | 5 | 32 | 10 | 9 | 14 | 8 | 15 | 20 | 282 |
Black | 133 | 21 | 14 | 4 | 1 | 3 | 6 | 30 | 7 | 13 | 8 | 10 | 11 | 23 | 284 |
계 | 261 | 40 | 23 | 10 | 5 | 6 | 11 | 62 | 17 | 22 | 22 | 18 | 26 | 43 | 566 |
분포표로부터 두 가지 문제를 살펴보겠습니다.
첫째, 날마다 고르게 제출하는가?
둘째, Red, Black 간에 통게적으로 유의한 차이가 있는가?
각 문제를 살펴보기 위해서는 분포표의 일부분을 대상으로 카이제곱 테스트를 수행합니다.
[0,1] | (1,2] | (2,3] | (3,4] | (4,5] | (5,6] | (6,7] | (7,8] | (8,9] | (9,10] | (10,11] | (11,12] | (12,13] | (13,14] |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
261 | 40 | 23 | 10 | 5 | 6 | 11 | 62 | 17 | 22 | 22 | 18 | 26 | 43 |
Test statistic | df | P value |
---|---|---|
1375 | 13 | 3.294e-286 * * * |
날마다 고르게 제출하는지 알아 보았습니다.
분포표의 “계”행에서 ’계’열을 제외하고 카이제곱테스트를 수행합니다.
분포표 만으로도 쉽게 파악할 수 있지만 카이제곱테스트가 명확히 해 줍니다. 카이제곱 통계량은 1375.251, 자유도는 13.00, p-value 는 3.3e-286 이므로 날짜 별로 고르게 제출하지 않았다는 점을 강력히 시사합니다.
막대그래프로 살펴 보겠습니다.
[0,1] | (1,2] | (2,3] | (3,4] | (4,5] | (5,6] | (6,7] | (7,8] | (8,9] | (9,10] | (10,11] | (11,12] | (12,13] | (13,14] | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Red | 128 | 19 | 9 | 6 | 4 | 3 | 5 | 32 | 10 | 9 | 14 | 8 | 15 | 20 |
Black | 133 | 21 | 14 | 4 | 1 | 3 | 6 | 30 | 7 | 13 | 8 | 10 | 11 | 23 |
Test statistic | df | P value |
---|---|---|
7.571 | 13 | 0.8704 |
제출시간의 분포가 Red, Black 간에 닮았는지 알아 보았습니다.
이번에는 분포표의 첫번째와 두번째 행, ’계’열을 제외한 나머지 열에 대해서 카이제곱테스트를 수행합니다. 카이제곱 통계량은 7.57, 자유도는 13, p-value 는 0.8704 이므로 제출 시간의 분포는 Red, Black 간에 통계적으로 유의한 차이가 관찰되지 않습니다.
이 사실을 Mosaic Plot 을 이용하여 시각적으로 살펴보겠습니다.
닮았다고 느껴지나요?