10주차 구글 예습 설문지 집계결과를 분석합니다.
Q1~Q6에서는 랜덤화의 효과로 Red, Black 이 얼마나 닮았는지 알아봅니다.
Q7에서는 Prospect Theory 에서 이득은 확고히 하고 손실은 회피하려는 심리에 대해서 살펴봅니다.
제출시간의 분포가 날마다 고른지, Red, Black 간에는 닮았는지 알아봅니다.
Red(구글예습퀴즈) | Black(구글예습퀴즈) | |
---|---|---|
Red(랜덤화출석부) | 360 | 2 |
Black(랜덤화출석부) | 0 | 358 |
계 | 360 | 360 |
Red 로 응답한 인원은 360명, Black 에 응답한 인원은 360명입니다.
전체 응답인원 720 명을 랜덤하게 둘로 나눌 때 어느 한 쪽의 기대인원은 전체 응답인원의 절반인 360명이고, 표준오차는 전체 응답인원의 제곱근에 1/2을 곱해 준 13.4 명입니다.
따라서 Red, Black 각 그룹에 관찰된 인원은 기대인원으로부터 표준오차 범위 안에 들어갑니다. 랜덤화출석부에 있는 Red, Black 과 실제 구글설문에 올린 Red, Black 이 다른 사람들의 수효는 2명입니다. Red를 Black 이라고 한 사람이 2명, Black 을 Red 라고 한 사람이 0명입니다.
소득불평등이 심한 나라에서 건강 및 사회문제지수가 나쁘게 나온다. | 소득이 많은 나라에서 건강 및 사회문제지수가 나쁘게 나온다. | 소득불평등이 심하면 건강 및 사회문제지수가 나빠진다. | 소득이 많아지면 건강 및 사회문제지수가 나빠진다. | 계 | |
---|---|---|---|---|---|
Red | 216 | 52 | 79 | 13 | 360 |
Black | 209 | 48 | 87 | 16 | 360 |
계 | 425 | 100 | 166 | 29 | 720 |
Test statistic | df | P value |
---|---|---|
0.9712 | 3 | 0.8082 |
Q1의 집계 결과가 Red, Black 간에 통계적으로 유의한 차이가 있는지 알아보기 위하여 카이제곱 테스트를 수행하였습니다.
그 결과 카이제곱 통계량은 0.971, 자유도는 3 , p-value 는 0.8082이므로 Red, Black 간에 통계적으로 유의한 차이를 보이지 않습니다.
실제로 닮은 게 느껴집니까?
소득불평등이 심한 나라에서 건강 및 사회문제지수가 나쁘게 나온다. | 소득이 많은 나라에서 건강 및 사회문제지수가 나쁘게 나온다. | 소득불평등이 심하면 건강 및 사회문제지수가 나빠진다. | 소득이 많아지면 건강 및 사회문제지수가 나빠진다. | 계 |
---|---|---|---|---|
59.0 | 13.9 | 23.1 | 4.0 | 100.0 |
정답률은 Red, Black 을 합하여 계산하는데, 59.0(%) 입니다.
대공황, 대침체, 대번영 | 대침체, 대공황, 대번영 | 대번영, 대공황, 대침체 | 대공황, 대번영, 대침체 | 계 | |
---|---|---|---|---|---|
Red | 51 | 43 | 64 | 202 | 360 |
Black | 68 | 52 | 56 | 184 | 360 |
계 | 119 | 95 | 120 | 386 | 720 |
Test statistic | df | P value |
---|---|---|
4.654 | 3 | 0.199 |
Q2의 집계 결과가 Red, Black 간에 통계적으로 유의한 차이가 있는지 알아보기 위하여 카이제곱 테스트를 수행하였습니다.
그 결과 카이제곱 통계량은 4.654, 자유도는 3, p-value 는 0.1990이므로 Red, Black 간에 통계적으로 유의한 차이를 보이지 않습니다.
실제로 닮은 게 느껴집니까?
대공황, 대침체, 대번영 | 대침체, 대공황, 대번영 | 대번영, 대공황, 대침체 | 대공황, 대번영, 대침체 | 계 |
---|---|---|---|---|
16.5 | 13.2 | 16.7 | 53.6 | 100.0 |
정답률은 Red, Black 을 합하여 계산하는데, 53.6(%) 입니다.
25% | 35% | 50% | 60% | 계 | |
---|---|---|---|---|---|
Red | 47 | 76 | 163 | 74 | 360 |
Black | 42 | 73 | 157 | 88 | 360 |
계 | 89 | 149 | 320 | 162 | 720 |
Test statistic | df | P value |
---|---|---|
1.664 | 3 | 0.645 |
Q3의 집계 결과가 Red, Black 간에 통계적으로 유의한 차이가 있는지 알아보기 위하여 카이제곱 테스트를 수행하였습니다.
그 결과 카이제곱 통계량은 1.664, 자유도는 3, p-value 는 0.6450이므로 Red, Black 간에 통계적으로 유의한 차이를 보이지 않습니다.
실제로 닮은 게 느껴집니까?
25% | 35% | 50% | 60% | 계 |
---|---|---|---|---|
12.4 | 20.7 | 44.4 | 22.5 | 100.0 |
정답률은 Red, Black 을 합하여 계산하는데, 44.4(%) 입니다.
25% | 35% | 45% | 60% | 계 | |
---|---|---|---|---|---|
Red | 36 | 67 | 226 | 31 | 360 |
Black | 24 | 78 | 226 | 32 | 360 |
계 | 60 | 145 | 452 | 63 | 720 |
Test statistic | df | P value |
---|---|---|
3.25 | 3 | 0.3546 |
Q4의 집계 결과가 Red, Black 간에 통계적으로 유의한 차이가 있는지 알아보기 위하여 카이제곱 테스트를 수행하였습니다.
그 결과 카이제곱 통계량은 3.250, 자유도는 3, p-value 는 0.3546이므로 Red, Black 간에 통계적으로 유의한 차이를 보이지 않습니다.
실제로 닮은 게 느껴집니까?
25% | 35% | 45% | 60% | 계 |
---|---|---|---|---|
8.3 | 20.1 | 62.8 | 8.8 | 100.0 |
정답률은 Red, Black 을 합하여 계산하는데, 62.8(%) 입니다.
황금기에 소득이 가장 많이 늘어난 계층은 하위 20%(1분위)이다. | 황금기에 소득증가율이 가장 높은 계층은 하위 20%(1분위)이다. | 신자유주의시기에 소득이 가장 많이 늘어난 계층은 하위 20%(1분위)이다. | 신자유주의시기에 소득증가율이 가장 높은 계층은 하위 20%(1분위)이다. | 계 | |
---|---|---|---|---|---|
Red | 61 | 221 | 40 | 38 | 360 |
Black | 62 | 217 | 52 | 29 | 360 |
계 | 123 | 438 | 92 | 67 | 720 |
Test statistic | df | P value |
---|---|---|
2.819 | 3 | 0.4204 |
Q5의 집계 결과가 Red, Black 간에 통계적으로 유의한 차이가 있는지 알아보기 위하여 카이제곱 테스트를 수행하였습니다.
그 결과 카이제곱 통계량은 2.819, 자유도는 3, p-value 는 0.4204이므로 Red, Black 간에 통계적으로 유의한 차이를 보이고 있습니다.
실제로 닮은 게 느껴집니까?
황금기에 소득이 가장 많이 늘어난 계층은 하위 20%(1분위)이다. | 황금기에 소득증가율이 가장 높은 계층은 하위 20%(1분위)이다. | 신자유주의시기에 소득이 가장 많이 늘어난 계층은 하위 20%(1분위)이다. | 신자유주의시기에 소득증가율이 가장 높은 계층은 하위 20%(1분위)이다. | 계 |
---|---|---|---|---|
17.1 | 60.8 | 12.8 | 9.3 | 100.0 |
정답률은 Red, Black 을 합하여 계산하는데, 60.8(%) 입니다.
지천태 | 천지비 | 풍뢰익 | 산택손 | 계 | |
---|---|---|---|---|---|
Red | 56 | 210 | 51 | 43 | 360 |
Black | 56 | 201 | 69 | 34 | 360 |
계 | 112 | 411 | 120 | 77 | 720 |
Test statistic | df | P value |
---|---|---|
3.949 | 3 | 0.267 |
Q6의 집계 결과가 Red, Black 간에 통계적으로 유의한 차이가 있는지 알아보기 위하여 카이제곱 테스트를 수행하였습니다.
그 결과 카이제곱 통계량은 3.949, 자유도는 3, p-value 는 0.2670이므로 Red, Black 간에 통계적으로 유의한 차이를 보이지 않습니다.
실제로 닮은 게 느껴집니까?
지천태 | 천지비 | 풍뢰익 | 산택손 | 계 |
---|---|---|---|---|
15.6 | 57.1 | 16.7 | 10.7 | 100.0 |
정답률은 Red, Black 을 합하여 계산하는데, 57.1(%) 입니다.
이득은 확고히 하고, 손실은 피하고자 하는 보통 사람들의 심리적 경향을 확인합니다.
기대값을 계산해 보면 어는 게임을 선택하더라도 상관이 없어야 하는 데 이득 게임인 Red에서는 조금 덜 받더라도이득을 확고히 하려는 게임(A)에, 손실 게임인 Black에서는 손실을 확률적으로 줄이려는 게임(B)을 많이 선택하여 Kahneman과 Tversky의 Prospect Theory 에 부합하는 결과를 보여줍니다.
확률 100% | 확률 90% | 계 | |
---|---|---|---|
이득 게임 | 272 | 88 | 360 |
손실 게임 | 130 | 230 | 360 |
계 | 402 | 318 | 720 |
Test statistic | df | P value |
---|---|---|
112 | 1 | 3.62e-26 * * * |
Q7의 Red 는 100%의 확률로 900달러를 따거나 90%의 확률로 1000달러를 따는 게임 중에서 많은 사람들이 900달러를 확고하게 갖는 것이 혹시라도 모를 10%의 확률로 아무 것도 안 생기는 것보다 선호한다는 것을 보여줍니다.
Black 은 100%의 확률로 900달러를 잃거나 90%의 확률로 1000달러를 잃는 게임 중에서는 손실을 확고히 하기 보다 10%의 확률이라도 1000달러의 손실을 회피하는 게임을 선호한다는 것을 보여줍니다.
이론적으로는 손실 게임이나 이득 게임이나 기대값이 같기 때문에 100% 게임이나 90% 게임을 비슷하게 선택할 것으로 생각되지만 우리의 실제 행동은 전혀 그렇지 않다는 것을 보여 줍니다.
여기서 수행하고 있는 카이제곱 테스트는 이득은 확고히 하고 손실은 운에 기대어 회피하려는 경향을 잘 보여 줍니다.
그 결과 카이제곱 통계량은 111.97, 자유도는 1, p-value 는 3.6e-26 합리적 행동을 한다는 가설로부터 어떤 선택도 비슷하게 나오리라는 기대와는 통계적으로 매우, 매우 유의하게 차이나는 결과를 보여줍니다.
확률 100% | 확률 90% | 계 | |
---|---|---|---|
이득 게임 | 75.6 | 24.4 | 100.0 |
손실 게임 | 36.1 | 63.9 | 100.0 |
이를 백분율로 살펴보면 이득 게임인 Red에서 100% 확률로 900달러를 따려는 사람들의 백분율, 75.6(%)은 90% 확률로 1000달러를 따려는 사람들의 백분율, 24.4(%) 보다 월등히 높습니다.반면 손실 게임인 Black에서 100% 확률로 900달러를 잃겠다는 사람들의 백분율, 36.1(%)은 90%의 확률로 1000달러를 잃겠다는 사람들의 백분율, 63.9(%) 보다 적습니다.
이득을 확고히 하려는 사람들의 백분율보다 손실을 운에 기대어 회피하려는 사람들의 백분울이 월등히 적은 것을 관찰할 수 있습니다.
Mosaic Plot 은 이 집계결과를 시각적으로 잘 보여줍니다.
이득을 확고히 하려는 사람들의 백분율이 손실을 운에 기대어 회피하려는 사람들의 백분율보다 월등히 많은 것을 쉽게 파악할 수 있습니다.
[0,1] | (1,2] | (2,3] | (3,4] | (4,5] | (5,6] | (6,7] | (7,8] | (8,9] | (9,10] | (10,11] | (11,12] | (12,13] | (13,14] | 계 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Red | 122 | 29 | 6 | 5 | 13 | 9 | 9 | 36 | 22 | 20 | 17 | 13 | 25 | 34 | 360 |
Black | 118 | 31 | 10 | 6 | 6 | 10 | 19 | 35 | 18 | 21 | 13 | 18 | 29 | 26 | 360 |
계 | 240 | 60 | 16 | 11 | 19 | 19 | 28 | 71 | 40 | 41 | 30 | 31 | 54 | 60 | 720 |
분포표로부터 두 가지 문제를 살펴보겠습니다.
첫째, 날마다 고르게 제출하는가?
둘쨰, Red, Black 간에 통게적으로 유의한 차이가 있는가?
각 문제를 살펴보기 위해서는 분포표의 일부분을 대상으로 카이제곱 테스트를 수행합니다.
[0,1] | (1,2] | (2,3] | (3,4] | (4,5] | (5,6] | (6,7] | (7,8] | (8,9] | (9,10] | (10,11] | (11,12] | (12,13] | (13,14] |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
240 | 60 | 16 | 11 | 19 | 19 | 28 | 71 | 40 | 41 | 30 | 31 | 54 | 60 |
Test statistic | df | P value |
---|---|---|
831.3 | 13 | 2.701e-169 * * * |
날마다 고르게 제출하는지 알아 보았습니다.
분포표의 “계”행에서 ’계’열을 제외하고 카이제곱테스트를 수행합니다.
분포표 만으로도 쉽게 파악할 수 있지만 카이제곱테스트가 명확히 해 줍니다.
카이제곱 통계량은 831.317, 자유도는 13.00, p-value 는 2.7e-169 이므로 날짜별로 고르게 제출하지 않고 있음을 강력히 시사합니다.
막대그래프로 살펴 보겠습니다.
[0,1] | (1,2] | (2,3] | (3,4] | (4,5] | (5,6] | (6,7] | (7,8] | (8,9] | (9,10] | (10,11] | (11,12] | (12,13] | (13,14] | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Red | 122 | 29 | 6 | 5 | 13 | 9 | 9 | 36 | 22 | 20 | 17 | 13 | 25 | 34 |
Black | 118 | 31 | 10 | 6 | 6 | 10 | 19 | 35 | 18 | 21 | 13 | 18 | 29 | 26 |
Test statistic | df | P value |
---|---|---|
10.57 | 13 | 0.6469 |
제출시간의 분포가 Red, Black 간에 닮았는지 알아 보았습니다.
이번에는 분포표의 첫번쨰와 두번쨰 행, ’계’열을 제외한 나머지 열에 대해서 카이제곱테스트를 수행합니다.
카이제곱 통계량은 10.57, 자유도는 13, p-value 는 0.6469 이므로 제출 시간의 분포는 Red, Black 간에 통계적으로 유의한 차이가 관찰되지 않습니다.
이 사실을 Mosaic Plot 을 이용하여 시각적으로 살펴보겠습니다.
닮았다고 느껴지나요?