10주차 구글 예습 설문지 집계결과를 분석합니다.
Q1 ~ Q6에서는 랜덤화의 효과로 Red, Black 이 얼마나 닮았는지 알아봅니다.
Q7에서는 Prospect Theory 에서 이득은 확고히 하고 손실은 회피하려는 심리에 대해서 살펴봅니다.
제출시간의 분포가 날마다 고른지, Red, Black 간에는 닮았는지 알아봅니다.
| Red(구글예습퀴즈) | Black(구글예습퀴즈) | |
|---|---|---|
| Red(랜덤화출석부) | 276 | 3 |
| Black(랜덤화출석부) | 1 | 287 |
| 계 | 277 | 290 |
Red 로 응답한 인원은 277명, Black 에 응답한 인원은 290명입니다.
전체 응답인원 567 명을 랜덤하게 둘로 나눌 때 어느 한 쪽의 기대인원은 전체 응답인원의 절반인 283.5명이고, 표준오차는 전체 응답인원의 제곱근에 1/2을 곱해 준 11.9 명입니다.
따라서 Red, Black 각 그룹에 관찰된 인원은 기대인원으로부터 표준오차 범위 안에 들어갑니다. 랜덤화출석부에 있는 Red, Black 과 실제 구글설문에 올린 Red, Black 이 다른 사람들의 수효는 4명입니다. Red를 Black 이라고 한 사람이 3명, Black 을 Red 라고 한 사람이 1명입니다.
| 소득불평등이 심한 나라에서 건강 및 사회문제지수가 나쁘게 나온다. | 소득이 많은 나라에서 건강 및 사회문제지수가 나쁘게 나온다. | 소득불평등이 심하면 건강 및 사회문제지수가 나빠진다. | 소득이 많아지면 건강 및 사회문제지수가 나빠진다. | 계 | |
|---|---|---|---|---|---|
| Red | 179 | 40 | 54 | 4 | 277 |
| Black | 184 | 29 | 66 | 11 | 290 |
| 계 | 363 | 69 | 120 | 15 | 567 |
| Test statistic | df | P value |
|---|---|---|
| 2.958 | 2 | 0.2279 |
Q1의 집계 결과가 Red, Black 간에 통계적으로 유의한 차이가 있는지 알아보기 위하여 카이제곱 테스트를 수행하였습니다.
그 결과 카이제곱 통계량은 2.958, 자유도는 2 , p-value 는 0.2279이므로 Red, Black 간에 통계적으로 유의한 차이를 보이지 않습니다.
실제로 닮은 게 느껴집니까?
| 소득불평등이 심한 나라에서 건강 및 사회문제지수가 나쁘게 나온다. | 소득이 많은 나라에서 건강 및 사회문제지수가 나쁘게 나온다. | 소득불평등이 심하면 건강 및 사회문제지수가 나빠진다. | 소득이 많아지면 건강 및 사회문제지수가 나빠진다. | 계 |
|---|---|---|---|---|
| 64.0 | 12.2 | 21.2 | 2.6 | 100.0 |
정답률은 Red, Black 을 합하여 계산하는데, 64.0(%) 입니다.
| 대공황, 대침체, 대번영 | 대침체, 대공황, 대번영 | 대번영, 대공황, 대침체 | 대공황, 대번영, 대침체 | 계 | |
|---|---|---|---|---|---|
| Red | 62 | 28 | 28 | 159 | 277 |
| Black | 58 | 21 | 33 | 178 | 290 |
| 계 | 120 | 49 | 61 | 337 | 567 |
| Test statistic | df | P value |
|---|---|---|
| 2.318 | 3 | 0.5092 |
Q2의 집계 결과가 Red, Black 간에 통계적으로 유의한 차이가 있는지 알아보기 위하여 카이제곱 테스트를 수행하였습니다.
그 결과 카이제곱 통계량은 2.318, 자유도는 3, p-value 는 0.5092이므로 Red, Black 간에 통계적으로 유의한 차이를 보이지 않습니다.
실제로 닮은 게 느껴집니까?
| 대공황, 대침체, 대번영 | 대침체, 대공황, 대번영 | 대번영, 대공황, 대침체 | 대공황, 대번영, 대침체 | 계 |
|---|---|---|---|---|
| 21.2 | 8.6 | 10.8 | 59.4 | 100.0 |
정답률은 Red, Black 을 합하여 계산하는데, 59.4(%) 입니다.
| 25% | 35% | 50% | 60% | 계 | |
|---|---|---|---|---|---|
| Red | 44 | 39 | 113 | 81 | 277 |
| Black | 34 | 47 | 143 | 66 | 290 |
| 계 | 78 | 86 | 256 | 147 | 567 |
| Test statistic | df | P value |
|---|---|---|
| 6.778 | 3 | 0.07932 |
Q3의 집계 결과가 Red, Black 간에 통계적으로 유의한 차이가 있는지 알아보기 위하여 카이제곱 테스트를 수행하였습니다.
그 결과 카이제곱 통계량은 6.778, 자유도는 3, p-value 는 0.0793이므로 Red, Black 간에 통계적으로 유의한 차이를 보이지 않습니다.
실제로 닮은 게 느껴집니까?
| 25% | 35% | 50% | 60% | 계 |
|---|---|---|---|---|
| 13.8 | 15.2 | 45.1 | 25.9 | 100.0 |
정답률은 Red, Black 을 합하여 계산하는데, 45.1(%) 입니다.
| 25% | 35% | 45% | 60% | 계 | |
|---|---|---|---|---|---|
| Red | 36 | 40 | 179 | 22 | 277 |
| Black | 24 | 34 | 208 | 24 | 290 |
| 계 | 60 | 74 | 387 | 46 | 567 |
| Test statistic | df | P value |
|---|---|---|
| 4.851 | 3 | 0.183 |
Q4의 집계 결과가 Red, Black 간에 통계적으로 유의한 차이가 있는지 알아보기 위하여 카이제곱 테스트를 수행하였습니다.
그 결과 카이제곱 통계량은 4.851, 자유도는 3, p-value 는 0.1830이므로 Red, Black 간에 통계적으로 유의한 차이를 보이지 않습니다.
실제로 닮은 게 느껴집니까?
| 25% | 35% | 45% | 60% | 계 |
|---|---|---|---|---|
| 10.6 | 13.1 | 68.3 | 8.1 | 100.0 |
정답률은 Red, Black 을 합하여 계산하는데, 68.3(%) 입니다.
| 황금기에 소득이 가장 많이 늘어난 계층은 하위 20%(1분위)이다. | 황금기에 소득증가율이 가장 높은 계층은 하위 20%(1분위)이다. | 신자유주의시기에 소득이 가장 많이 늘어난 계층은 하위 20%(1분위)이다. | 신자유주의시기에 소득증가율이 가장 높은 계층은 하위 20%(1분위)이다. | 계 | |
|---|---|---|---|---|---|
| Red | 52 | 179 | 29 | 17 | 277 |
| Black | 45 | 198 | 21 | 26 | 290 |
| 계 | 97 | 377 | 50 | 43 | 567 |
| Test statistic | df | P value |
|---|---|---|
| 4.331 | 3 | 0.2279 |
Q5의 집계 결과가 Red, Black 간에 통계적으로 유의한 차이가 있는지 알아보기 위하여 카이제곱 테스트를 수행하였습니다.
그 결과 카이제곱 통계량은 4.331, 자유도는 3, p-value 는 0.2279이므로 Red, Black 간에 통계적으로 유의한 차이를 보이지 않습니다.
실제로 닮은 게 느껴집니까?
| 황금기에 소득이 가장 많이 늘어난 계층은 하위 20%(1분위)이다. | 황금기에 소득증가율이 가장 높은 계층은 하위 20%(1분위)이다. | 신자유주의시기에 소득이 가장 많이 늘어난 계층은 하위 20%(1분위)이다. | 신자유주의시기에 소득증가율이 가장 높은 계층은 하위 20%(1분위)이다. | 계 |
|---|---|---|---|---|
| 17.1 | 66.5 | 8.8 | 7.6 | 100.0 |
정답률은 Red, Black 을 합하여 계산하는데, 66.5(%) 입니다.
| 지천태 | 천지비 | 풍뢰익 | 산택손 | 계 | |
|---|---|---|---|---|---|
| Red | 52 | 162 | 38 | 25 | 277 |
| Black | 58 | 180 | 26 | 26 | 290 |
| 계 | 110 | 342 | 64 | 51 | 567 |
| Test statistic | df | P value |
|---|---|---|
| 3.248 | 3 | 0.355 |
Q6의 집계 결과가 Red, Black 간에 통계적으로 유의한 차이가 있는지 알아보기 위하여 카이제곱 테스트를 수행하였습니다.
그 결과 카이제곱 통계량은 3.248, 자유도는 3, p-value 는 0.3550이므로 Red, Black 간에 통계적으로 유의한 차이를 보이지 않습니다.
실제로 닮은 게 느껴집니까?
| 지천태 | 천지비 | 풍뢰익 | 산택손 | 계 |
|---|---|---|---|---|
| 19.4 | 60.3 | 11.3 | 9.0 | 100.0 |
정답률은 Red, Black 을 합하여 계산하는데, 60.3(%) 입니다.
이득은 확고히 하고, 손실은 피하고자 하는 보통 사람들의 심리적 경향을 확인합니다.
기대값을 계산해 보면 어는 게임을 선택하더라도 상관이 없어야 하는 데 이득 게임인 Red에서는 조금 덜 받더라도이득을 확고히 하려는 게임(A)에, 손실 게임인 Black에서는 손실을 확률적으로 줄이려는 게임(B)을 많이 선택하여 Kahneman과 Tversky의 Prospect Theory 에 부합하는 결과를 보여줍니다.
| 확률 100% | 확률 90% | 계 | |
|---|---|---|---|
| 이득 게임 | 189 | 88 | 277 |
| 손실 게임 | 78 | 212 | 290 |
| 계 | 267 | 300 | 567 |
| Test statistic | df | P value |
|---|---|---|
| 95.5 | 1 | 1.479e-22 * * * |
Q7의 Red 는 100%의 확률로 900달러를 따거나 90%의 확률로 1000달러를 따는 게임 중에서 많은 사람들이 900달러를 확고하게 갖는 것이 혹시라도 모를 10%의 확률로 아무 것도 안 생기는 것보다 선호한다는 것을 보여줍니다.
Black 은 100%의 확률로 900달러를 잃거나 90%의 확률로 1000달러를 잃는 게임 중에서는 손실을 확고히 하기 보다 10%의 확률이라도 1000달러의 손실을 회피하는 게임을 선호한다는 것을 보여줍니다.
이론적으로는 손실 게임이나 이득 게임이나 기대값이 같기 때문에 100% 게임이나 90% 게임을 비슷하게 선택할 것으로 생각되지만 우리의 실제 행동은 전혀 그렇지 않다는 것을 보여 줍니다.
여기서 수행하고 있는 카이제곱 테스트는 이득은 확고히 하고 손실은 운에 기대어 회피하려는 경향을 잘 보여 줍니다.
그 결과 카이제곱 통계량은 95.50, 자유도는 1, p-value 는 1.5e-22 합리적 행동을 한다는 가설로부터 어떤 선택도 비슷하게 나오리라는 기대와는 통계적으로 매우, 매우 유의하게 차이나는 결과를 보여줍니다.
| 확률 100% | 확률 90% | 계 | |
|---|---|---|---|
| 이득 게임 | 68.2 | 31.8 | 100.0 |
| 손실 게임 | 26.9 | 73.1 | 100.0 |
이를 백분율로 살펴보면 이득 게임인 Red에서 100% 확률로 900달러를 따려는 사람들의 백분율, 68.2(%)은 90% 확률로 1000달러를 따려는 사람들의 백분율, 31.8(%) 보다 월등히 높습니다.반면 손실 게임인 Black에서 100% 확률로 900달러를 잃겠다는 사람들의 백분율, 26.9(%)은 90%의 확률로 1000달러를 잃겠다는 사람들의 백분율, 73.1(%) 보다 적습니다.
이득을 확고히 하려는 사람들의 백분율보다 손실을 운에 기대어 회피하려는 사람들의 백분울이 월등히 적은 것을 관찰할 수 있습니다.
Mosaic Plot 은 이 집계결과를 시각적으로 잘 보여줍니다.
이득을 확고히 하려는 사람들의 백분율이 손실을 운에 기대어 회피하려는 사람들의 백분율보다 월등히 많은 것을 쉽게 파악할 수 있습니다.
| 14일 | 13일 | 12일 | 11일 | 10일 | 9일 | 8일 | 7일 | 6일 | 5일 | 4일 | 3일 | 2일 | 1일 | 계 | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Red | 130 | 18 | 10 | 8 | 7 | 5 | 8 | 23 | 16 | 10 | 8 | 12 | 13 | 9 | 277 |
| Black | 120 | 20 | 11 | 9 | 6 | 7 | 9 | 29 | 19 | 5 | 12 | 12 | 15 | 16 | 290 |
| 계 | 250 | 38 | 21 | 17 | 13 | 12 | 17 | 52 | 35 | 15 | 20 | 24 | 28 | 25 | 567 |
분포표로부터 두 가지 문제를 살펴보겠습니다.
첫째, 날마다 고르게 제출하는가?
둘째, Red, Black 간에 통계적으로 유의한 차이가 있는가?
각 문제를 살펴보기 위해서는 분포표의 일부분을 대상으로 카이제곱 테스트를 수행합니다.
| 14일 | 13일 | 12일 | 11일 | 10일 | 9일 | 8일 | 7일 | 6일 | 5일 | 4일 | 3일 | 2일 | 1일 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 250 | 38 | 21 | 17 | 13 | 12 | 17 | 52 | 35 | 15 | 20 | 24 | 28 | 25 |
| Test statistic | df | P value |
|---|---|---|
| 1206 | 13 | 8.161e-250 * * * |
날마다 고르게 제출하는지 알아 보았습니다.
분포표의 “계”행에서 ’계’열을 제외하고 카이제곱테스트를 수행합니다.
분포표 만으로도 쉽게 파악할 수 있지만 카이제곱테스트가 명확히 해 줍니다.
카이제곱 통계량은 1206.210, 자유도는 13.00, p-value 는 8.2e-250 이므로 날짜별로 고르게 제출하지 않고 있음을 강력히 시사합니다.
막대그래프로 살펴 보겠습니다.
| 14일 | 13일 | 12일 | 11일 | 10일 | 9일 | 8일 | 7일 | 6일 | 5일 | 4일 | 3일 | 2일 | 1일 | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Red | 130 | 18 | 10 | 8 | 7 | 5 | 8 | 23 | 16 | 10 | 8 | 12 | 13 | 9 |
| Black | 120 | 20 | 11 | 9 | 6 | 7 | 9 | 29 | 19 | 5 | 12 | 12 | 15 | 16 |
| Test statistic | df | P value |
|---|---|---|
| 6.305 | 13 | 0.9343 |
제출시간의 분포가 Red, Black 간에 닮았는지 알아 보았습니다.
이번에는 분포표의 첫번째와 두번째 행, ’계’열을 제외한 나머지 열에 대해서 카이제곱테스트를 수행합니다.
카이제곱 통계량은 6.31, 자유도는 13, p-value 는 0.9343 이므로 제출 시간의 분포는 Red, Black 간에 통계적으로 유의한 차이가 관찰되지 않습니다.
이 사실을 Mosaic Plot 을 이용하여 시각적으로 살펴보겠습니다.
닮았다고 느껴지나요?