Red, Black을 잘못 표시한 사람들

랜덤화출석부에 있는 Red, Black 과 실제 구글예습퀴즈에 올린 Red, Black 이 여전히 다른 사람들이 있어서 파악해 보았습니다. Red를 Black 이라고 한 사람의 수효(10명)와 Black을 Red 라고 한 사람의 수효(11명)가 매우 닮았습니다. 요약의 일관성을 기하기 위하여 기대값과 표준오차를 계산해 봅니다. 21명을 랜덤하게 둘로 나누면 \(21/2\pm\sqrt21/2\)명 = 11.5 \(\pm\) 2.3명 이 나오는데 굳이 이 계산을 하지 않아도 더 이상 닮을 방법이 없다는 것을 쉽게 알 수 있습니다.

  Red(구글예습퀴즈) Black(구글예습퀴즈)
Red(랜덤화출석부) 381 10
Black(랜덤화출석부) 11 387

퀴즈 응답 비교

Q1. 국세와 지방세 비중

국세와 지방세 비중(집계표)

  78:22 77:23 76:24 75:25 74:26
Red 31 42 52 46 221 392
Black 13 57 54 37 236 397
44 99 106 83 457 789
Pearson’s Chi-squared test: .
Test statistic df P value
11.11 4 0.02534 *

국세와 지방세 비중(%)

78:22 77:23 76:24 75:25 74:26
5.6 12.5 13.4 10.5 57.9 100.0

Q2. 조세부담률

조세부담률(집계표)

  10% 15% 20% 25% 30%
Red 8 54 283 36 11 392
Black 18 27 293 47 12 397
26 81 576 83 23 789
Pearson’s Chi-squared test: .
Test statistic df P value
14.49 4 0.005885 * *

조세부담률(%)

10% 15% 20% 25% 30%
3.3 10.3 73.0 10.5 2.9 100.0

Q3. OECD 국민부담률

OECD 국민부담률(집계표)

  조세 뿐 아니라 사회보장기여금을 포함하는 모든 강제적 납부액을 명목 GDP 대비 비율로 표시한 것이다 우리나라의 국민부담률은 2010년 22.4%에서 꾸준히 상승하여 2020년 27.9%에 달하였다. OECD평균은 2010년 31.6%에서 2020년 33.5%까지 상승하였다. 프랑스와 스웨덴의 국민부담률은 꾸준히 40%를 넘고 있다. 미국의 국민부담률은 우리나라의 국민부담률보다 항상 높은 수준을 유지하고 있다.
Red 25 51 39 56 221 392
Black 26 59 44 37 231 397
51 110 83 93 452 789
Pearson’s Chi-squared test: .
Test statistic df P value
4.974 4 0.29

OECD 국민부담률(%)

조세 뿐 아니라 사회보장기여금을 포함하는 모든 강제적 납부액을 명목 GDP 대비 비율로 표시한 것이다 우리나라의 국민부담률은 2010년 22.4%에서 꾸준히 상승하여 2020년 27.9%에 달하였다. OECD평균은 2010년 31.6%에서 2020년 33.5%까지 상승하였다. 프랑스와 스웨덴의 국민부담률은 꾸준히 40%를 넘고 있다. 미국의 국민부담률은 우리나라의 국민부담률보다 항상 높은 수준을 유지하고 있다.
6.5 13.9 10.5 11.8 57.3 100.0

Q4. 과세대상 근로소득 1,200만 원

과세대상 근로소득 1,200만 원(집계표)

  952만 명 779만 명 166만 명 38만 명
Red 205 93 72 22 392
Black 235 81 66 15 397
440 174 138 37 789
Pearson’s Chi-squared test: .
Test statistic df P value
4.427 3 0.2189

과세대상 근로소득 1,200만 원(%)

952만 명 779만 명 166만 명 38만 명
55.8 22.1 17.5 4.7 100.0

Q5. 소득세 실효세율

소득세 실효세율(집계표)

  0.2% 15.1% 37.4% 5.9%
Red 14 101 39 238 392
Black 14 85 54 244 397
28 186 93 482 789
Pearson’s Chi-squared test: .
Test statistic df P value
3.839 3 0.2794

소득세 실효세율(%)

0.2% 15.1% 37.4% 5.9%
3.5 23.6 11.8 61.1 100.0

Q6. 기업규모별 과세 현황

기업규모별 과세 현황(집계표)

  중소기업이 신고법인수의 91%를 차지하는 데 부담하는 세액은 24.6%이다 중견기업은 신고법인수의 0.5%를 차지하는 데 부담하는 세액은 8.7%이다 상호출자제한기업은 신고법인수의 0.1%를 차지하는 데 부담하는 세액은 25.5%이다 그 외 대기업은 신고법인수의 8.3%를 차지하는 데 부담하는 세액은 41.2%이다 법인당 평균세액은 상호출자제한기업 > 그외 대기업 > 중견기업 > 중소기업의 순서로 많이 부담하였다.
Red 34 53 64 49 192 392
Black 30 50 52 52 213 397
64 103 116 101 405 789
Pearson’s Chi-squared test: .
Test statistic df P value
2.725 4 0.6048

기업규모별 과세 현황(%)

중소기업이 신고법인수의 91%를 차지하는 데 부담하는 세액은 24.6%이다 중견기업은 신고법인수의 0.5%를 차지하는 데 부담하는 세액은 8.7%이다 상호출자제한기업은 신고법인수의 0.1%를 차지하는 데 부담하는 세액은 25.5%이다 그 외 대기업은 신고법인수의 8.3%를 차지하는 데 부담하는 세액은 41.2%이다 법인당 평균세액은 상호출자제한기업 > 그외 대기업 > 중견기업 > 중소기업의 순서로 많이 부담하였다.
8.1 13.1 14.7 12.8 51.3 100.0

국민부담률 적정 수준

Q7. 아일랜드와 OECD 평균

질문 내용에 의도하는 바를 담으면 어떨까요? OECD 국가 중 국민부담률이 매우 낮은 편인 아일랜드의 사례를 들어서 감세정책이 가져온 긍정적적인 효과에 대해서 설명하고 우리나라의 바람직한 조정 방향은 무엇이냐고 묻는 것을 Red, 감세 정책이 가져온 부정적인 효과에 대해서 설명하고 우리나라의 바람직한 조정 방향은 무엇이냐고 묻는 것을 Black 에 배치했을 때, 설명이 영향을 미치지 않으면 Red 와 Black에 차이가 없어야 할텐데 집계결과는 어떻게 나오고 있나요? 분명히 영향을 미치고 있는 것으로 보입니다. 통계적으로 매우 유의한 차이가 관찰되고 있습니다. 감세정책의 효과가 긍정적이라고 설명한 Red 에서는 낮춰야 한다는 응답이, 감세정책의 효과가 부정적이라고 설명한 Black 에서는 높여야 한다는 응답이 높게 나온 것을 볼 수 있고, 따라서 p-value 가 엄청나게 작은 값을 보여주고 있습니다.

Red

Black

집계표

  낮춰야 한다 높여야 한다 모름/무응답
Red(감세의 긍정적효과 설명) 175 124 93 392
Black(감세의 부정적 효과 설명) 75 201 121 397
250 325 214 789
Pearson’s Chi-squared test: .
Test statistic df P value
61.88 2 3.66e-14 * * *

% 비교

  낮춰야 한다 높여야 한다 모름/무응답
Red(감세의 긍정적효과 설명) 44.6 31.6 23.7 100.0
Black(감세의 부정적 효과 설명) 18.9 50.6 30.5 100.0

Mosaic Plot

제출 시간의 분포

과제 제출이 제출 기간 마지막 날에 몰린다는 것을 시각적으로 보여주고 싶어서 하나 추가하였습니다. 아직은 학기초라 덜 한데, 중반 이후가 되면 마지막 날, 그것도 오후2시부터 몰리는 현상을 관찰할 수 있습니다. 여기서조차 랜덤화 효과를 관찰할 수 있네요. p-value 에 유의해 주세요. 제출시간과 관련한 두 가지 현상에 대해서도 여러분의 생각을 들어보고 싶습니다. 첫째, 랜덤화 효과. 둘쨰, 마감날에 몰리는 현상.

일 단위 마감 시간으로부터 제출 시간의 분포

분포표 (Red, Black 은 닮았는가?)

일 단위
  [0,1] (1,2] (2,3] (3,4] (4,5] (5,6] (6,7] (7,8] (8,9] (9,10] (10,11] (11,12] (12,13] (13,14]
Red 69 44 22 31 17 16 15 45 38 25 34 17 11 8
Black 88 38 26 17 19 10 12 40 44 27 37 16 18 5
Pearson’s Chi-squared test: .
Test statistic df P value
12.3 13 0.503

막대그래프

Mosaic Plot