목차

Part I. 심슨의 역설(Simpson's paradox)

Part II. heatmap으로 본 22대총선, 보수언론

Part III. 시각적 왜곡과 지리적 편향 해결

Part IV. honeycomb으로 본 22대총선, 중도언론

Part V. 참고문헌

Part I. Simpson's paradox

  • 개념: 확률 및 통계학에서 여러 데이터 그룹에서 추세가 나타나지만 그룹을 합치면 사라지거나 반전되는 현상
  • 배경: Edward H. Simpson은 1951년 기술 논문에서 이 현상을 처음 기술[1], Karl Pearson(1899)과 Udny Yule(1903)은 이전에 유사한 효과를 언급[2][3]
  • 동의어: Simpson’s paradox, Yule–Simpson effect, the amalgamation paradox, the reversal paradox
  • 사례 1. 캘리포니아 대학교 버클리의 대학원 입학에서 성 편견: 1973년 가을 입학 수치는 전체 통계로 보면남성 지원자가 여성보다 입학할 가능성이 현저하게 높았으나, 학과별로 여성이 오히려 입학할 가능성이 높았음[4][5]
  • 사례 2. 프로 야구 선수들의 타율: 한 선수가 여러 해 동안 매년 다른 선수보다 타율이 높지만, 그 해 전체에서 타율이 낮은 경우가 있습니다. 이러한 현상은 해마다 타석 수에 큰 차이가 있을 때 발생[6][7]

Part II. 22대총선 heatmap, 보수언론

Part III. 시각적 왜곡문제와 해결

  • 시각적 왜곡 문제: 이 문제는 심슨의 역설과는 거리가 있지만, 시각화에서 당선자가 해당되는 지역을 기준으로 지도를 시각화하여 데이터 해석의 왜곡을 초래
  • 지역별 면적의 왜곡 해결 방안: 면적을 인구나 의석 수에 비례하도록 조정한 카토그램(Cartogram) 등을 사용
    • 예: 도시 지역을 더 크게 표시하고, 농촌 지역을 축소.히트맵 대신 막대그래프 사용
    • 정당별 의석 수를 막대그래프로 표시하여, 각 정당의 의석 수 차이를 직관적으로 시각화
    • 정확한 문구 첨부: 지도 아래에 민주당 162석, 국민의힘 90석이라는 수치를 강조하여 실제 의석 수를 명확히 전달

Part IV. 22대총선 honeycomb, 중도언론

Part V. 참고문헌

[1] Simpson, Edward H. (1951). "The Interpretation of Interaction in Contingency 
Tables". Journal of the Royal Statistical Society, Series B. 13 (2): 238–241.
doi:10.1111/j.2517-6161.1951.tb00088.x.
[2] Pearson, Karl; Lee, Alice; Bramley-Moore, Lesley (1899). "Genetic 
(reproductive) selection: Inheritance of fertility in man, and of fecundity in 
thoroughbred racehorses".\\ Philosophical Transactions of the Royal Society A. 
192: 257–330. doi:10.1098/rsta.1899.0006.
[3] G. U. Yule (1903). "Notes on the Theory of Association of Attributes in 
Statistics". Biometrika. 2 (2): 121–134. doi:10.1093/biomet/2.2.121.
[4] David Freedman, Robert Pisani, and Roger Purves (2007), Statistics 
(4th edition), W. W. Norton. ISBN 0-393-92972-8.
[5] P.J. Bickel, E.A. Hammel and J.W. O'Connell (1975). "Sex Bias in Graduate 
Admissions: Data From Berkeley" (PDF). Science. 187 (4175): 398–404. Bibcode:
1975Sci...187..398B. doi:10.1126/science.187.4175.398. PMID 17835295. S2CID 
15278703. Archived (PDF) from the original on 2016-06-04.
[6] Ken Ross. "A Mathematician at the Ballpark: Odds and Probabilities for 
Baseball Fans (Paperback)" Pi Press, 2004. ISBN 0-13-147990-3. 12–13
[7] Statistics available from Baseball-Reference.com: Data for Derek Jeter; 
Data for David Justice.