준비한 자료는 E. Saez 교수의 홈페이지에 있는 TabFig2013prel.xls 인데 이를 약간의 작업을 거쳐 R에서 불러들이기 편하게 고쳐놓았다.
load("US_top_income_share_2013.rda")
ls()
## [1] "add12_13" "P99_99.9"
## [3] "P99.5_99.99" "top.income.shares"
## [5] "top.income.shares.2" "US.top.income.shares"
## [7] "US.top.income.shares.13" "v"
## [9] "year"
작업을 마친 자료파일은 US.top.income.shares.13
이며, 이 자료의 구조와 앞의 몇 열의 값은 다음과 같다.
str(US.top.income.shares.13)
## 'data.frame': 101 obs. of 14 variables:
## $ year : int 1913 1914 1915 1916 1917 1918 1919 1920 1921 1922 ...
## $ P90_100 : num NA NA NA NA 40.5 ...
## $ P95_100 : num NA NA NA NA 30.6 ...
## $ P99_100 : num 18 18.2 17.6 19.3 17.7 ...
## $ P99.5_100 : num 14.7 15.1 14.6 16.4 14.3 ...
## $ P99.9_100 : num 8.62 8.6 9.22 10.51 8.4 ...
## $ P99.99_100 : num 2.76 2.73 4.36 4.78 3.37 2.45 2.29 1.66 1.69 2.27 ...
## $ P90_95 : num NA NA NA NA 9.87 ...
## $ P95_99 : num NA NA NA NA 12.9 ...
## $ P99_99.5 : num 3.23 3.08 3 2.94 3.39 3.53 3.77 3.69 3.94 4 ...
## $ P99.5_99.9 : num 6.11 6.48 5.36 5.86 5.94 5.71 6.01 5.79 6.1 6.42 ...
## $ P99.9_99.99: num 5.86 5.87 4.86 5.73 5.04 4.26 4.34 3.69 3.91 4.36 ...
## $ P99.5_99.99: num 12 12.3 10.2 11.6 11 ...
## $ P99_99.9 : num 9.34 9.56 8.36 8.8 9.34 ...
US.top.income.shares.13[, 1:8]
## year P90_100 P95_100 P99_100 P99.5_100 P99.9_100 P99.99_100 P90_95
## 1 1913 NA NA 17.96 14.73 8.62 2.76 NA
## 2 1914 NA NA 18.16 15.08 8.60 2.73 NA
## 3 1915 NA NA 17.58 14.58 9.22 4.36 NA
## 4 1916 NA NA 19.31 16.37 10.51 4.78 NA
## 5 1917 40.51 30.64 17.74 14.34 8.40 3.37 9.87
## 6 1918 40.11 29.49 15.96 12.43 6.72 2.45 10.61
## 7 1919 40.32 30.17 16.41 12.64 6.63 2.29 10.15
## 8 1920 39.01 28.32 14.83 11.14 5.36 1.66 10.69
## 9 1921 43.18 30.80 15.64 11.70 5.60 1.69 12.38
## 10 1922 43.72 31.94 17.06 13.06 6.64 2.27 11.78
## 11 1923 41.46 29.78 15.64 11.91 5.91 2.00 11.68
## 12 1924 44.41 32.11 17.42 13.40 6.79 2.32 12.29
## 13 1925 46.35 35.01 20.24 15.86 8.52 3.31 11.34
## 14 1926 45.71 34.61 19.91 15.55 8.46 3.36 11.10
## 15 1927 46.67 35.69 21.03 16.60 9.25 3.75 10.98
## 16 1928 49.29 38.56 23.94 19.40 11.54 5.02 10.73
## 17 1929 46.71 36.48 22.35 18.07 10.91 4.99 10.23
## 18 1930 43.87 32.06 17.22 13.20 7.07 2.84 11.80
## 19 1931 44.54 31.23 15.50 11.57 5.89 2.25 13.31
## 20 1932 46.37 32.67 15.56 11.62 5.97 1.99 13.70
## 21 1933 45.60 33.19 16.46 12.46 6.61 2.34 12.42
## 22 1934 45.78 33.71 16.40 12.30 6.13 2.07 12.07
## 23 1935 44.49 32.28 16.68 12.63 6.39 2.19 12.21
## 24 1936 46.59 34.64 19.29 14.86 7.57 2.54 11.96
## 25 1937 44.23 32.27 17.15 13.02 6.49 2.17 11.96
## 26 1938 44.07 31.34 15.75 11.78 5.88 2.19 12.73
## 27 1939 45.52 32.28 16.18 12.06 5.87 1.96 13.24
## 28 1940 45.29 32.22 16.48 12.33 6.01 2.04 13.07
## 29 1941 41.93 29.99 15.79 11.86 5.81 1.98 11.94
## 30 1942 36.13 25.80 13.43 10.07 4.81 1.55 10.32
## 31 1943 33.69 24.08 12.31 9.15 4.26 1.24 9.61
## 32 1944 32.51 22.77 11.28 8.26 3.76 1.16 9.75
## 33 1945 34.42 24.79 12.52 9.14 4.16 1.26 9.63
## 34 1946 36.70 26.77 13.28 9.61 4.39 1.47 9.93
## 35 1947 34.35 24.68 11.96 8.61 3.92 1.30 9.67
## 36 1948 35.01 25.06 12.24 8.90 4.06 1.31 9.96
## 37 1949 34.75 24.51 11.73 8.48 3.83 1.24 10.25
## 38 1950 35.56 25.53 12.82 9.37 4.39 1.22 10.03
## 39 1951 34.22 24.20 11.79 8.53 3.89 1.28 10.02
## 40 1952 33.21 23.07 10.79 7.74 3.43 1.09 10.14
## 41 1953 32.31 22.01 9.90 7.02 3.06 0.97 10.29
## 42 1954 33.64 23.30 10.77 7.71 3.49 1.17 10.34
## 43 1955 33.94 23.60 11.06 7.96 3.71 1.32 10.34
## 44 1956 33.46 23.13 10.67 7.70 3.49 1.20 10.34
## 45 1957 32.99 22.60 10.16 7.23 3.18 1.05 10.38
## 46 1958 33.56 22.93 10.21 7.27 3.22 1.08 10.63
## 47 1959 34.00 23.39 10.65 7.72 3.45 1.19 10.61
## 48 1960 33.48 22.57 10.03 7.13 3.25 1.17 10.90
## 49 1961 34.25 23.50 10.64 7.66 3.65 1.38 10.75
## 50 1962 33.70 22.81 9.95 7.06 3.19 1.16 10.90
## 51 1963 33.78 22.84 9.92 7.00 3.15 1.15 10.94
## 52 1964 34.42 23.50 10.48 7.39 3.37 1.30 10.92
## 53 1965 34.78 23.88 10.89 7.73 3.66 1.49 10.90
## 54 1966 33.67 22.92 10.18 7.22 3.39 1.29 10.75
## 55 1967 34.44 23.70 10.74 7.67 3.68 1.42 10.74
## 56 1968 34.85 24.15 11.21 8.14 4.02 1.61 10.70
## 57 1969 33.93 23.08 10.35 7.45 3.69 1.56 10.85
## 58 1970 32.63 21.66 9.03 6.25 2.78 1.00 10.96
## 59 1971 33.34 22.26 9.40 6.56 2.99 1.11 11.08
## 60 1972 33.59 22.52 9.64 6.78 3.13 1.18 11.07
## 61 1973 33.33 22.21 9.16 6.30 2.76 0.94 11.12
## 62 1974 33.31 22.12 9.12 6.31 2.73 0.88 11.19
## 63 1975 33.43 21.98 8.87 6.07 2.56 0.85 11.45
## 64 1976 33.41 21.97 8.86 6.07 2.59 0.86 11.44
## 65 1977 33.58 22.12 9.03 6.22 2.71 0.92 11.46
## 66 1978 33.49 22.04 8.95 6.16 2.65 0.86 11.45
## 67 1979 34.21 22.93 9.96 7.11 3.44 1.37 11.28
## 68 1980 34.63 23.17 10.02 7.15 3.41 1.28 11.47
## 69 1981 34.54 23.04 10.02 7.23 3.57 1.37 11.51
## 70 1982 35.33 23.83 10.80 7.97 4.18 1.73 11.50
## 71 1983 36.38 24.85 11.56 8.63 4.62 1.88 11.53
## 72 1984 36.74 25.29 11.99 9.04 4.98 2.15 11.45
## 73 1985 37.56 26.12 12.67 9.63 5.32 2.24 11.44
## 74 1986 40.63 29.49 15.92 12.62 7.40 3.34 11.14
## 75 1987 38.25 26.54 12.66 9.45 4.90 1.91 11.71
## 76 1988 40.63 29.29 15.49 12.09 6.80 2.86 11.34
## 77 1989 40.08 28.55 14.49 11.08 6.00 2.45 11.54
## 78 1990 39.98 28.41 14.33 10.94 5.82 2.33 11.57
## 79 1991 39.55 27.72 13.36 9.99 5.12 1.96 11.82
## 80 1992 40.82 29.06 14.67 11.20 6.03 2.46 11.76
## 81 1993 40.68 28.83 14.24 10.78 5.73 2.32 11.85
## 82 1994 40.78 28.89 14.23 10.73 5.70 2.29 11.89
## 83 1995 42.11 30.22 15.23 11.57 6.21 2.46 11.89
## 84 1996 43.48 31.76 16.69 12.91 7.24 3.06 11.73
## 85 1997 44.64 33.14 18.02 14.16 8.19 3.53 11.50
## 86 1998 45.39 34.10 19.09 15.18 9.00 3.92 11.30
## 87 1999 46.47 35.22 20.04 16.04 9.62 4.21 11.25
## 88 2000 47.61 36.61 21.52 17.46 10.88 5.07 11.00
## 89 2001 44.82 33.35 18.22 14.32 8.37 3.70 11.47
## 90 2002 43.82 32.07 16.87 13.04 7.34 3.14 11.75
## 91 2003 44.53 32.77 17.53 13.67 7.87 3.49 11.76
## 92 2004 46.40 34.95 19.75 15.74 9.47 4.34 11.45
## 93 2005 48.33 37.16 21.92 17.77 10.98 5.13 11.18
## 94 2006 49.32 38.08 22.82 18.62 11.59 5.46 11.24
## 95 2007 49.74 38.67 23.50 19.31 12.28 6.04 11.07
## 96 2008 48.23 36.52 20.95 16.87 10.40 5.03 11.71
## 97 2009 46.50 34.11 18.12 14.15 8.30 3.89 12.39
## 98 2010 48.04 35.85 19.86 15.83 9.66 4.78 12.19
## 99 2011 48.13 35.89 19.65 15.55 9.27 4.32 12.24
## 100 2012 50.60 38.82 22.83 18.59 11.71 5.81 11.78
## 101 2013 48.89 36.63 20.08 15.89 9.47 4.48 12.27
이 중에서 소득 상위 10%(P90_100
)를 상위 1%(P99_100
), 차상위 4%(P95_99
), 차차상위 5%(P90_95
)로 나누어 그 몫의 변화를 살펴보자. 우선 밋밋하게 상위 1%의 소득 점유율 변화만 그려보면,
plot(P99_100~year,data=US.top.income.shares.13)
최소한의 정보를 주기 위하여 각 자료의 최대값, 최소값을 고려하여 y-축의 범위를 ylim=c(5,25)
로 설정하고, x-축의 눈금은 비워둔다. 점들을 선으로 이어주고, 점은 다시 삼각형 모양으로 바꾼다.
plot(P99_100~year,data=US.top.income.shares.13, xlab="연도", ylab="소득점유(%)", ylim=c(5,25), xaxt="n", type="b",pch=17)
이제 x-축에는 연도를 10년 단위로 표시하고, lines()
를 이용하여 차상위4%와 차차상위5%의 소득 점유율 변화를 함께 그린다.
plot(P99_100~year,data=US.top.income.shares.13, xlab="연도", ylab="소득점유(%)", ylim=c(5,25), xaxt="n", type="b",pch=17)
axis(side=1, at=seq(1910, 2010, by=10), labels=seq(1910, 2010, by=10))
lines(P95_99~year,data=US.top.income.shares.13,type="b", pch=17, col="red")
lines(P90_95~year,data=US.top.income.shares.13,type="b", pch=17, col="blue")
도표의 가독성을 높이기 위하여 x-축과 y-축을 가로지르는 격자를 설치한다.
plot(P99_100~year,data=US.top.income.shares.13, xlab="연도", ylab="소득점유(%)", ylim=c(5,25), xaxt="n", type="b",pch=17)
axis(side=1, at=seq(1910, 2010, by=10), labels=seq(1910, 2010, by=10))
lines(P95_99~year,data=US.top.income.shares.13,type="b", pch=17, col="red")
lines(P90_95~year,data=US.top.income.shares.13,type="b", pch=17, col="blue")
abline(h=seq(5,25, by=5), lty=2)
abline(v=seq(1910, 2010, by=10), lty=2)
TabFig2013prel.xls의 Table 0 시트에 나와 있는 정보를 활용하여 범례를 만든다.
plot(P99_100~year,data=US.top.income.shares.13, xlab="연도", ylab="소득점유(%)", ylim=c(5,25), xaxt="n", type="b",pch=17)
axis(side=1, at=seq(1910, 2010, by=10), labels=seq(1910, 2010, by=10))
lines(P95_99~year,data=US.top.income.shares.13,type="b", pch=17, col="red")
lines(P90_95~year,data=US.top.income.shares.13,type="b", pch=17, col="blue")
abline(h=seq(5,25, by=5), lty=2)
abline(v=seq(1910, 2010, by=10), lty=2)
legend(x=1945, y=25, legend=c("99-100%:$391,960 이상(2013년 기준)","95-99%:$165,500-$392,000","90-95%:$116,500-$165,500"), pch=17, col=c("black", "red", "blue"))
메인 타이틀을 입력하고, 상위1%의 소득점유율이 최고에 달했던 연도를 표시한다.
plot(P99_100~year,data=US.top.income.shares.13, xlab="연도", ylab="소득점유(%)", ylim=c(5,25), xaxt="n", type="b",pch=17)
axis(side=1, at=seq(1910, 2010, by=10), labels=seq(1910, 2010, by=10))
lines(P95_99~year,data=US.top.income.shares.13,type="b", pch=17, col="red")
lines(P90_95~year,data=US.top.income.shares.13,type="b", pch=17, col="blue")
abline(h=seq(5,25, by=5), lty=2)
abline(v=seq(1910, 2010, by=10), lty=2)
legend(x=1945, y=25, legend=c("99-100%:$391,960 이상(2013년 기준)","95-99%:$165,500-$392,000","90-95%:$116,500-$165,500"), pch=17, col=c("black", "red", "blue"))
title(main="미국 소득 상위 10%의 점유율 분할")
text(x=c(1928, 2007), y=c(24, 23.5), labels=c("1928", "2007"), pos=3)
역사적으로 각 시기를 어떻게 부르고 있는지 텍스트를 추가한다.
plot(P99_100~year,data=US.top.income.shares.13, xlab="연도", ylab="소득점유(%)", ylim=c(5,25), xaxt="n", type="b",pch=17)
axis(side=1, at=seq(1910, 2010, by=10), labels=seq(1910, 2010, by=10))
lines(P95_99~year,data=US.top.income.shares.13,type="b", pch=17, col="red")
lines(P90_95~year,data=US.top.income.shares.13,type="b", pch=17, col="blue")
abline(h=seq(5,25, by=5), lty=2)
abline(v=seq(1910, 2010, by=10), lty=2)
legend(x=1945, y=25, legend=c("99-100%:$391,960 이상(2013년 기준)","95-99%:$165,500-$392,000","90-95%:$116,500-$165,500"), pch=17, col=c("black", "red", "blue"))
title(main="미국 소득 상위 10%의 점유율 분할")
text(x=c(1928, 2007), y=c(24, 23.5), labels=c("1928", "2007"), pos=3)
text(x=1935, y=22, label="대공황", cex=2.0, col="red")
text(x=1960, y=8, label="대번영", cex=2.0, col="red")
text(x=2012, y=17.5, label="대침체", cex=2.0, col="red")