Data Preparation

준비한 자료는 E. Saez 교수의 홈페이지에 있는 TabFig2013prel.xls 인데 이를 약간의 작업을 거쳐 R에서 불러들이기 편하게 고쳐놓았다.

load("US_top_income_share_2013.rda")
ls()
## [1] "add12_13"                "P99_99.9"               
## [3] "P99.5_99.99"             "top.income.shares"      
## [5] "top.income.shares.2"     "US.top.income.shares"   
## [7] "US.top.income.shares.13" "v"                      
## [9] "year"

작업을 마친 자료파일은 US.top.income.shares.13이며, 이 자료의 구조와 앞의 몇 열의 값은 다음과 같다.

str(US.top.income.shares.13)
## 'data.frame':    101 obs. of  14 variables:
##  $ year       : int  1913 1914 1915 1916 1917 1918 1919 1920 1921 1922 ...
##  $ P90_100    : num  NA NA NA NA 40.5 ...
##  $ P95_100    : num  NA NA NA NA 30.6 ...
##  $ P99_100    : num  18 18.2 17.6 19.3 17.7 ...
##  $ P99.5_100  : num  14.7 15.1 14.6 16.4 14.3 ...
##  $ P99.9_100  : num  8.62 8.6 9.22 10.51 8.4 ...
##  $ P99.99_100 : num  2.76 2.73 4.36 4.78 3.37 2.45 2.29 1.66 1.69 2.27 ...
##  $ P90_95     : num  NA NA NA NA 9.87 ...
##  $ P95_99     : num  NA NA NA NA 12.9 ...
##  $ P99_99.5   : num  3.23 3.08 3 2.94 3.39 3.53 3.77 3.69 3.94 4 ...
##  $ P99.5_99.9 : num  6.11 6.48 5.36 5.86 5.94 5.71 6.01 5.79 6.1 6.42 ...
##  $ P99.9_99.99: num  5.86 5.87 4.86 5.73 5.04 4.26 4.34 3.69 3.91 4.36 ...
##  $ P99.5_99.99: num  12 12.3 10.2 11.6 11 ...
##  $ P99_99.9   : num  9.34 9.56 8.36 8.8 9.34 ...
US.top.income.shares.13[, 1:8]
##     year P90_100 P95_100 P99_100 P99.5_100 P99.9_100 P99.99_100 P90_95
## 1   1913      NA      NA   17.96     14.73      8.62       2.76     NA
## 2   1914      NA      NA   18.16     15.08      8.60       2.73     NA
## 3   1915      NA      NA   17.58     14.58      9.22       4.36     NA
## 4   1916      NA      NA   19.31     16.37     10.51       4.78     NA
## 5   1917   40.51   30.64   17.74     14.34      8.40       3.37   9.87
## 6   1918   40.11   29.49   15.96     12.43      6.72       2.45  10.61
## 7   1919   40.32   30.17   16.41     12.64      6.63       2.29  10.15
## 8   1920   39.01   28.32   14.83     11.14      5.36       1.66  10.69
## 9   1921   43.18   30.80   15.64     11.70      5.60       1.69  12.38
## 10  1922   43.72   31.94   17.06     13.06      6.64       2.27  11.78
## 11  1923   41.46   29.78   15.64     11.91      5.91       2.00  11.68
## 12  1924   44.41   32.11   17.42     13.40      6.79       2.32  12.29
## 13  1925   46.35   35.01   20.24     15.86      8.52       3.31  11.34
## 14  1926   45.71   34.61   19.91     15.55      8.46       3.36  11.10
## 15  1927   46.67   35.69   21.03     16.60      9.25       3.75  10.98
## 16  1928   49.29   38.56   23.94     19.40     11.54       5.02  10.73
## 17  1929   46.71   36.48   22.35     18.07     10.91       4.99  10.23
## 18  1930   43.87   32.06   17.22     13.20      7.07       2.84  11.80
## 19  1931   44.54   31.23   15.50     11.57      5.89       2.25  13.31
## 20  1932   46.37   32.67   15.56     11.62      5.97       1.99  13.70
## 21  1933   45.60   33.19   16.46     12.46      6.61       2.34  12.42
## 22  1934   45.78   33.71   16.40     12.30      6.13       2.07  12.07
## 23  1935   44.49   32.28   16.68     12.63      6.39       2.19  12.21
## 24  1936   46.59   34.64   19.29     14.86      7.57       2.54  11.96
## 25  1937   44.23   32.27   17.15     13.02      6.49       2.17  11.96
## 26  1938   44.07   31.34   15.75     11.78      5.88       2.19  12.73
## 27  1939   45.52   32.28   16.18     12.06      5.87       1.96  13.24
## 28  1940   45.29   32.22   16.48     12.33      6.01       2.04  13.07
## 29  1941   41.93   29.99   15.79     11.86      5.81       1.98  11.94
## 30  1942   36.13   25.80   13.43     10.07      4.81       1.55  10.32
## 31  1943   33.69   24.08   12.31      9.15      4.26       1.24   9.61
## 32  1944   32.51   22.77   11.28      8.26      3.76       1.16   9.75
## 33  1945   34.42   24.79   12.52      9.14      4.16       1.26   9.63
## 34  1946   36.70   26.77   13.28      9.61      4.39       1.47   9.93
## 35  1947   34.35   24.68   11.96      8.61      3.92       1.30   9.67
## 36  1948   35.01   25.06   12.24      8.90      4.06       1.31   9.96
## 37  1949   34.75   24.51   11.73      8.48      3.83       1.24  10.25
## 38  1950   35.56   25.53   12.82      9.37      4.39       1.22  10.03
## 39  1951   34.22   24.20   11.79      8.53      3.89       1.28  10.02
## 40  1952   33.21   23.07   10.79      7.74      3.43       1.09  10.14
## 41  1953   32.31   22.01    9.90      7.02      3.06       0.97  10.29
## 42  1954   33.64   23.30   10.77      7.71      3.49       1.17  10.34
## 43  1955   33.94   23.60   11.06      7.96      3.71       1.32  10.34
## 44  1956   33.46   23.13   10.67      7.70      3.49       1.20  10.34
## 45  1957   32.99   22.60   10.16      7.23      3.18       1.05  10.38
## 46  1958   33.56   22.93   10.21      7.27      3.22       1.08  10.63
## 47  1959   34.00   23.39   10.65      7.72      3.45       1.19  10.61
## 48  1960   33.48   22.57   10.03      7.13      3.25       1.17  10.90
## 49  1961   34.25   23.50   10.64      7.66      3.65       1.38  10.75
## 50  1962   33.70   22.81    9.95      7.06      3.19       1.16  10.90
## 51  1963   33.78   22.84    9.92      7.00      3.15       1.15  10.94
## 52  1964   34.42   23.50   10.48      7.39      3.37       1.30  10.92
## 53  1965   34.78   23.88   10.89      7.73      3.66       1.49  10.90
## 54  1966   33.67   22.92   10.18      7.22      3.39       1.29  10.75
## 55  1967   34.44   23.70   10.74      7.67      3.68       1.42  10.74
## 56  1968   34.85   24.15   11.21      8.14      4.02       1.61  10.70
## 57  1969   33.93   23.08   10.35      7.45      3.69       1.56  10.85
## 58  1970   32.63   21.66    9.03      6.25      2.78       1.00  10.96
## 59  1971   33.34   22.26    9.40      6.56      2.99       1.11  11.08
## 60  1972   33.59   22.52    9.64      6.78      3.13       1.18  11.07
## 61  1973   33.33   22.21    9.16      6.30      2.76       0.94  11.12
## 62  1974   33.31   22.12    9.12      6.31      2.73       0.88  11.19
## 63  1975   33.43   21.98    8.87      6.07      2.56       0.85  11.45
## 64  1976   33.41   21.97    8.86      6.07      2.59       0.86  11.44
## 65  1977   33.58   22.12    9.03      6.22      2.71       0.92  11.46
## 66  1978   33.49   22.04    8.95      6.16      2.65       0.86  11.45
## 67  1979   34.21   22.93    9.96      7.11      3.44       1.37  11.28
## 68  1980   34.63   23.17   10.02      7.15      3.41       1.28  11.47
## 69  1981   34.54   23.04   10.02      7.23      3.57       1.37  11.51
## 70  1982   35.33   23.83   10.80      7.97      4.18       1.73  11.50
## 71  1983   36.38   24.85   11.56      8.63      4.62       1.88  11.53
## 72  1984   36.74   25.29   11.99      9.04      4.98       2.15  11.45
## 73  1985   37.56   26.12   12.67      9.63      5.32       2.24  11.44
## 74  1986   40.63   29.49   15.92     12.62      7.40       3.34  11.14
## 75  1987   38.25   26.54   12.66      9.45      4.90       1.91  11.71
## 76  1988   40.63   29.29   15.49     12.09      6.80       2.86  11.34
## 77  1989   40.08   28.55   14.49     11.08      6.00       2.45  11.54
## 78  1990   39.98   28.41   14.33     10.94      5.82       2.33  11.57
## 79  1991   39.55   27.72   13.36      9.99      5.12       1.96  11.82
## 80  1992   40.82   29.06   14.67     11.20      6.03       2.46  11.76
## 81  1993   40.68   28.83   14.24     10.78      5.73       2.32  11.85
## 82  1994   40.78   28.89   14.23     10.73      5.70       2.29  11.89
## 83  1995   42.11   30.22   15.23     11.57      6.21       2.46  11.89
## 84  1996   43.48   31.76   16.69     12.91      7.24       3.06  11.73
## 85  1997   44.64   33.14   18.02     14.16      8.19       3.53  11.50
## 86  1998   45.39   34.10   19.09     15.18      9.00       3.92  11.30
## 87  1999   46.47   35.22   20.04     16.04      9.62       4.21  11.25
## 88  2000   47.61   36.61   21.52     17.46     10.88       5.07  11.00
## 89  2001   44.82   33.35   18.22     14.32      8.37       3.70  11.47
## 90  2002   43.82   32.07   16.87     13.04      7.34       3.14  11.75
## 91  2003   44.53   32.77   17.53     13.67      7.87       3.49  11.76
## 92  2004   46.40   34.95   19.75     15.74      9.47       4.34  11.45
## 93  2005   48.33   37.16   21.92     17.77     10.98       5.13  11.18
## 94  2006   49.32   38.08   22.82     18.62     11.59       5.46  11.24
## 95  2007   49.74   38.67   23.50     19.31     12.28       6.04  11.07
## 96  2008   48.23   36.52   20.95     16.87     10.40       5.03  11.71
## 97  2009   46.50   34.11   18.12     14.15      8.30       3.89  12.39
## 98  2010   48.04   35.85   19.86     15.83      9.66       4.78  12.19
## 99  2011   48.13   35.89   19.65     15.55      9.27       4.32  12.24
## 100 2012   50.60   38.82   22.83     18.59     11.71       5.81  11.78
## 101 2013   48.89   36.63   20.08     15.89      9.47       4.48  12.27

이 중에서 소득 상위 10%(P90_100)를 상위 1%(P99_100), 차상위 4%(P95_99), 차차상위 5%(P90_95)로 나누어 그 몫의 변화를 살펴보자. 우선 밋밋하게 상위 1%의 소득 점유율 변화만 그려보면,

plot(P99_100~year,data=US.top.income.shares.13)

최소한의 정보를 주기 위하여 각 자료의 최대값, 최소값을 고려하여 y-축의 범위를 ylim=c(5,25)로 설정하고, x-축의 눈금은 비워둔다. 점들을 선으로 이어주고, 점은 다시 삼각형 모양으로 바꾼다.

plot(P99_100~year,data=US.top.income.shares.13, xlab="연도", ylab="소득점유(%)", ylim=c(5,25), xaxt="n", type="b",pch=17)

이제 x-축에는 연도를 10년 단위로 표시하고, lines()를 이용하여 차상위4%와 차차상위5%의 소득 점유율 변화를 함께 그린다.

plot(P99_100~year,data=US.top.income.shares.13, xlab="연도", ylab="소득점유(%)", ylim=c(5,25), xaxt="n", type="b",pch=17)
axis(side=1, at=seq(1910, 2010, by=10), labels=seq(1910, 2010, by=10))
lines(P95_99~year,data=US.top.income.shares.13,type="b", pch=17, col="red")
lines(P90_95~year,data=US.top.income.shares.13,type="b", pch=17, col="blue")

도표의 가독성을 높이기 위하여 x-축과 y-축을 가로지르는 격자를 설치한다.

plot(P99_100~year,data=US.top.income.shares.13, xlab="연도", ylab="소득점유(%)", ylim=c(5,25), xaxt="n", type="b",pch=17)
axis(side=1, at=seq(1910, 2010, by=10), labels=seq(1910, 2010, by=10))
lines(P95_99~year,data=US.top.income.shares.13,type="b", pch=17, col="red")
lines(P90_95~year,data=US.top.income.shares.13,type="b", pch=17, col="blue")
abline(h=seq(5,25, by=5), lty=2)
abline(v=seq(1910, 2010, by=10), lty=2)

TabFig2013prel.xls의 Table 0 시트에 나와 있는 정보를 활용하여 범례를 만든다.

plot(P99_100~year,data=US.top.income.shares.13, xlab="연도", ylab="소득점유(%)", ylim=c(5,25), xaxt="n", type="b",pch=17)
axis(side=1, at=seq(1910, 2010, by=10), labels=seq(1910, 2010, by=10))
lines(P95_99~year,data=US.top.income.shares.13,type="b", pch=17, col="red")
lines(P90_95~year,data=US.top.income.shares.13,type="b", pch=17, col="blue")
abline(h=seq(5,25, by=5), lty=2)
abline(v=seq(1910, 2010, by=10), lty=2)
legend(x=1945, y=25, legend=c("99-100%:$391,960 이상(2013년 기준)","95-99%:$165,500-$392,000","90-95%:$116,500-$165,500"), pch=17, col=c("black", "red", "blue"))

메인 타이틀을 입력하고, 상위1%의 소득점유율이 최고에 달했던 연도를 표시한다.

plot(P99_100~year,data=US.top.income.shares.13, xlab="연도", ylab="소득점유(%)", ylim=c(5,25), xaxt="n", type="b",pch=17)
axis(side=1, at=seq(1910, 2010, by=10), labels=seq(1910, 2010, by=10))
lines(P95_99~year,data=US.top.income.shares.13,type="b", pch=17, col="red")
lines(P90_95~year,data=US.top.income.shares.13,type="b", pch=17, col="blue")
abline(h=seq(5,25, by=5), lty=2)
abline(v=seq(1910, 2010, by=10), lty=2)
legend(x=1945, y=25, legend=c("99-100%:$391,960 이상(2013년 기준)","95-99%:$165,500-$392,000","90-95%:$116,500-$165,500"), pch=17, col=c("black", "red", "blue"))
title(main="미국 소득 상위 10%의 점유율 분할")
text(x=c(1928, 2007), y=c(24, 23.5), labels=c("1928", "2007"), pos=3)

역사적으로 각 시기를 어떻게 부르고 있는지 텍스트를 추가한다.

plot(P99_100~year,data=US.top.income.shares.13, xlab="연도", ylab="소득점유(%)", ylim=c(5,25), xaxt="n", type="b",pch=17)
axis(side=1, at=seq(1910, 2010, by=10), labels=seq(1910, 2010, by=10))
lines(P95_99~year,data=US.top.income.shares.13,type="b", pch=17, col="red")
lines(P90_95~year,data=US.top.income.shares.13,type="b", pch=17, col="blue")
abline(h=seq(5,25, by=5), lty=2)
abline(v=seq(1910, 2010, by=10), lty=2)
legend(x=1945, y=25, legend=c("99-100%:$391,960 이상(2013년 기준)","95-99%:$165,500-$392,000","90-95%:$116,500-$165,500"), pch=17, col=c("black", "red", "blue"))
title(main="미국 소득 상위 10%의 점유율 분할")
text(x=c(1928, 2007), y=c(24, 23.5), labels=c("1928", "2007"), pos=3)
text(x=1935, y=22, label="대공황", cex=2.0, col="red")
text(x=1960, y=8, label="대번영", cex=2.0, col="red")
text(x=2012, y=17.5, label="대침체", cex=2.0, col="red")

뒷 정리