d <- read.csv("https://stats.dip.jp/01_ds/data/UN_jp.csv")
head(d)
## 国名 地域 分類 出生数 GDP 平均寿命 都市人口率 乳児死亡率
## 1 Afghanistan Asia other 5.97 499.0 49.49 23 12.45
## 2 Albania Europe other 1.52 3677.2 80.40 53 1.66
## 3 Algeria Africa africa 2.14 4473.0 75.00 67 2.15
## 4 Angola Africa africa 5.14 4321.9 53.17 59 9.62
## 5 Argentina Latin Amer other 2.17 9162.1 79.89 93 1.23
## 6 Armenia Asia other 1.74 3030.7 77.33 64 2.43
library(DT)
datatable(d, caption = "国連社会指標データ")
r <- prcomp(d[, 4:ncol(d)], scale = T)
summary(r)
## Importance of components:
## PC1 PC2 PC3 PC4 PC5
## Standard deviation 1.9015 0.8551 0.63807 0.42872 0.24968
## Proportion of Variance 0.7231 0.1462 0.08143 0.03676 0.01247
## Cumulative Proportion 0.7231 0.8693 0.95077 0.98753 1.00000
options(digits = 1)
(variance <- r$sdev^2)
## [1] 3.62 0.73 0.41 0.18 0.06
(proportion_variance <- variance / sum(variance))
## [1] 0.72 0.15 0.08 0.04 0.01
(cumulative_propotion <- cumsum(proportion_variance))
## [1] 0.7 0.9 1.0 1.0 1.0
evec <- r$rotation
datatable(round(evec, 2))
rownames(r$x) <- d$国名
datatable(round(r$x, 2))
library(factoextra)
## 要求されたパッケージ ggplot2 をロード中です
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
fviz_screeplot(r, addlabels = T)
fviz_contrib(r, choice = "var", axes = 1, top = 5)
fviz_contrib(r, choice = "var", axes = 2, top = 5)
library("corrplot")
## corrplot 0.92 loaded
var <- get_pca_var(r)
corrplot(var$cor, is.corr = T, addCoef.col = "gray")
fviz_pca_var(r, col.var = "contrib", repel = T)
fviz_pca_biplot(r, col.ind = "contrib", repel = T)
生活水準を示す指標であると考えられる。経済的要因を主に反映していると考えられる第2主成分は国の健康状態や福祉の水準を示す指標と考えられる。
健康指標を反映していると推測される。
d0 <- read.csv(file = "https://stats.dip.jp/01_ds/data/UN_jp.csv")
library(DT)
library(factoextra)
datatable(d0, caption = "United Nations Data")
numeric_data <- d0[, sapply(d0, is.numeric)]
pca_result <- prcomp(numeric_data, scale. = TRUE)
summary(pca_result)
## Importance of components:
## PC1 PC2 PC3 PC4 PC5
## Standard deviation 1.901 0.855 0.6381 0.4287 0.2497
## Proportion of Variance 0.723 0.146 0.0814 0.0368 0.0125
## Cumulative Proportion 0.723 0.869 0.9508 0.9875 1.0000
pca_scores <- as.data.frame(pca_result$x)
pca_scores$Country <- d0$Country
top_countries <- pca_scores[order(-pca_scores$PC1), ]
print(top_countries)
## PC1 PC2 PC3 PC4 PC5
## 100 3.83 -3.41 -2.450 0.471 2e-01
## 130 3.24 -2.55 -1.919 0.131 9e-02
## 101 3.12 -1.36 -0.051 0.334 -2e-01
## 168 2.99 -1.67 -1.599 0.200 -8e-02
## 155 2.95 -1.15 0.162 0.147 -9e-02
## 75 2.90 -0.54 0.539 0.062 -3e-01
## 143 2.84 -2.64 -0.875 0.216 3e-01
## 8 2.83 -1.64 -0.672 -0.092 -9e-02
## 16 2.67 -1.26 0.076 -0.056 -3e-02
## 47 2.66 -1.59 -0.659 0.072 1e-01
## 167 2.59 -1.22 -0.520 -0.131 -2e-02
## 30 2.50 -1.00 -0.564 0.024 -1e-01
## 77 2.50 -1.06 0.117 -0.311 -4e-02
## 86 2.50 -0.40 -0.982 -0.050 -3e-01
## 59 2.49 -1.04 -0.363 -0.113 -2e-02
## 123 2.49 -1.10 -0.506 -0.003 -3e-02
## 60 2.44 -0.86 -0.177 -0.288 -1e-01
## 9 2.39 -0.57 -0.970 0.198 -9e-02
## 65 2.32 -0.53 -0.575 0.120 -6e-02
## 142 2.32 -0.62 0.744 -0.122 -2e-01
## 185 2.28 -1.22 -0.468 -0.074 3e-02
## 161 2.26 -0.21 -0.139 -0.058 -2e-01
## 107 2.25 -0.13 0.851 0.132 -2e-01
## 84 2.18 -0.15 -0.560 -0.017 -2e-01
## 91 2.18 -1.67 0.154 0.101 3e-01
## 184 2.16 -0.65 -0.236 -0.102 -3e-02
## 144 2.15 0.08 0.368 -0.023 -2e-01
## 183 2.11 -0.94 -0.155 0.256 2e-01
## 125 2.11 -0.68 0.102 -0.299 -5e-02
## 82 2.03 -0.72 -1.200 -0.209 6e-03
## 83 1.98 -0.86 0.395 -0.863 -5e-02
## 44 1.97 -0.04 -0.267 0.089 -6e-02
## 24 1.89 -0.49 -0.222 -0.106 9e-02
## 122 1.79 -0.42 0.805 -0.025 -1e-01
## 34 1.77 0.13 0.918 -0.231 -2e-01
## 45 1.77 0.26 0.176 0.038 2e-02
## 67 1.76 0.21 -0.514 0.009 -8e-02
## 141 1.73 0.50 -0.378 0.093 -1e-01
## 186 1.61 -0.10 1.084 -0.213 -2e-01
## 11 1.60 -0.36 0.441 0.073 -9e-02
## 124 1.57 -0.25 -0.958 -0.140 1e-01
## 157 1.52 0.64 -0.845 -0.007 -6e-02
## 43 1.51 0.77 0.663 -0.024 -9e-02
## 56 1.46 0.43 0.220 -0.045 6e-02
## 5 1.46 -0.05 1.192 -0.265 -1e-01
## 76 1.40 0.56 0.214 0.187 1e-01
## 12 1.40 -0.44 0.786 -0.221 3e-01
## 140 1.37 0.77 -0.029 0.086 -2e-02
## 189 1.34 -0.39 1.111 -0.220 -4e-02
## 42 1.31 0.74 -0.182 0.062 2e-03
## 156 1.31 0.73 -0.348 0.197 5e-02
## 94 1.31 0.61 0.294 0.138 7e-02
## 99 1.30 0.62 0.250 0.149 1e-01
## 23 1.28 -0.01 0.976 0.161 -2e-01
## 131 1.26 -0.15 0.148 -0.038 2e-01
## 15 1.23 0.63 0.730 0.224 2e-01
## 40 1.21 0.76 0.255 -0.204 -2e-01
## 25 1.16 0.63 0.601 0.179 9e-02
## 146 1.15 0.39 0.527 0.341 2e-01
## 111 1.13 0.21 0.691 -0.267 -1e-01
## 95 1.13 -0.01 1.058 0.304 -5e-02
## 61 1.10 0.23 -0.759 -0.034 2e-01
## 98 1.05 0.04 0.637 -0.276 2e-02
## 115 0.98 0.84 0.216 0.106 1e-01
## 7 0.97 0.40 -0.817 0.262 -1e-02
## 145 0.97 0.89 0.078 0.251 -4e-02
## 151 0.97 -0.37 0.653 -0.230 1e-01
## 14 0.96 0.89 -0.634 0.107 -1e-01
## 39 0.94 -0.01 0.557 -0.277 2e-01
## 135 0.92 0.24 0.652 -0.330 -1e-01
## 104 0.90 0.25 0.571 -0.411 3e-01
## 182 0.90 0.76 0.651 0.353 2e-01
## 133 0.89 -0.15 0.942 0.323 2e-01
## 172 0.88 0.97 0.231 0.296 -2e-02
## 21 0.87 1.28 -0.130 0.387 -1e-01
## 36 0.86 0.30 0.718 -0.196 -8e-02
## 178 0.84 0.26 0.432 0.079 -1e-01
## 153 0.83 0.98 0.103 0.185 7e-02
## 2 0.82 1.13 0.017 0.097 -3e-01
## 80 0.78 0.49 0.655 0.399 -2e-01
## 138 0.77 0.22 0.828 -0.215 -6e-02
## 177 0.76 0.60 0.558 0.061 -1e-01
## 51 0.68 0.50 0.543 -0.304 -2e-01
## 6 0.64 0.72 0.468 0.203 -3e-01
## 105 0.64 1.34 -0.418 0.008 5e-02
## 53 0.60 0.61 0.485 -0.091 -1e-01
## 110 0.59 1.14 -0.451 0.210 7e-02
## 165 0.57 0.26 0.571 0.031 7e-02
## 49 0.54 0.31 0.608 -0.209 -1e-01
## 31 0.54 0.66 0.381 -0.192 -1e-01
## 87 0.52 0.03 0.956 -0.406 6e-02
## 3 0.52 0.46 0.549 0.066 -4e-02
## 64 0.49 1.00 0.107 0.339 -3e-01
## 173 0.46 1.47 -0.637 0.173 2e-02
## 35 0.45 1.05 -0.109 0.352 -6e-02
## 113 0.41 1.19 0.003 0.444 2e-01
## 68 0.38 1.03 -0.522 -0.159 4e-02
## 126 0.34 0.76 0.323 -0.325 -8e-02
## 169 0.34 0.70 0.183 -0.532 5e-02
## 17 0.32 0.71 0.029 -0.446 -2e-02
## 163 0.30 0.77 -0.087 0.169 6e-04
## 85 0.27 0.73 0.012 -0.043 -9e-02
## 148 0.24 1.38 -0.905 -0.011 6e-02
## 88 0.22 0.26 0.148 0.036 9e-02
## 116 0.21 0.60 0.346 0.116 -2e-01
## 129 0.17 0.70 0.490 0.309 4e-02
## 190 0.13 1.52 -0.603 0.113 -1e-01
## 137 0.05 0.36 0.453 -0.295 -1e-01
## 114 0.04 0.39 0.536 0.081 -1e-01
## 58 0.02 0.65 0.101 -0.119 3e-01
## 10 -0.05 0.52 0.043 0.316 -3e-01
## 52 -0.07 0.86 -0.174 -0.257 -2e-02
## 74 -0.07 0.61 0.120 -0.475 -6e-02
## 79 -0.08 0.88 -0.100 0.300 9e-02
## 176 -0.11 1.19 -1.608 0.536 1e-03
## 134 -0.12 -0.17 0.891 -1.205 2e-01
## 162 -0.14 1.77 -1.244 -0.283 7e-02
## 62 -0.23 -1.03 1.104 0.295 2e-01
## 139 -0.26 0.60 0.053 -0.364 2e-01
## 108 -0.39 -0.33 0.838 -1.032 4e-01
## 69 -0.47 0.33 0.043 -0.885 -4e-03
## 20 -0.50 -0.08 0.748 -0.093 -8e-02
## 72 -0.52 1.08 -0.646 0.276 -3e-01
## 120 -0.54 -1.28 1.895 0.567 6e-01
## 179 -0.56 0.34 0.088 0.546 -3e-01
## 92 -0.60 0.93 -0.359 0.020 -9e-02
## 19 -0.66 0.88 -0.360 0.421 -9e-02
## 187 -0.66 0.86 -0.320 0.386 -4e-01
## 81 -0.71 -0.25 0.705 -1.104 2e-02
## 180 -0.73 0.20 0.180 -0.401 9e-01
## 175 -0.78 0.91 -0.879 -0.921 1e-01
## 93 -0.79 0.86 -0.354 0.259 -1e-02
## 149 -0.80 1.03 -1.018 -0.952 1e-01
## 118 -0.80 0.92 -0.318 0.773 -2e-01
## 13 -0.80 1.05 -0.516 0.492 -2e-01
## 188 -0.89 0.83 -0.761 -0.779 2e-01
## 150 -0.93 -0.19 0.687 -0.027 -4e-02
## 121 -0.97 1.23 -0.863 0.142 9e-02
## 119 -0.99 0.37 -0.251 0.227 6e-01
## 160 -1.01 -0.36 0.598 1.263 7e-01
## 22 -1.04 -0.39 0.612 1.142 1e+00
## 112 -1.08 0.87 -0.799 -0.274 2e-01
## 78 -1.13 0.77 -0.460 0.475 -2e-01
## 66 -1.26 -0.09 0.317 -0.323 1e-01
## 73 -1.29 -0.06 0.455 0.411 -2e-01
## 170 -1.30 0.75 -0.614 -0.037 -4e-01
## 28 -1.48 0.92 -0.739 0.721 -1e-01
## 158 -1.50 0.76 -0.872 -0.665 2e-01
## 90 -1.50 0.06 0.086 0.188 8e-02
## 48 -1.51 -0.91 1.262 0.542 -3e-01
## 132 -1.59 0.28 -0.197 0.323 -5e-01
## 102 -1.63 0.32 -0.405 -0.792 1e-01
## 164 -1.84 -0.14 -0.024 -0.205 -3e-02
## 191 -1.85 0.07 -0.385 -0.961 1e-01
## 38 -1.89 -0.88 0.772 0.001 1e-02
## 193 -1.89 0.11 0.071 0.875 8e-01
## 136 -1.90 0.74 -1.010 -0.190 2e-01
## 152 -1.97 -0.25 0.099 -0.376 4e-01
## 55 -2.02 0.41 -0.647 -0.364 2e-01
## 63 -2.04 -0.76 0.696 -0.211 -2e-02
## 174 -2.08 -0.25 0.196 0.327 -5e-02
## 41 -2.17 -0.57 0.439 0.223 5e-02
## 109 -2.24 -0.37 0.094 -0.008 -2e-01
## 57 -2.37 0.40 -0.752 0.174 -5e-02
## 37 -2.40 -0.05 -0.407 -0.422 -8e-02
## 29 -2.53 -1.02 0.792 0.569 -1e-01
## 96 -2.53 0.08 -0.232 1.308 8e-01
## 89 -2.56 0.03 -0.536 -0.202 3e-01
## 97 -2.62 -0.78 0.377 -0.215 -1e-01
## 50 -2.63 -0.32 -0.389 -1.229 1e-01
## 171 -2.66 -0.22 -0.408 -0.823 4e-01
## 166 -2.66 0.08 -0.551 1.262 7e-01
## 18 -2.72 -0.68 0.154 -0.240 -1e-01
## 54 -2.94 -1.56 -0.367 0.408 -1e-01
## 4 -2.96 -1.52 0.715 0.242 -3e-01
## 117 -3.00 -0.68 0.152 0.329 2e-01
## 70 -3.05 -0.66 0.003 -0.016 -2e-01
## 128 -3.11 -1.22 0.533 -0.055 -5e-02
## 26 -3.20 -0.54 -0.333 -0.611 2e-01
## 32 -3.23 -0.79 0.187 0.722 -2e-01
## 27 -3.51 -0.06 -0.779 0.854 -2e-01
## 147 -3.54 -0.47 -0.572 -0.100 -4e-01
## 154 -3.59 -1.01 0.237 0.748 -2e-01
## 181 -3.59 -0.35 -0.785 -0.605 3e-01
## 106 -3.69 -1.16 0.094 -0.397 -7e-02
## 192 -3.72 -1.18 0.060 -0.467 4e-01
## 103 -3.74 -0.66 -0.514 -0.480 -4e-02
## 71 -3.82 -0.91 -0.084 0.656 -5e-01
## 159 -3.86 -1.29 0.156 -0.419 -3e-01
## 46 -3.92 -1.18 0.133 0.293 -4e-01
## 127 -4.09 -0.85 -0.618 -1.066 1e-02
## 33 -4.33 -1.24 -0.144 0.254 -8e-01
## 1 -4.61 -1.25 -0.276 0.231 -7e-01
fviz_pca_biplot(pca_result, repel = TRUE)
上記から、Luxembourgが最も豊かであると推測される。
GDPが最も高く、平均寿命も乳児死亡率も良い数値である。高いGDPと生活の質を両立している、経済的に暮らしやすい国である。