Abstract
O referido trabalho tem como objetivo a aplicação do método de análise de componentes principais (PCA) apresentados durante a disciplina de Estatística Multivariada no curso de Especialização em Estatística da Universidade Federal de Minas Gerais. A técnica será aplicada no bando de dados ‘Boston’ publicado em 1978 por Harrison e Rubinfeld, que contém informações sobre moradias na cidade de Boston. O conjunto de dados é amplamente utilizado para aplicação de técnicas estatísticas e é comumente utilizado para benchmarks. Será realizada uma breve análise descritiva, a aplicação do PCA e breve discussão dos resultados.
Para realização do trabalho foi escolhido o banco de dados ‘Boston’ nativo do R. O conjunto de dados contém informações coletadas pelo Serviço de Censo dos EUA. Os dados compreendem 506 observações para cada distrito censitário da área metropolitana de Boston Ele foi obtido do arquivo StatLib (http://lib.stat.cmu.edu/datasets/boston), e tem sido usado extensivamente em todo o a literatura para algoritmos de benchmark. No entanto, essas comparações foram feitas principalmente fora do Delve e, portanto, são um pouco suspeitas.
Os dados foram originalmente publicados por Harrison, D. e Rubinfeld, D.L. `Preços hedônicos e a demanda por ar limpo’, J. Environ. Economics & Management, vol.5, 81-102, 1978. Os autores queriam descobrir se o “ar limpo” tinha influência nos preços das casas.
No presente trabalho será analisado, por meio da técnica de análise de componentes principais, se é possível realizar uma classificação de áreas e verificar se há correlação entre variáveis de qualidade de ar e preço de imóveis.
\[\\\]
Para Ringnér (2008) a análise de componentes principais (PCA) é um algoritmo matemático que reduz dimensionalidade dos dados enquanto retém a maior parte da variação no conjunto de dados. O algoritmo realiza as reduções identificando direções, chamadas de componentes principais, ao longo das quais a variação dos dados são máximos. Usando alguns componentes, cada amostra pode ser representada por relativamente poucos números em vez de por valores para milhares de variáveis. As amostras podem então ser plotadas, tornando-se possível avaliar visualmente semelhanças e diferenças entre as amostras e determinar se essas amostras podem ser agrupadas.
A análise de componentes principais (PCA) é provavelmente o método multivariado mais popular técnica estatística e é usada por quase todas as disciplinas científicas. Isso é também provavelmente a mais antiga técnica multivariada. Abdi et al (2010)
Segundo os autores Härdle, W. K., & Simar, L. (2019), o principal objetivo do PCA é reduzir a dimensão das observações. A maneira mais simples de redução de dimensão é tomar apenas um elemento do observado vetor e descartar todos os outros.
Abaixo a descrição de cada variável: \[\\\]
\[\\\]
CONSIDERAÇÕES: Existe no banco de dado uma variável chamada Black que se destina a medir a proporção de negros por cidade. Em 1978 era aceitável utilizar uma variável dessa natureza devido a um senso comum racista vigente na então sociedade estadunidense localizada na região da Nova Inglaterra. Visto que hoje tal indicador é inapropriado, será retirado da análise. O autor deste documento considera que seria mais adequado a utilização de indicadores objetIvos como renda per capita, proporção de residências com esgoto adequado ou inúmeras outras para realizar uma análise justa, imparcial e sem qualquer viés racista ou identitário. \[\\\]
## Medidas descritivas
| mean | sd | median | min | max | range |
|---|---|---|---|---|---|
| 3.61 | 8.60 | 0.26 | 0.01 | 88.98 | 88.97 |
| 11.36 | 23.32 | 0.00 | 0.00 | 100.00 | 100.00 |
| 11.14 | 6.86 | 9.69 | 0.46 | 27.74 | 27.28 |
| 0.55 | 0.12 | 0.54 | 0.38 | 0.87 | 0.49 |
| 6.28 | 0.70 | 6.21 | 3.56 | 8.78 | 5.22 |
| 68.57 | 28.15 | 77.50 | 2.90 | 100.00 | 97.10 |
| 3.80 | 2.11 | 3.21 | 1.13 | 12.13 | 11.00 |
| 9.55 | 8.71 | 5.00 | 1.00 | 24.00 | 23.00 |
| 408.24 | 168.54 | 330.00 | 187.00 | 711.00 | 524.00 |
| 18.46 | 2.16 | 19.05 | 12.60 | 22.00 | 9.40 |
| 12.65 | 7.14 | 11.36 | 1.73 | 37.97 | 36.24 |
| 22.53 | 9.20 | 21.20 | 5.00 | 50.00 | 45.00 |
Analisando os dados, é possível verificar primeiramente que a escala das variáveis é muito diversa, esse primeiro ponto sugere que, ao realizar uma análise de componentes principais, a matriz de correlação seja utilizada ao invés da matriz de covariâncias, para obter melhores resultados. É importante salientar esse ponto quando temos variáveis com valores de frequência relativa, ou seja, representam uma proporção ou percentual e valores absolutos, como idade, valor de impostos e distâncias para centros de emprego. Com relação as variáveis, a que mais chamou a atenção foi a ‘tax’ com alto valor de desvio padrão e de amplitude, demonstrando que há sérias distorções de tributos entre as residências de algumas cidades. \[\\\]
Correlações: Analisando as correlações entre as variáveis, podemos destacar que as variáveis ‘tax’ e ‘rad’ tel alta correlação positiva, ou seja a quantidade de impostos pagas pela população de uma cidade tem relação positiva com a qualidade de suas estradas.
A variável ‘nox’ tem alta correlação negativa com a variável ‘dis’, o que significa que à medida que a distância entre os centros de emprego diminui (ficam uns perto do outro) a quantidade de óxido nítrico aumenta. Ainda analisando a variável ‘nox’ , nota-se correlação expressiva com as variáveis ‘age’ ‘indus’, ‘lstat’, ‘rad’, ‘tax.
Percebe-se uma correlação forte entre as variáveis ‘medv’ e ‘rm’, indicando que o preço dos imóveis aumenta de acordo com a quantidade de cômodos na residência, o que é esperado. Também é notada uma forte correlação negativa entre ‘medv’ e ‘lstat’.
## Gráficos de histogramas
\[\\\]
## Teste de normalidade para rm
## p-valor: 2.411977e-10
## Rejeita-se hipótese nula, dados não são normalmente distribuídos
Histogramas: Analisando os histogramas de todas as variáveis do banco de dados utilizadas, é possível notar que praticamente todas possuem distribuições aleatórias não se enquadrando em nenhum modelo de distribuição probabilístico. A única variável com que aparenta ter uma distribuição bem definida é a ‘rm’ relacionada com o numero médio de cômodos por domicilio. O histograma da variável aparenta ter uma distribuição normal, entretanto o teste Shapiro - Wilk mostrou que a distribuição não é normal.
\[\\\] Boxplots: Analisando os boxplots, É possível observar uma grande diferença na variável ‘tax’, uma vez que possui grande amplitude, alto desvio-padrão e a ordem de grandeza da variável e diferente das demais. Os box plots dão visão ao que foi observado anteriormente nas medidas descritivas e fortalece as evidencias de que para a analise de componentes principais será utilizada a matriz de correlação.
\[\\\]
## Componentes principais
## Comp. 1 Comp. 2 Comp. 3 Comp. 4 Comp. 5 Comp. 6 Comp. 7 Comp. 8 Comp. 9
## crim 0.24 -0.022 0.447 -0.20 0.75 0.183 -0.252 -0.11 0.078
## zn -0.25 -0.125 0.421 -0.45 -0.30 -0.364 -0.454 0.13 0.109
## indus 0.34 0.120 -0.056 -0.01 -0.35 0.172 -0.521 -0.43 -0.261
## nox 0.33 0.263 -0.085 -0.23 -0.20 0.041 0.094 -0.17 0.443
## rm -0.21 0.525 0.262 0.20 0.11 -0.460 0.174 -0.52 -0.198
## Comp. 10 Comp. 11 Comp. 12
## crim -0.072 0.101 0.0609
## zn 0.239 -0.132 -0.0981
## indus -0.359 0.076 -0.2320
## nox 0.434 0.538 0.0948
## rm 0.098 -0.035 0.0098
## Explicação das componentes
## Autovalor % da variancia % acumulada da variancia
## Comp 1 6.32 52.7 53
## Comp 2 1.52 12.7 65
## Comp 3 1.25 10.4 76
## Comp 4 0.82 6.9 83
## Comp 5 0.54 4.5 87
## Comp 6 0.40 3.4 91
## 3 componentes principais explicam 75% da variação
## Correlação das componentes com as variáveis
## crim zn indus nox rm age dis rad tax ptratio lstat
## Comp 1 0.610 -0.64 0.853 0.833 -0.53 0.77 -0.77 0.768 0.823 0.54 0.80
## Comp 2 -0.027 -0.15 0.148 0.324 0.65 0.32 -0.46 0.099 0.065 -0.40 -0.30
## Comp 3 0.499 0.47 -0.063 -0.095 0.29 -0.27 0.24 0.539 0.452 0.15 -0.15
## medv
## Comp 1 -0.68
## Comp 2 0.61
## Comp 3 0.11
## Scores
## Comp..1 Comp..2 Comp..3
## 1 -2.0 0.62 -0.594
## 2 -1.3 -0.16 -1.016
## 3 -2.3 1.12 -0.345
## 4 -2.8 0.37 -0.056
## 5 -2.7 0.62 -0.085
\[\\\]
Análise das componentes:
PC1: Altas correlações com todas as variáveis, o que indica que fornece um score geral para cada local de residência
PC2: A segunda componente faz um contraste entre a quantidade de oxido nítrico, numero de quartos, idade e valor médio do imóvel com as outras variáveis. E possível dizer que essa componente indica que teremos imóveis mais caros, com mais quartos e velhos em locais com alta concentração de oxido nítrico
PC3: Relacionada com impostos, professores por alunos, índice de criminalidade e grandes terrenos. Quanto mais positivo, maiores esses índices.
\[\\\]
\[\\\]
\[\\\]
Pode-se concluir que o uso das componentes principais cumpriu seu objetivo de auxiliar na separação de grupos para analisar o impacto das variáveis na precificação de residências na região de Boston.
Abaixo classificação das cidades de acordo com a media dos scores das componentes:
## cities_id Comp..1 Comp..2 Comp..3 medida
## 355 355 -3.084 -3.6364 1.8570 -1.6211
## 287 287 -3.521 -2.4682 1.1637 -1.6083
## 256 256 -3.676 -2.3580 1.2753 -1.5861
## 356 356 -3.371 -3.2425 2.0540 -1.5198
## 353 353 -3.242 -2.8110 1.5928 -1.4866
## 255 255 -3.753 -1.9218 1.3126 -1.4542
## 354 354 -4.838 -1.5684 2.0590 -1.4492
## 332 332 -2.125 -1.9399 -0.0886 -1.3846
## 57 57 -3.936 -1.6646 1.6299 -1.3236
## 286 286 -3.452 -1.1088 0.6761 -1.2950
## 333 333 -2.551 -1.4653 0.1849 -1.2770
## 54 54 -2.565 -1.2516 0.0025 -1.2715
## 49 49 0.190 -2.1134 -1.8549 -1.2595
## 69 69 -1.411 -2.1343 -0.2193 -1.2550
## 67 67 -2.929 -1.8727 1.0401 -1.2539
## 50 50 -1.061 -1.5447 -1.1511 -1.2523
## 46 46 -1.512 -1.3700 -0.8733 -1.2518
## 51 51 -1.958 -1.4219 -0.3483 -1.2428
## 347 347 -1.453 -1.9111 -0.3635 -1.2426
## 351 351 -2.938 -1.6092 0.8485 -1.2328
## 47 47 -1.394 -1.3932 -0.8948 -1.2272
## 346 346 -1.634 -1.7707 -0.2466 -1.2171
## 43 43 -2.416 -0.8979 -0.2529 -1.1890
## 44 44 -2.339 -0.9548 -0.2720 -1.1887
## 68 68 -2.023 -1.6490 0.1554 -1.1722
## 352 352 -3.525 -1.7603 1.8049 -1.1602
## 195 195 -3.887 -0.4569 0.8912 -1.1508
## 299 299 -3.711 -1.1792 1.4507 -1.1464
## 45 45 -1.738 -1.0108 -0.6892 -1.1459
## 349 349 -3.773 -1.2397 1.5776 -1.1451
## 70 70 -1.834 -1.6193 0.0381 -1.1384
## 246 246 -1.012 -2.2152 -0.1379 -1.1216
## 52 52 -2.020 -0.9701 -0.3588 -1.1161
## 194 194 -4.072 -0.3077 1.0500 -1.1098
## 288 288 -2.955 -1.2472 0.8832 -1.1064
## 350 350 -3.293 -1.1643 1.1398 -1.1060
## 66 66 -3.592 -1.2116 1.4875 -1.1055
## 53 53 -2.909 -0.6789 0.2719 -1.1054
## 245 245 -1.178 -2.0121 -0.0948 -1.0948
## 202 202 -3.408 -0.9195 1.0583 -1.0897
## 244 244 -3.017 -1.0146 0.7671 -1.0883
## 271 271 -1.422 -1.2221 -0.6056 -1.0833
## 65 65 -3.282 -0.3782 0.4197 -1.0801
## 336 336 -1.508 -1.2967 -0.4094 -1.0712
## 348 348 -3.468 -1.5854 1.8504 -1.0678
## 215 215 -0.250 -1.8692 -1.0836 -1.0675
## 87 87 -1.402 -0.9424 -0.8455 -1.0632
## 48 48 -0.678 -1.1752 -1.3099 -1.0545
## 59 59 -2.257 -1.5896 0.6888 -1.0524
## 72 72 -1.489 -1.3818 -0.2790 -1.0500
## 61 61 -1.234 -1.9044 -0.0031 -1.0470
## 337 337 -1.093 -1.3249 -0.6996 -1.0392
## 73 73 -1.854 -1.1866 -0.0686 -1.0363
## 289 289 -2.785 -1.1001 0.7830 -1.0339
## 247 247 -2.140 -1.5577 0.6027 -1.0316
## 290 290 -3.095 -1.0536 1.0611 -1.0290
## 60 60 -1.655 -1.7063 0.2787 -1.0277
## 338 338 -0.949 -1.3309 -0.7895 -1.0232
## 55 55 -1.832 -2.6133 1.3800 -1.0217
## 42 42 -2.718 -0.3807 0.0339 -1.0217
## 285 285 -4.424 -0.3348 1.7048 -1.0181
## 335 335 -1.659 -1.1192 -0.2749 -1.0177
## 272 272 -2.227 -0.7361 -0.0870 -1.0166
## 58 58 -4.527 -0.4382 1.9301 -1.0118
## 56 56 -4.687 -0.5784 2.2378 -1.0093
## 6 6 -2.257 -0.2674 -0.4702 -0.9981
## 334 334 -1.756 -1.0021 -0.2327 -0.9971
## 84 84 -1.991 -1.0212 0.0309 -0.9938
## 74 74 -1.850 -1.1036 -0.0134 -0.9890
## 83 83 -2.280 -0.9256 0.2400 -0.9885
## 298 298 -0.968 -1.0097 -0.9871 -0.9882
## 340 340 -1.064 -1.1963 -0.6942 -0.9849
## 252 252 -2.691 -1.2167 0.9829 -0.9748
## 339 339 -1.277 -1.0884 -0.5588 -0.9746
## 270 270 -1.122 -0.9472 -0.8263 -0.9651
## 239 239 -2.754 -0.7388 0.5990 -0.9647
## 329 329 -1.513 -1.1313 -0.2366 -0.9602
## 242 242 -1.779 -1.0216 -0.0769 -0.9592
## 243 243 -2.206 -0.9103 0.2403 -0.9588
## 40 40 -3.559 -0.6109 1.2946 -0.9583
## 251 251 -2.548 -1.2419 0.9153 -0.9583
## 85 85 -1.719 -0.5147 -0.6204 -0.9512
## 341 341 -0.928 -1.0893 -0.8069 -0.9414
## 71 71 -1.960 -0.9007 0.0655 -0.9318
## 88 88 -1.395 -0.5002 -0.8951 -0.9300
## 294 294 -1.810 -0.5377 -0.4365 -0.9280
## 185 185 -0.812 -0.2690 -1.6880 -0.9229
## 300 300 -4.231 -0.3976 1.8695 -0.9196
## 293 293 -3.302 -0.8465 1.4075 -0.9137
## 198 198 -4.265 0.1666 1.3695 -0.9097
## 331 331 -1.676 -0.9274 -0.1010 -0.9016
## 253 253 -3.236 -0.8598 1.3927 -0.9010
## 295 295 -1.370 -0.5851 -0.7417 -0.8988
## 97 97 -1.197 -0.4085 -1.0745 -0.8933
## 250 250 -2.654 -1.0312 1.0162 -0.8896
## 62 62 -0.810 -1.6012 -0.2440 -0.8849
## 206 206 -1.112 -0.8851 -0.6496 -0.8821
## 248 248 -1.543 -1.2979 0.2023 -0.8794
## 301 301 -3.592 -0.4497 1.4169 -0.8748
## 249 249 -2.045 -1.1444 0.5659 -0.8744
## 311 311 0.035 -1.4352 -1.2228 -0.8742
## 13 13 -1.314 -0.7148 -0.5901 -0.8728
## 38 38 -1.039 -0.8906 -0.6834 -0.8711
## 19 19 -0.364 -1.4954 -0.7522 -0.8706
## 328 328 -1.045 -1.0807 -0.4821 -0.8691
## 9 9 0.122 -1.2191 -1.4554 -0.8509
## 240 240 -2.478 -0.4830 0.4208 -0.8466
## 324 324 -0.436 -1.1170 -0.9713 -0.8414
## 326 326 -1.878 -0.6979 0.0609 -0.8383
## 186 186 -1.378 0.0947 -1.2261 -0.8365
## 342 342 -3.575 0.5314 0.5390 -0.8349
## 39 39 -1.230 -0.7413 -0.5333 -0.8348
## 327 327 -1.591 -0.7781 -0.1357 -0.8348
## 4 4 -2.806 0.3659 -0.0561 -0.8320
## 64 64 -2.245 -1.0265 0.7823 -0.8297
## 2 2 -1.304 -0.1606 -1.0161 -0.8268
## 81 81 -2.551 -0.3769 0.4481 -0.8265
## 200 200 -4.380 -0.5249 2.4313 -0.8246
## 197 197 -4.636 0.5918 1.5733 -0.8236
## 291 291 -3.401 -0.5540 1.4869 -0.8227
## 330 330 -1.959 -0.5978 0.0941 -0.8210
## 343 343 -1.597 -0.3808 -0.4543 -0.8107
## 41 41 -3.977 -0.0475 1.5931 -0.8105
## 323 323 -1.034 -0.8545 -0.5403 -0.8096
## 201 201 -4.390 -0.5212 2.4829 -0.8093
## 212 212 0.481 -1.2101 -1.6908 -0.8068
## 199 199 -4.512 0.6040 1.4994 -0.8029
## 86 86 -1.870 0.0498 -0.5480 -0.7894
## 63 63 -1.820 -0.9510 0.4039 -0.7890
## 210 210 0.533 -1.1202 -1.7622 -0.7830
## 10 10 -0.859 -0.5981 -0.8836 -0.7801
## 26 26 0.431 -1.5542 -1.2057 -0.7765
## 213 213 -0.465 -0.7915 -1.0729 -0.7764
## 303 303 -2.565 -0.4346 0.6743 -0.7749
## 37 37 -0.593 -0.7577 -0.9716 -0.7740
## 279 279 -2.474 -0.1557 0.3119 -0.7725
## 82 82 -1.911 -0.4023 0.0136 -0.7667
## 17 17 -0.994 -1.0029 -0.3016 -0.7663
## 208 208 -0.266 -0.8247 -1.2067 -0.7659
## 241 241 -2.238 -0.3859 0.3539 -0.7566
## 177 177 -1.265 -0.1808 -0.8193 -0.7552
## 12 12 -1.011 -0.4266 -0.8250 -0.7543
## 273 273 -1.709 -0.1132 -0.4217 -0.7479
## 16 16 -0.503 -1.0618 -0.6627 -0.7425
## 282 282 -3.278 0.9318 0.1411 -0.7350
## 5 5 -2.735 0.6228 -0.0847 -0.7322
## 36 36 -0.589 -0.6232 -0.9786 -0.7304
## 182 182 -1.706 0.6267 -1.1030 -0.7276
## 91 91 -1.282 0.1083 -0.9978 -0.7238
## 31 31 0.834 -1.6235 -1.3676 -0.7191
## 7 7 -1.248 -0.2133 -0.6956 -0.7190
## 96 96 -1.878 0.3605 -0.6398 -0.7190
## 302 302 -2.189 -0.4240 0.4567 -0.7189
## 280 280 -3.094 0.9485 0.0108 -0.7115
## 80 80 -0.803 -0.9749 -0.3445 -0.7073
## 209 209 -0.692 -0.5023 -0.9204 -0.7048
## 92 92 -1.203 0.1598 -1.0643 -0.7026
## 296 296 -2.143 0.2379 -0.1979 -0.7011
## 14 14 -0.534 -0.9307 -0.6346 -0.6998
## 278 278 -2.984 0.2470 0.6494 -0.6957
## 20 20 -0.050 -1.0829 -0.9497 -0.6943
## 21 21 0.890 -1.5144 -1.4541 -0.6929
## 216 216 -1.112 -0.3074 -0.6580 -0.6924
## 325 325 -1.458 -0.3662 -0.2395 -0.6880
## 27 27 0.223 -1.1905 -1.0906 -0.6859
## 316 316 -0.079 -0.7261 -1.2477 -0.6843
## 33 33 0.886 -1.6616 -1.2764 -0.6839
## 297 297 -1.797 0.2068 -0.4565 -0.6822
## 11 11 -0.578 -0.5201 -0.9417 -0.6801
## 192 192 -3.210 0.0820 1.0927 -0.6783
## 1 1 -2.038 0.6170 -0.5942 -0.6719
## 34 34 0.712 -1.3790 -1.3410 -0.6694
## 318 318 -0.089 -0.6977 -1.2032 -0.6633
## 173 173 -0.336 -0.1249 -1.5183 -0.6596
## 322 322 -1.181 -0.3588 -0.4360 -0.6587
## 175 175 -0.863 0.0331 -1.1463 -0.6587
## 94 94 -1.586 -0.3197 -0.0630 -0.6562
## 207 207 -1.020 -0.2630 -0.6815 -0.6548
## 75 75 -1.433 -0.6321 0.1232 -0.6472
## 321 321 -1.224 -0.3137 -0.3996 -0.6459
## 214 214 -1.376 -0.0875 -0.4681 -0.6439
## 292 292 -3.737 0.1201 1.6874 -0.6431
## 275 275 -2.799 0.3693 0.5032 -0.6422
## 257 257 -4.734 0.9405 1.8893 -0.6348
## 24 24 0.710 -1.2812 -1.3326 -0.6346
## 25 25 0.370 -1.1263 -1.1444 -0.6335
## 28 28 0.341 -1.1692 -1.0638 -0.6307
## 18 18 0.109 -1.0091 -0.9762 -0.6254
## 284 284 -5.578 1.8904 1.8157 -0.6239
## 211 211 -0.053 -0.4443 -1.3527 -0.6167
## 317 317 0.168 -0.6754 -1.3172 -0.6081
## 189 189 -2.879 0.2386 0.8431 -0.5990
## 345 345 -3.078 -0.1129 1.3943 -0.5988
## 276 276 -2.760 0.4954 0.4817 -0.5942
## 320 320 -0.495 -0.3915 -0.8885 -0.5917
## 306 306 -1.962 0.1415 0.0494 -0.5904
## 15 15 -0.142 -0.7534 -0.8584 -0.5848
## 191 191 -3.547 0.4877 1.3140 -0.5816
## 79 79 -0.682 -0.7034 -0.3570 -0.5808
## 506 506 0.301 -0.6333 -1.4081 -0.5802
## 344 344 -2.282 -0.3310 0.8865 -0.5755
## 78 78 -0.685 -0.6309 -0.3818 -0.5660
## 203 203 -4.816 1.0709 2.0652 -0.5601
## 8 8 -0.856 0.1040 -0.9249 -0.5591
## 22 22 0.136 -0.7746 -1.0330 -0.5570
## 304 304 -3.084 0.4094 1.0041 -0.5570
## 23 23 0.473 -1.0146 -1.1094 -0.5502
## 176 176 -1.910 0.6509 -0.3913 -0.5500
## 76 76 -0.874 -0.5258 -0.2473 -0.5491
## 32 32 0.327 -0.8709 -1.0824 -0.5420
## 266 266 -0.932 0.6016 -1.2929 -0.5411
## 35 35 0.708 -1.1089 -1.2213 -0.5408
## 184 184 -1.563 1.1329 -1.1747 -0.5351
## 178 178 -1.246 0.5274 -0.8723 -0.5305
## 93 93 -1.238 -0.0981 -0.2455 -0.5273
## 3 3 -2.339 1.1186 -0.3452 -0.5217
## 231 231 -0.700 -0.0993 -0.7648 -0.5214
## 236 236 -0.823 -0.0607 -0.6731 -0.5189
## 95 95 -0.740 -0.2203 -0.5944 -0.5184
## 217 217 -0.376 0.0579 -1.2221 -0.5135
## 180 180 -2.257 1.3779 -0.6437 -0.5077
## 193 193 -3.644 0.7450 1.3923 -0.5022
## 90 90 -1.877 0.9485 -0.5698 -0.4995
## 310 310 -0.234 -0.1148 -1.1480 -0.4988
## 277 277 -2.790 0.7280 0.5919 -0.4902
## 89 89 -1.464 0.8416 -0.8444 -0.4888
## 496 496 0.058 -0.8221 -0.6623 -0.4754
## 312 312 -0.688 0.0902 -0.8189 -0.4724
## 308 308 -1.929 0.4981 0.0367 -0.4646
## 503 503 0.058 -0.1414 -1.2912 -0.4582
## 305 305 -2.743 0.8103 0.6109 -0.4404
## 29 29 -0.043 -0.4388 -0.8327 -0.4381
## 174 174 -0.910 0.6745 -1.0535 -0.4298
## 313 313 0.041 -0.0098 -1.3196 -0.4296
## 100 100 -2.227 1.2665 -0.3281 -0.4295
## 497 497 0.881 -0.9272 -1.2392 -0.4285
## 77 77 -0.311 -0.3566 -0.6181 -0.4284
## 319 319 -0.586 0.1632 -0.8451 -0.4225
## 230 230 -1.900 0.6025 0.0345 -0.4209
## 188 188 -2.675 0.7025 0.7279 -0.4149
## 127 127 1.837 -0.6015 -2.4494 -0.4045
## 111 111 -0.106 -0.5451 -0.5323 -0.3945
## 222 222 0.105 -0.1020 -1.1758 -0.3910
## 196 196 -5.032 1.9820 1.8781 -0.3908
## 314 314 -0.411 0.2720 -1.0262 -0.3885
## 254 254 -3.989 0.8308 2.0199 -0.3795
## 204 204 -4.955 1.8525 1.9762 -0.3754
## 283 283 -3.722 2.1775 0.4270 -0.3726
## 121 121 0.640 0.0369 -1.7928 -0.3721
## 219 219 0.298 0.2468 -1.6412 -0.3655
## 30 30 -0.249 -0.1659 -0.6724 -0.3623
## 274 274 -2.561 1.2194 0.2545 -0.3622
## 500 500 0.685 -0.6290 -1.1355 -0.3598
## 502 502 -0.220 0.1838 -1.0214 -0.3526
## 107 107 0.809 -0.6765 -1.1686 -0.3455
## 120 120 0.223 -0.3574 -0.8848 -0.3398
## 494 494 0.171 -0.3678 -0.8167 -0.3379
## 190 190 -3.075 1.0427 1.0308 -0.3340
## 498 498 0.449 -0.4993 -0.9452 -0.3317
## 124 124 1.617 -0.2918 -2.3128 -0.3294
## 237 237 -0.982 0.4994 -0.5013 -0.3280
## 205 205 -5.109 2.0874 2.0872 -0.3115
## 183 183 -1.954 1.8873 -0.8668 -0.3112
## 106 106 0.773 -0.5281 -1.1760 -0.3104
## 104 104 0.372 -0.4168 -0.8703 -0.3052
## 125 125 1.194 0.0490 -2.1296 -0.2955
## 122 122 0.810 0.1929 -1.8880 -0.2950
## 495 495 -0.025 -0.2189 -0.6326 -0.2921
## 315 315 -0.503 0.5479 -0.9149 -0.2899
## 179 179 -1.468 1.2770 -0.6729 -0.2881
## 99 99 -3.054 1.9872 0.2032 -0.2879
## 123 123 1.092 0.1480 -2.0548 -0.2717
## 309 309 -0.711 0.7126 -0.7939 -0.2642
## 108 108 0.431 -0.3018 -0.9198 -0.2635
## 235 235 -1.230 0.8259 -0.3654 -0.2565
## 110 110 0.502 -0.3491 -0.9209 -0.2560
## 105 105 0.359 -0.2374 -0.8858 -0.2549
## 126 126 0.886 0.2957 -1.9453 -0.2545
## 220 220 -0.286 0.7961 -1.2705 -0.2535
## 119 119 0.353 -0.1300 -0.9497 -0.2424
## 103 103 0.166 -0.1771 -0.7079 -0.2397
## 281 281 -3.489 2.4794 0.2919 -0.2391
## 307 307 -2.270 1.2676 0.3038 -0.2328
## 501 501 0.589 -0.2587 -0.9985 -0.2229
## 499 499 0.256 -0.0987 -0.8138 -0.2189
## 505 505 -0.177 0.6226 -1.0708 -0.2084
## 116 116 0.582 -0.0721 -1.0867 -0.1923
## 118 118 0.182 0.1283 -0.8659 -0.1850
## 224 224 -1.035 1.0182 -0.5376 -0.1848
## 187 187 -3.022 2.6063 -0.1008 -0.1720
## 181 181 -2.174 2.2624 -0.5910 -0.1676
## 113 113 0.657 -0.0089 -1.1490 -0.1669
## 117 117 0.047 0.2020 -0.7355 -0.1622
## 223 223 -0.967 0.9668 -0.4841 -0.1613
## 109 109 0.348 0.0412 -0.8334 -0.1482
## 218 218 -0.660 1.2513 -1.0286 -0.1456
## 98 98 -2.525 2.2390 -0.1019 -0.1292
## 114 114 0.647 0.0776 -1.0961 -0.1237
## 504 504 -0.275 0.9438 -1.0066 -0.1128
## 102 102 -0.488 0.4710 -0.3000 -0.1056
## 115 115 0.228 0.3624 -0.8531 -0.0874
## 221 221 -0.805 1.1588 -0.6093 -0.0852
## 142 142 3.198 -1.4530 -1.9861 -0.0802
## 101 101 -0.318 0.5177 -0.4215 -0.0738
## 238 238 -1.655 1.5020 -0.0317 -0.0617
## 228 228 -1.313 1.5429 -0.3018 -0.0241
## 232 232 -1.538 1.6627 -0.1129 0.0040
## 267 267 -1.192 2.1365 -0.9169 0.0093
## 269 269 -2.889 2.9654 -0.0074 0.0229
## 171 171 0.911 0.6987 -1.5316 0.0261
## 260 260 -1.292 2.4074 -0.9920 0.0412
## 229 229 -2.732 2.2151 0.6465 0.0432
## 112 112 -0.140 0.8470 -0.5673 0.0466
## 130 130 2.145 -0.5952 -1.3983 0.0506
## 168 168 0.470 0.9762 -1.2581 0.0627
## 135 135 2.015 -0.4329 -1.3102 0.0906
## 128 128 2.046 -0.3652 -1.3988 0.0940
## 261 261 -1.605 2.5980 -0.7082 0.0950
## 172 172 0.819 0.9032 -1.4366 0.0952
## 165 165 0.637 1.0327 -1.3541 0.1051
## 134 134 1.743 -0.2057 -1.2094 0.1092
## 139 139 2.307 -0.4958 -1.4763 0.1115
## 264 264 -1.335 2.6070 -0.8194 0.1508
## 137 137 1.872 -0.1604 -1.2450 0.1554
## 145 145 3.024 -0.0089 -2.4782 0.1790
## 265 265 -1.618 2.9175 -0.7523 0.1823
## 141 141 2.277 -0.3502 -1.3675 0.1863
## 148 148 2.894 0.1107 -2.4360 0.1897
## 153 153 1.934 0.7084 -2.0581 0.1949
## 166 166 0.466 1.4361 -1.1925 0.2366
## 259 259 -1.556 3.0795 -0.7740 0.2499
## 159 159 0.455 1.6497 -1.3457 0.2529
## 140 140 1.964 0.0574 -1.2479 0.2578
## 157 157 2.184 0.6782 -2.0288 0.2777
## 170 170 0.536 1.4909 -1.1825 0.2815
## 136 136 1.773 0.1855 -1.1055 0.2842
## 149 149 2.637 0.4870 -2.2614 0.2875
## 169 169 0.536 1.5541 -1.2253 0.2883
## 161 161 0.191 1.8875 -1.1674 0.3036
## 132 132 1.512 0.3833 -0.9524 0.3142
## 227 227 -1.826 2.6885 0.0910 0.3179
## 262 262 -1.999 3.4750 -0.5102 0.3219
## 491 491 3.704 -1.3356 -1.4029 0.3220
## 138 138 1.696 0.3504 -1.0667 0.3264
## 129 129 1.720 0.3645 -1.0891 0.3320
## 131 131 1.510 0.4895 -0.9837 0.3386
## 133 133 1.324 0.6310 -0.9053 0.3499
## 233 233 -2.284 2.9251 0.4413 0.3606
## 143 143 2.760 0.5569 -2.2221 0.3650
## 268 268 -2.916 3.9977 0.1245 0.4022
## 234 234 -2.397 3.1670 0.4438 0.4045
## 152 152 1.885 1.3041 -1.9727 0.4055
## 150 150 2.303 0.9088 -1.9954 0.4055
## 490 490 3.399 -0.9460 -1.1999 0.4178
## 144 144 2.667 0.7183 -2.1176 0.4226
## 147 147 2.115 1.1554 -1.9675 0.4343
## 225 225 -2.105 3.1894 0.2673 0.4506
## 154 154 1.909 1.4150 -1.8576 0.4887
## 489 489 2.812 -0.3413 -0.9356 0.5117
## 156 156 1.702 1.3976 -1.4985 0.5339
## 146 146 2.533 1.0731 -2.0039 0.5342
## 155 155 1.757 1.5798 -1.7182 0.5397
## 151 151 1.622 1.8841 -1.6658 0.6133
## 263 263 -2.489 4.4736 -0.1007 0.6279
## 492 492 2.759 0.0159 -0.8052 0.6567
## 226 226 -2.317 3.8358 0.4557 0.6582
## 493 493 2.157 0.3388 -0.4932 0.6676
## 158 158 -0.439 3.2292 -0.7754 0.6715
## 484 484 1.289 -0.5852 1.3497 0.6845
## 258 258 -2.628 4.8376 0.0355 0.7484
## 160 160 1.156 2.4965 -1.3980 0.7514
## 485 485 1.627 -0.4686 1.2118 0.7900
## 366 366 3.093 -0.5143 -0.0533 0.8416
## 162 162 -1.065 4.1202 -0.3479 0.9025
## 466 466 2.108 -0.2797 1.0157 0.9480
## 488 488 1.808 -0.1792 1.2327 0.9537
## 486 486 1.460 0.0273 1.4427 0.9768
## 425 425 2.887 -0.7548 0.8514 0.9945
## 368 368 3.558 -0.8244 0.3133 1.0156
## 163 163 -1.070 4.4022 -0.2716 1.0204
## 475 475 3.105 -0.6145 0.5913 1.0272
## 167 167 -1.046 4.4170 -0.2304 1.0469
## 481 481 1.572 0.1638 1.4151 1.0502
## 487 487 2.201 -0.0506 1.0866 1.0791
## 472 472 2.049 0.2023 0.9870 1.0795
## 427 427 2.773 -0.6791 1.2299 1.1079
## 471 471 2.294 0.1141 0.9353 1.1144
## 367 367 3.137 0.0105 0.2222 1.1231
## 375 375 5.145 -1.8129 0.0546 1.1288
## 468 468 2.789 -0.0281 0.6339 1.1316
## 470 470 2.337 -0.3985 1.4616 1.1332
## 164 164 -1.252 4.7224 -0.0511 1.1397
## 467 467 2.652 0.0831 0.7226 1.1527
## 374 374 4.558 -1.1184 0.0201 1.1533
## 393 393 4.222 -0.9946 0.2800 1.1691
## 409 409 3.502 -0.3429 0.3821 1.1805
## 385 385 4.894 -1.7255 0.3877 1.1853
## 473 473 1.930 0.5010 1.1293 1.1868
## 407 407 4.581 -1.4515 0.4309 1.1870
## 476 476 3.171 -0.2316 0.6237 1.1878
## 413 413 4.462 -1.3422 0.4580 1.1927
## 424 424 3.148 -0.2568 0.7163 1.2024
## 478 478 3.846 -0.9056 0.6915 1.2107
## 389 389 4.610 -1.1991 0.2350 1.2153
## 390 390 3.778 -0.4365 0.3221 1.2213
## 457 457 3.181 -0.0876 0.5773 1.2237
## 400 400 4.032 -0.8520 0.5242 1.2348
## 433 433 2.231 0.3165 1.1699 1.2392
## 482 482 1.386 0.7931 1.5650 1.2481
## 384 384 3.916 -0.3772 0.2730 1.2708
## 398 398 3.699 -0.2961 0.4111 1.2712
## 458 458 3.066 -0.1190 0.8776 1.2749
## 469 469 2.665 -0.2970 1.4844 1.2842
## 465 465 2.222 0.3320 1.3019 1.2853
## 429 429 3.244 -0.1601 0.7770 1.2871
## 431 431 2.752 0.1085 1.0154 1.2920
## 383 383 3.925 -0.3975 0.3529 1.2936
## 363 363 3.029 0.4783 0.3854 1.2977
## 391 391 3.326 0.0738 0.5246 1.3082
## 477 477 2.721 0.3933 0.8218 1.3121
## 423 423 2.836 0.1326 1.0266 1.3318
## 483 483 1.234 1.1247 1.6996 1.3529
## 386 386 4.661 -1.0637 0.4760 1.3578
## 440 440 3.841 -0.2334 0.4736 1.3605
## 364 364 3.179 0.4114 0.4945 1.3616
## 479 479 3.048 0.1189 0.9383 1.3685
## 392 392 2.820 0.5302 0.7679 1.3728
## 460 460 2.746 0.4644 0.9284 1.3795
## 462 462 2.700 0.6354 0.8040 1.3799
## 388 388 4.847 -1.4103 0.7363 1.3910
## 459 459 2.908 0.2841 0.9898 1.3939
## 453 453 2.993 0.4654 0.7324 1.3969
## 456 456 2.945 0.4399 0.8148 1.3998
## 422 422 3.245 0.3267 0.6496 1.4070
## 434 434 2.937 0.4810 0.8380 1.4186
## 463 463 2.637 0.6226 1.0303 1.4298
## 430 430 3.587 -0.0371 0.7397 1.4299
## 387 387 4.867 -1.2779 0.7067 1.4320
## 397 397 3.271 0.3977 0.6449 1.4378
## 360 360 2.658 0.8395 0.8369 1.4447
## 369 369 1.769 1.8332 0.7328 1.4450
## 439 439 4.429 -0.6827 0.6098 1.4521
## 426 426 3.971 -0.4813 0.8753 1.4551
## 394 394 3.134 0.3923 0.8420 1.4561
## 359 359 2.616 0.8751 0.9182 1.4697
## 461 461 2.765 0.7552 0.9262 1.4820
## 432 432 2.838 0.4451 1.1692 1.4840
## 449 449 3.333 0.3176 0.8039 1.4850
## 395 395 3.468 0.0739 0.9204 1.4874
## 445 445 3.987 -0.1993 0.6822 1.4899
## 362 362 2.889 0.8771 0.7045 1.4901
## 450 450 3.305 0.4068 0.7589 1.4901
## 474 474 1.553 1.4215 1.5095 1.4948
## 464 464 2.434 0.9854 1.0839 1.5012
## 447 447 3.242 0.5700 0.6996 1.5039
## 443 443 3.154 0.7530 0.6438 1.5168
## 452 452 3.014 0.7295 0.8101 1.5178
## 358 358 2.720 1.0735 0.8172 1.5370
## 451 451 3.006 0.6644 0.9423 1.5374
## 448 448 3.363 0.3959 0.8665 1.5419
## 417 417 3.613 0.0771 0.9403 1.5435
## 403 403 3.479 0.3778 0.7783 1.5449
## 396 396 3.237 0.5651 0.8463 1.5494
## 480 480 2.669 0.6301 1.3832 1.5609
## 418 418 4.441 -0.9246 1.1861 1.5675
## 408 408 2.909 0.8837 0.9124 1.5683
## 435 435 3.361 0.2684 1.1074 1.5789
## 404 404 4.259 -0.6818 1.1849 1.5874
## 361 361 2.364 1.4060 1.0177 1.5958
## 402 402 3.782 0.0702 0.9377 1.5966
## 446 446 3.692 0.2719 0.8290 1.5975
## 420 420 3.426 0.2188 1.1638 1.6029
## 414 414 3.989 -0.5807 1.4168 1.6085
## 455 455 3.094 0.6615 1.0768 1.6109
## 438 438 4.179 -0.1571 0.8180 1.6133
## 357 357 3.352 0.6961 0.8005 1.6163
## 442 442 3.341 0.6771 0.8863 1.6349
## 378 378 3.339 0.6903 0.9290 1.6528
## 412 412 3.160 0.5990 1.2005 1.6533
## 416 416 4.173 -0.2461 1.0467 1.6579
## 444 444 3.388 0.7087 0.8899 1.6621
## 436 436 3.554 0.4808 0.9635 1.6660
## 380 380 3.861 0.0656 1.0835 1.6701
## 421 421 3.188 0.8214 1.0092 1.6727
## 437 437 3.580 0.3311 1.1250 1.6787
## 382 382 3.628 0.3402 1.1417 1.7032
## 441 441 4.152 -0.2423 1.2100 1.7064
## 377 377 3.550 0.4840 1.1738 1.7360
## 401 401 4.525 -0.5301 1.2316 1.7422
## 373 373 1.865 2.3344 1.1826 1.7940
## 454 454 2.749 1.4386 1.2776 1.8218
## 410 410 2.754 1.3532 1.4234 1.8437
## 415 415 5.951 -1.9636 1.5925 1.8601
## 379 379 3.936 0.2231 1.4704 1.8763
## 372 372 1.820 2.5695 1.2901 1.8933
## 370 370 1.260 3.0611 1.4328 1.9181
## 399 399 5.262 -1.1069 1.6365 1.9307
## 405 405 4.908 -0.9165 2.0639 2.0183
## 371 371 1.181 3.3678 1.5948 2.0478
## 376 376 3.059 1.4075 1.7967 2.0879
## 428 428 3.806 0.0198 2.4700 2.0984
## 365 365 1.485 3.0524 1.8832 2.1404
## 411 411 4.064 0.1119 2.9617 2.3793
## 406 406 5.699 -0.7410 3.3925 2.7836
## 419 419 5.464 -0.3670 3.9188 3.0052
## 381 381 5.343 0.5262 5.2140 3.6946
Abdi, H., and Williams, L. J. (2010). Principal component analysis. Wiley interdisciplinary reviews: computational statistics, 2(4), 433-459.
Härdle, W. K., and Simar, L. (2019). Applied multivariate statistical analysis. Springer Nature.
Ringnér, M. (2008). What is principal component analysis. Nature biotechnology, 26(3), 303-304.