Vou ir rodando voce vai interpretando as saidas para fazer o artigo. Abaixo a sequencia do artigo para voce montá-lo: Esse banco de dados é em csv. e contem 20 cidades com 12 variáveis, precisa ser montada a estrutura de artigo onde tem que posicionar os graficos, tabelas, formulas explicativas para entendimento, etc. Em seu devido lugar.
1º - Resumo - Fazer um resumo sobre análise de Componentes Principais: resumo teórico, aplicação e interpretação
2º - Palavras-chave:Colocar as palavras chaves conforme meus dados e resultados
3º - Abstract: Fazer
4º - INTRODUÇÃO - Fazer introdução do artigo
5º - MATERIAL E MÉTODOS
6º - RESULTADOS E DISCUSSÕES
Análise de Componentes Principais: resumo teórico, aplicação e interpretação
Resumo:
## [1] 0
## [1] 0
res.pca <- PCA(dados_numericos_clean, scale.unit = TRUE, graph = FALSE)
# Resumo da PCA
summary(res.pca)
##
## Call:
## PCA(X = dados_numericos_clean, scale.unit = TRUE, graph = FALSE)
##
##
## Eigenvalues
## Dim.1 Dim.2 Dim.3 Dim.4 Dim.5 Dim.6 Dim.7
## Variance 9.860 0.500 0.225 0.219 0.125 0.032 0.023
## % of var. 89.637 4.541 2.047 1.987 1.133 0.295 0.213
## Cumulative % of var. 89.637 94.178 96.225 98.212 99.345 99.640 99.854
## Dim.8 Dim.9 Dim.10 Dim.11
## Variance 0.008 0.005 0.002 0.001
## % of var. 0.069 0.047 0.023 0.009
## Cumulative % of var. 99.922 99.969 99.991 100.000
##
## Individuals (the 10 first)
## Dist Dim.1 ctr cos2 Dim.2 ctr cos2 Dim.3 ctr
## 1 | 15.296 | 15.259 78.717 0.995 | 0.193 0.248 0.000 | -0.977 14.121
## 2 | 5.945 | 5.187 9.094 0.761 | -2.194 32.120 0.136 | 1.391 28.637
## 3 | 3.510 | 2.205 1.643 0.395 | 2.416 38.957 0.474 | 0.357 1.890
## 4 | 2.617 | 1.511 0.772 0.334 | -0.099 0.065 0.001 | 1.288 24.555
## 5 | 0.805 | 0.289 0.028 0.129 | 0.155 0.161 0.037 | 0.281 1.170
## 6 | 0.715 | -0.005 0.000 0.000 | 0.233 0.361 0.106 | 0.390 2.256
## 7 | 0.809 | -0.203 0.014 0.063 | 0.369 0.909 0.208 | 0.255 0.960
## 8 | 0.958 | -0.512 0.088 0.285 | -0.246 0.405 0.066 | 0.071 0.075
## 9 | 0.942 | -0.033 0.000 0.001 | 0.526 1.849 0.312 | 0.369 2.020
## 10 | 0.991 | -0.579 0.113 0.342 | -0.406 1.099 0.168 | -0.194 0.558
## cos2
## 1 0.004 |
## 2 0.055 |
## 3 0.010 |
## 4 0.242 |
## 5 0.122 |
## 6 0.298 |
## 7 0.099 |
## 8 0.005 |
## 9 0.154 |
## 10 0.038 |
##
## Variables (the 10 first)
## Dim.1 ctr cos2 Dim.2 ctr cos2 Dim.3 ctr cos2
## x1 | 0.969 9.520 0.939 | 0.080 1.287 0.006 | -0.191 16.239 0.037 |
## x2 | 0.998 10.092 0.995 | -0.015 0.043 0.000 | 0.011 0.053 0.000 |
## x3 | 0.995 10.041 0.990 | 0.038 0.294 0.001 | -0.040 0.701 0.002 |
## x4 | 0.962 9.384 0.925 | -0.002 0.001 0.000 | 0.176 13.769 0.031 |
## x5 | 0.806 6.590 0.650 | 0.540 58.381 0.292 | 0.138 8.416 0.019 |
## x6 | 0.987 9.876 0.974 | -0.048 0.464 0.002 | -0.133 7.845 0.018 |
## x7 | 0.950 9.145 0.902 | -0.006 0.008 0.000 | -0.286 36.455 0.082 |
## x8 | 0.943 9.019 0.889 | 0.123 3.021 0.015 | 0.054 1.276 0.003 |
## x9 | 0.870 7.678 0.757 | -0.378 28.661 0.143 | 0.117 6.042 0.014 |
## x10 | 0.938 8.920 0.879 | -0.148 4.371 0.022 | 0.128 7.258 0.016 |
fviz_pca_ind(res.pca, col.ind = "steelblue") +
ggtitle("Visualização das Variáveis")
fviz_pca_var(res.pca, col.var = "steelblue") +
ggtitle("Visualização das Variáveis")
fviz_screeplot(res.pca, addlabels = TRUE, ylim = c(0, 50)) +
ggtitle("Scree Plot")
fviz_pca_biplot(res.pca, repel = TRUE,
col.ind = "steelblue", # Cor dos indivíduos
col.var = "red", # Cor das variáveis
label = "all", # Rótulos para todos os indivíduos
pointshape = 21, # Forma dos pontos
addEllipses = TRUE) + # Adiciona elipses de confiança
ggtitle("Biplot de CP1 × CP2 com Variáveis") +
theme_minimal()
autovalores <- res.pca$eig # Autovalores e variância explicada
autovalores
## eigenvalue percentage of variance cumulative percentage of variance
## comp 1 9.8600664787 89.636967988 89.63697
## comp 2 0.4995528381 4.541389437 94.17836
## comp 3 0.2251406627 2.046733297 96.22509
## comp 4 0.2185769512 1.987063192 98.21215
## comp 5 0.1246254544 1.132958676 99.34511
## comp 6 0.0324678307 0.295162097 99.64027
## comp 7 0.0234574107 0.213249189 99.85352
## comp 8 0.0075608669 0.068735153 99.92226
## comp 9 0.0051151095 0.046500995 99.96876
## comp 10 0.0024886961 0.022624510 99.99138
## comp 11 0.0009477011 0.008615465 100.00000
variancia_explicada <- autovalores[, 2] # Porcentagem da variância explicada
variancia_explicada
## comp 1 comp 2 comp 3 comp 4 comp 5 comp 6
## 89.636967988 4.541389437 2.046733297 1.987063192 1.132958676 0.295162097
## comp 7 comp 8 comp 9 comp 10 comp 11
## 0.213249189 0.068735153 0.046500995 0.022624510 0.008615465
proporcao_acumulada <- cumsum(variancia_explicada) # Proporção acumulada
proporcao_acumulada
## comp 1 comp 2 comp 3 comp 4 comp 5 comp 6 comp 7 comp 8
## 89.63697 94.17836 96.22509 98.21215 99.34511 99.64027 99.85352 99.92226
## comp 9 comp 10 comp 11
## 99.96876 99.99138 100.00000
resultados_pca <- data.frame(
CP = paste("CP", 1:nrow(autovalores)),
Autovalores = round(autovalores[, 1], 4), # Arredondar para 4 casas decimais
Variancia_Explicada = round(variancia_explicada, 2), # Arredondar para 2 casas decimais
Proporcao_Acumulada = round(proporcao_acumulada, 2) # Arredondar para 2 casas decimais
)
resultados_pca
## CP Autovalores Variancia_Explicada Proporcao_Acumulada
## comp 1 CP 1 9.8601 89.64 89.64
## comp 2 CP 2 0.4996 4.54 94.18
## comp 3 CP 3 0.2251 2.05 96.23
## comp 4 CP 4 0.2186 1.99 98.21
## comp 5 CP 5 0.1246 1.13 99.35
## comp 6 CP 6 0.0325 0.30 99.64
## comp 7 CP 7 0.0235 0.21 99.85
## comp 8 CP 8 0.0076 0.07 99.92
## comp 9 CP 9 0.0051 0.05 99.97
## comp 10 CP 10 0.0025 0.02 99.99
## comp 11 CP 11 0.0009 0.01 100.00
kable(resultados_pca, format = "html", caption = "Resultados da Análise de Componentes Principais (PCA)") %>%
kable_styling(full_width = F, position = "left", bootstrap_options = c("striped", "hover", "condensed"))
| CP | Autovalores | Variancia_Explicada | Proporcao_Acumulada | |
|---|---|---|---|---|
| comp 1 | CP 1 | 9.8601 | 89.64 | 89.64 |
| comp 2 | CP 2 | 0.4996 | 4.54 | 94.18 |
| comp 3 | CP 3 | 0.2251 | 2.05 | 96.23 |
| comp 4 | CP 4 | 0.2186 | 1.99 | 98.21 |
| comp 5 | CP 5 | 0.1246 | 1.13 | 99.35 |
| comp 6 | CP 6 | 0.0325 | 0.30 | 99.64 |
| comp 7 | CP 7 | 0.0235 | 0.21 | 99.85 |
| comp 8 | CP 8 | 0.0076 | 0.07 | 99.92 |
| comp 9 | CP 9 | 0.0051 | 0.05 | 99.97 |
| comp 10 | CP 10 | 0.0025 | 0.02 | 99.99 |
| comp 11 | CP 11 | 0.0009 | 0.01 | 100.00 |
cargas_fatoriais <- res.pca$var$coord # Cargas fatoriais
cargas_fatoriais
## Dim.1 Dim.2 Dim.3 Dim.4 Dim.5
## x1 0.9688537 0.080182374 -0.19121078 0.068867728 -0.052434681
## x2 0.9975247 -0.014673513 0.01097106 0.006843728 -0.027302195
## x3 0.9949967 0.038351131 -0.03974049 -0.010094264 -0.022304096
## x4 0.9618890 -0.002141919 0.17606397 -0.166942020 0.036561041
## x5 0.8060654 0.540039893 0.13765091 0.158798845 0.116145691
## x6 0.9867996 -0.048130119 -0.13290279 -0.007980674 0.060114108
## x7 0.9495707 -0.006309745 -0.28648930 -0.055617550 0.084651973
## x8 0.9430396 0.122837568 0.05360497 -0.073430277 -0.288076024
## x9 0.8701042 -0.378385576 0.11663558 0.286836016 0.011128552
## x10 0.9378099 -0.147771200 0.12782777 -0.249917581 0.108825273
## x11 0.9797922 -0.131652836 0.06615566 0.085533848 -0.008508926
correlacoes <- cor(dados_numericos_clean, res.pca$ind$coord[, 1:2])
correlacoes
## Dim.1 Dim.2
## x1 0.9688537 0.080182374
## x2 0.9975247 -0.014673513
## x3 0.9949967 0.038351131
## x4 0.9618890 -0.002141919
## x5 0.8060654 0.540039893
## x6 0.9867996 -0.048130119
## x7 0.9495707 -0.006309745
## x8 0.9430396 0.122837568
## x9 0.8701042 -0.378385576
## x10 0.9378099 -0.147771200
## x11 0.9797922 -0.131652836
resultados <- data.frame(
Características = rownames(cargas_fatoriais),
Carga_1 = round(cargas_fatoriais[, 1], 4),
Carga_2 = round(cargas_fatoriais[, 2], 4),
Correlacao_PC1 = round(correlacoes[, 1], 4),
Correlacao_PC2 = round(correlacoes[, 2], 4)
)
kable(resultados, format = "html", caption = "Coeficientes de Ponderação e Correlações com Componentes Principais") %>%
kable_styling(full_width = F, position = "left", bootstrap_options = c("striped", "hover", "condensed"))
| Características | Carga_1 | Carga_2 | Correlacao_PC1 | Correlacao_PC2 | |
|---|---|---|---|---|---|
| x1 | x1 | 0.9689 | 0.0802 | 0.9689 | 0.0802 |
| x2 | x2 | 0.9975 | -0.0147 | 0.9975 | -0.0147 |
| x3 | x3 | 0.9950 | 0.0384 | 0.9950 | 0.0384 |
| x4 | x4 | 0.9619 | -0.0021 | 0.9619 | -0.0021 |
| x5 | x5 | 0.8061 | 0.5400 | 0.8061 | 0.5400 |
| x6 | x6 | 0.9868 | -0.0481 | 0.9868 | -0.0481 |
| x7 | x7 | 0.9496 | -0.0063 | 0.9496 | -0.0063 |
| x8 | x8 | 0.9430 | 0.1228 | 0.9430 | 0.1228 |
| x9 | x9 | 0.8701 | -0.3784 | 0.8701 | -0.3784 |
| x10 | x10 | 0.9378 | -0.1478 | 0.9378 | -0.1478 |
| x11 | x11 | 0.9798 | -0.1317 | 0.9798 | -0.1317 |