knitr::opts_chunk$set(echo = TRUE)
library(FactoMineR)
library(ggplot2)
library(factoextra)
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
library(corrplot)
## corrplot 0.92 loaded
read.table("datosTaller1.csv",header=TRUE,sep=";",
row.names=1)->datos
##NOMBRE DE LAS VARIABLES
colnames(datos) <- c("alimentacion", "vestidocalza", "vivienda",
"movildomest", "gastsanitarios", "transporte",
"ensecultura", "turisocio", "otros")
##Las variables son: X1=
#alimentación, X2= vestido y calzado, X3= vivienda, X4= moviliario doméstico, X5= gastos sanitarios,
#X6= transporte, X7= enseñanza y cultura, X8= turismo y ocio, X9= otros gastos.#
summary(datos)
## alimentacion vestidocalza vivienda movildomest
## Min. :430442 Min. :167814 Min. :332662 Min. : 78217
## 1st Qu.:547131 1st Qu.:201655 1st Qu.:417691 1st Qu.:113550
## Median :598669 Median :228072 Median :487651 Median :129768
## Mean :600781 Mean :232043 Mean :499956 Mean :129688
## 3rd Qu.:646183 3rd Qu.:256498 3rd Qu.:553526 3rd Qu.:143317
## Max. :736441 Max. :324877 Max. :864553 Max. :221954
## gastsanitarios transporte ensecultura turisocio
## Min. :24476 Min. :136992 Min. : 57607 Min. :189811
## 1st Qu.:42610 1st Qu.:235941 1st Qu.: 97603 1st Qu.:244666
## Median :54684 Median :280023 Median :118269 Median :291708
## Mean :55104 Mean :278112 Mean :125310 Mean :294558
## 3rd Qu.:63087 3rd Qu.:315771 3rd Qu.:145831 3rd Qu.:323239
## Max. :97595 Max. :415313 Max. :239187 Max. :440275
## otros
## Min. : 54442
## 1st Qu.: 84019
## Median :100255
## Mean :102225
## 3rd Qu.:117851
## Max. :156493
A continuación realizamos el gráfico de correlación, donde se observa que hay correlaciones en las variables superiores a 0.6 es decir la información permite hacer un análisis de ACP.
R <- cor(datos)
R
## alimentacion vestidocalza vivienda movildomest gastsanitarios
## alimentacion 1.0000000 0.5315184 0.4754647 0.5166632 0.4743040
## vestidocalza 0.5315184 1.0000000 0.5491653 0.6333676 0.5053109
## vivienda 0.4754647 0.5491653 1.0000000 0.6989189 0.6703857
## movildomest 0.5166632 0.6333676 0.6989189 1.0000000 0.6740832
## gastsanitarios 0.4743040 0.5053109 0.6703857 0.6740832 1.0000000
## transporte 0.5275621 0.5874919 0.6913566 0.7272596 0.7297507
## ensecultura 0.5887396 0.5459001 0.8333798 0.7556073 0.8121268
## turisocio 0.4381000 0.4626088 0.8102114 0.7561336 0.7058343
## otros 0.4831851 0.5323911 0.5417361 0.6352716 0.5906500
## transporte ensecultura turisocio otros
## alimentacion 0.5275621 0.5887396 0.4381000 0.4831851
## vestidocalza 0.5874919 0.5459001 0.4626088 0.5323911
## vivienda 0.6913566 0.8333798 0.8102114 0.5417361
## movildomest 0.7272596 0.7556073 0.7561336 0.6352716
## gastsanitarios 0.7297507 0.8121268 0.7058343 0.5906500
## transporte 1.0000000 0.7447034 0.7268374 0.7132310
## ensecultura 0.7447034 1.0000000 0.8449916 0.5623888
## turisocio 0.7268374 0.8449916 1.0000000 0.5826521
## otros 0.7132310 0.5623888 0.5826521 1.0000000
corrplot(R,addCoef.col = 'black')
Teniendo en cuenta los anteriores resultados, se observa que hay una correlación alta entre los gastos de vivienda y los de enseñanza y cultura (0.83), asi mismo los gastos de turismo y ocio con los gastos de enseñanza y cultura.
A continuación se presenta el diagrama de caja de cada componente de gasto, donde se observa valores atipicos para los gastos de vivienda, moviliario dómestico, enseñanza y cultura y por último gastos sanitarios.
boxplot(datos,col=rainbow(9))
A continuación se presenta el histograma de cada componente de gasto
xx <- colnames(datos)
par(mfrow=c(3,3))
for(i in 1:9){
hist(datos[,i],col=i+1,main=xx[i])
}
Se observa que la gran mayoria de los componentes de gasto tienen una distribución normal es decir con forma de campana,y simétrica alrededor de la media.
En el siguiente ánalisis, se observa la nube de individuos y el círculo de correlación.
Dentro de la nube de individuos se observa provincias como Navarra, Madrid y Lugo que están alejadas al resto
En el círculo de correlación se observa que variables como el trasnporte está muy alineada al eje 1 puede que esta variable tenga una contribución en este eje, esto se verifica más adelante con el análisis de contribuciones y cosenos.
res.pca <- PCA(datos)
fviz_pca_biplot(res.pca,repel = TRUE,col.var = "#2E9FDF",
col.ind = "#696969")
## representacion simultanea
Al realizar la representación simultanea, se observa que provincias como navarra tiene un gasto representativo en transporte, también se observa que el componente de gasto de alimentación y gasto en vestido y calzado es muy representativo para el eje 2.
El grupo en el que se encuentran los individuos Vizcaya, Guipuzcua, Lérida, Baleares y Gerona (caracterizados por una coordenada positiva en el eje) comparte:
valores altos para las variables turisocio, ensecultura, otros, gastsanitarios, movildomest, vivienda, vestidocalza y transporte (las variables se ordenan de la más fuerte).
El grupo en el que se sitúan los individuos Navarra, Madrid y Barcelona (caracterizados por una coordenada positiva en el eje) comparte:
valores altos para las variables vivienda, ensecultura, gastsanitarios, turisocio, movildomest, transporte y vestidocalza (las variables se ordenan de la más fuerte).
El grupo en el que se sitúan los individuos Salamanca, Jaén, Badajoz y Ceuta_Melilla (caracterizados por una coordenada negativa en el eje) comparte:
valores bajos para las variables otros, transporte, movildomest, turisocio, gastsanitarios, ensecultura, vivienda y vestidocalza (variables ordenadas de menor a mayor).
El grupo en el que se encuentran los individuos Castellón y Tenerife (caracterizados por una coordenada negativa en el eje) comparte:
valores bajos para las variables alimentación, vestidocalza, ensecultura, vivienda, gastsanitarios, turisocio, movildomest y transporte (variables ordenadas de menor a mayor).
Dentro de esta representación se puede observar 3 provincias que no tienen un comportamiento similar al resto, como son Navarra, Lugo y Madrid, estos pueden ser datos atipicos.
Para un ánalisis mas especifico se realizara el analisis de contribuciones y cosenos más adelante.
Las dos primeras dimensiones de análisis expresan el 76,27% de la inercia total del conjunto de datos; eso quiere decir que el 76.27% de los individuos (o variables) nublan la variabilidad total es explicada por el plano
Este porcentaje es alto y por lo tanto el primer plano representa una parte importante de la variabilidad de los datos.
A partir de estas observaciones, probablemente no sea útil interpretar el resto de las dimensiones
eig.val <- res.pca$eig
barplot(eig.val[, 2],
names.arg = 1:nrow(eig.val),
main = "Varianzas Explicadas por los Comp",
xlab = "Componentes Principales",
ylab = "Porcentaje de Varianzas",
col ="steelblue")
lines(x = 1:nrow(eig.val), eig.val[, 2],
type = "b", pch = 19, col = "red")
Se realiza el analisis de contribuciones teniendo en cuenta los dos primeros componentes debido a su representatividad:
res.pca$var$contrib ## variables
## Dim.1 Dim.2 Dim.3 Dim.4 Dim.5
## alimentacion 7.266847 3.382314e+01 33.63998936 20.41916487 1.763432
## vestidocalza 8.325522 2.864335e+01 0.39133819 49.28324686 3.996112
## vivienda 12.084665 7.518112e+00 4.45512604 4.98614903 9.446375
## movildomest 12.452002 4.571022e-04 0.98671359 5.31415883 4.437071
## gastsanitarios 11.634141 3.990710e+00 0.01635416 3.52434650 61.920076
## transporte 12.643107 6.156476e-03 7.53953027 2.26499222 1.318846
## ensecultura 13.728371 5.257316e+00 8.61487805 0.15370465 1.019036
## turisocio 12.401940 1.520623e+01 0.34555016 0.04528046 9.986416
## otros 9.463405 5.554519e+00 44.01052018 14.00895657 6.112635
fviz_contrib(res.pca,choice="var",axes=1) # eje 1
fviz_contrib(res.pca,choice="var",axes=2) # eje 2
En la contribución de las variables se observa que las variables de enseñanza y cultura y trasnporte son representativas en la dimensión 1. Mientras que en la dimensión 2, las variables de alimentación, y vestido-calzado se destacan.
res.pca$ind$contrib ## ind
## Dim.1 Dim.2 Dim.3 Dim.4 Dim.5
## Almeria 0.625870549 2.085260e+00 8.539844e-02 7.029351515 2.546469e-03
## Cadiz 0.006461224 4.489906e-02 4.981877e+00 4.833385400 5.809824e-01
## Cordoba 0.550801434 1.475357e+00 1.349266e+00 5.741984506 6.283594e-02
## Granada 0.942178870 4.079681e-02 3.835828e-01 4.755905732 2.167336e-02
## Huelva 0.073248120 7.368313e-01 5.472922e+00 0.025091364 3.448578e+00
## Jaen 7.226379491 6.318239e-02 2.595392e+00 0.001801072 8.553663e-01
## Malaga 0.004461411 1.240239e+00 1.388721e+00 1.739154441 1.250811e-01
## Sevilla 0.006104599 3.822570e-01 1.603983e+00 0.014622220 2.882942e+00
## Huesca 0.603803110 2.481112e+00 1.339913e+00 0.414280670 5.460194e-01
## Teruel 2.269000398 1.531848e-02 2.536216e-02 0.022290008 2.386090e-01
## Zaragoza 0.113778562 2.616311e-06 3.510623e-01 8.603098573 9.711687e-01
## Asturias 0.843418240 1.286335e+00 6.649885e-01 0.416382023 5.063762e-02
## Baleares 1.899643117 3.968831e+00 4.746365e+00 1.225565063 3.170982e+00
## Las_Palmas 1.121043813 1.518319e+00 7.213991e-03 6.164740049 4.826691e+00
## Tenerife 0.238564139 8.492139e+00 4.976487e-04 1.611656098 4.288961e+00
## Cantabria 0.310530977 7.070994e-01 1.616289e-04 4.537126165 9.137851e-01
## Avila 1.727920895 4.044345e-01 4.004886e-01 1.218025135 2.573746e+00
## Burgos 0.394517994 4.840343e-02 8.286255e-02 2.702849111 2.919637e+00
## Leon 0.159224079 3.689653e+00 7.071684e+00 1.243299482 4.575347e+00
## Palencia 0.478579208 2.889100e-03 1.620472e-01 0.843984698 5.212667e+00
## Salamanca 7.549302097 1.595288e+00 4.737263e-01 0.272714985 9.910449e-02
## Segovia 1.339251808 7.389230e-01 3.198047e+00 1.746728669 6.987259e-01
## Soria 0.084341172 2.039675e+00 8.309197e-02 2.606811505 1.043143e+00
## Valladolid 0.012165314 1.958792e+00 2.063957e-01 1.073827667 3.668990e+00
## Zamora 2.370770764 1.283914e-01 6.556858e+00 4.254645533 4.505083e+00
## Albacete 0.506594549 1.759744e+00 4.147366e-01 0.010119434 1.037711e-01
## Ciudad Real 0.971541647 3.524146e-02 2.612596e-01 1.840944929 5.711903e-02
## Cuenca 1.560668322 1.195566e+00 3.399876e+00 0.145730554 2.841258e-02
## Guadalajara 0.807161894 2.078971e+00 2.895272e-01 0.645596093 1.706242e+00
## Toledo 0.007985073 2.229532e+00 4.759291e+00 0.015875696 4.758506e+00
## Barcelona 7.190138520 2.453238e+00 9.847054e+00 0.188520861 6.688257e+00
## Gerona 2.582216372 1.518050e+00 4.862566e-01 0.014527491 1.084114e+00
## Lerida 5.288079687 2.294577e+00 2.598931e+00 5.006141808 7.447132e+00
## Tarragona 2.044194052 4.547433e-01 2.422765e-01 3.335524091 5.857295e-05
## Alicante 0.031074549 1.236529e+00 1.226131e+00 1.788317289 5.656824e-01
## Castellon 2.722917649 1.126754e+00 3.094598e-01 1.027304102 2.501786e-01
## Valencia 0.067876181 4.240783e+00 4.646779e-01 0.530797017 6.931227e-02
## Badajoz 5.989470378 1.882928e+00 9.082348e-01 4.423185037 4.896689e+00
## Caceres 0.658730757 3.330098e-06 3.999487e-02 0.063067695 4.732751e-02
## La Coruna 0.271478104 2.675303e+00 1.709098e+00 0.428408259 1.431318e-01
## Lugo 0.136777568 1.934191e+01 4.368614e-02 0.360961747 3.347721e+00
## Orense 2.378388784 3.982658e-01 4.393894e-01 2.635216345 7.218246e-01
## Pontevedra 0.460821758 6.901034e+00 2.641239e+00 0.809376368 2.097618e-01
## Madrid 9.589295072 6.899703e+00 2.330707e+00 0.374912239 4.941423e-01
## Murcia 0.004125314 2.543641e-02 1.292923e+00 2.152282145 2.255069e+00
## Navarra 12.444492769 7.469461e-01 4.494990e+00 3.817426618 1.420399e+00
## Alava 1.948556895 4.813572e-01 2.714708e+00 0.375611633 4.899260e+00
## Guipuzcua 2.247861833 1.280070e+00 1.659103e+00 0.669952705 3.651441e+00
## Vizcaya 4.470993605 3.799403e-01 9.781031e-02 1.168389332 2.564724e+00
## La_Rioja 0.068401858 3.286785e-02 8.689940e-03 3.035559738 2.639002e+00
## Ceuta_Melilla 4.598795424 3.186074e+00 1.408804e+01 2.036929092 1.667423e+00
fviz_contrib(res.pca,choice="ind",axes=1) # eje 1
fviz_contrib(res.pca,choice="ind",axes=2) # eje 2
Respecto a las contribuciones de los individuos se observa que las provincias de Navarra, Madrid, Salamanca, Lugo y Tenerife son las más representativas. Si se observa en la representación simultanea son estas las que se encuentran en los extremos del gráfico.
El ánalisis de cosenos permite fortalecer las contribuciones, teniendo como hallazgos las variables e individuos representativos mencionados anteriormente.
Los cosenos2 son utilizados cuando hay existencia de variables suplementarias, para el estudio de caso se presenta como un ánalisis adicional.
res.pca$var$cos2 ## cosenos 2 de las variables
## Dim.1 Dim.2 Dim.3 Dim.4 Dim.5
## alimentacion 0.4423566 2.628765e-01 1.872633e-01 0.0978373159 0.006131192
## vestidocalza 0.5068016 2.226187e-01 2.178458e-03 0.2361379920 0.013893886
## vivienda 0.7356329 5.843144e-02 2.480030e-02 0.0238908614 0.032843641
## movildomest 0.7579939 3.552639e-06 5.492727e-03 0.0254625025 0.015427034
## gastsanitarios 0.7082081 3.101615e-02 9.103851e-05 0.0168867142 0.215286886
## transporte 0.7696271 4.784868e-05 4.197021e-02 0.0108525868 0.004585432
## ensecultura 0.8356907 4.086033e-02 4.795634e-02 0.0007364674 0.003543037
## turisocio 0.7549465 1.181842e-01 1.923570e-03 0.0002169589 0.034721282
## otros 0.5760683 4.317021e-02 2.449928e-01 0.0671231521 0.021252723
fviz_cos2(res.pca,choice="var",axes=1)
fviz_cos2(res.pca,choice="var",axes=2)
res.pca$ind$cos2 ## cosenos cuadrados individuos
## Dim.1 Dim.2 Dim.3 Dim.4 Dim.5
## Almeria 0.379315292 1.613568e-01 4.732996e-03 3.353290e-01 8.814826e-05
## Cadiz 0.005596500 4.965353e-03 3.946072e-01 3.295286e-01 2.874248e-02
## Cordoba 0.384679502 1.315565e-01 8.617312e-02 3.156502e-01 2.506523e-03
## Granada 0.679799380 3.758242e-03 2.530911e-02 2.700976e-01 8.931682e-04
## Huelva 0.052434950 6.734473e-02 3.582729e-01 1.413802e-03 1.410016e-01
## Jaen 0.943149050 1.052851e-03 3.097654e-02 1.850251e-05 6.376337e-03
## Malaga 0.008650226 3.070236e-01 2.462298e-01 2.654199e-01 1.385181e-02
## Sevilla 0.009730398 7.779292e-02 2.337995e-01 1.834538e-03 2.624635e-01
## Huesca 0.328641450 1.724188e-01 6.669202e-02 1.774850e-02 1.697441e-02
## Teruel 0.894967059 7.714350e-04 9.148061e-04 6.920265e-04 5.375499e-03
## Zaragoza 0.124765811 3.662991e-07 3.520381e-02 7.425575e-01 6.082602e-02
## Asturias 0.636943461 1.240290e-01 4.592428e-02 2.475084e-02 2.184192e-03
## Baleares 0.592000157 1.579151e-01 1.352637e-01 3.006258e-02 5.644209e-02
## Las_Palmas 0.475836180 8.228280e-02 2.800147e-04 2.059632e-01 1.170156e-01
## Tenerife 0.125264595 5.693135e-01 2.389551e-05 6.660941e-02 1.286278e-01
## Cantabria 0.190408071 5.535694e-02 9.062953e-06 2.189784e-01 3.200251e-02
## Avila 0.744466993 2.224749e-02 1.577909e-02 4.130645e-02 6.333544e-02
## Burgos 0.402937986 6.311880e-03 7.739271e-03 2.172867e-01 1.703177e-01
## Leon 0.087784707 2.597209e-01 3.565359e-01 5.395428e-02 1.440767e-01
## Palencia 0.494256314 3.809537e-04 1.530419e-02 6.860772e-02 3.074807e-01
## Salamanca 0.940029695 2.536210e-02 5.394269e-03 2.672907e-03 7.048353e-04
## Segovia 0.616607533 4.343672e-02 1.346486e-01 6.330122e-02 1.837439e-02
## Soria 0.121723251 3.758426e-01 1.096638e-02 2.961308e-01 8.598787e-02
## Valladolid 0.018664109 3.836926e-01 2.895709e-02 1.296757e-01 3.215067e-01
## Zamora 0.638964502 4.418089e-03 1.616044e-01 9.025901e-02 6.935049e-02
## Albacete 0.464752906 2.061211e-01 3.479400e-02 7.307315e-04 5.437476e-03
## Ciudad Real 0.739915153 3.426775e-03 1.819546e-02 1.103574e-01 2.484625e-03
## Cuenca 0.716025530 7.003298e-02 1.426433e-01 5.262699e-03 7.445403e-04
## Guadalajara 0.514255532 1.691134e-01 1.686856e-02 3.237570e-02 6.208953e-02
## Toledo 0.007549620 2.691356e-01 4.114895e-01 1.181460e-03 2.569664e-01
## Barcelona 0.807213431 3.516431e-02 1.010946e-01 1.665906e-03 4.288680e-02
## Gerona 0.694697769 5.214354e-02 1.196297e-02 3.076337e-04 1.665857e-02
## Lerida 0.779606347 4.319080e-02 3.503826e-02 5.809256e-02 6.270844e-02
## Tarragona 0.742343024 2.108434e-02 8.045704e-03 9.534252e-02 1.214896e-06
## Alicante 0.056393224 2.865087e-01 2.034835e-01 2.554505e-01 5.863464e-02
## Castellon 0.908141848 4.797991e-02 9.438300e-03 2.696859e-02 4.765725e-03
## Valencia 0.056795273 4.530562e-01 3.555635e-02 3.495934e-02 3.312565e-03
## Badajoz 0.857764791 3.442903e-02 1.189456e-02 4.986030e-02 4.005363e-02
## Caceres 0.848939327 5.479450e-07 4.713499e-03 6.397579e-03 3.483709e-03
## La Coruna 0.317543936 3.995335e-01 1.828127e-01 3.944272e-02 9.562350e-03
## Lugo 0.046206061 8.342472e-01 1.349578e-03 9.598100e-03 6.459411e-02
## Orense 0.785465114 1.679300e-02 1.326979e-02 6.850154e-02 1.361555e-02
## Pontevedra 0.218656041 4.180747e-01 1.146058e-01 3.022867e-02 5.684791e-03
## Madrid 0.833725470 7.659104e-02 1.853081e-02 2.565701e-03 2.453850e-03
## Murcia 0.007048324 5.548759e-03 2.020095e-01 2.894463e-01 2.200636e-01
## Navarra 0.911074970 6.981961e-03 3.009373e-02 2.199822e-02 5.939457e-03
## Alava 0.607448583 1.915910e-02 7.739090e-02 9.216701e-03 8.723413e-02
## Guipuzcua 0.770169705 5.599663e-02 5.198291e-02 1.806762e-02 7.145632e-02
## Vizcaya 0.896198928 9.723596e-03 1.792897e-03 1.843436e-02 2.936301e-02
## La_Rioja 0.121859006 7.476052e-03 1.415718e-03 4.256656e-01 2.685276e-01
## Ceuta_Melilla 0.683593814 6.046736e-02 1.915027e-01 2.383252e-02 1.415661e-02
fviz_cos2(res.pca,choice="ind",axes=1)
fviz_cos2(res.pca,choice="ind",axes=2)
cluster <- HCPC(res.pca, nb.clust=-1)
fviz_cluster(cluster)
#cluster$data.clust ## como queda la base de datos clasificada
cluster$desc.var ## interpretacion de los cluster
##
## Link between the cluster variable and the quantitative variables
## ================================================================
## Eta2 P-value
## ensecultura 0.7482247 4.210320e-15
## turisocio 0.6779080 1.554245e-12
## vivienda 0.6389418 2.409091e-11
## gastsanitarios 0.6269020 5.293572e-11
## movildomest 0.5963752 3.495169e-10
## transporte 0.5409971 7.648398e-09
## alimentacion 0.4513729 5.529092e-07
## otros 0.4315503 1.296012e-06
## vestidocalza 0.4173618 2.341938e-06
##
## Description of each cluster by quantitative variables
## =====================================================
## $`1`
## v.test Mean in category Overall mean sd in category
## otros -4.122862 85299.1 102224.86 18263.120
## vestidocalza -4.147666 204622.2 232042.76 27010.461
## turisocio -4.544125 246541.8 294558.41 32594.310
## vivienda -4.562021 414508.7 499955.45 48208.553
## transporte -4.562556 230376.4 278111.96 46583.365
## alimentacion -4.653904 547229.8 600781.24 48716.038
## ensecultura -4.686000 92491.7 125310.37 19557.738
## gastsanitarios -4.697435 41426.1 55103.84 9309.073
## movildomest -4.748398 107613.3 129687.76 15037.723
## Overall sd p.value
## otros 23316.78 3.741941e-05
## vestidocalza 37548.43 3.358816e-05
## turisocio 60015.14 5.516391e-06
## vivienda 106379.44 5.066360e-06
## transporte 59422.84 5.053458e-06
## alimentacion 65354.17 3.257090e-06
## ensecultura 39777.54 2.785965e-06
## gastsanitarios 16537.61 2.634488e-06
## movildomest 26403.54 2.050344e-06
##
## $`2`
## v.test Mean in category Overall mean sd in category Overall sd
## alimentacion 2.421169 627527.6 600781.2 50358.83 65354.17
## p.value
## alimentacion 0.0154707
##
## $`3`
## v.test Mean in category Overall mean sd in category Overall sd
## ensecultura 5.467322 187586.2 125310.37 26626.24 39777.54
## turisocio 5.143519 382953.5 294558.41 34268.29 60015.14
## vivienda 4.872820 648393.4 499955.45 95354.13 106379.44
## gastsanitarios 4.659646 77170.3 55103.84 12943.29 16537.61
## movildomest 4.358934 162644.9 129687.76 23577.57 26403.54
## transporte 4.101638 347905.9 278111.96 46245.18 59422.84
## otros 3.599874 126260.9 102224.86 19021.65 23316.78
## vestidocalza 3.402645 268628.8 232042.76 27458.97 37548.43
## alimentacion 2.721710 651716.9 600781.24 43342.67 65354.17
## p.value
## ensecultura 4.568846e-08
## turisocio 2.696391e-07
## vivienda 1.100167e-06
## gastsanitarios 3.167544e-06
## movildomest 1.306975e-05
## transporte 4.102351e-05
## otros 3.183712e-04
## vestidocalza 6.673687e-04
## alimentacion 6.494520e-03
El clúster 1 está formado por las provincias como Jaén, Salamanca, Castellón, Badajoz y Ceuta_Melilla. Este grupo se caracteriza por:
valores bajos para las variables transporte, gastsanitarios, vestidocalza, ensecultura, alimentacion, vivienda, movildomest, turisocio y otras (variables ordenadas de menor a mayor).
El clúster 2 está formado por provincias como Huesca, Tenerife, León, Valencia, La Coruña, Lugo y Pontevedra. Este grupo se caracteriza por:
variables cuyos valores no difieren significativamente de la media.
El clúster 3 está formado por individuos como Baleares, Barcelona,Gerona, Lérida, Madrid, Navarra, Guipuzcua y Vizcaya. Este grupo se caracteriza por:
valores altos para las variables ensecultura, movildomest, vivienda, turisocio, gastsanitarios, transporte, vestidocalza, otros y alimentacion (las variables se ordenan de la mas fuerte).
Teniendo en cuenta que se cumple el factor tamaño donde las variables tienen el mismo signo de correlación, se puede estimar un índice teniendo en cuenta el primer componente principal.
T1 <-res.pca$ind$coord[,1] ## primer componente
sort(T1,decreasing = TRUE)
## Navarra Madrid Barcelona Lerida Vizcaya
## 6.2156558 5.4562178 4.7246211 4.0517940 3.7256357
## Gerona Guipuzcua Tarragona Alava Baleares
## 2.8313573 2.6416980 2.5191813 2.4595457 2.4284791
## Las_Palmas Asturias Almeria Pontevedra Burgos
## 1.8655618 1.6181540 1.3939289 1.1960927 1.1067047
## Cantabria La Coruna Leon Lugo Soria
## 0.9818628 0.9180488 0.7030767 0.6516371 0.5117032
## La_Rioja Valencia Alicante Valladolid Murcia
## 0.4608210 0.4590469 0.3105995 0.1943390 -0.1131688
## Malaga Sevilla Cadiz Toledo Huelva
## -0.1176886 -0.1376661 -0.1416302 -0.1574482 -0.4768663
## Zaragoza Tenerife Palencia Albacete Cordoba
## -0.5943313 -0.8605992 -1.2189202 -1.2540897 -1.3076632
## Huesca Caceres Guadalajara Granada Ciudad Real
## -1.3691342 -1.4300536 -1.5829919 -1.7102714 -1.7367171
## Segovia Cuenca Avila Teruel Zamora
## -2.0390575 -2.2011704 -2.3161159 -2.6540900 -2.7129584
## Orense Castellon Ceuta_Melilla Badajoz Jaen
## -2.7173137 -2.9074725 -3.7785085 -4.3121372 -4.7365131
## Salamanca
## -4.8411859
Indice.gasto <- (T1 - min(T1))*100/(max(T1)-min(T1)) ## reescalamiento (0-100)
sort(Indice.gasto,decreasing = TRUE)
## Navarra Madrid Barcelona Lerida Vizcaya
## 100.0000000 93.1315106 86.5148228 80.4296570 77.4798246
## Gerona Guipuzcua Tarragona Alava Baleares
## 69.3918152 67.6765036 66.5684411 66.0290871 65.7481148
## Las_Palmas Asturias Almeria Pontevedra Burgos
## 60.6569934 58.4193938 56.3914628 54.6021981 53.7937576
## Cantabria La Coruna Leon Lugo Soria
## 52.6646658 52.0875205 50.1432759 49.6780468 48.4124607
## La_Rioja Valencia Alicante Valladolid Murcia
## 47.9522733 47.9362275 46.5936436 45.5421635 42.7610088
## Malaga Sevilla Cadiz Toledo Huelva
## 42.7201312 42.5394516 42.5035997 42.3605383 39.4716661
## Zaragoza Tenerife Palencia Albacete Cordoba
## 38.4092921 36.0011186 32.7604013 32.4423218 31.9577944
## Huesca Caceres Guadalajara Granada Ciudad Real
## 31.4018393 30.8508736 29.4676737 28.3165353 28.0773564
## Segovia Cuenca Avila Teruel Zamora
## 25.3429365 23.8767594 22.8371725 19.7804759 19.2480595
## Orense Castellon Ceuta_Melilla Badajoz Jaen
## 19.2086695 17.4888407 9.6110394 4.7848087 0.9466793
## Salamanca
## 0.0000000
Del índice se observa que las provincias de Navarra, Madrid, Barcelona y Lerida, presentan un índice superior a 80, para el caso de estudio se puede interpretar que estas provincias tienen un gasto superior en los diferentes rubros del presupuesto familiar. Mientras que Salamanca y Jaen presentan un índice menor.