knitr::opts_chunk$set(echo = TRUE)

library(FactoMineR)
library(ggplot2)
library(factoextra)
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
library(corrplot)
## corrplot 0.92 loaded
read.table("datosTaller1.csv",header=TRUE,sep=";",
           row.names=1)->datos
##NOMBRE DE LAS VARIABLES
colnames(datos) <- c("alimentacion", "vestidocalza", "vivienda", 
                    "movildomest", "gastsanitarios", "transporte", 
                    "ensecultura", "turisocio", "otros")

##Las variables son: X1=
  #alimentación, X2= vestido y calzado, X3= vivienda, X4= moviliario doméstico, X5= gastos sanitarios,
#X6= transporte, X7= enseñanza y cultura, X8= turismo y ocio, X9= otros gastos.#

Estadísticas descriptivas

summary(datos)
##   alimentacion     vestidocalza       vivienda       movildomest    
##  Min.   :430442   Min.   :167814   Min.   :332662   Min.   : 78217  
##  1st Qu.:547131   1st Qu.:201655   1st Qu.:417691   1st Qu.:113550  
##  Median :598669   Median :228072   Median :487651   Median :129768  
##  Mean   :600781   Mean   :232043   Mean   :499956   Mean   :129688  
##  3rd Qu.:646183   3rd Qu.:256498   3rd Qu.:553526   3rd Qu.:143317  
##  Max.   :736441   Max.   :324877   Max.   :864553   Max.   :221954  
##  gastsanitarios    transporte      ensecultura       turisocio     
##  Min.   :24476   Min.   :136992   Min.   : 57607   Min.   :189811  
##  1st Qu.:42610   1st Qu.:235941   1st Qu.: 97603   1st Qu.:244666  
##  Median :54684   Median :280023   Median :118269   Median :291708  
##  Mean   :55104   Mean   :278112   Mean   :125310   Mean   :294558  
##  3rd Qu.:63087   3rd Qu.:315771   3rd Qu.:145831   3rd Qu.:323239  
##  Max.   :97595   Max.   :415313   Max.   :239187   Max.   :440275  
##      otros       
##  Min.   : 54442  
##  1st Qu.: 84019  
##  Median :100255  
##  Mean   :102225  
##  3rd Qu.:117851  
##  Max.   :156493

Gráfico de la correlación

A continuación realizamos el gráfico de correlación, donde se observa que hay correlaciones en las variables superiores a 0.6 es decir la información permite hacer un análisis de ACP.

R <- cor(datos)
R
##                alimentacion vestidocalza  vivienda movildomest gastsanitarios
## alimentacion      1.0000000    0.5315184 0.4754647   0.5166632      0.4743040
## vestidocalza      0.5315184    1.0000000 0.5491653   0.6333676      0.5053109
## vivienda          0.4754647    0.5491653 1.0000000   0.6989189      0.6703857
## movildomest       0.5166632    0.6333676 0.6989189   1.0000000      0.6740832
## gastsanitarios    0.4743040    0.5053109 0.6703857   0.6740832      1.0000000
## transporte        0.5275621    0.5874919 0.6913566   0.7272596      0.7297507
## ensecultura       0.5887396    0.5459001 0.8333798   0.7556073      0.8121268
## turisocio         0.4381000    0.4626088 0.8102114   0.7561336      0.7058343
## otros             0.4831851    0.5323911 0.5417361   0.6352716      0.5906500
##                transporte ensecultura turisocio     otros
## alimentacion    0.5275621   0.5887396 0.4381000 0.4831851
## vestidocalza    0.5874919   0.5459001 0.4626088 0.5323911
## vivienda        0.6913566   0.8333798 0.8102114 0.5417361
## movildomest     0.7272596   0.7556073 0.7561336 0.6352716
## gastsanitarios  0.7297507   0.8121268 0.7058343 0.5906500
## transporte      1.0000000   0.7447034 0.7268374 0.7132310
## ensecultura     0.7447034   1.0000000 0.8449916 0.5623888
## turisocio       0.7268374   0.8449916 1.0000000 0.5826521
## otros           0.7132310   0.5623888 0.5826521 1.0000000
corrplot(R,addCoef.col = 'black')

Teniendo en cuenta los anteriores resultados, se observa que hay una correlación alta entre los gastos de vivienda y los de enseñanza y cultura (0.83), asi mismo los gastos de turismo y ocio con los gastos de enseñanza y cultura.

Gráfico de diagrama de cajas

A continuación se presenta el diagrama de caja de cada componente de gasto, donde se observa valores atipicos para los gastos de vivienda, moviliario dómestico, enseñanza y cultura y por último gastos sanitarios.

boxplot(datos,col=rainbow(9))

Histograma

A continuación se presenta el histograma de cada componente de gasto

xx <- colnames(datos)
par(mfrow=c(3,3))
for(i in 1:9){
  hist(datos[,i],col=i+1,main=xx[i])
}

Se observa que la gran mayoria de los componentes de gasto tienen una distribución normal es decir con forma de campana,y simétrica alrededor de la media.

ACP: Análisis de componentes principales

En el siguiente ánalisis, se observa la nube de individuos y el círculo de correlación.

Dentro de la nube de individuos se observa provincias como Navarra, Madrid y Lugo que están alejadas al resto

En el círculo de correlación se observa que variables como el trasnporte está muy alineada al eje 1 puede que esta variable tenga una contribución en este eje, esto se verifica más adelante con el análisis de contribuciones y cosenos.

res.pca <- PCA(datos)

fviz_pca_biplot(res.pca,repel = TRUE,col.var = "#2E9FDF",
                col.ind = "#696969")

                ## representacion simultanea

Al realizar la representación simultanea, se observa que provincias como navarra tiene un gasto representativo en transporte, también se observa que el componente de gasto de alimentación y gasto en vestido y calzado es muy representativo para el eje 2.

El grupo en el que se encuentran los individuos Vizcaya, Guipuzcua, Lérida, Baleares y Gerona (caracterizados por una coordenada positiva en el eje) comparte:

valores altos para las variables turisocio, ensecultura, otros, gastsanitarios, movildomest, vivienda, vestidocalza y transporte (las variables se ordenan de la más fuerte).

El grupo en el que se sitúan los individuos Navarra, Madrid y Barcelona (caracterizados por una coordenada positiva en el eje) comparte:

valores altos para las variables vivienda, ensecultura, gastsanitarios, turisocio, movildomest, transporte y vestidocalza (las variables se ordenan de la más fuerte).

El grupo en el que se sitúan los individuos Salamanca, Jaén, Badajoz y Ceuta_Melilla (caracterizados por una coordenada negativa en el eje) comparte:

valores bajos para las variables otros, transporte, movildomest, turisocio, gastsanitarios, ensecultura, vivienda y vestidocalza (variables ordenadas de menor a mayor).

El grupo en el que se encuentran los individuos Castellón y Tenerife (caracterizados por una coordenada negativa en el eje) comparte:

valores bajos para las variables alimentación, vestidocalza, ensecultura, vivienda, gastsanitarios, turisocio, movildomest y transporte (variables ordenadas de menor a mayor).

Dentro de esta representación se puede observar 3 provincias que no tienen un comportamiento similar al resto, como son Navarra, Lugo y Madrid, estos pueden ser datos atipicos.

Para un ánalisis mas especifico se realizara el analisis de contribuciones y cosenos más adelante.

Porcenjate de inercia

Las dos primeras dimensiones de análisis expresan el 76,27% de la inercia total del conjunto de datos; eso quiere decir que el 76.27% de los individuos (o variables) nublan la variabilidad total es explicada por el plano

Este porcentaje es alto y por lo tanto el primer plano representa una parte importante de la variabilidad de los datos.

A partir de estas observaciones, probablemente no sea útil interpretar el resto de las dimensiones

eig.val <- res.pca$eig
barplot(eig.val[, 2], 
        names.arg = 1:nrow(eig.val), 
        main = "Varianzas Explicadas por los Comp",
        xlab = "Componentes Principales",
        ylab = "Porcentaje de Varianzas",
        col ="steelblue")  
lines(x = 1:nrow(eig.val), eig.val[, 2], 
      type = "b", pch = 19, col = "red")

Contribucciones para variables e individuos

Se realiza el analisis de contribuciones teniendo en cuenta los dos primeros componentes debido a su representatividad:

res.pca$var$contrib ## variables
##                    Dim.1        Dim.2       Dim.3       Dim.4     Dim.5
## alimentacion    7.266847 3.382314e+01 33.63998936 20.41916487  1.763432
## vestidocalza    8.325522 2.864335e+01  0.39133819 49.28324686  3.996112
## vivienda       12.084665 7.518112e+00  4.45512604  4.98614903  9.446375
## movildomest    12.452002 4.571022e-04  0.98671359  5.31415883  4.437071
## gastsanitarios 11.634141 3.990710e+00  0.01635416  3.52434650 61.920076
## transporte     12.643107 6.156476e-03  7.53953027  2.26499222  1.318846
## ensecultura    13.728371 5.257316e+00  8.61487805  0.15370465  1.019036
## turisocio      12.401940 1.520623e+01  0.34555016  0.04528046  9.986416
## otros           9.463405 5.554519e+00 44.01052018 14.00895657  6.112635
fviz_contrib(res.pca,choice="var",axes=1) # eje 1

fviz_contrib(res.pca,choice="var",axes=2) # eje 2

En la contribución de las variables se observa que las variables de enseñanza y cultura y trasnporte son representativas en la dimensión 1. Mientras que en la dimensión 2, las variables de alimentación, y vestido-calzado se destacan.

res.pca$ind$contrib ## ind
##                      Dim.1        Dim.2        Dim.3       Dim.4        Dim.5
## Almeria        0.625870549 2.085260e+00 8.539844e-02 7.029351515 2.546469e-03
## Cadiz          0.006461224 4.489906e-02 4.981877e+00 4.833385400 5.809824e-01
## Cordoba        0.550801434 1.475357e+00 1.349266e+00 5.741984506 6.283594e-02
## Granada        0.942178870 4.079681e-02 3.835828e-01 4.755905732 2.167336e-02
## Huelva         0.073248120 7.368313e-01 5.472922e+00 0.025091364 3.448578e+00
## Jaen           7.226379491 6.318239e-02 2.595392e+00 0.001801072 8.553663e-01
## Malaga         0.004461411 1.240239e+00 1.388721e+00 1.739154441 1.250811e-01
## Sevilla        0.006104599 3.822570e-01 1.603983e+00 0.014622220 2.882942e+00
## Huesca         0.603803110 2.481112e+00 1.339913e+00 0.414280670 5.460194e-01
## Teruel         2.269000398 1.531848e-02 2.536216e-02 0.022290008 2.386090e-01
## Zaragoza       0.113778562 2.616311e-06 3.510623e-01 8.603098573 9.711687e-01
## Asturias       0.843418240 1.286335e+00 6.649885e-01 0.416382023 5.063762e-02
## Baleares       1.899643117 3.968831e+00 4.746365e+00 1.225565063 3.170982e+00
## Las_Palmas     1.121043813 1.518319e+00 7.213991e-03 6.164740049 4.826691e+00
## Tenerife       0.238564139 8.492139e+00 4.976487e-04 1.611656098 4.288961e+00
## Cantabria      0.310530977 7.070994e-01 1.616289e-04 4.537126165 9.137851e-01
## Avila          1.727920895 4.044345e-01 4.004886e-01 1.218025135 2.573746e+00
## Burgos         0.394517994 4.840343e-02 8.286255e-02 2.702849111 2.919637e+00
## Leon           0.159224079 3.689653e+00 7.071684e+00 1.243299482 4.575347e+00
## Palencia       0.478579208 2.889100e-03 1.620472e-01 0.843984698 5.212667e+00
## Salamanca      7.549302097 1.595288e+00 4.737263e-01 0.272714985 9.910449e-02
## Segovia        1.339251808 7.389230e-01 3.198047e+00 1.746728669 6.987259e-01
## Soria          0.084341172 2.039675e+00 8.309197e-02 2.606811505 1.043143e+00
## Valladolid     0.012165314 1.958792e+00 2.063957e-01 1.073827667 3.668990e+00
## Zamora         2.370770764 1.283914e-01 6.556858e+00 4.254645533 4.505083e+00
## Albacete       0.506594549 1.759744e+00 4.147366e-01 0.010119434 1.037711e-01
## Ciudad Real    0.971541647 3.524146e-02 2.612596e-01 1.840944929 5.711903e-02
## Cuenca         1.560668322 1.195566e+00 3.399876e+00 0.145730554 2.841258e-02
## Guadalajara    0.807161894 2.078971e+00 2.895272e-01 0.645596093 1.706242e+00
## Toledo         0.007985073 2.229532e+00 4.759291e+00 0.015875696 4.758506e+00
## Barcelona      7.190138520 2.453238e+00 9.847054e+00 0.188520861 6.688257e+00
## Gerona         2.582216372 1.518050e+00 4.862566e-01 0.014527491 1.084114e+00
## Lerida         5.288079687 2.294577e+00 2.598931e+00 5.006141808 7.447132e+00
## Tarragona      2.044194052 4.547433e-01 2.422765e-01 3.335524091 5.857295e-05
## Alicante       0.031074549 1.236529e+00 1.226131e+00 1.788317289 5.656824e-01
## Castellon      2.722917649 1.126754e+00 3.094598e-01 1.027304102 2.501786e-01
## Valencia       0.067876181 4.240783e+00 4.646779e-01 0.530797017 6.931227e-02
## Badajoz        5.989470378 1.882928e+00 9.082348e-01 4.423185037 4.896689e+00
## Caceres        0.658730757 3.330098e-06 3.999487e-02 0.063067695 4.732751e-02
## La Coruna      0.271478104 2.675303e+00 1.709098e+00 0.428408259 1.431318e-01
## Lugo           0.136777568 1.934191e+01 4.368614e-02 0.360961747 3.347721e+00
## Orense         2.378388784 3.982658e-01 4.393894e-01 2.635216345 7.218246e-01
## Pontevedra     0.460821758 6.901034e+00 2.641239e+00 0.809376368 2.097618e-01
## Madrid         9.589295072 6.899703e+00 2.330707e+00 0.374912239 4.941423e-01
## Murcia         0.004125314 2.543641e-02 1.292923e+00 2.152282145 2.255069e+00
## Navarra       12.444492769 7.469461e-01 4.494990e+00 3.817426618 1.420399e+00
## Alava          1.948556895 4.813572e-01 2.714708e+00 0.375611633 4.899260e+00
## Guipuzcua      2.247861833 1.280070e+00 1.659103e+00 0.669952705 3.651441e+00
## Vizcaya        4.470993605 3.799403e-01 9.781031e-02 1.168389332 2.564724e+00
## La_Rioja       0.068401858 3.286785e-02 8.689940e-03 3.035559738 2.639002e+00
## Ceuta_Melilla  4.598795424 3.186074e+00 1.408804e+01 2.036929092 1.667423e+00
fviz_contrib(res.pca,choice="ind",axes=1) # eje 1

fviz_contrib(res.pca,choice="ind",axes=2) # eje 2

Respecto a las contribuciones de los individuos se observa que las provincias de Navarra, Madrid, Salamanca, Lugo y Tenerife son las más representativas. Si se observa en la representación simultanea son estas las que se encuentran en los extremos del gráfico.

Ánalisis de Cosenos

El ánalisis de cosenos permite fortalecer las contribuciones, teniendo como hallazgos las variables e individuos representativos mencionados anteriormente.

Los cosenos2 son utilizados cuando hay existencia de variables suplementarias, para el estudio de caso se presenta como un ánalisis adicional.

res.pca$var$cos2 ## cosenos 2 de las variables
##                    Dim.1        Dim.2        Dim.3        Dim.4       Dim.5
## alimentacion   0.4423566 2.628765e-01 1.872633e-01 0.0978373159 0.006131192
## vestidocalza   0.5068016 2.226187e-01 2.178458e-03 0.2361379920 0.013893886
## vivienda       0.7356329 5.843144e-02 2.480030e-02 0.0238908614 0.032843641
## movildomest    0.7579939 3.552639e-06 5.492727e-03 0.0254625025 0.015427034
## gastsanitarios 0.7082081 3.101615e-02 9.103851e-05 0.0168867142 0.215286886
## transporte     0.7696271 4.784868e-05 4.197021e-02 0.0108525868 0.004585432
## ensecultura    0.8356907 4.086033e-02 4.795634e-02 0.0007364674 0.003543037
## turisocio      0.7549465 1.181842e-01 1.923570e-03 0.0002169589 0.034721282
## otros          0.5760683 4.317021e-02 2.449928e-01 0.0671231521 0.021252723
fviz_cos2(res.pca,choice="var",axes=1) 

fviz_cos2(res.pca,choice="var",axes=2)

res.pca$ind$cos2 ## cosenos cuadrados individuos
##                     Dim.1        Dim.2        Dim.3        Dim.4        Dim.5
## Almeria       0.379315292 1.613568e-01 4.732996e-03 3.353290e-01 8.814826e-05
## Cadiz         0.005596500 4.965353e-03 3.946072e-01 3.295286e-01 2.874248e-02
## Cordoba       0.384679502 1.315565e-01 8.617312e-02 3.156502e-01 2.506523e-03
## Granada       0.679799380 3.758242e-03 2.530911e-02 2.700976e-01 8.931682e-04
## Huelva        0.052434950 6.734473e-02 3.582729e-01 1.413802e-03 1.410016e-01
## Jaen          0.943149050 1.052851e-03 3.097654e-02 1.850251e-05 6.376337e-03
## Malaga        0.008650226 3.070236e-01 2.462298e-01 2.654199e-01 1.385181e-02
## Sevilla       0.009730398 7.779292e-02 2.337995e-01 1.834538e-03 2.624635e-01
## Huesca        0.328641450 1.724188e-01 6.669202e-02 1.774850e-02 1.697441e-02
## Teruel        0.894967059 7.714350e-04 9.148061e-04 6.920265e-04 5.375499e-03
## Zaragoza      0.124765811 3.662991e-07 3.520381e-02 7.425575e-01 6.082602e-02
## Asturias      0.636943461 1.240290e-01 4.592428e-02 2.475084e-02 2.184192e-03
## Baleares      0.592000157 1.579151e-01 1.352637e-01 3.006258e-02 5.644209e-02
## Las_Palmas    0.475836180 8.228280e-02 2.800147e-04 2.059632e-01 1.170156e-01
## Tenerife      0.125264595 5.693135e-01 2.389551e-05 6.660941e-02 1.286278e-01
## Cantabria     0.190408071 5.535694e-02 9.062953e-06 2.189784e-01 3.200251e-02
## Avila         0.744466993 2.224749e-02 1.577909e-02 4.130645e-02 6.333544e-02
## Burgos        0.402937986 6.311880e-03 7.739271e-03 2.172867e-01 1.703177e-01
## Leon          0.087784707 2.597209e-01 3.565359e-01 5.395428e-02 1.440767e-01
## Palencia      0.494256314 3.809537e-04 1.530419e-02 6.860772e-02 3.074807e-01
## Salamanca     0.940029695 2.536210e-02 5.394269e-03 2.672907e-03 7.048353e-04
## Segovia       0.616607533 4.343672e-02 1.346486e-01 6.330122e-02 1.837439e-02
## Soria         0.121723251 3.758426e-01 1.096638e-02 2.961308e-01 8.598787e-02
## Valladolid    0.018664109 3.836926e-01 2.895709e-02 1.296757e-01 3.215067e-01
## Zamora        0.638964502 4.418089e-03 1.616044e-01 9.025901e-02 6.935049e-02
## Albacete      0.464752906 2.061211e-01 3.479400e-02 7.307315e-04 5.437476e-03
## Ciudad Real   0.739915153 3.426775e-03 1.819546e-02 1.103574e-01 2.484625e-03
## Cuenca        0.716025530 7.003298e-02 1.426433e-01 5.262699e-03 7.445403e-04
## Guadalajara   0.514255532 1.691134e-01 1.686856e-02 3.237570e-02 6.208953e-02
## Toledo        0.007549620 2.691356e-01 4.114895e-01 1.181460e-03 2.569664e-01
## Barcelona     0.807213431 3.516431e-02 1.010946e-01 1.665906e-03 4.288680e-02
## Gerona        0.694697769 5.214354e-02 1.196297e-02 3.076337e-04 1.665857e-02
## Lerida        0.779606347 4.319080e-02 3.503826e-02 5.809256e-02 6.270844e-02
## Tarragona     0.742343024 2.108434e-02 8.045704e-03 9.534252e-02 1.214896e-06
## Alicante      0.056393224 2.865087e-01 2.034835e-01 2.554505e-01 5.863464e-02
## Castellon     0.908141848 4.797991e-02 9.438300e-03 2.696859e-02 4.765725e-03
## Valencia      0.056795273 4.530562e-01 3.555635e-02 3.495934e-02 3.312565e-03
## Badajoz       0.857764791 3.442903e-02 1.189456e-02 4.986030e-02 4.005363e-02
## Caceres       0.848939327 5.479450e-07 4.713499e-03 6.397579e-03 3.483709e-03
## La Coruna     0.317543936 3.995335e-01 1.828127e-01 3.944272e-02 9.562350e-03
## Lugo          0.046206061 8.342472e-01 1.349578e-03 9.598100e-03 6.459411e-02
## Orense        0.785465114 1.679300e-02 1.326979e-02 6.850154e-02 1.361555e-02
## Pontevedra    0.218656041 4.180747e-01 1.146058e-01 3.022867e-02 5.684791e-03
## Madrid        0.833725470 7.659104e-02 1.853081e-02 2.565701e-03 2.453850e-03
## Murcia        0.007048324 5.548759e-03 2.020095e-01 2.894463e-01 2.200636e-01
## Navarra       0.911074970 6.981961e-03 3.009373e-02 2.199822e-02 5.939457e-03
## Alava         0.607448583 1.915910e-02 7.739090e-02 9.216701e-03 8.723413e-02
## Guipuzcua     0.770169705 5.599663e-02 5.198291e-02 1.806762e-02 7.145632e-02
## Vizcaya       0.896198928 9.723596e-03 1.792897e-03 1.843436e-02 2.936301e-02
## La_Rioja      0.121859006 7.476052e-03 1.415718e-03 4.256656e-01 2.685276e-01
## Ceuta_Melilla 0.683593814 6.046736e-02 1.915027e-01 2.383252e-02 1.415661e-02
fviz_cos2(res.pca,choice="ind",axes=1)

fviz_cos2(res.pca,choice="ind",axes=2)

Cluster

cluster <- HCPC(res.pca, nb.clust=-1)

fviz_cluster(cluster)

#cluster$data.clust ## como queda la base de datos clasificada
cluster$desc.var ## interpretacion de los cluster
## 
## Link between the cluster variable and the quantitative variables
## ================================================================
##                     Eta2      P-value
## ensecultura    0.7482247 4.210320e-15
## turisocio      0.6779080 1.554245e-12
## vivienda       0.6389418 2.409091e-11
## gastsanitarios 0.6269020 5.293572e-11
## movildomest    0.5963752 3.495169e-10
## transporte     0.5409971 7.648398e-09
## alimentacion   0.4513729 5.529092e-07
## otros          0.4315503 1.296012e-06
## vestidocalza   0.4173618 2.341938e-06
## 
## Description of each cluster by quantitative variables
## =====================================================
## $`1`
##                   v.test Mean in category Overall mean sd in category
## otros          -4.122862          85299.1    102224.86      18263.120
## vestidocalza   -4.147666         204622.2    232042.76      27010.461
## turisocio      -4.544125         246541.8    294558.41      32594.310
## vivienda       -4.562021         414508.7    499955.45      48208.553
## transporte     -4.562556         230376.4    278111.96      46583.365
## alimentacion   -4.653904         547229.8    600781.24      48716.038
## ensecultura    -4.686000          92491.7    125310.37      19557.738
## gastsanitarios -4.697435          41426.1     55103.84       9309.073
## movildomest    -4.748398         107613.3    129687.76      15037.723
##                Overall sd      p.value
## otros            23316.78 3.741941e-05
## vestidocalza     37548.43 3.358816e-05
## turisocio        60015.14 5.516391e-06
## vivienda        106379.44 5.066360e-06
## transporte       59422.84 5.053458e-06
## alimentacion     65354.17 3.257090e-06
## ensecultura      39777.54 2.785965e-06
## gastsanitarios   16537.61 2.634488e-06
## movildomest      26403.54 2.050344e-06
## 
## $`2`
##                v.test Mean in category Overall mean sd in category Overall sd
## alimentacion 2.421169         627527.6     600781.2       50358.83   65354.17
##                p.value
## alimentacion 0.0154707
## 
## $`3`
##                  v.test Mean in category Overall mean sd in category Overall sd
## ensecultura    5.467322         187586.2    125310.37       26626.24   39777.54
## turisocio      5.143519         382953.5    294558.41       34268.29   60015.14
## vivienda       4.872820         648393.4    499955.45       95354.13  106379.44
## gastsanitarios 4.659646          77170.3     55103.84       12943.29   16537.61
## movildomest    4.358934         162644.9    129687.76       23577.57   26403.54
## transporte     4.101638         347905.9    278111.96       46245.18   59422.84
## otros          3.599874         126260.9    102224.86       19021.65   23316.78
## vestidocalza   3.402645         268628.8    232042.76       27458.97   37548.43
## alimentacion   2.721710         651716.9    600781.24       43342.67   65354.17
##                     p.value
## ensecultura    4.568846e-08
## turisocio      2.696391e-07
## vivienda       1.100167e-06
## gastsanitarios 3.167544e-06
## movildomest    1.306975e-05
## transporte     4.102351e-05
## otros          3.183712e-04
## vestidocalza   6.673687e-04
## alimentacion   6.494520e-03

El clúster 1 está formado por las provincias como Jaén, Salamanca, Castellón, Badajoz y Ceuta_Melilla. Este grupo se caracteriza por:

valores bajos para las variables transporte, gastsanitarios, vestidocalza, ensecultura, alimentacion, vivienda, movildomest, turisocio y otras (variables ordenadas de menor a mayor).

El clúster 2 está formado por provincias como Huesca, Tenerife, León, Valencia, La Coruña, Lugo y Pontevedra. Este grupo se caracteriza por:

variables cuyos valores no difieren significativamente de la media.

El clúster 3 está formado por individuos como Baleares, Barcelona,Gerona, Lérida, Madrid, Navarra, Guipuzcua y Vizcaya. Este grupo se caracteriza por:

valores altos para las variables ensecultura, movildomest, vivienda, turisocio, gastsanitarios, transporte, vestidocalza, otros y alimentacion (las variables se ordenan de la mas fuerte).

Cálculo del índice

Teniendo en cuenta que se cumple el factor tamaño donde las variables tienen el mismo signo de correlación, se puede estimar un índice teniendo en cuenta el primer componente principal.

T1 <-res.pca$ind$coord[,1] ## primer componente
sort(T1,decreasing = TRUE)
##       Navarra        Madrid     Barcelona        Lerida       Vizcaya 
##     6.2156558     5.4562178     4.7246211     4.0517940     3.7256357 
##        Gerona     Guipuzcua     Tarragona         Alava      Baleares 
##     2.8313573     2.6416980     2.5191813     2.4595457     2.4284791 
##    Las_Palmas      Asturias       Almeria    Pontevedra        Burgos 
##     1.8655618     1.6181540     1.3939289     1.1960927     1.1067047 
##     Cantabria     La Coruna          Leon          Lugo         Soria 
##     0.9818628     0.9180488     0.7030767     0.6516371     0.5117032 
##      La_Rioja      Valencia      Alicante    Valladolid        Murcia 
##     0.4608210     0.4590469     0.3105995     0.1943390    -0.1131688 
##        Malaga       Sevilla         Cadiz        Toledo        Huelva 
##    -0.1176886    -0.1376661    -0.1416302    -0.1574482    -0.4768663 
##      Zaragoza      Tenerife      Palencia      Albacete       Cordoba 
##    -0.5943313    -0.8605992    -1.2189202    -1.2540897    -1.3076632 
##        Huesca       Caceres   Guadalajara       Granada   Ciudad Real 
##    -1.3691342    -1.4300536    -1.5829919    -1.7102714    -1.7367171 
##       Segovia        Cuenca         Avila        Teruel        Zamora 
##    -2.0390575    -2.2011704    -2.3161159    -2.6540900    -2.7129584 
##        Orense     Castellon Ceuta_Melilla       Badajoz          Jaen 
##    -2.7173137    -2.9074725    -3.7785085    -4.3121372    -4.7365131 
##     Salamanca 
##    -4.8411859
Indice.gasto <- (T1 - min(T1))*100/(max(T1)-min(T1)) ## reescalamiento (0-100)

sort(Indice.gasto,decreasing = TRUE)
##       Navarra        Madrid     Barcelona        Lerida       Vizcaya 
##   100.0000000    93.1315106    86.5148228    80.4296570    77.4798246 
##        Gerona     Guipuzcua     Tarragona         Alava      Baleares 
##    69.3918152    67.6765036    66.5684411    66.0290871    65.7481148 
##    Las_Palmas      Asturias       Almeria    Pontevedra        Burgos 
##    60.6569934    58.4193938    56.3914628    54.6021981    53.7937576 
##     Cantabria     La Coruna          Leon          Lugo         Soria 
##    52.6646658    52.0875205    50.1432759    49.6780468    48.4124607 
##      La_Rioja      Valencia      Alicante    Valladolid        Murcia 
##    47.9522733    47.9362275    46.5936436    45.5421635    42.7610088 
##        Malaga       Sevilla         Cadiz        Toledo        Huelva 
##    42.7201312    42.5394516    42.5035997    42.3605383    39.4716661 
##      Zaragoza      Tenerife      Palencia      Albacete       Cordoba 
##    38.4092921    36.0011186    32.7604013    32.4423218    31.9577944 
##        Huesca       Caceres   Guadalajara       Granada   Ciudad Real 
##    31.4018393    30.8508736    29.4676737    28.3165353    28.0773564 
##       Segovia        Cuenca         Avila        Teruel        Zamora 
##    25.3429365    23.8767594    22.8371725    19.7804759    19.2480595 
##        Orense     Castellon Ceuta_Melilla       Badajoz          Jaen 
##    19.2086695    17.4888407     9.6110394     4.7848087     0.9466793 
##     Salamanca 
##     0.0000000

Del índice se observa que las provincias de Navarra, Madrid, Barcelona y Lerida, presentan un índice superior a 80, para el caso de estudio se puede interpretar que estas provincias tienen un gasto superior en los diferentes rubros del presupuesto familiar. Mientras que Salamanca y Jaen presentan un índice menor.