En el archivo datos_prob_7_3.txt, se puede ver una lista de variables que caracterizan el grado de desarrollo de algunos países del mundo. Las variables son X1 = Tasa de mortalidad infantil por cada 1000 nacidos vivos, X2 = Porcentaje de mujeres en la población activa, X3 = Producto Nacional Bruto (PNB) per capita en 1995 (en $), X4 = Producción de electricidad (en millones de kw/h), X5 = Promedio de líneas telefónicas por cada 1000 habitantes, X6 = Consumo de agua per capita en m3 (de 1980 a 1995), X7 = Consumo de energía per capita en 1994, X8 = Emisión de CO2 per capita en 1992 (en Tm).

  1. Supóngase un modelo factorial ortogonal para las variables Xi estandarizadas. Utilícese el método de la componente principal para estimar la matriz de cargas en los modelos con tres y cuatro factores comunes.

  2. Estímense las comunalidades y las varianzas específicas para los dos modelos del apartado anterior. ¿Cuál de los dos modelos es razonable elegir?

library(Hmisc)
library(readr)
library(stargazer)
datos_ejercicio <- read_table2("http://halweb.uc3m.es/esp/Personal/personas/agrane/libro/ficheros_datos/capitulo_7/datos_prob_7_3.txt",col_names = FALSE)
Mat_R<-rcorr(as.matrix(datos_ejercicio))
descomposicion<-eigen(Mat_R$r)
stargazer(descomposicion$values,type = "html")
3.754 1.929 0.836 0.723 0.341 0.305 0.099 0.014
stargazer(descomposicion$vectors,type = "html")
-0.373 -0.046 -0.032 0.705 -0.420 0.407 0.119 0.063
-0.222 -0.611 0.045 -0.240 0.049 0.013 0.702 -0.148
0.414 -0.200 -0.270 -0.025 0.365 0.753 -0.049 0.114
0.215 -0.286 0.883 0.039 -0.084 0.159 -0.235 -0.059
0.411 0.184 -0.091 -0.346 -0.754 0.183 0.190 -0.175
0.177 0.605 0.299 0.206 0.320 0.088 0.573 -0.178
0.472 -0.169 -0.014 0.279 -0.090 -0.345 0.257 0.691
0.413 -0.271 -0.215 0.450 0.041 -0.288 -0.071 -0.646

#Extracción de los Factores, vía metodo de Componentes Principales

##Solución con 3 Factores

library(psych)
modelo_3<-principal(r = datos_ejercicio,nfactors = 3,covar = FALSE,rotate = "none")
modelo_3
## Principal Components Analysis
## Call: principal(r = datos_ejercicio, nfactors = 3, rotate = "none", 
##     covar = FALSE)
## Standardized loadings (pattern matrix) based upon correlation matrix
##      PC1   PC2   PC3   h2    u2 com
## X1 -0.72  0.06 -0.03 0.53 0.472 1.0
## X2 -0.43  0.85  0.04 0.91 0.092 1.5
## X3  0.80  0.28 -0.25 0.78 0.219 1.4
## X4  0.42  0.40  0.81 0.98 0.017 2.0
## X5  0.80 -0.25 -0.08 0.71 0.295 1.2
## X6  0.34 -0.84  0.27 0.90 0.101 1.6
## X7  0.91  0.23 -0.01 0.89 0.108 1.1
## X8  0.80  0.38 -0.20 0.82 0.179 1.6
## 
##                        PC1  PC2  PC3
## SS loadings           3.75 1.93 0.84
## Proportion Var        0.47 0.24 0.10
## Cumulative Var        0.47 0.71 0.81
## Proportion Explained  0.58 0.30 0.13
## Cumulative Proportion 0.58 0.87 1.00
## 
## Mean item complexity =  1.4
## Test of the hypothesis that 3 components are sufficient.
## 
## The root mean square of the residuals (RMSR) is  0.08 
##  with the empirical chi square  5.8  with prob <  0.56 
## 
## Fit based upon off diagonal values = 0.97

##Solución con 4 Factores

library(psych)
modelo_4<-principal(r = datos_ejercicio,nfactors = 4,covar = FALSE,rotate = "none")
modelo_4
## Principal Components Analysis
## Call: principal(r = datos_ejercicio, nfactors = 4, rotate = "none", 
##     covar = FALSE)
## Standardized loadings (pattern matrix) based upon correlation matrix
##      PC1   PC2   PC3   PC4   h2    u2 com
## X1 -0.72  0.06 -0.03  0.60 0.89 0.112 2.0
## X2 -0.43  0.85  0.04 -0.20 0.95 0.050 1.6
## X3  0.80  0.28 -0.25 -0.02 0.78 0.219 1.4
## X4  0.42  0.40  0.81  0.03 0.98 0.016 2.0
## X5  0.80 -0.25 -0.08 -0.29 0.79 0.208 1.5
## X6  0.34 -0.84  0.27  0.18 0.93 0.070 1.7
## X7  0.91  0.23 -0.01  0.24 0.95 0.052 1.3
## X8  0.80  0.38 -0.20  0.38 0.97 0.032 2.1
## 
##                        PC1  PC2  PC3  PC4
## SS loadings           3.75 1.93 0.84 0.72
## Proportion Var        0.47 0.24 0.10 0.09
## Cumulative Var        0.47 0.71 0.81 0.91
## Proportion Explained  0.52 0.27 0.12 0.10
## Cumulative Proportion 0.52 0.78 0.90 1.00
## 
## Mean item complexity =  1.7
## Test of the hypothesis that 4 components are sufficient.
## 
## The root mean square of the residuals (RMSR) is  0.04 
##  with the empirical chi square  1.87  with prob <  0.39 
## 
## Fit based upon off diagonal values = 0.99