Introducción

Este documento hace parte del trabajo final del curso de Análisis multivariado . El alcance de este documento reporta de manera técnica el paso a paso que se llevó a cabo para realizar el análisis factorial.

#Cargue de la base de datos

datos<-fread(file =paste0(dir.input, 'cdv.csv')
               ,dec = ',')

datos1=scale(datos, center=TRUE, scale=TRUE)

1. Descripción de la base de datos

La Encuesta de Calidad de Vida es un instrumento diseñado para realizar el seguimiento y la medición de las condiciones socioeconómicas de los habitantes de las 16 comunas y 5 corregimientos que conforman el municipio de Medellín. Es un compendio estadístico que permite conocer de primera mano los índices de temas vitales como la Población, Vivienda, Hogares, Educación, Fuerza de Trabajo, Salud y Seguridad Social. Esta encuesta se ha llevado a cabo anualmente desde el 2004, para este análisis se utilizó la encuesta del año 2020.

La base de datos cuenta con 275 variables, de las cuales se tomaron 25 que tenían una alta correlación entre ellas:

Variable Preguntas
P_69 ¿En qué actividad ocupó la mayor parte del tiempo la semana pasada? [la predominante]
P_73 En las últimas 4 semanas ¿hizo alguna diligencia para conseguir trabajo o instalar un negocio?
P_74 Desea conseguir un trabajo remunerado o instalar un negocio?
P_75 Aunque desea trabajar por qué motivo principal no hizo diligencias en las últimas 4 semanas?
P_83 ¿Cuál es el medio de transporte utilizado predominante para dirigirse al sitio de su empleo principal?
P_84 ¿Cuánto tiempo tardan en llegar al sitio de trabajo?
P_85 A qué actividad específica se dedica principalmente la empresa o negocio en la que realiza su trabajo?
P_291 En este hogar: En los últimos 30 días, ¿Usted se preocupó alguna vez de que en su hogar se acabaran los alimentos debido a falta de dinero?
P_292 En este hogar: En los últimos 30 días, ¿Alguna vez en su hogar se quedaron sin dinero para obtener una alimentación nutritiva:…?
P_293 En este hogar: En los últimos 30 días, ¿alguna vez usted o algún adulto de su hogar no pudo variar la alimentación por falta de dinero?
P_294 En este hogar: En los últimos 30 días, ¿Alguna vez usted o algún adulto de su hogar comió menos de lo que está acostumbrado por falta de dinero?
P_295 En este hogar: En los últimos 30 días, ¿Alguna vez en su hogar se quedaron sin alimentos por falta de dinero?
P_296 En este hogar: En los últimos 30 días, ¿Alguna vez usted o algún adulto de su hogar dejo de desayunar, almorzar o comer por falta de dinero?
P_297 En este hogar: En los últimos 30 días, ¿alguna vez usted o algún adulto de su hogar sintió o se quejó de hambre y no comió por falta de dinero?
P_298 En este hogar: En los últimos 30 días, ¿Alguna vez usted o algún adulto de su hogar solo comió una sola vez al día o dejó de comer en todo un día por falta de dinero?
P_299 En este hogar: En los últimos 30 días, ¿Alguna vez, algún adulto de su hogar se acostó con hambre o porque no alcanzó el dinero para los alimentos?
P_300 En este hogar: En los últimos 30 días, ¿Alguna vez por falta de dinero, algún niño o joven de su hogar dejó de tener una alimentación nutritiva…?
P_301 En este hogar: En los últimos 30 días, ¿Alguna vez algún niño o joven de su hogar no pudo variar la alimentación por falta de dinero?
P_302 En este hogar: En los últimos 30 días, ¿Alguna vez usted tuvo que disminuir la cantidad servida en las comidas de algún niño o joven de su hogar por falta de dinero?
P_303 En este hogar: En los últimos 30 días, ¿Alguna vez, algún niño o joven de su hogar se quejó de hambre pero no se pudo comprar más alimentos por falta de dinero?
P_304 En este hogar: En los últimos 30 días, ¿Alguna vez algún niño o joven de su hogar se acostó con hambre porque no alcanzó el dinero para alimentos?
P_305 En este hogar: En los últimos 30 días, ¿Alguna vez, algún niño o joven de su hogar sólo comió una vez al día o dejó de comer todo un día por falta de dinero?

Como se puede observar algunas variables están relaciondas con el ingreso de los hogares, frente a algunas situaciones que se puedieron presentar. De otro parte, otra parte de las variables se enfoca en la situación de empleo de las personas.

2. Procedimiento a ejecutar para el análisis factorial

A continuación, se validan los supuestos que se deben cumplir para aplicar el análisis factorial

2.1 Matriz de correlaciones

Se puede observar la matriz de correlaciones obtenida, donde se observa como los dos grupos de variables mencionadas cuentan con una alta correlación entre las variables del mismo grupo.

corr.test(datos1)
Call:corr.test(x = datos1)
Correlation matrix 
      P_291 P_292 P_293 P_294 P_295 P_296 P_297 P_298 P_299 P_300 P_301 P_302
P_291  1.00  0.58  0.59  0.58  0.89  0.89  0.89  0.89  0.89  0.50  0.50  0.50
P_292  0.58  1.00  0.72  0.67  0.63  0.63  0.63  0.63  0.63  0.39  0.39  0.39
P_293  0.59  0.72  1.00  0.72  0.66  0.66  0.66  0.66  0.65  0.41  0.41  0.41
P_294  0.58  0.67  0.72  1.00  0.64  0.64  0.64  0.64  0.64  0.40  0.40  0.40
P_295  0.89  0.63  0.66  0.64  1.00  1.00  1.00  1.00  1.00  0.55  0.55  0.55
P_296  0.89  0.63  0.66  0.64  1.00  1.00  1.00  1.00  1.00  0.55  0.55  0.55
P_297  0.89  0.63  0.66  0.64  1.00  1.00  1.00  1.00  1.00  0.55  0.55  0.55
P_298  0.89  0.63  0.66  0.64  1.00  1.00  1.00  1.00  1.00  0.55  0.55  0.55
P_299  0.89  0.63  0.65  0.64  1.00  1.00  1.00  1.00  1.00  0.55  0.55  0.55
P_300  0.50  0.39  0.41  0.40  0.55  0.55  0.55  0.55  0.55  1.00  1.00  1.00
P_301  0.50  0.39  0.41  0.40  0.55  0.55  0.55  0.55  0.55  1.00  1.00  1.00
P_302  0.50  0.39  0.41  0.40  0.55  0.55  0.55  0.55  0.55  1.00  1.00  1.00
P_303  0.50  0.39  0.41  0.40  0.55  0.55  0.55  0.55  0.55  1.00  1.00  1.00
P_304  0.50  0.39  0.41  0.40  0.55  0.55  0.55  0.55  0.55  1.00  1.00  1.00
P_305  0.50  0.39  0.41  0.40  0.55  0.55  0.55  0.55  0.55  1.00  1.00  1.00
P_69  -0.07 -0.08 -0.07 -0.06 -0.07 -0.07 -0.07 -0.07 -0.07 -0.18 -0.18 -0.18
P_73   0.04  0.05  0.05  0.05  0.04  0.04  0.04  0.04  0.04 -0.05 -0.05 -0.05
P_74  -0.04 -0.02 -0.02 -0.03 -0.04 -0.04 -0.04 -0.04 -0.04 -0.09 -0.09 -0.09
P_75   0.09  0.09  0.09  0.08  0.10  0.10  0.10  0.10  0.10  0.04  0.04  0.04
P_83  -0.06 -0.07 -0.08 -0.07 -0.06 -0.06 -0.06 -0.06 -0.06 -0.07 -0.07 -0.07
P_84  -0.07 -0.08 -0.08 -0.07 -0.07 -0.07 -0.07 -0.07 -0.07 -0.07 -0.07 -0.07
P_85  -0.07 -0.08 -0.09 -0.08 -0.08 -0.08 -0.08 -0.08 -0.08 -0.08 -0.08 -0.08
      P_303 P_304 P_305  P_69  P_73  P_74  P_75  P_83  P_84  P_85
P_291  0.50  0.50  0.50 -0.07  0.04 -0.04  0.09 -0.06 -0.07 -0.07
P_292  0.39  0.39  0.39 -0.08  0.05 -0.02  0.09 -0.07 -0.08 -0.08
P_293  0.41  0.41  0.41 -0.07  0.05 -0.02  0.09 -0.08 -0.08 -0.09
P_294  0.40  0.40  0.40 -0.06  0.05 -0.03  0.08 -0.07 -0.07 -0.08
P_295  0.55  0.55  0.55 -0.07  0.04 -0.04  0.10 -0.06 -0.07 -0.08
P_296  0.55  0.55  0.55 -0.07  0.04 -0.04  0.10 -0.06 -0.07 -0.08
P_297  0.55  0.55  0.55 -0.07  0.04 -0.04  0.10 -0.06 -0.07 -0.08
P_298  0.55  0.55  0.55 -0.07  0.04 -0.04  0.10 -0.06 -0.07 -0.08
P_299  0.55  0.55  0.55 -0.07  0.04 -0.04  0.10 -0.06 -0.07 -0.08
P_300  1.00  1.00  1.00 -0.18 -0.05 -0.09  0.04 -0.07 -0.07 -0.08
P_301  1.00  1.00  1.00 -0.18 -0.05 -0.09  0.04 -0.07 -0.07 -0.08
P_302  1.00  1.00  1.00 -0.18 -0.05 -0.09  0.04 -0.07 -0.07 -0.08
P_303  1.00  1.00  1.00 -0.18 -0.05 -0.09  0.04 -0.07 -0.07 -0.08
P_304  1.00  1.00  1.00 -0.18 -0.05 -0.09  0.04 -0.07 -0.07 -0.08
P_305  1.00  1.00  1.00 -0.18 -0.05 -0.09  0.04 -0.07 -0.07 -0.08
P_69  -0.18 -0.18 -0.18  1.00  0.18  0.14  0.04  0.23  0.21  0.24
P_73  -0.05 -0.05 -0.05  0.18  1.00  0.81  0.21 -0.77 -0.70 -0.79
P_74  -0.09 -0.09 -0.09  0.14  0.81  1.00  0.27 -0.63 -0.57 -0.65
P_75   0.04  0.04  0.04  0.04  0.21  0.27  1.00 -0.16 -0.15 -0.17
P_83  -0.07 -0.07 -0.07  0.23 -0.77 -0.63 -0.16  1.00  0.82  0.90
P_84  -0.07 -0.07 -0.07  0.21 -0.70 -0.57 -0.15  0.82  1.00  0.83
P_85  -0.08 -0.08 -0.08  0.24 -0.79 -0.65 -0.17  0.90  0.83  1.00
Sample Size 
[1] 32795
Probability values (Entries above the diagonal are adjusted for multiple tests.) 
      P_291 P_292 P_293 P_294 P_295 P_296 P_297 P_298 P_299 P_300 P_301 P_302
P_291     0     0     0     0     0     0     0     0     0     0     0     0
P_292     0     0     0     0     0     0     0     0     0     0     0     0
P_293     0     0     0     0     0     0     0     0     0     0     0     0
P_294     0     0     0     0     0     0     0     0     0     0     0     0
P_295     0     0     0     0     0     0     0     0     0     0     0     0
P_296     0     0     0     0     0     0     0     0     0     0     0     0
P_297     0     0     0     0     0     0     0     0     0     0     0     0
P_298     0     0     0     0     0     0     0     0     0     0     0     0
P_299     0     0     0     0     0     0     0     0     0     0     0     0
P_300     0     0     0     0     0     0     0     0     0     0     0     0
P_301     0     0     0     0     0     0     0     0     0     0     0     0
P_302     0     0     0     0     0     0     0     0     0     0     0     0
P_303     0     0     0     0     0     0     0     0     0     0     0     0
P_304     0     0     0     0     0     0     0     0     0     0     0     0
P_305     0     0     0     0     0     0     0     0     0     0     0     0
P_69      0     0     0     0     0     0     0     0     0     0     0     0
P_73      0     0     0     0     0     0     0     0     0     0     0     0
P_74      0     0     0     0     0     0     0     0     0     0     0     0
P_75      0     0     0     0     0     0     0     0     0     0     0     0
P_83      0     0     0     0     0     0     0     0     0     0     0     0
P_84      0     0     0     0     0     0     0     0     0     0     0     0
P_85      0     0     0     0     0     0     0     0     0     0     0     0
      P_303 P_304 P_305 P_69 P_73 P_74 P_75 P_83 P_84 P_85
P_291     0     0     0    0    0    0    0    0    0    0
P_292     0     0     0    0    0    0    0    0    0    0
P_293     0     0     0    0    0    0    0    0    0    0
P_294     0     0     0    0    0    0    0    0    0    0
P_295     0     0     0    0    0    0    0    0    0    0
P_296     0     0     0    0    0    0    0    0    0    0
P_297     0     0     0    0    0    0    0    0    0    0
P_298     0     0     0    0    0    0    0    0    0    0
P_299     0     0     0    0    0    0    0    0    0    0
P_300     0     0     0    0    0    0    0    0    0    0
P_301     0     0     0    0    0    0    0    0    0    0
P_302     0     0     0    0    0    0    0    0    0    0
P_303     0     0     0    0    0    0    0    0    0    0
P_304     0     0     0    0    0    0    0    0    0    0
P_305     0     0     0    0    0    0    0    0    0    0
P_69      0     0     0    0    0    0    0    0    0    0
P_73      0     0     0    0    0    0    0    0    0    0
P_74      0     0     0    0    0    0    0    0    0    0
P_75      0     0     0    0    0    0    0    0    0    0
P_83      0     0     0    0    0    0    0    0    0    0
P_84      0     0     0    0    0    0    0    0    0    0
P_85      0     0     0    0    0    0    0    0    0    0

 To see confidence intervals of the correlations, print with the short=FALSE option

Dado que se rechaza la hipotesis nula, entonces se puede aplicar el análisis factorial.

mat_cor <- hetcor(datos1)$correlations #matriz de correlación policorica
ggcorrplot(mat_cor,type="lower",hc.order = T)

Prueba Bartlett

\[H_0:Las\ variables\ no\ están\ correlacionadas\ en\ la\ población\] \[H_1:Las\ variables\ están\ correlacionadas\ en\ la\ población\]

cortest.bartlett(mat_cor,n=nrow(datos1))
$chisq
[1] 3466857

$p.value
[1] 0

$df
[1] 231

Se confirma la hipótesis alternativa, dado que el p-valor es menor que 0.05.

Prueba de Kaiser-Meyer-Olkin

KMO(mat_cor)
Kaiser-Meyer-Olkin factor adequacy
Call: KMO(r = mat_cor)
Overall MSA =  0.94
MSA for each item = 
P_291 P_292 P_293 P_294 P_295 P_296 P_297 P_298 P_299 P_300 P_301 P_302 P_303 
 1.00  0.95  0.94  0.96  0.98  0.97  0.96  0.96  0.95  0.96  0.95  0.97  0.97 
P_304 P_305  P_69  P_73  P_74  P_75  P_83  P_84  P_85 
 0.93  0.94  0.48  0.76  0.87  0.89  0.87  0.94  0.84 

La medida de adecuación de la muestra MSA o KMO (Kaiser-Meyer-Olkin) contrasta si las correlaciones parciales entre las variables son suficientemente pequeñas. El estadístico KMO varía entre 0 y 1. Los valores pequeños indican que el análisis factorial puede no ser una buena idea, dado que las correlaciones entre los pares de variables no pueden ser explicadas por otras variables. Los menores que 0.5 indican que no debe utilizarse el AF con la matriz de datos que se están analizando.

Como referencia, Kaiser puso los siguientes valores en los resultados:

  • 0.00 a 0.49 inaceptable.
  • 0.50 a 0.59 miserable.
  • 0,60 a 0,69 mediocre.
  • 0.70 a 0.79 medio.
  • 0,80 a 0,89 meritorio.
  • 0.90 a 1.00 totalmente ajustado.

Con el resultado obtenido, de un KMO de 0.94 nos indica que es viable utilizar el análisis factorial con estos datos.

3. Extracción de los factores

El método seleccionado para la extracción de los factores son las componentes principales iteradas, que es aplicable tanto si los datos siguen una distribución normal multivariada como cuando esta condición no se cumple.

Una forma de determinar el número de factores o componentes en una matriz de datos o una matriz de correlación es examinar la gráfica de “scree” de los valores propios sucesivos. Las roturas bruscas en la gráfica sugieren el número apropiado de componentes o factores para extraer. El resultado es el siguiente:

fa.parallel(mat_cor, fm="pa", n.obs =nrow(datos1),ylabel="Eigenvalues" )

Parallel analysis suggests that the number of factors =  5  and the number of components =  4 

Según el Análisis paralelo, se sugiere que los factores a extraer sean 5, no obstante, vemos que los cambios bruscos son hasta el factor 4 y de ahí en adelante tiende a ser constante. Debido a esto se va a realizar la extracción de 3 y 4 factores con el fin de comparar los resultados y tomar una decisión sobre el número de factores.

Extracción de 4 factores

cpi <- fa(mat_cor,nfactors= 4, fm="pa", rotate="none", n.obs=nrow(datos1))
cpi
Factor Analysis using method =  pa
Call: fa(r = mat_cor, nfactors = 4, n.obs = nrow(datos1), rotate = "none", 
    fm = "pa")
Standardized loadings (pattern matrix) based upon correlation matrix
        PA1   PA2   PA3   PA4   h2       u2 com
P_291  0.81 -0.02  0.37  0.00 0.79 0.213200 1.4
P_292  0.63 -0.04  0.27 -0.05 0.48 0.523202 1.4
P_293  0.66 -0.04  0.28 -0.05 0.52 0.482148 1.4
P_294  0.64 -0.03  0.27 -0.04 0.49 0.508825 1.4
P_295  0.90 -0.02  0.42  0.00 0.98 0.023642 1.4
P_296  0.90 -0.02  0.42  0.00 0.98 0.023644 1.4
P_297  0.90 -0.02  0.42  0.00 0.98 0.023805 1.4
P_298  0.90 -0.02  0.42  0.00 0.98 0.023893 1.4
P_299  0.90 -0.02  0.42  0.00 0.98 0.024080 1.4
P_300  0.85  0.10 -0.51  0.05 1.00 0.000019 1.7
P_301  0.85  0.10 -0.51  0.05 1.00 0.000016 1.7
P_302  0.85  0.10 -0.51  0.05 1.00 0.000018 1.7
P_303  0.85  0.10 -0.51  0.05 1.00 0.000014 1.7
P_304  0.85  0.10 -0.51  0.05 1.00 0.000016 1.7
P_305  0.85  0.10 -0.51  0.05 1.00 0.000018 1.7
P_69  -0.15  0.07  0.17  0.65 0.48 0.523427 1.3
P_73   0.03 -0.92  0.01  0.36 0.97 0.025096 1.3
P_74  -0.05 -0.77 -0.03  0.31 0.69 0.314697 1.3
P_75   0.09 -0.21  0.04  0.12 0.07 0.930474 2.1
P_83  -0.12  0.91  0.14  0.20 0.89 0.106343 1.2
P_84  -0.11  0.82  0.12  0.19 0.74 0.258338 1.2
P_85  -0.13  0.92  0.14  0.19 0.92 0.076886 1.2

                        PA1  PA2  PA3  PA4
SS loadings           10.33 3.90 2.90 0.79
Proportion Var         0.47 0.18 0.13 0.04
Cumulative Var         0.47 0.65 0.78 0.81
Proportion Explained   0.58 0.22 0.16 0.04
Cumulative Proportion  0.58 0.79 0.96 1.00

Mean item complexity =  1.5
Test of the hypothesis that 4 factors are sufficient.

The degrees of freedom for the null model are  231  and the objective function was  105.74 with Chi Square of  3466857
The degrees of freedom for the model are 149  and the objective function was  25.73 

The root mean square of the residuals (RMSR) is  0.03 
The df corrected root mean square of the residuals is  0.04 

The harmonic number of observations is  32795 with the empirical chi square  12611.59  with prob <  0 
The total number of observations was  32795  with Likelihood Chi Square =  843672.1  with prob <  0 

Tucker Lewis Index of factoring reliability =  0.623
RMSEA index =  0.415  and the 90 % confidence intervals are  0.415 0.416
BIC =  842122.8
Fit based upon off diagonal values = 1
Measures of factor score adequacy             
                                                   PA1  PA2  PA3  PA4
Correlation of (regression) scores with factors   1.00 0.99 0.99 0.94
Multiple R square of scores with factors          1.00 0.98 0.99 0.89
Minimum correlation of possible factor scores     0.99 0.96 0.98 0.77

Extracción de 3 factores

cpi1 <- fa(mat_cor,nfactors= 3, fm="pa", rotate="none", n.obs=nrow(datos1))
cpi1
Factor Analysis using method =  pa
Call: fa(r = mat_cor, nfactors = 3, n.obs = nrow(datos1), rotate = "none", 
    fm = "pa")
Standardized loadings (pattern matrix) based upon correlation matrix
        PA1   PA2   PA3    h2     u2 com
P_291  0.81 -0.02  0.36 0.787 0.2131 1.4
P_292  0.63 -0.04  0.27 0.474 0.5262 1.4
P_293  0.66 -0.05  0.28 0.516 0.4845 1.4
P_294  0.64 -0.04  0.27 0.490 0.5105 1.4
P_295  0.90 -0.02  0.42 0.977 0.0235 1.4
P_296  0.90 -0.02  0.42 0.977 0.0235 1.4
P_297  0.90 -0.02  0.42 0.976 0.0237 1.4
P_298  0.90 -0.02  0.42 0.976 0.0237 1.4
P_299  0.90 -0.02  0.42 0.976 0.0239 1.4
P_300  0.85  0.10 -0.51 0.998 0.0015 1.7
P_301  0.85  0.10 -0.51 0.998 0.0015 1.7
P_302  0.85  0.10 -0.51 0.998 0.0015 1.7
P_303  0.85  0.10 -0.51 0.998 0.0015 1.7
P_304  0.85  0.10 -0.51 0.998 0.0015 1.7
P_305  0.85  0.10 -0.51 0.998 0.0015 1.7
P_69  -0.14  0.06  0.14 0.045 0.9551 2.4
P_73   0.03 -0.89  0.00 0.784 0.2160 1.0
P_74  -0.05 -0.75 -0.03 0.567 0.4328 1.0
P_75   0.09 -0.21  0.04 0.056 0.9442 1.4
P_83  -0.11  0.91  0.15 0.856 0.1439 1.1
P_84  -0.11  0.83  0.12 0.711 0.2888 1.1
P_85  -0.13  0.92  0.14 0.886 0.1135 1.1

                        PA1  PA2  PA3
SS loadings           10.33 3.82 2.90
Proportion Var         0.47 0.17 0.13
Cumulative Var         0.47 0.64 0.77
Proportion Explained   0.61 0.22 0.17
Cumulative Proportion  0.61 0.83 1.00

Mean item complexity =  1.4
Test of the hypothesis that 3 factors are sufficient.

The degrees of freedom for the null model are  231  and the objective function was  105.74 with Chi Square of  3466857
The degrees of freedom for the model are 168  and the objective function was  44.59 

The root mean square of the residuals (RMSR) is  0.04 
The df corrected root mean square of the residuals is  0.05 

The harmonic number of observations is  32795 with the empirical chi square  25663.62  with prob <  0 
The total number of observations was  32795  with Likelihood Chi Square =  1461972  with prob <  0 

Tucker Lewis Index of factoring reliability =  0.42
RMSEA index =  0.515  and the 90 % confidence intervals are  0.514 0.516
BIC =  1460225
Fit based upon off diagonal values = 0.99
Measures of factor score adequacy             
                                                   PA1  PA2  PA3
Correlation of (regression) scores with factors   1.00 0.98 0.99
Multiple R square of scores with factors          1.00 0.96 0.99
Minimum correlation of possible factor scores     0.99 0.91 0.98

Comunalidad extrayendo 3 factores

cpi1$communality
     P_291      P_292      P_293      P_294      P_295      P_296      P_297 
0.78688185 0.47375492 0.51553923 0.48953571 0.97650366 0.97650240 0.97634221 
     P_298      P_299      P_300      P_301      P_302      P_303      P_304 
0.97625415 0.97606718 0.99846875 0.99847033 0.99846339 0.99846455 0.99845878 
     P_305       P_69       P_73       P_74       P_75       P_83       P_84 
0.99845104 0.04486406 0.78396183 0.56717345 0.05584002 0.85606331 0.71123790 
      P_85 
0.88649214 

Comunalidad extrayendo 4 factores

cpi$communality
     P_291      P_292      P_293      P_294      P_295      P_296      P_297 
0.78680015 0.47679753 0.51785157 0.49117512 0.97635806 0.97635630 0.97619549 
     P_298      P_299      P_300      P_301      P_302      P_303      P_304 
0.97610688 0.97591960 0.99998120 0.99998362 0.99998249 0.99998563 0.99998392 
     P_305       P_69       P_73       P_74       P_75       P_83       P_84 
0.99998210 0.47657278 0.97490360 0.68530317 0.06952607 0.89365657 0.74166225 
      P_85 
0.92311441 

Se puede observar que cuando se extraen cuatro factores se mejora el porcentaje de variabilidad explicada por el factor para el grupo de variables asociadas al trabajo.

Unicidad extrayendo 3 factores

cpi1$uniquenesses
      P_291       P_292       P_293       P_294       P_295       P_296 
0.213118150 0.526245080 0.484460770 0.510464286 0.023496336 0.023497598 
      P_297       P_298       P_299       P_300       P_301       P_302 
0.023657787 0.023745853 0.023932820 0.001531248 0.001529668 0.001536612 
      P_303       P_304       P_305        P_69        P_73        P_74 
0.001535445 0.001541225 0.001548956 0.955135941 0.216038168 0.432826550 
       P_75        P_83        P_84        P_85 
0.944159983 0.143936689 0.288762097 0.113507859 

Unicidad extrayendo 4 factores

cpi$uniquenesses
        P_291         P_292         P_293         P_294         P_295 
0.21319984952 0.52320246792 0.48214842766 0.50882488324 0.02364194118 
        P_296         P_297         P_298         P_299         P_300 
0.02364369850 0.02380451276 0.02389311988 0.02408039671 0.00001880136 
        P_301         P_302         P_303         P_304         P_305 
0.00001637730 0.00001751306 0.00001436956 0.00001607893 0.00001790490 
         P_69          P_73          P_74          P_75          P_83 
0.52342722239 0.02509639931 0.31469682790 0.93047392571 0.10634343063 
         P_84          P_85 
0.25833775241 0.07688558735 

Se puede observar que el porcentaje de varianza que no es explicado por los factores disminuye de manera importante cuando se extraen 4 factores.

4. Selección del número de factores

N° de factores RMSR* Cumulative Var
3 factores 0.04 0.77
4 factores 0.03 0.81

RMSR =La raíz cuadrada media de los residuos

Para determinar el número de factores que se van a utilizar para el análisis, se tienen en cuenta la raíz cuadrada media de los residuos que se interpreta que entre más pequeño es el porcentaje es mejor y el porcentaje de varianza acumulada, que indica el porcentaje de varianza de los datos explicada por los factores. Además, se analizó la comunalidad y la unicidad para las dos opciones. Teniendo en cuenta lo anterior, se concluye que es viable utilizar 4 factores para los ejercicios que se consideren necesarios.

Puntuaciones factoriales

cpi_punt1 <- fa(datos1,nfactors=4,fm="pa",rotate="none", n.obs=nrow(datos1), scores="regression")
puntfac_cpi1<-cpi_punt1$scores
puntfac_cpi1<-as.data.frame(puntfac_cpi1)
puntfac_cpi1[1:10,]
factor.scores(mat_cor,cpi,method = "Thurstone")
$scores
NULL

$weights
               PA1          PA2          PA3         PA4
P_291  0.008578808  0.003108792  0.013797384 -0.01242878
P_292  0.035321459 -0.003985372  0.051699952 -0.05092279
P_293  0.038331240 -0.007674121  0.057042877 -0.03966429
P_294  0.031031008 -0.001629557  0.048053850 -0.03659187
P_295  1.071205602 -0.269959274  1.731515404  0.59401090
P_296  1.531626403  0.194785547  2.425797340 -1.16607279
P_297  0.269582025  0.136077862  0.478010308 -0.23637710
P_298  0.035748079 -0.278170741 -0.089494038 -0.58174095
P_299 -2.365783377  0.188789290 -3.656878928  1.35374355
P_300  0.434902002  0.123353266  0.425963029 -0.59356215
P_301  1.058284691 -0.317346982  1.352328951  0.27288673
P_302  0.847190299 -0.121255181  0.890906830 -1.19255507
P_303  0.197415756 -0.006897283 -0.145709547 -0.81831403
P_304 -0.956663554  0.310032250 -1.764418606  0.88782401
P_305 -1.077538932  0.155570580 -1.811847700  1.77662973
P_69  -0.004115153  0.038709557  0.009012018  0.09059782
P_73  -0.003257292 -0.422554943  0.045648098  1.39518561
P_74  -0.004028011 -0.044637405 -0.008200424  0.08207914
P_75   0.001835257 -0.019789898  0.003306111  0.04365795
P_83  -0.014496630  0.220351974  0.065735165  0.51388620
P_84  -0.006858233  0.081506625  0.018134367  0.14980135
P_85  -0.022627678  0.288689516  0.088618604  0.76154964

$r.scores
             PA1          PA2          PA3          PA4
PA1  1.000000000  0.001636644 -0.006664568  0.006800485
PA2  0.001636644  1.000000000 -0.003489677 -0.021341070
PA3 -0.006664568 -0.003489677  1.000000000 -0.004066853
PA4  0.006800485 -0.021341070 -0.004066853  1.000000000

$R2
[1] 0.9954241 0.9779087 0.9881344 0.8863325