Este documento hace parte del trabajo final del curso de Análisis multivariado . El alcance de este documento reporta de manera técnica el paso a paso que se llevó a cabo para realizar el análisis factorial.
#Cargue de la base de datos
datos<-fread(file =paste0(dir.input, 'cdv.csv')
,dec = ',')
datos1=scale(datos, center=TRUE, scale=TRUE)
La Encuesta de Calidad de Vida es un instrumento diseñado para realizar el seguimiento y la medición de las condiciones socioeconómicas de los habitantes de las 16 comunas y 5 corregimientos que conforman el municipio de Medellín. Es un compendio estadístico que permite conocer de primera mano los índices de temas vitales como la Población, Vivienda, Hogares, Educación, Fuerza de Trabajo, Salud y Seguridad Social. Esta encuesta se ha llevado a cabo anualmente desde el 2004, para este análisis se utilizó la encuesta del año 2020.
La base de datos cuenta con 275 variables, de las cuales se tomaron 25 que tenían una alta correlación entre ellas:
| Variable | Preguntas |
|---|---|
| P_69 | ¿En qué actividad ocupó la mayor parte del tiempo la semana pasada? [la predominante] |
| P_73 | En las últimas 4 semanas ¿hizo alguna diligencia para conseguir trabajo o instalar un negocio? |
| P_74 | Desea conseguir un trabajo remunerado o instalar un negocio? |
| P_75 | Aunque desea trabajar por qué motivo principal no hizo diligencias en las últimas 4 semanas? |
| P_83 | ¿Cuál es el medio de transporte utilizado predominante para dirigirse al sitio de su empleo principal? |
| P_84 | ¿Cuánto tiempo tardan en llegar al sitio de trabajo? |
| P_85 | A qué actividad específica se dedica principalmente la empresa o negocio en la que realiza su trabajo? |
| P_291 | En este hogar: En los últimos 30 días, ¿Usted se preocupó alguna vez de que en su hogar se acabaran los alimentos debido a falta de dinero? |
| P_292 | En este hogar: En los últimos 30 días, ¿Alguna vez en su hogar se quedaron sin dinero para obtener una alimentación nutritiva:…? |
| P_293 | En este hogar: En los últimos 30 días, ¿alguna vez usted o algún adulto de su hogar no pudo variar la alimentación por falta de dinero? |
| P_294 | En este hogar: En los últimos 30 días, ¿Alguna vez usted o algún adulto de su hogar comió menos de lo que está acostumbrado por falta de dinero? |
| P_295 | En este hogar: En los últimos 30 días, ¿Alguna vez en su hogar se quedaron sin alimentos por falta de dinero? |
| P_296 | En este hogar: En los últimos 30 días, ¿Alguna vez usted o algún adulto de su hogar dejo de desayunar, almorzar o comer por falta de dinero? |
| P_297 | En este hogar: En los últimos 30 días, ¿alguna vez usted o algún adulto de su hogar sintió o se quejó de hambre y no comió por falta de dinero? |
| P_298 | En este hogar: En los últimos 30 días, ¿Alguna vez usted o algún adulto de su hogar solo comió una sola vez al día o dejó de comer en todo un día por falta de dinero? |
| P_299 | En este hogar: En los últimos 30 días, ¿Alguna vez, algún adulto de su hogar se acostó con hambre o porque no alcanzó el dinero para los alimentos? |
| P_300 | En este hogar: En los últimos 30 días, ¿Alguna vez por falta de dinero, algún niño o joven de su hogar dejó de tener una alimentación nutritiva…? |
| P_301 | En este hogar: En los últimos 30 días, ¿Alguna vez algún niño o joven de su hogar no pudo variar la alimentación por falta de dinero? |
| P_302 | En este hogar: En los últimos 30 días, ¿Alguna vez usted tuvo que disminuir la cantidad servida en las comidas de algún niño o joven de su hogar por falta de dinero? |
| P_303 | En este hogar: En los últimos 30 días, ¿Alguna vez, algún niño o joven de su hogar se quejó de hambre pero no se pudo comprar más alimentos por falta de dinero? |
| P_304 | En este hogar: En los últimos 30 días, ¿Alguna vez algún niño o joven de su hogar se acostó con hambre porque no alcanzó el dinero para alimentos? |
| P_305 | En este hogar: En los últimos 30 días, ¿Alguna vez, algún niño o joven de su hogar sólo comió una vez al día o dejó de comer todo un día por falta de dinero? |
Como se puede observar algunas variables están relaciondas con el ingreso de los hogares, frente a algunas situaciones que se puedieron presentar. De otro parte, otra parte de las variables se enfoca en la situación de empleo de las personas.
A continuación, se validan los supuestos que se deben cumplir para aplicar el análisis factorial
Se puede observar la matriz de correlaciones obtenida, donde se observa como los dos grupos de variables mencionadas cuentan con una alta correlación entre las variables del mismo grupo.
corr.test(datos1)
Call:corr.test(x = datos1)
Correlation matrix
P_291 P_292 P_293 P_294 P_295 P_296 P_297 P_298 P_299 P_300 P_301 P_302
P_291 1.00 0.58 0.59 0.58 0.89 0.89 0.89 0.89 0.89 0.50 0.50 0.50
P_292 0.58 1.00 0.72 0.67 0.63 0.63 0.63 0.63 0.63 0.39 0.39 0.39
P_293 0.59 0.72 1.00 0.72 0.66 0.66 0.66 0.66 0.65 0.41 0.41 0.41
P_294 0.58 0.67 0.72 1.00 0.64 0.64 0.64 0.64 0.64 0.40 0.40 0.40
P_295 0.89 0.63 0.66 0.64 1.00 1.00 1.00 1.00 1.00 0.55 0.55 0.55
P_296 0.89 0.63 0.66 0.64 1.00 1.00 1.00 1.00 1.00 0.55 0.55 0.55
P_297 0.89 0.63 0.66 0.64 1.00 1.00 1.00 1.00 1.00 0.55 0.55 0.55
P_298 0.89 0.63 0.66 0.64 1.00 1.00 1.00 1.00 1.00 0.55 0.55 0.55
P_299 0.89 0.63 0.65 0.64 1.00 1.00 1.00 1.00 1.00 0.55 0.55 0.55
P_300 0.50 0.39 0.41 0.40 0.55 0.55 0.55 0.55 0.55 1.00 1.00 1.00
P_301 0.50 0.39 0.41 0.40 0.55 0.55 0.55 0.55 0.55 1.00 1.00 1.00
P_302 0.50 0.39 0.41 0.40 0.55 0.55 0.55 0.55 0.55 1.00 1.00 1.00
P_303 0.50 0.39 0.41 0.40 0.55 0.55 0.55 0.55 0.55 1.00 1.00 1.00
P_304 0.50 0.39 0.41 0.40 0.55 0.55 0.55 0.55 0.55 1.00 1.00 1.00
P_305 0.50 0.39 0.41 0.40 0.55 0.55 0.55 0.55 0.55 1.00 1.00 1.00
P_69 -0.07 -0.08 -0.07 -0.06 -0.07 -0.07 -0.07 -0.07 -0.07 -0.18 -0.18 -0.18
P_73 0.04 0.05 0.05 0.05 0.04 0.04 0.04 0.04 0.04 -0.05 -0.05 -0.05
P_74 -0.04 -0.02 -0.02 -0.03 -0.04 -0.04 -0.04 -0.04 -0.04 -0.09 -0.09 -0.09
P_75 0.09 0.09 0.09 0.08 0.10 0.10 0.10 0.10 0.10 0.04 0.04 0.04
P_83 -0.06 -0.07 -0.08 -0.07 -0.06 -0.06 -0.06 -0.06 -0.06 -0.07 -0.07 -0.07
P_84 -0.07 -0.08 -0.08 -0.07 -0.07 -0.07 -0.07 -0.07 -0.07 -0.07 -0.07 -0.07
P_85 -0.07 -0.08 -0.09 -0.08 -0.08 -0.08 -0.08 -0.08 -0.08 -0.08 -0.08 -0.08
P_303 P_304 P_305 P_69 P_73 P_74 P_75 P_83 P_84 P_85
P_291 0.50 0.50 0.50 -0.07 0.04 -0.04 0.09 -0.06 -0.07 -0.07
P_292 0.39 0.39 0.39 -0.08 0.05 -0.02 0.09 -0.07 -0.08 -0.08
P_293 0.41 0.41 0.41 -0.07 0.05 -0.02 0.09 -0.08 -0.08 -0.09
P_294 0.40 0.40 0.40 -0.06 0.05 -0.03 0.08 -0.07 -0.07 -0.08
P_295 0.55 0.55 0.55 -0.07 0.04 -0.04 0.10 -0.06 -0.07 -0.08
P_296 0.55 0.55 0.55 -0.07 0.04 -0.04 0.10 -0.06 -0.07 -0.08
P_297 0.55 0.55 0.55 -0.07 0.04 -0.04 0.10 -0.06 -0.07 -0.08
P_298 0.55 0.55 0.55 -0.07 0.04 -0.04 0.10 -0.06 -0.07 -0.08
P_299 0.55 0.55 0.55 -0.07 0.04 -0.04 0.10 -0.06 -0.07 -0.08
P_300 1.00 1.00 1.00 -0.18 -0.05 -0.09 0.04 -0.07 -0.07 -0.08
P_301 1.00 1.00 1.00 -0.18 -0.05 -0.09 0.04 -0.07 -0.07 -0.08
P_302 1.00 1.00 1.00 -0.18 -0.05 -0.09 0.04 -0.07 -0.07 -0.08
P_303 1.00 1.00 1.00 -0.18 -0.05 -0.09 0.04 -0.07 -0.07 -0.08
P_304 1.00 1.00 1.00 -0.18 -0.05 -0.09 0.04 -0.07 -0.07 -0.08
P_305 1.00 1.00 1.00 -0.18 -0.05 -0.09 0.04 -0.07 -0.07 -0.08
P_69 -0.18 -0.18 -0.18 1.00 0.18 0.14 0.04 0.23 0.21 0.24
P_73 -0.05 -0.05 -0.05 0.18 1.00 0.81 0.21 -0.77 -0.70 -0.79
P_74 -0.09 -0.09 -0.09 0.14 0.81 1.00 0.27 -0.63 -0.57 -0.65
P_75 0.04 0.04 0.04 0.04 0.21 0.27 1.00 -0.16 -0.15 -0.17
P_83 -0.07 -0.07 -0.07 0.23 -0.77 -0.63 -0.16 1.00 0.82 0.90
P_84 -0.07 -0.07 -0.07 0.21 -0.70 -0.57 -0.15 0.82 1.00 0.83
P_85 -0.08 -0.08 -0.08 0.24 -0.79 -0.65 -0.17 0.90 0.83 1.00
Sample Size
[1] 32795
Probability values (Entries above the diagonal are adjusted for multiple tests.)
P_291 P_292 P_293 P_294 P_295 P_296 P_297 P_298 P_299 P_300 P_301 P_302
P_291 0 0 0 0 0 0 0 0 0 0 0 0
P_292 0 0 0 0 0 0 0 0 0 0 0 0
P_293 0 0 0 0 0 0 0 0 0 0 0 0
P_294 0 0 0 0 0 0 0 0 0 0 0 0
P_295 0 0 0 0 0 0 0 0 0 0 0 0
P_296 0 0 0 0 0 0 0 0 0 0 0 0
P_297 0 0 0 0 0 0 0 0 0 0 0 0
P_298 0 0 0 0 0 0 0 0 0 0 0 0
P_299 0 0 0 0 0 0 0 0 0 0 0 0
P_300 0 0 0 0 0 0 0 0 0 0 0 0
P_301 0 0 0 0 0 0 0 0 0 0 0 0
P_302 0 0 0 0 0 0 0 0 0 0 0 0
P_303 0 0 0 0 0 0 0 0 0 0 0 0
P_304 0 0 0 0 0 0 0 0 0 0 0 0
P_305 0 0 0 0 0 0 0 0 0 0 0 0
P_69 0 0 0 0 0 0 0 0 0 0 0 0
P_73 0 0 0 0 0 0 0 0 0 0 0 0
P_74 0 0 0 0 0 0 0 0 0 0 0 0
P_75 0 0 0 0 0 0 0 0 0 0 0 0
P_83 0 0 0 0 0 0 0 0 0 0 0 0
P_84 0 0 0 0 0 0 0 0 0 0 0 0
P_85 0 0 0 0 0 0 0 0 0 0 0 0
P_303 P_304 P_305 P_69 P_73 P_74 P_75 P_83 P_84 P_85
P_291 0 0 0 0 0 0 0 0 0 0
P_292 0 0 0 0 0 0 0 0 0 0
P_293 0 0 0 0 0 0 0 0 0 0
P_294 0 0 0 0 0 0 0 0 0 0
P_295 0 0 0 0 0 0 0 0 0 0
P_296 0 0 0 0 0 0 0 0 0 0
P_297 0 0 0 0 0 0 0 0 0 0
P_298 0 0 0 0 0 0 0 0 0 0
P_299 0 0 0 0 0 0 0 0 0 0
P_300 0 0 0 0 0 0 0 0 0 0
P_301 0 0 0 0 0 0 0 0 0 0
P_302 0 0 0 0 0 0 0 0 0 0
P_303 0 0 0 0 0 0 0 0 0 0
P_304 0 0 0 0 0 0 0 0 0 0
P_305 0 0 0 0 0 0 0 0 0 0
P_69 0 0 0 0 0 0 0 0 0 0
P_73 0 0 0 0 0 0 0 0 0 0
P_74 0 0 0 0 0 0 0 0 0 0
P_75 0 0 0 0 0 0 0 0 0 0
P_83 0 0 0 0 0 0 0 0 0 0
P_84 0 0 0 0 0 0 0 0 0 0
P_85 0 0 0 0 0 0 0 0 0 0
To see confidence intervals of the correlations, print with the short=FALSE option
Dado que se rechaza la hipotesis nula, entonces se puede aplicar el análisis factorial.
mat_cor <- hetcor(datos1)$correlations #matriz de correlación policorica
ggcorrplot(mat_cor,type="lower",hc.order = T)
Prueba Bartlett
\[H_0:Las\ variables\ no\ están\ correlacionadas\ en\ la\ población\] \[H_1:Las\ variables\ están\ correlacionadas\ en\ la\ población\]
cortest.bartlett(mat_cor,n=nrow(datos1))
$chisq
[1] 3466857
$p.value
[1] 0
$df
[1] 231
Se confirma la hipótesis alternativa, dado que el p-valor es menor que 0.05.
Prueba de Kaiser-Meyer-Olkin
KMO(mat_cor)
Kaiser-Meyer-Olkin factor adequacy
Call: KMO(r = mat_cor)
Overall MSA = 0.94
MSA for each item =
P_291 P_292 P_293 P_294 P_295 P_296 P_297 P_298 P_299 P_300 P_301 P_302 P_303
1.00 0.95 0.94 0.96 0.98 0.97 0.96 0.96 0.95 0.96 0.95 0.97 0.97
P_304 P_305 P_69 P_73 P_74 P_75 P_83 P_84 P_85
0.93 0.94 0.48 0.76 0.87 0.89 0.87 0.94 0.84
La medida de adecuación de la muestra MSA o KMO (Kaiser-Meyer-Olkin) contrasta si las correlaciones parciales entre las variables son suficientemente pequeñas. El estadístico KMO varía entre 0 y 1. Los valores pequeños indican que el análisis factorial puede no ser una buena idea, dado que las correlaciones entre los pares de variables no pueden ser explicadas por otras variables. Los menores que 0.5 indican que no debe utilizarse el AF con la matriz de datos que se están analizando.
Como referencia, Kaiser puso los siguientes valores en los resultados:
Con el resultado obtenido, de un KMO de 0.94 nos indica que es viable utilizar el análisis factorial con estos datos.
El método seleccionado para la extracción de los factores son las componentes principales iteradas, que es aplicable tanto si los datos siguen una distribución normal multivariada como cuando esta condición no se cumple.
Una forma de determinar el número de factores o componentes en una matriz de datos o una matriz de correlación es examinar la gráfica de “scree” de los valores propios sucesivos. Las roturas bruscas en la gráfica sugieren el número apropiado de componentes o factores para extraer. El resultado es el siguiente:
fa.parallel(mat_cor, fm="pa", n.obs =nrow(datos1),ylabel="Eigenvalues" )
Parallel analysis suggests that the number of factors = 5 and the number of components = 4
Según el Análisis paralelo, se sugiere que los factores a extraer sean 5, no obstante, vemos que los cambios bruscos son hasta el factor 4 y de ahí en adelante tiende a ser constante. Debido a esto se va a realizar la extracción de 3 y 4 factores con el fin de comparar los resultados y tomar una decisión sobre el número de factores.
Extracción de 4 factores
cpi <- fa(mat_cor,nfactors= 4, fm="pa", rotate="none", n.obs=nrow(datos1))
cpi
Factor Analysis using method = pa
Call: fa(r = mat_cor, nfactors = 4, n.obs = nrow(datos1), rotate = "none",
fm = "pa")
Standardized loadings (pattern matrix) based upon correlation matrix
PA1 PA2 PA3 PA4 h2 u2 com
P_291 0.81 -0.02 0.37 0.00 0.79 0.213200 1.4
P_292 0.63 -0.04 0.27 -0.05 0.48 0.523202 1.4
P_293 0.66 -0.04 0.28 -0.05 0.52 0.482148 1.4
P_294 0.64 -0.03 0.27 -0.04 0.49 0.508825 1.4
P_295 0.90 -0.02 0.42 0.00 0.98 0.023642 1.4
P_296 0.90 -0.02 0.42 0.00 0.98 0.023644 1.4
P_297 0.90 -0.02 0.42 0.00 0.98 0.023805 1.4
P_298 0.90 -0.02 0.42 0.00 0.98 0.023893 1.4
P_299 0.90 -0.02 0.42 0.00 0.98 0.024080 1.4
P_300 0.85 0.10 -0.51 0.05 1.00 0.000019 1.7
P_301 0.85 0.10 -0.51 0.05 1.00 0.000016 1.7
P_302 0.85 0.10 -0.51 0.05 1.00 0.000018 1.7
P_303 0.85 0.10 -0.51 0.05 1.00 0.000014 1.7
P_304 0.85 0.10 -0.51 0.05 1.00 0.000016 1.7
P_305 0.85 0.10 -0.51 0.05 1.00 0.000018 1.7
P_69 -0.15 0.07 0.17 0.65 0.48 0.523427 1.3
P_73 0.03 -0.92 0.01 0.36 0.97 0.025096 1.3
P_74 -0.05 -0.77 -0.03 0.31 0.69 0.314697 1.3
P_75 0.09 -0.21 0.04 0.12 0.07 0.930474 2.1
P_83 -0.12 0.91 0.14 0.20 0.89 0.106343 1.2
P_84 -0.11 0.82 0.12 0.19 0.74 0.258338 1.2
P_85 -0.13 0.92 0.14 0.19 0.92 0.076886 1.2
PA1 PA2 PA3 PA4
SS loadings 10.33 3.90 2.90 0.79
Proportion Var 0.47 0.18 0.13 0.04
Cumulative Var 0.47 0.65 0.78 0.81
Proportion Explained 0.58 0.22 0.16 0.04
Cumulative Proportion 0.58 0.79 0.96 1.00
Mean item complexity = 1.5
Test of the hypothesis that 4 factors are sufficient.
The degrees of freedom for the null model are 231 and the objective function was 105.74 with Chi Square of 3466857
The degrees of freedom for the model are 149 and the objective function was 25.73
The root mean square of the residuals (RMSR) is 0.03
The df corrected root mean square of the residuals is 0.04
The harmonic number of observations is 32795 with the empirical chi square 12611.59 with prob < 0
The total number of observations was 32795 with Likelihood Chi Square = 843672.1 with prob < 0
Tucker Lewis Index of factoring reliability = 0.623
RMSEA index = 0.415 and the 90 % confidence intervals are 0.415 0.416
BIC = 842122.8
Fit based upon off diagonal values = 1
Measures of factor score adequacy
PA1 PA2 PA3 PA4
Correlation of (regression) scores with factors 1.00 0.99 0.99 0.94
Multiple R square of scores with factors 1.00 0.98 0.99 0.89
Minimum correlation of possible factor scores 0.99 0.96 0.98 0.77
Extracción de 3 factores
cpi1 <- fa(mat_cor,nfactors= 3, fm="pa", rotate="none", n.obs=nrow(datos1))
cpi1
Factor Analysis using method = pa
Call: fa(r = mat_cor, nfactors = 3, n.obs = nrow(datos1), rotate = "none",
fm = "pa")
Standardized loadings (pattern matrix) based upon correlation matrix
PA1 PA2 PA3 h2 u2 com
P_291 0.81 -0.02 0.36 0.787 0.2131 1.4
P_292 0.63 -0.04 0.27 0.474 0.5262 1.4
P_293 0.66 -0.05 0.28 0.516 0.4845 1.4
P_294 0.64 -0.04 0.27 0.490 0.5105 1.4
P_295 0.90 -0.02 0.42 0.977 0.0235 1.4
P_296 0.90 -0.02 0.42 0.977 0.0235 1.4
P_297 0.90 -0.02 0.42 0.976 0.0237 1.4
P_298 0.90 -0.02 0.42 0.976 0.0237 1.4
P_299 0.90 -0.02 0.42 0.976 0.0239 1.4
P_300 0.85 0.10 -0.51 0.998 0.0015 1.7
P_301 0.85 0.10 -0.51 0.998 0.0015 1.7
P_302 0.85 0.10 -0.51 0.998 0.0015 1.7
P_303 0.85 0.10 -0.51 0.998 0.0015 1.7
P_304 0.85 0.10 -0.51 0.998 0.0015 1.7
P_305 0.85 0.10 -0.51 0.998 0.0015 1.7
P_69 -0.14 0.06 0.14 0.045 0.9551 2.4
P_73 0.03 -0.89 0.00 0.784 0.2160 1.0
P_74 -0.05 -0.75 -0.03 0.567 0.4328 1.0
P_75 0.09 -0.21 0.04 0.056 0.9442 1.4
P_83 -0.11 0.91 0.15 0.856 0.1439 1.1
P_84 -0.11 0.83 0.12 0.711 0.2888 1.1
P_85 -0.13 0.92 0.14 0.886 0.1135 1.1
PA1 PA2 PA3
SS loadings 10.33 3.82 2.90
Proportion Var 0.47 0.17 0.13
Cumulative Var 0.47 0.64 0.77
Proportion Explained 0.61 0.22 0.17
Cumulative Proportion 0.61 0.83 1.00
Mean item complexity = 1.4
Test of the hypothesis that 3 factors are sufficient.
The degrees of freedom for the null model are 231 and the objective function was 105.74 with Chi Square of 3466857
The degrees of freedom for the model are 168 and the objective function was 44.59
The root mean square of the residuals (RMSR) is 0.04
The df corrected root mean square of the residuals is 0.05
The harmonic number of observations is 32795 with the empirical chi square 25663.62 with prob < 0
The total number of observations was 32795 with Likelihood Chi Square = 1461972 with prob < 0
Tucker Lewis Index of factoring reliability = 0.42
RMSEA index = 0.515 and the 90 % confidence intervals are 0.514 0.516
BIC = 1460225
Fit based upon off diagonal values = 0.99
Measures of factor score adequacy
PA1 PA2 PA3
Correlation of (regression) scores with factors 1.00 0.98 0.99
Multiple R square of scores with factors 1.00 0.96 0.99
Minimum correlation of possible factor scores 0.99 0.91 0.98
Comunalidad extrayendo 3 factores
cpi1$communality
P_291 P_292 P_293 P_294 P_295 P_296 P_297
0.78688185 0.47375492 0.51553923 0.48953571 0.97650366 0.97650240 0.97634221
P_298 P_299 P_300 P_301 P_302 P_303 P_304
0.97625415 0.97606718 0.99846875 0.99847033 0.99846339 0.99846455 0.99845878
P_305 P_69 P_73 P_74 P_75 P_83 P_84
0.99845104 0.04486406 0.78396183 0.56717345 0.05584002 0.85606331 0.71123790
P_85
0.88649214
Comunalidad extrayendo 4 factores
cpi$communality
P_291 P_292 P_293 P_294 P_295 P_296 P_297
0.78680015 0.47679753 0.51785157 0.49117512 0.97635806 0.97635630 0.97619549
P_298 P_299 P_300 P_301 P_302 P_303 P_304
0.97610688 0.97591960 0.99998120 0.99998362 0.99998249 0.99998563 0.99998392
P_305 P_69 P_73 P_74 P_75 P_83 P_84
0.99998210 0.47657278 0.97490360 0.68530317 0.06952607 0.89365657 0.74166225
P_85
0.92311441
Se puede observar que cuando se extraen cuatro factores se mejora el porcentaje de variabilidad explicada por el factor para el grupo de variables asociadas al trabajo.
Unicidad extrayendo 3 factores
cpi1$uniquenesses
P_291 P_292 P_293 P_294 P_295 P_296
0.213118150 0.526245080 0.484460770 0.510464286 0.023496336 0.023497598
P_297 P_298 P_299 P_300 P_301 P_302
0.023657787 0.023745853 0.023932820 0.001531248 0.001529668 0.001536612
P_303 P_304 P_305 P_69 P_73 P_74
0.001535445 0.001541225 0.001548956 0.955135941 0.216038168 0.432826550
P_75 P_83 P_84 P_85
0.944159983 0.143936689 0.288762097 0.113507859
Unicidad extrayendo 4 factores
cpi$uniquenesses
P_291 P_292 P_293 P_294 P_295
0.21319984952 0.52320246792 0.48214842766 0.50882488324 0.02364194118
P_296 P_297 P_298 P_299 P_300
0.02364369850 0.02380451276 0.02389311988 0.02408039671 0.00001880136
P_301 P_302 P_303 P_304 P_305
0.00001637730 0.00001751306 0.00001436956 0.00001607893 0.00001790490
P_69 P_73 P_74 P_75 P_83
0.52342722239 0.02509639931 0.31469682790 0.93047392571 0.10634343063
P_84 P_85
0.25833775241 0.07688558735
Se puede observar que el porcentaje de varianza que no es explicado por los factores disminuye de manera importante cuando se extraen 4 factores.
| N° de factores | RMSR* | Cumulative Var |
|---|---|---|
| 3 factores | 0.04 | 0.77 |
| 4 factores | 0.03 | 0.81 |
RMSR =La raíz cuadrada media de los residuos
Para determinar el número de factores que se van a utilizar para el análisis, se tienen en cuenta la raíz cuadrada media de los residuos que se interpreta que entre más pequeño es el porcentaje es mejor y el porcentaje de varianza acumulada, que indica el porcentaje de varianza de los datos explicada por los factores. Además, se analizó la comunalidad y la unicidad para las dos opciones. Teniendo en cuenta lo anterior, se concluye que es viable utilizar 4 factores para los ejercicios que se consideren necesarios.
Puntuaciones factoriales
cpi_punt1 <- fa(datos1,nfactors=4,fm="pa",rotate="none", n.obs=nrow(datos1), scores="regression")
puntfac_cpi1<-cpi_punt1$scores
puntfac_cpi1<-as.data.frame(puntfac_cpi1)
puntfac_cpi1[1:10,]
factor.scores(mat_cor,cpi,method = "Thurstone")
$scores
NULL
$weights
PA1 PA2 PA3 PA4
P_291 0.008578808 0.003108792 0.013797384 -0.01242878
P_292 0.035321459 -0.003985372 0.051699952 -0.05092279
P_293 0.038331240 -0.007674121 0.057042877 -0.03966429
P_294 0.031031008 -0.001629557 0.048053850 -0.03659187
P_295 1.071205602 -0.269959274 1.731515404 0.59401090
P_296 1.531626403 0.194785547 2.425797340 -1.16607279
P_297 0.269582025 0.136077862 0.478010308 -0.23637710
P_298 0.035748079 -0.278170741 -0.089494038 -0.58174095
P_299 -2.365783377 0.188789290 -3.656878928 1.35374355
P_300 0.434902002 0.123353266 0.425963029 -0.59356215
P_301 1.058284691 -0.317346982 1.352328951 0.27288673
P_302 0.847190299 -0.121255181 0.890906830 -1.19255507
P_303 0.197415756 -0.006897283 -0.145709547 -0.81831403
P_304 -0.956663554 0.310032250 -1.764418606 0.88782401
P_305 -1.077538932 0.155570580 -1.811847700 1.77662973
P_69 -0.004115153 0.038709557 0.009012018 0.09059782
P_73 -0.003257292 -0.422554943 0.045648098 1.39518561
P_74 -0.004028011 -0.044637405 -0.008200424 0.08207914
P_75 0.001835257 -0.019789898 0.003306111 0.04365795
P_83 -0.014496630 0.220351974 0.065735165 0.51388620
P_84 -0.006858233 0.081506625 0.018134367 0.14980135
P_85 -0.022627678 0.288689516 0.088618604 0.76154964
$r.scores
PA1 PA2 PA3 PA4
PA1 1.000000000 0.001636644 -0.006664568 0.006800485
PA2 0.001636644 1.000000000 -0.003489677 -0.021341070
PA3 -0.006664568 -0.003489677 1.000000000 -0.004066853
PA4 0.006800485 -0.021341070 -0.004066853 1.000000000
$R2
[1] 0.9954241 0.9779087 0.9881344 0.8863325