Introducción

En el año 2006, el Sistema Nacional de Competitividad e Innovación trazó como una de sus metas centrales lograr que, a 2030, Colombia se ubique entre los tres países más competitivos de América Latina y se planteó una meta en términos de desigualdad: trabajar en el cierre de sus brechas regionales.

Por lo anterior, desde el año 2013 con el Índice Departamental de Competitividad (IDC) el Consejo Privado de Competitividad y la Universidad del Rosario le han entregado al país un diagnóstico completo, permanente y confiable de la situación competitiva de sus regiones.A través de las ediciones anuales del IDC se ha hecho evidente que aún es largo el camino por recorrer para lograr la meta para el año 2030.

Dicho lo anterior, el siguiente trabajo tiene como objetivo analizar el comportamiento de los departamentos del país en variables de interés que permitan identificar similitudes entre entidades territoriales y conocer avances entre estos indicadores durante dos periodos 2021-2022, utilizando como metodología un análisis factorial múltiple.

Metodología

Para dar cumplimiento al objetivo se va a tener en cuenta los datos publicados por el Consejo Privado de Competitividad para el año 2022.

El IDC 2022 evalúa la competitividad de los 32 departamentos del país y la ciudad de Bogotá mediante 106 indicadores distribuidos en 13 pilares y agrupados en 4 factores de competitividad: i) condiciones habilitantes, ii) capital humano, iii) eficiencia de los mercados y iv) ecosistema innovador.

Para nuestro caso de análisis se tendrá en cuenta indicadores del factor capital humano y eficiencia de los mercados, que hacen parte del pilar de salud, educación y mercado laboral. Los indicadores seleccionados son los siguientes:

Salud: Sal 1-3 Controles prenatales Sal 1-4 Inversión en salud pública Sal 2-2 Mortalidad materna

Educación Edu 1-3 Cobertura neta en educación secundaria Edu 2-1 Puntaje pruebas Saber 11 Edu 2-5 Inversión en calidad de la educación básica y media

Mercado laboral Lab 1-2 Tasa de desempleo Lab 1-3 Formalidad laboral Lab 2-2 Brecha en tasa de desempleo entre hombres y mujeres

Estas variables en total son 9 indicadores/variables que se registran para los 32 departamentos del país en el año 2021 y 2022.

Para realizar el AFM con esta información se realizará en el software R versión 4.2.2, se tendrá en cuenta las siguientes librerias para su ejecución: library(FactoMineR) library(factoextra) library(Factoshiny) library(ggplot2) library(corrplot)

Resultados

library(FactoMineR)
library(factoextra)
## Loading required package: ggplot2
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
library(Factoshiny)
## Loading required package: shiny
## Loading required package: FactoInvestigate
library(ggplot2)
library(corrplot)
## corrplot 0.92 loaded
##Se cargan los datos
library(readxl)
datos_taller <- read_excel("datos_taller.xlsx")

Estadísticas descriptivas

summary(datos_taller)
##  Departamento        SAL-1-3 2021    SAL-1-4 2021     SAL-2-2 2021   
##  Length:33          Min.   :30.99   Min.   : 13.37   Min.   :  0.00  
##  Class :character   1st Qu.:79.32   1st Qu.: 22.93   1st Qu.: 61.61  
##  Mode  :character   Median :85.32   Median : 30.95   Median : 80.84  
##                     Mean   :78.85   Mean   : 77.63   Mean   :102.79  
##                     3rd Qu.:89.63   3rd Qu.: 43.58   3rd Qu.:109.63  
##                     Max.   :93.50   Max.   :470.37   Max.   :326.80  
##   EDU-1-3 2021     EDU-2-1 2021    EDU-2-5 2021      LAB-1-2 2021  
##  Min.   :0.2500   Min.   :42.38   Min.   :  32.45   Min.   : 5.00  
##  1st Qu.:0.6878   1st Qu.:47.29   1st Qu.:  96.90   1st Qu.: 8.60  
##  Median :0.7635   Median :49.06   Median : 150.68   Median :11.00  
##  Mean   :0.7206   Mean   :49.05   Mean   : 199.03   Mean   :11.39  
##  3rd Qu.:0.8213   3rd Qu.:51.17   3rd Qu.: 196.73   3rd Qu.:13.20  
##  Max.   :0.9011   Max.   :54.33   Max.   :1073.11   Max.   :27.20  
##   LAB-1-3 2021    LAB-2-2 2021      SAL-1-3 2022    SAL-1-4 2022   
##  Min.   :15.40   Min.   :0.01178   Min.   :28.99   Min.   : 13.37  
##  1st Qu.:22.40   1st Qu.:0.04064   1st Qu.:78.77   1st Qu.: 22.93  
##  Median :32.60   Median :0.05518   Median :84.34   Median : 30.95  
##  Mean   :32.11   Mean   :0.05737   Mean   :78.02   Mean   : 77.63  
##  3rd Qu.:39.30   3rd Qu.:0.07493   3rd Qu.:88.86   3rd Qu.: 43.58  
##  Max.   :66.40   Max.   :0.11926   Max.   :93.89   Max.   :470.37  
##   SAL-2-2 2022     EDU-1-3 2022     EDU-2-1 2022    EDU-2-5 2022    
##  Min.   :  0.00   Min.   :0.2674   Min.   :40.99   Min.   :  32.45  
##  1st Qu.: 78.01   1st Qu.:0.6972   1st Qu.:46.63   1st Qu.:  96.90  
##  Median :101.24   Median :0.7687   Median :48.39   Median : 150.68  
##  Mean   :113.15   Mean   :0.7290   Mean   :48.49   Mean   : 199.03  
##  3rd Qu.:146.70   3rd Qu.:0.8301   3rd Qu.:50.63   3rd Qu.: 196.73  
##  Max.   :285.44   Max.   :0.8976   Max.   :54.27   Max.   :1073.11  
##   LAB-1-2 2022    LAB-1-3 2022    LAB-2-2 2022     
##  Min.   : 9.20   Min.   :15.40   Min.   :0.002299  
##  1st Qu.:13.00   1st Qu.:22.40   1st Qu.:0.048917  
##  Median :15.80   Median :32.40   Median :0.064853  
##  Mean   :16.76   Mean   :32.14   Mean   :0.070670  
##  3rd Qu.:18.90   3rd Qu.:39.30   3rd Qu.:0.095563  
##  Max.   :32.50   Max.   :66.40   Max.   :0.154206
##grafico de cajas- 2021
x11(11)
## Warning in x11(11): Calls like 'x11(w, h)' are unsafe and should be replaced by
## 'x11(width=w, height=h)'
par(mfrow=c(2,2))
boxplot(datos_taller[,2:4],col=rainbow(3),ylab="Porcentaje")
boxplot(datos_taller[,5:7],col=rainbow(3),ylab="Porcentaje")
boxplot(datos_taller[,8:10],col=rainbow(3),ylab="Porcentaje")

##2022
x11(11)
## Warning in x11(11): Calls like 'x11(w, h)' are unsafe and should be replaced by
## 'x11(width=w, height=h)'
par(mfrow=c(2,2))
boxplot(datos_taller[,11:13],col=rainbow(3),ylab="Porcentaje")
boxplot(datos_taller[,14:16],col=rainbow(3),ylab="Porcentaje")
boxplot(datos_taller[,17:19],col=rainbow(3),ylab="Porcentaje")

El análisis descriptivo y los diagramas de caja permite observar que para los años 2021 y 2022, existen datos atipicos para los indicadores de salud en particular en el indicador de inversión pública en salud, así mismo en el indicador de inversión en educación, lo cuál permite inferir que hay algunos departamentos que reciben una alta inversión teniendo en cuenta las condiciones de vida de los territorios.

corMatriz <- cor(datos_taller[,-1])##se quita la primera columna de los departamentos
corrplot(corMatriz)

Teniendo en cuenta el diagrama de correlación de las variables de análisis se observa que existe una correlación entre las variables de salud y educación como lo es la relación entre controles prenatales y educación, así como la correlación entre cobertura en educación y en las pruebas saber.

Se observa que existe una correlación alta en cada una de las variables en los dos periodos de análisis, es decir que puede que no haya mucha variación en los indicadores por departamento en un año a otro.

Análisis factorial múltiple con datos del índice departamental

A continuación se realiza el AFM con los datos previamente analizados, este tipo de análisis entrega 4 tipos de gráficos: el gráfico de factores individuales con su trayectoria año a año, el círculo de correlación, el gráfico donde se observa el conjunto de variables estudiadas, en nuestro caso el departamento y los dos periodos de análisis y por último el gráfico de individuos sin incluir su trayectoria.

Para su realización se tiene en cuenta la variable departamento como variable suplementaria.

resAFM.departamento <- MFA(datos_taller,group = c(1,9,9),
                           type = c("n","s","s"),
                           name.group = c("Departamento","2021","2022"),
                           num.group.sup = 1)
## Warning: ggrepel: 8 unlabeled data points (too many overlaps). Consider
## increasing max.overlaps

## Warning: ggrepel: 6 unlabeled data points (too many overlaps). Consider
## increasing max.overlaps

## Warning: ggrepel: 6 unlabeled data points (too many overlaps). Consider
## increasing max.overlaps

Resultados

Dentro de los resultados obtenidos, se observa en primer lugar el gráfico de los factores individuales en el cual se puede observar los 32 departamentos, a simple vista se destaca como se van consolidando tres posibles grupos de análisis, lo cuál se confirmará más adelante con la elaboración de cluster.

En segundo lugar, el AFM muestra el círculo de correlación donde se representa la dirección de las variables de ánalisis según los componentes, también este gráfico permite ver cuanta variabilidad de los datos se representa en estos dos componentes, para este caso el ánalisis representa el 63% de la variabilidad de los datos. Se observa que las variables de salud 1-3 (Controles prenatales) y 2-2 (Mortalidad materna) y las variables de edu 2-1(Puntaje pruebas Saber 11) y 1-3 (Cobertura neta en educación secundaria) están alineadas al componente 1 para los dos periodos de análisis 2021-2022.

Mientras que en el componente 2 se descatan las variables de Sal 1-4(Inversión en salud pública), Edu 2-5(Inversión en calidad de la educación básica y media), lab 1-3(Formalidad laboral) y lab 2-2(Brecha en tasa de desempleo entre hombres y mujeres) para los dos periodos 2021-2022.

Por últimos las variables lab 1-2 para el 2021- 2022 están cercanas al origen se puede afirmar que no son muy representativas en el análisis.

Si se analiza en conjunto el gráfico de individuos con el gráfico de correlación se ve que un grupo de departamentos tienen un comportamiento positivo en las variables representativas del eje 1.

Al realizar un análisis particular de departamentos que hacen parte de la región pacífica se observa como el Cauca tuvo una reduccion en la variable lab 2-2 en el periodo 2022, lo mismo ocurre para el caso del Chocó. Mientras que para el Valle del Cauca no hubo cambios significativos

Se observa también el AFM el gráfico de los grupos de ánalisis en nuestro caso existen 3 grupos de análisis, los departamentos y los dos periodos 2021 y 2022. Se observa que estos dos años están muy correlacionados conclusión que se observó en el gráfico de correlación.

Porcentaje de inercia

Las dos primeras dimensiones de análisis expresan el 63% de la inercia total del conjunto de datos.

Este porcentaje es alto y por lo tanto el primer plano representa una parte importante de la variabilidad de los datos.

A partir de estas observaciones, probablemente no sea útil interpretar el resto de las dimensiones

eig.val <- resAFM.departamento$eig
barplot(eig.val[, 2], 
        names.arg = 1:nrow(eig.val), 
        main = "Varianzas Explicadas por los Comp",
        xlab = "Componentes Principales",
        ylab = "Porcentaje de Varianzas",
        col ="steelblue")  
lines(x = 1:nrow(eig.val), eig.val[, 2], 
      type = "b", pch = 19, col = "red")

Contribuciones para los individuos

###contribuciones por individuo 2021 eje 1
library(factoextra)
resAFM.departamento$separate.analyses$`2021`$ind$contrib
##           Dim.1       Dim.2        Dim.3        Dim.4        Dim.5
## 1  6.622959e+00  1.56865494  7.758628871  8.490030807 2.635919e-02
## 2  5.685351e-01  1.15534968  0.044236584  0.018302933 1.255572e+00
## 3  2.229426e-01  0.21562045 35.749912279  1.134265631 5.169397e-02
## 4  5.329534e-01  0.11125450  2.176554870  0.071347651 3.168298e-01
## 5  5.483410e-01 15.92924269  0.799848909  8.362738016 1.563242e+00
## 6  8.268918e-02  0.19953362  6.755561544  6.718082734 1.574973e+00
## 7  3.056511e+00  1.06001858  0.274533949  0.174146271 1.290374e-02
## 8  1.280705e+00  1.40039250  0.175135724  0.064032091 2.824257e+00
## 9  9.172836e-02  2.27170142  0.048462009  0.411820211 7.274101e-01
## 10 9.401750e-02  2.73794491  0.150724928  0.001295196 8.561556e-01
## 11 5.379122e-01  6.68482948  0.443971514  0.036485997 1.622766e-01
## 12 6.971889e-01  4.29868160  0.471879296  0.053208766 1.067439e-01
## 13 1.553695e+00 16.99967095  0.447418331  0.795687834 3.724102e-02
## 14 6.722465e-01  2.09643655  0.125548025  0.165359315 1.176493e-01
## 15 1.473776e+00  1.27691493  0.209087446  0.908940553 3.309733e-04
## 16 3.400432e+01  0.58758548  0.002759597 44.114561918 1.017683e-01
## 17 7.111282e-01  1.76872639  0.002535706  0.020960904 5.473984e-01
## 18 2.022771e+00  0.09308368  0.930150953  0.084676071 5.364926e-02
## 19 8.655256e-01  4.18018719  5.170844593  0.016036700 1.820590e+00
## 20 1.984360e-01  5.90043997  1.562443224  0.035645371 1.335064e-02
## 21 8.117169e-01  0.32686926  1.317300557  0.263965020 2.804660e-02
## 22 6.537778e-01  0.30975388  3.284390158  0.028289014 1.443088e+00
## 23 7.831602e-01  0.03948120  2.472955170  0.258134514 1.514282e+00
## 24 1.093823e-04  0.93187709  3.448684476  2.985333839 8.904144e-02
## 25 2.291966e+00  0.06731847  3.460256747  0.221930739 2.452382e-01
## 26 1.899736e+00  1.85790674  0.997278020  0.081317128 2.924269e-01
## 27 3.078343e+00 14.72833640  7.114296065 10.230711392 1.696072e+01
## 28 2.420174e+00  1.34970234  0.002607202  0.001350425 1.459772e+00
## 29 7.827395e-01  6.45065204  0.109144575  0.442852466 2.154362e-02
## 30 1.192914e+00  1.41743784  1.876815154  0.032667966 6.824794e-01
## 31 6.709398e-01  0.42764331  0.352335435  0.515492257 1.401970e-02
## 32 1.167897e+01  0.41915868  0.234245610 10.621706512 5.522150e+01
## 33 1.789708e+01  1.13759324 12.029452480  2.638623759 9.857448e+00
fviz_contrib(resAFM.departamento,choice="ind",
             axes = 1,top=10)## analisis conjunto

Analizando las contribuciones de los individuos en el eje 1 se destacan los departamentos 16 y 33 que corresponden a Guanía y Vichada.

###contribuciones por individuo 2021 eje 2
library(factoextra)
resAFM.departamento$separate.analyses$`2021`$ind$contrib
##           Dim.1       Dim.2        Dim.3        Dim.4        Dim.5
## 1  6.622959e+00  1.56865494  7.758628871  8.490030807 2.635919e-02
## 2  5.685351e-01  1.15534968  0.044236584  0.018302933 1.255572e+00
## 3  2.229426e-01  0.21562045 35.749912279  1.134265631 5.169397e-02
## 4  5.329534e-01  0.11125450  2.176554870  0.071347651 3.168298e-01
## 5  5.483410e-01 15.92924269  0.799848909  8.362738016 1.563242e+00
## 6  8.268918e-02  0.19953362  6.755561544  6.718082734 1.574973e+00
## 7  3.056511e+00  1.06001858  0.274533949  0.174146271 1.290374e-02
## 8  1.280705e+00  1.40039250  0.175135724  0.064032091 2.824257e+00
## 9  9.172836e-02  2.27170142  0.048462009  0.411820211 7.274101e-01
## 10 9.401750e-02  2.73794491  0.150724928  0.001295196 8.561556e-01
## 11 5.379122e-01  6.68482948  0.443971514  0.036485997 1.622766e-01
## 12 6.971889e-01  4.29868160  0.471879296  0.053208766 1.067439e-01
## 13 1.553695e+00 16.99967095  0.447418331  0.795687834 3.724102e-02
## 14 6.722465e-01  2.09643655  0.125548025  0.165359315 1.176493e-01
## 15 1.473776e+00  1.27691493  0.209087446  0.908940553 3.309733e-04
## 16 3.400432e+01  0.58758548  0.002759597 44.114561918 1.017683e-01
## 17 7.111282e-01  1.76872639  0.002535706  0.020960904 5.473984e-01
## 18 2.022771e+00  0.09308368  0.930150953  0.084676071 5.364926e-02
## 19 8.655256e-01  4.18018719  5.170844593  0.016036700 1.820590e+00
## 20 1.984360e-01  5.90043997  1.562443224  0.035645371 1.335064e-02
## 21 8.117169e-01  0.32686926  1.317300557  0.263965020 2.804660e-02
## 22 6.537778e-01  0.30975388  3.284390158  0.028289014 1.443088e+00
## 23 7.831602e-01  0.03948120  2.472955170  0.258134514 1.514282e+00
## 24 1.093823e-04  0.93187709  3.448684476  2.985333839 8.904144e-02
## 25 2.291966e+00  0.06731847  3.460256747  0.221930739 2.452382e-01
## 26 1.899736e+00  1.85790674  0.997278020  0.081317128 2.924269e-01
## 27 3.078343e+00 14.72833640  7.114296065 10.230711392 1.696072e+01
## 28 2.420174e+00  1.34970234  0.002607202  0.001350425 1.459772e+00
## 29 7.827395e-01  6.45065204  0.109144575  0.442852466 2.154362e-02
## 30 1.192914e+00  1.41743784  1.876815154  0.032667966 6.824794e-01
## 31 6.709398e-01  0.42764331  0.352335435  0.515492257 1.401970e-02
## 32 1.167897e+01  0.41915868  0.234245610 10.621706512 5.522150e+01
## 33 1.789708e+01  1.13759324 12.029452480  2.638623759 9.857448e+00
fviz_contrib(resAFM.departamento,choice="ind",
             axes = 2,top=10)

En el eje 2 se destacan los departamentos 27 y 5 que corresponden a Bogotá y Archipiealgo de San Andrés, si contrastando esta información con el gráfico de individuos estos están muy alejados al resto de departamentos y más alineados al eje.

Cluster de departamentos

Se realiza el análisis de cluster para identificar que departamentos tienen un desempeño parecido en los indicadores definidos.

cluster <- HCPC(resAFM.departamento,nb.clust = -1)

fviz_cluster(cluster, repel = TRUE)

Se observa un total de tres cluster.

cluster$desc.var  ## valores test
## 
## Link between the cluster variable and the quantitative variables
## ================================================================
##                   Eta2      P-value
## SAL-1-3.2022 0.8102960 1.483020e-11
## SAL-1-3.2021 0.8098425 1.537102e-11
## EDU-1-3.2022 0.7559919 6.472389e-10
## EDU-1-3.2021 0.7447021 1.275579e-09
## EDU-2-1.2022 0.6320926 3.062513e-07
## EDU-2-1.2021 0.6153333 5.974060e-07
## LAB-1-3.2021 0.5382067 9.262198e-06
## SAL-1-4.2021 0.5224400 1.532565e-05
## SAL-1-4.2022 0.5224400 1.532565e-05
## LAB-1-3.2022 0.4943470 3.612344e-05
## LAB-2-2.2021 0.4791197 5.637275e-05
## LAB-2-2.2022 0.4685973 7.609511e-05
## SAL-2-2.2022 0.4234457 2.585849e-04
## SAL-2-2.2021 0.2788586 7.418342e-03
## 
## Description of each cluster by quantitative variables
## =====================================================
## $`1`
##                 v.test Mean in category Overall mean sd in category
## SAL-1-4.2022  4.036778     301.54850965  77.62878132   131.39225250
## SAL-1-4.2021  4.036778     301.54850965  77.62878132   131.39225250
## SAL-2-2.2022  3.502361     216.40246125 113.14538154    59.49566451
## SAL-2-2.2021  2.773849     202.23316744 102.79006835   131.94306994
## EDU-2-5.2022  2.064383     388.63556416 199.03145098   397.45973540
## EDU-2-5.2021  2.064383     388.63556416 199.03145098   397.45973540
## LAB-2-2.2022 -2.419009       0.02809942   0.07066968     0.01906261
## EDU-2-1.2021 -3.066558      44.75266279  49.05362164     1.27956369
## EDU-2-1.2022 -3.327841      43.34602989  48.49354159     0.80968366
## EDU-1-3.2021 -4.606682       0.36772500   0.72056970     0.13986371
## EDU-1-3.2022 -4.636750       0.37927500   0.72895152     0.13094948
## SAL-1-3.2021 -4.959326      38.52096126  78.84800245     9.82062392
## SAL-1-3.2022 -4.995626      37.60146143  78.01750939    11.05105730
##                Overall sd      p.value
## SAL-1-4.2022 116.53689295 5.419021e-05
## SAL-1-4.2021 116.53689295 5.419021e-05
## SAL-2-2.2022  61.93910826 4.611548e-04
## SAL-2-2.2021  75.31783720 5.539741e-03
## EDU-2-5.2022 192.95833079 3.898145e-02
## EDU-2-5.2021 192.95833079 3.898145e-02
## LAB-2-2.2022   0.03697216 1.556286e-02
## EDU-2-1.2021   2.94659272 2.165389e-03
## EDU-2-1.2022   3.24968168 8.752195e-04
## EDU-1-3.2021   0.16091679 4.091450e-06
## EDU-1-3.2022   0.15843779 3.539304e-06
## SAL-1-3.2021  17.08361238 7.073826e-07
## SAL-1-3.2022  16.99690738 5.864520e-07
## 
## $`2`
##                 v.test Mean in category Overall mean sd in category  Overall sd
## LAB-2-2.2021  3.850088       0.08316953   0.05737109     0.02505233  0.02865358
## LAB-2-2.2022  3.581337       0.10163418   0.07066968     0.02721745  0.03697216
## EDU-2-1.2022 -1.969355      46.99693056  48.49354159     2.26761044  3.24968168
## EDU-2-1.2021 -2.217406      47.52567053  49.05362164     1.99715490  2.94659272
## LAB-1-3.2022 -3.976523      21.11666667  32.14242424     4.38117818 11.85661892
## LAB-1-3.2021 -4.122753      20.32500000  32.11212121     4.00460672 12.22577401
##                   p.value
## LAB-2-2.2021 1.180756e-04
## LAB-2-2.2022 3.418402e-04
## EDU-2-1.2022 4.891230e-02
## EDU-2-1.2021 2.659533e-02
## LAB-1-3.2022 6.993012e-05
## LAB-1-3.2021 3.743705e-05
## 
## $`3`
##                 v.test Mean in category Overall mean sd in category  Overall sd
## EDU-2-1.2021  4.136935      51.14416569  49.05362164     1.81175657  2.94659272
## EDU-2-1.2022  4.068807      50.76115212  48.49354159     1.93856480  3.24968168
## EDU-1-3.2022  3.290871       0.81837059   0.72895152     0.05311576  0.15843779
## EDU-1-3.2021  3.255714       0.81041765   0.72056970     0.05451502  0.16091679
## LAB-1-3.2022  3.048477      38.34117647  32.14242424    10.78457825 11.85661892
## SAL-1-3.2021  2.959943      87.52008952  78.84800245     5.06184245 17.08361238
## LAB-1-3.2021  2.914771      38.22352941  32.11212121    10.51075244 12.22577401
## SAL-1-3.2022  2.823785      86.24868950  78.01750939     4.98885521 16.99690738
## SAL-2-2.2021 -2.086138      75.84363262 102.79006835    52.37602313 75.31783720
## SAL-2-2.2022 -2.387485      87.78439665 113.14538154    37.12477077 61.93910826
## LAB-2-2.2021 -2.552942       0.04482581   0.05737109     0.01742743  0.02865358
##                   p.value
## EDU-2-1.2021 3.519762e-05
## EDU-2-1.2022 4.725445e-05
## EDU-1-3.2022 9.987777e-04
## EDU-1-3.2021 1.131075e-03
## LAB-1-3.2022 2.300048e-03
## SAL-1-3.2021 3.076958e-03
## LAB-1-3.2021 3.559500e-03
## SAL-1-3.2022 4.746018e-03
## SAL-2-2.2021 3.696616e-02
## SAL-2-2.2022 1.696410e-02
## LAB-2-2.2021 1.068173e-02
##con esto se saca el conteo de departamentos por cada cluster
summary(cluster$data.clust)
##                      Departamento  SAL-1-3 2021    SAL-1-4 2021   
##  Amazonas                  : 1    Min.   :30.99   Min.   : 13.37  
##  Antioquia                 : 1    1st Qu.:79.32   1st Qu.: 22.93  
##  Arauca                    : 1    Median :85.32   Median : 30.95  
##  Archipiélago de San Andrés: 1    Mean   :78.85   Mean   : 77.63  
##  Atlántico                 : 1    3rd Qu.:89.63   3rd Qu.: 43.58  
##  Bogotá, D.C.              : 1    Max.   :93.50   Max.   :470.37  
##  (Other)                   :27                                    
##   SAL-2-2 2021     EDU-1-3 2021     EDU-2-1 2021    EDU-2-5 2021    
##  Min.   :  0.00   Min.   :0.2500   Min.   :42.38   Min.   :  32.45  
##  1st Qu.: 61.61   1st Qu.:0.6878   1st Qu.:47.29   1st Qu.:  96.90  
##  Median : 80.84   Median :0.7635   Median :49.06   Median : 150.68  
##  Mean   :102.79   Mean   :0.7206   Mean   :49.05   Mean   : 199.03  
##  3rd Qu.:109.63   3rd Qu.:0.8213   3rd Qu.:51.17   3rd Qu.: 196.73  
##  Max.   :326.80   Max.   :0.9011   Max.   :54.33   Max.   :1073.11  
##                                                                     
##   LAB-1-2 2021    LAB-1-3 2021    LAB-2-2 2021      SAL-1-3 2022  
##  Min.   : 5.00   Min.   :15.40   Min.   :0.01178   Min.   :28.99  
##  1st Qu.: 8.60   1st Qu.:22.40   1st Qu.:0.04064   1st Qu.:78.77  
##  Median :11.00   Median :32.60   Median :0.05518   Median :84.34  
##  Mean   :11.39   Mean   :32.11   Mean   :0.05737   Mean   :78.02  
##  3rd Qu.:13.20   3rd Qu.:39.30   3rd Qu.:0.07493   3rd Qu.:88.86  
##  Max.   :27.20   Max.   :66.40   Max.   :0.11926   Max.   :93.89  
##                                                                   
##   SAL-1-4 2022     SAL-2-2 2022     EDU-1-3 2022     EDU-2-1 2022  
##  Min.   : 13.37   Min.   :  0.00   Min.   :0.2674   Min.   :40.99  
##  1st Qu.: 22.93   1st Qu.: 78.01   1st Qu.:0.6972   1st Qu.:46.63  
##  Median : 30.95   Median :101.24   Median :0.7687   Median :48.39  
##  Mean   : 77.63   Mean   :113.15   Mean   :0.7290   Mean   :48.49  
##  3rd Qu.: 43.58   3rd Qu.:146.70   3rd Qu.:0.8301   3rd Qu.:50.63  
##  Max.   :470.37   Max.   :285.44   Max.   :0.8976   Max.   :54.27  
##                                                                    
##   EDU-2-5 2022      LAB-1-2 2022    LAB-1-3 2022    LAB-2-2 2022      clust 
##  Min.   :  32.45   Min.   : 9.20   Min.   :15.40   Min.   :0.002299   1: 4  
##  1st Qu.:  96.90   1st Qu.:13.00   1st Qu.:22.40   1st Qu.:0.048917   2:12  
##  Median : 150.68   Median :15.80   Median :32.40   Median :0.064853   3:17  
##  Mean   : 199.03   Mean   :16.76   Mean   :32.14   Mean   :0.070670         
##  3rd Qu.: 196.73   3rd Qu.:18.90   3rd Qu.:39.30   3rd Qu.:0.095563         
##  Max.   :1073.11   Max.   :32.50   Max.   :66.40   Max.   :0.154206         
## 

Revisando los valores test de los cluster encontramos que:

En primer lugar el cluster uno se destacan las variables de salud en especial Inversión en salud pública y la Mortalidad materna, seguida por la variable de educación de Inversión en calidad de la educación básica y media.

En este cluster están los departamentos de Guainia, Vaupes, Vichada y Amazonas.

En el segundo cluster se destacan el indicador de mercado laboral de Brecha en tasa de desempleo entre hombres y mujeres tiene una relevancia positiva, mientras que en educación el indicador de puntaje de pruebas saber 11 y el de formalidad laboral tienen un aporte negativo.

Es decir los departamentos ubicados en este cluster registran unas pruebas saber 11 poco satisfactorias, y existe una brecha en el mercado laboral lo cuál indica que existe una disparidad en las oportunidades laborales.

Este cluster tiene un total de 12 departamentos,los cuales son: Bolívar,Caquetá, Cauca, Chocó, Córdoba ,Guaviare,La Guajira, Magdalena, Nariño, Sucre,Tolima

Por último, el cluster tres las siguientes variables tienen una representatividad positiva, en términos de educación la Cobertura neta en educación secundaria y el Puntaje en pruebas Saber 11, así en el mercado laboral la variable de formalidad laboral y en téminos de salud Controles prenatales estas para ambos periodos (2021-2022).

Este cluster incluye un total de 17 departamentos en los que se encuentran:

Antioquia Arauca Atlántico Bogotá, D.C. Boyacá Caldas Casanare Cundinamarca Huila Meta Norte de Santander Putumayo Quindío Risaralda Archipiélago de San Andrés Santander, Valle del Cauca.

Estos departamentos se puede afirmar que tienen condiciones de vida de más desarrollo como lo fue el cluster uno.

Conclusiones

El anterior análisis permitió conocer la aplicabilidad que tienen los análisis multivariados, en este caso el análisis factorial multiple en diferentes conjuntos de datos.

Este ejercicio permitió conocer que departamentos del país tienen caracteristicas similares se observó que se pueden formar tres cluster, lo que según la representatividad de las variables vistas en AFM se puede observar fortalezas y debilidades que presentan y así mismo poder orientar acciones de mejoría a través de acciones institucionales.

Adicional a este análisis de cluster se podria realizar un índice que lograra ponderar que departamentos tienen unas condiciones de vida aceptable, en el ejercicio de estudio no se puede realizar ya que no se cumple el factor tamaño.

También se pudo observar que no es mucha la diferencia en los indicadores de un año a otro, por lo que es interesante analizar periodos historicos y así ver si existe un cambio más siginificativo.