Introducción

Este documento hace parte del trabajo del curso de Métodos multivariados aplicados de la Universidad Nacional de Colombia para la Maestría y Especialización en Estadística. El alcance de este documento reporta de manera técnica el paso a paso que se llevó a cabo para la consolidación del trabajo.

Los datos que se consideraron para este trabajo son los del PNUD donde se identifican las vulnerabibilidades economicas y algunos indicadores economicos de los paises tales como: Población en situación de pobreza multidimensional, Población vulnerable a la pobreza multidimensional, Remesas, entradas (% del PIB), Gasto en turismo receptivo (porcentaje del PIB) entre otras. Estas variables, junto a las variables del sector salud hace que se genere un hipótesis que es: ¿Son las condiciones económicas y de salubridad factores diferenciales para los países de América Latina al momento de enfrentar las crisis del coronavirus? y que será la hipótesis que llevará a que se desarrolle todo el trabajo a continuación.

Análisis de datos

A continuación, se presentan algunos datos cargados.

Tabla 1. Datos de vulnerabilidad económica sin procesar

COUNTRY PMP PVMP PPP NPL WPPPP SPLP RI DAR ITE
Norway NA NA 0.2 NA NA NA 0.15 NA 1.6
Switzerland NA NA 0.0 NA NA NA 0.35 NA 2.9
Ireland NA NA 0.1 NA NA NA 0.17 NA 3.8
Germany NA NA 0.0 NA NA NA 0.45 NA 1.5
Hong Kong, China (SAR) NA NA NA NA 0.1 NA 0.12 NA 11.5
Australia NA NA 0.5 NA NA NA 0.13 NA 3.3

En la anterior tabla se muestran las variables proxy que hace referencia a las condiciones económicas de los países. Es por esta razón que en la siguiente tabla se hace una descripción de cada una de ellas.

Tabla 2. Diccionario de variables analizadas

Significado Indicador Medida
Población en situación de pobreza multidimensional PMP % Población de la total
Población vulnerable a la pobreza multidimensional PVMP % Población de la total
PPA 1,90 dólares al día PPP % Población de la total
Línea de pobreza nacional NPL % Del empleo total
Trabajadores pobres a 3,20 dólares PPA al día WPPPP % Población de la total
Programas de protección social y laboral SPLP % Población sin ninguno
Remesas, entradas RI % del PIB
Ayuda oficial al desarrollo neta recibida DAR % del PIB
Gasto en turismo receptivo ITE % del PIB

Como se mencionó al inicio, el análisis en cuestión consta de tomar los datos de vulnerabilidad económica y los de salubridad vistos en clase y ver si estos juntos generan condiciones diferenciales para los países al momento de enfrentar las crisis que ha generado la pandemia por el virus SARS-COV-2. De esta manera, se imprimen algunos datos de la información de salubridad.

Tabla 3. Datos de salubridad sin procesar

ABR GLO RA IDH PM PE CH GS ST SI CM MM MC
JAM SG Latinoamerica 0.726 13.2 11 17 6.1 101.0 9.7 4306.41 100.64 2.336981
PER SG Latinoamerica 0.759 12.7 14 16 5.1 123.8 7.3 30599.07 1138.09 3.719361
CUB SG Latinoamerica 0.778 81.9 78 52 12.2 47.4 0.9 1024.22 12.63 1.233134
HTI SG Latinoamerica 0.503 2.3 7 7 5.4 57.5 0.3 876.91 20.70 2.360562
SLV SG Latinoamerica 0.667 15.7 23 13 7.0 146.9 7.7 7001.78 202.43 2.891122
SUR SG Latinoamerica 0.724 12.3 41 31 6.1 139.5 12.7 10250.04 204.56 1.995699

Se juntan los datos de salubridad y vulnerabilidad económica para los países de América Latina sy se obtiene la siguiente tabla:

Tabla 4. Datos de salubridad y vulnerabilidad económica

ABR COUNTRY PMP PVMP PPP NPL WPPPP SPLP RI DAR ITE IDH PM PE CH GS ST SI CM MM MC
ARG Argentina NA NA 1.0 32.0 0.6 53.6 0.10 0.0 1.2 0.830 39.6 26 50 7.5 132.1 19.1 35191.63 948.50 2.6952432
URY Uruguay NA NA 0.1 8.1 0.1 20.2 0.17 0.1 4.1 0.808 50.5 19 28 9.1 149.9 28.3 4981.96 46.06 0.9245357
PRY Paraguay 4.5 7.2 1.6 24.2 2.8 36.6 1.67 0.4 1.0 0.724 13.7 12 13 8.0 107.0 4.6 14773.70 308.73 2.0897270
CHL Chile NA NA 0.3 8.6 0.8 12.3 0.02 0.0 1.3 0.847 10.8 9 22 8.5 134.4 17.4 31595.50 862.51 2.7298508
BRA Brazil 3.8 6.2 4.4 NA 2.8 46.2 0.16 0.0 0.3 0.761 21.5 97 22 11.8 98.8 14.9 35306.99 901.25 2.5526107
PER Peru 12.7 12.5 2.6 20.5 10.3 35.1 1.46 0.0 2.2 0.759 12.7 14 16 5.1 123.8 7.3 30599.07 1138.09 3.7193614

La anterior tabla muestra que para algunos países hacen falta los datos para algunas variables lo cual dificulta el análisis dado que ni el PCA y los gráficos Biplot admiten marcos de datos con NA o faltantes. Para solucionar esto se recurre a imputar estos datos con los k-vecinos más cercanos de cada país, es decir, se ordenan los países geográficamente para así cuando se calcule los k-vecinos más cercanos (se decidió que fueran los 4 paises mas cercanos con los que se realizará la imputación) los valores corresponden a una zona geográficamente igual y las imputaciones sean “razonables”. Esto puede que no tenga mucha validez desde la estadística pura, pero en términos económicos y de estadísticas espacial podemos decir que un cluster de países más o menos cercanos comparten similitudes y ese supuesto lo aplicaremos en este caso.

De esta manera, al realizar la imputación de los datos se obtiene el siguiente data.frame

Tabla 5. Datos de salubridad y vulnerabilidad económica con imputación

ABR COUNTRY IDH PM PE CH GS ST SI CM MM MC PMP PVMP PPP NPL WPPPP SPLP RI DAR ITE
ARG Argentina 0.830 39.6 26 50 7.5 132.1 19.1 35191.63 948.50 2.6952432 4.79 5.96 1.0 32.00 0.6 53.6 0.10 0.0 1.2
URY Uruguay 0.808 50.5 19 28 9.1 149.9 28.3 4981.96 46.06 0.9245357 6.59 8.37 0.1 8.10 0.1 20.2 0.17 0.1 4.1
PRY Paraguay 0.724 13.7 12 13 8.0 107.0 4.6 14773.70 308.73 2.0897270 4.50 7.20 1.6 24.20 2.8 36.6 1.67 0.4 1.0
CHL Chile 0.847 10.8 9 22 8.5 134.4 17.4 31595.50 862.51 2.7298508 6.53 8.35 0.3 8.60 0.8 12.3 0.02 0.0 1.3
BRA Brazil 0.761 21.5 97 22 11.8 98.8 14.9 35306.99 901.25 2.5526107 3.80 6.20 4.4 29.06 2.8 46.2 0.16 0.0 0.3
PER Peru 0.759 12.7 14 16 5.1 123.8 7.3 30599.07 1138.09 3.7193614 12.70 12.50 2.6 20.50 10.3 35.1 1.46 0.0 2.2
¿Cual es el correlograma de los datos?

El siguiente correlograma permitirá entender más en detalle el comportamiento de los datos sobre todo las relaciones entre las condiciones de salubridad y las vulnerabilidades económicas de los países de América Latina.

1. La parte superior izquierda muestra el mapa de calor de las variables de condiciones del sector salud, en esta parte es evidente que persisten correlaciones positivas entre todas las variables (lo cual a priori es de esperarse) toda vez por ejemplo, que un mayor gasto sanitario (por parte del PIB) genere un mayor índice de desarrollo humano o un mayor número de camas de hospitales.

2. De manera correspondiente, al observar la parte izquierda inferior (correlaciones entre las variables del sector salud y las vulnerabilidades económicas) se puede decir que las correlaciones también se mantienen (sabiendo que son negativas) ya que en la teoría económica se espera que a mayor índice de desarrollo humano refleja menor número de personas en la línea de pobreza o menor personas vulnerables a la pobreza multidimensional.

3. Otro hecho que se valida de la teoría económica son los llamados circulos viciosos o círculos de trampa de pobreza y esto se observa en las correlaciones positivas entre las variables de vulnerabilidad económica, es decir, a mayor porcentaje de población en situación de pobreza multidimensional (PMP) mayor población vulnerable a la pobreza multidimensional (PVMP) o mayor porcentaje de personas que solo ganan 1,90 dólares al día (PPP).

Gráfico 1. Correlograma de las variables.

Resultados

Gráfico 2. Porcentaje de varianza explicada por cada componente principal.

Gráfico 3. Representación de las Variables sobre las 2 primeras componentes.

Este gráfico, además de indicar el porcentaje de varianza explicada por cada una de las componentes también muestra que la distancia entre las variables y el origen mide: la calidad de la representación de las variables (mayor cuanto más próxima a la circunferencia o círculo de correlación). Es por eso que las variables ITE (Gasto en turismo receptivo) y SPLP (Programas de protección social y laboral) explican poco de las 2 primeras componentes ya que su contribución (color morado) es baja. Así mismo, variables como IDH, PPP, PMP, PVMP, WPPPP y PE muestran contribuciones altas ya que se encuentran próximas a la circunferencia.

Gráfico 4. Gráfico Biplot.

Conclusiones

Este último gráfico nos pinta el nivel de incidencia de cada variable para las 2 primeras componentes para los países latinoamericanos y las principales conclusiones del trabajo donde sobresalen los siguientes hechos:

1. Los índices de PMP (Población en situación de pobreza multidimensional) y PVMP (Población vulnerable a la pobreza multidimensional) son representativos para países como Haití (HTI) y Honduras (HND) lo cual al contrastarlo con los datos reales evidencia que son correctos. Ya que los indicadores corresponden a: 41.3 y 19.3 para PMP y de 21.8 y 22.3 para el indicador de PVMP para Haití y Honduras cada uno respectivamente.

2. El Gasto Sanitario como porcentaje del PIB (GS) es de gran incidencia para Cuba (12.2%) siendo este el porcentaje más alto para todos los países en el análisis. Si bien este es un hecho que ya se había analizado en el ejercicio con Erika es algo que no se puede obviar.

3. Pese a que las cifras en términos de contagios y de muertes no son nada favorables para BRA (Brasil) se puede haber dicho que en términos de Enfermeras por cada 10.000 personas era el país que mejores condiciones tenía en este tema. Las malas decisiones políticas y la subestimación del Covid han hecho que la población de este país se está viendo fuertemente afectada por esto, no por nada este país es el epicentro de la pandemia.

4. Colombia por su parte (COL) se muestra como un país muy céntrico (promedio) en cuanto a los demás países pues no sobresale en ningún indicador (ni para bien, ni para mal) es por eso que se ubica más hacia el centro de las variables.

5. Como se planteó al inicio del trabajo: las condiciones de salubridad y las vulnerabilidades económicas de los países latinoamericanos si pudieron determinar el grado de afectación de la pandemia en sus territorios. Variables como PMP y PVMP sin duda son de gran relevancia para la explicación de las 2 primeras componentes al mismo tiempo que el IDH tienen sus efectos sobre qué tan preparados están los países. Esto se debe principalmente a que a los países con un mayor número de personas en estado de pobreza multidimensional o en mayor riesgo de serlo son quienes más sufren, toda vez que se encuentran en un estado de desatención completa por el Estado lo que aunado por supuesto a sus niveles de ingresos precarios van generando los círculos viciosos que se hablaron anteriormente.

6. Si bien ningún país (ni rico, ni pobre) está preparado completamente para afrontar esta crisis lo cierto que esta crisis profundizó los estado iniciales de los países, es decir, los países con altos % de personas vulnerables o en estado de pobreza presentaron mayores números de personas en este estado, lo que hace que superar o librarse de los círculo de trampa de pobreza sea una tarea más compleja de lo que era inicialmente.