Este documento hace parte del trabajo del curso de Métodos multivariados aplicados de la Universidad Nacional de Colombia para la Maestría y Especialización en Estadística. El alcance de este documento reporta de manera técnica el paso a paso que se llevó a cabo para la consolidación del trabajo.
Los datos que se consideraron para este trabajo son los del PNUD donde se identifican las vulnerabibilidades economicas y algunos indicadores economicos de los paises tales como: Población en situación de pobreza multidimensional, Población vulnerable a la pobreza multidimensional, Remesas, entradas (% del PIB), Gasto en turismo receptivo (porcentaje del PIB) entre otras. Estas variables, junto a las variables del sector salud hace que se genere un hipótesis que es: ¿Son las condiciones económicas y de salubridad factores diferenciales para los países de América Latina al momento de enfrentar las crisis del coronavirus? y que será la hipótesis que llevará a que se desarrolle todo el trabajo a continuación.
A continuación, se presentan algunos datos cargados.
| COUNTRY | PMP | PVMP | PPP | NPL | WPPPP | SPLP | RI | DAR | ITE |
|---|---|---|---|---|---|---|---|---|---|
| Norway | NA | NA | 0.2 | NA | NA | NA | 0.15 | NA | 1.6 |
| Switzerland | NA | NA | 0.0 | NA | NA | NA | 0.35 | NA | 2.9 |
| Ireland | NA | NA | 0.1 | NA | NA | NA | 0.17 | NA | 3.8 |
| Germany | NA | NA | 0.0 | NA | NA | NA | 0.45 | NA | 1.5 |
| Hong Kong, China (SAR) | NA | NA | NA | NA | 0.1 | NA | 0.12 | NA | 11.5 |
| Australia | NA | NA | 0.5 | NA | NA | NA | 0.13 | NA | 3.3 |
En la anterior tabla se muestran las variables proxy que hace referencia a las condiciones económicas de los países. Es por esta razón que en la siguiente tabla se hace una descripción de cada una de ellas.
| Significado | Indicador | Medida |
|---|---|---|
| Población en situación de pobreza multidimensional | PMP | % Población de la total |
| Población vulnerable a la pobreza multidimensional | PVMP | % Población de la total |
| PPA 1,90 dólares al día | PPP | % Población de la total |
| Línea de pobreza nacional | NPL | % Del empleo total |
| Trabajadores pobres a 3,20 dólares PPA al día | WPPPP | % Población de la total |
| Programas de protección social y laboral | SPLP | % Población sin ninguno |
| Remesas, entradas | RI | % del PIB |
| Ayuda oficial al desarrollo neta recibida | DAR | % del PIB |
| Gasto en turismo receptivo | ITE | % del PIB |
Como se mencionó al inicio, el análisis en cuestión consta de tomar los datos de vulnerabilidad económica y los de salubridad vistos en clase y ver si estos juntos generan condiciones diferenciales para los países al momento de enfrentar las crisis que ha generado la pandemia por el virus SARS-COV-2. De esta manera, se imprimen algunos datos de la información de salubridad.
| ABR | GLO | RA | IDH | PM | PE | CH | GS | ST | SI | CM | MM | MC |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| JAM | SG | Latinoamerica | 0.726 | 13.2 | 11 | 17 | 6.1 | 101.0 | 9.7 | 4306.41 | 100.64 | 2.336981 |
| PER | SG | Latinoamerica | 0.759 | 12.7 | 14 | 16 | 5.1 | 123.8 | 7.3 | 30599.07 | 1138.09 | 3.719361 |
| CUB | SG | Latinoamerica | 0.778 | 81.9 | 78 | 52 | 12.2 | 47.4 | 0.9 | 1024.22 | 12.63 | 1.233134 |
| HTI | SG | Latinoamerica | 0.503 | 2.3 | 7 | 7 | 5.4 | 57.5 | 0.3 | 876.91 | 20.70 | 2.360562 |
| SLV | SG | Latinoamerica | 0.667 | 15.7 | 23 | 13 | 7.0 | 146.9 | 7.7 | 7001.78 | 202.43 | 2.891122 |
| SUR | SG | Latinoamerica | 0.724 | 12.3 | 41 | 31 | 6.1 | 139.5 | 12.7 | 10250.04 | 204.56 | 1.995699 |
Se juntan los datos de salubridad y vulnerabilidad económica para los países de América Latina sy se obtiene la siguiente tabla:
| ABR | COUNTRY | PMP | PVMP | PPP | NPL | WPPPP | SPLP | RI | DAR | ITE | IDH | PM | PE | CH | GS | ST | SI | CM | MM | MC |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ARG | Argentina | NA | NA | 1.0 | 32.0 | 0.6 | 53.6 | 0.10 | 0.0 | 1.2 | 0.830 | 39.6 | 26 | 50 | 7.5 | 132.1 | 19.1 | 35191.63 | 948.50 | 2.6952432 |
| URY | Uruguay | NA | NA | 0.1 | 8.1 | 0.1 | 20.2 | 0.17 | 0.1 | 4.1 | 0.808 | 50.5 | 19 | 28 | 9.1 | 149.9 | 28.3 | 4981.96 | 46.06 | 0.9245357 |
| PRY | Paraguay | 4.5 | 7.2 | 1.6 | 24.2 | 2.8 | 36.6 | 1.67 | 0.4 | 1.0 | 0.724 | 13.7 | 12 | 13 | 8.0 | 107.0 | 4.6 | 14773.70 | 308.73 | 2.0897270 |
| CHL | Chile | NA | NA | 0.3 | 8.6 | 0.8 | 12.3 | 0.02 | 0.0 | 1.3 | 0.847 | 10.8 | 9 | 22 | 8.5 | 134.4 | 17.4 | 31595.50 | 862.51 | 2.7298508 |
| BRA | Brazil | 3.8 | 6.2 | 4.4 | NA | 2.8 | 46.2 | 0.16 | 0.0 | 0.3 | 0.761 | 21.5 | 97 | 22 | 11.8 | 98.8 | 14.9 | 35306.99 | 901.25 | 2.5526107 |
| PER | Peru | 12.7 | 12.5 | 2.6 | 20.5 | 10.3 | 35.1 | 1.46 | 0.0 | 2.2 | 0.759 | 12.7 | 14 | 16 | 5.1 | 123.8 | 7.3 | 30599.07 | 1138.09 | 3.7193614 |
La anterior tabla muestra que para algunos países hacen falta los datos para algunas variables lo cual dificulta el análisis dado que ni el PCA y los gráficos Biplot admiten marcos de datos con NA o faltantes. Para solucionar esto se recurre a imputar estos datos con los k-vecinos más cercanos de cada país, es decir, se ordenan los países geográficamente para así cuando se calcule los k-vecinos más cercanos (se decidió que fueran los 4 paises mas cercanos con los que se realizará la imputación) los valores corresponden a una zona geográficamente igual y las imputaciones sean “razonables”. Esto puede que no tenga mucha validez desde la estadística pura, pero en términos económicos y de estadísticas espacial podemos decir que un cluster de países más o menos cercanos comparten similitudes y ese supuesto lo aplicaremos en este caso.
De esta manera, al realizar la imputación de los datos se obtiene el siguiente data.frame
| ABR | COUNTRY | IDH | PM | PE | CH | GS | ST | SI | CM | MM | MC | PMP | PVMP | PPP | NPL | WPPPP | SPLP | RI | DAR | ITE |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ARG | Argentina | 0.830 | 39.6 | 26 | 50 | 7.5 | 132.1 | 19.1 | 35191.63 | 948.50 | 2.6952432 | 4.79 | 5.96 | 1.0 | 32.00 | 0.6 | 53.6 | 0.10 | 0.0 | 1.2 |
| URY | Uruguay | 0.808 | 50.5 | 19 | 28 | 9.1 | 149.9 | 28.3 | 4981.96 | 46.06 | 0.9245357 | 6.59 | 8.37 | 0.1 | 8.10 | 0.1 | 20.2 | 0.17 | 0.1 | 4.1 |
| PRY | Paraguay | 0.724 | 13.7 | 12 | 13 | 8.0 | 107.0 | 4.6 | 14773.70 | 308.73 | 2.0897270 | 4.50 | 7.20 | 1.6 | 24.20 | 2.8 | 36.6 | 1.67 | 0.4 | 1.0 |
| CHL | Chile | 0.847 | 10.8 | 9 | 22 | 8.5 | 134.4 | 17.4 | 31595.50 | 862.51 | 2.7298508 | 6.53 | 8.35 | 0.3 | 8.60 | 0.8 | 12.3 | 0.02 | 0.0 | 1.3 |
| BRA | Brazil | 0.761 | 21.5 | 97 | 22 | 11.8 | 98.8 | 14.9 | 35306.99 | 901.25 | 2.5526107 | 3.80 | 6.20 | 4.4 | 29.06 | 2.8 | 46.2 | 0.16 | 0.0 | 0.3 |
| PER | Peru | 0.759 | 12.7 | 14 | 16 | 5.1 | 123.8 | 7.3 | 30599.07 | 1138.09 | 3.7193614 | 12.70 | 12.50 | 2.6 | 20.50 | 10.3 | 35.1 | 1.46 | 0.0 | 2.2 |
El siguiente correlograma permitirá entender más en detalle el comportamiento de los datos sobre todo las relaciones entre las condiciones de salubridad y las vulnerabilidades económicas de los países de América Latina.
1. La parte superior izquierda muestra el mapa de calor de las variables de condiciones del sector salud, en esta parte es evidente que persisten correlaciones positivas entre todas las variables (lo cual a priori es de esperarse) toda vez por ejemplo, que un mayor gasto sanitario (por parte del PIB) genere un mayor índice de desarrollo humano o un mayor número de camas de hospitales.
2. De manera correspondiente, al observar la parte izquierda inferior (correlaciones entre las variables del sector salud y las vulnerabilidades económicas) se puede decir que las correlaciones también se mantienen (sabiendo que son negativas) ya que en la teoría económica se espera que a mayor índice de desarrollo humano refleja menor número de personas en la línea de pobreza o menor personas vulnerables a la pobreza multidimensional.
3. Otro hecho que se valida de la teoría económica son los llamados circulos viciosos o círculos de trampa de pobreza y esto se observa en las correlaciones positivas entre las variables de vulnerabilidad económica, es decir, a mayor porcentaje de población en situación de pobreza multidimensional (PMP) mayor población vulnerable a la pobreza multidimensional (PVMP) o mayor porcentaje de personas que solo ganan 1,90 dólares al día (PPP).
Este gráfico, además de indicar el porcentaje de varianza explicada por cada una de las componentes también muestra que la distancia entre las variables y el origen mide: la calidad de la representación de las variables (mayor cuanto más próxima a la circunferencia o círculo de correlación). Es por eso que las variables ITE (Gasto en turismo receptivo) y SPLP (Programas de protección social y laboral) explican poco de las 2 primeras componentes ya que su contribución (color morado) es baja. Así mismo, variables como IDH, PPP, PMP, PVMP, WPPPP y PE muestran contribuciones altas ya que se encuentran próximas a la circunferencia.
Este último gráfico nos pinta el nivel de incidencia de cada variable para las 2 primeras componentes para los países latinoamericanos y las principales conclusiones del trabajo donde sobresalen los siguientes hechos:
1. Los índices de PMP (Población en situación de pobreza multidimensional) y PVMP (Población vulnerable a la pobreza multidimensional) son representativos para países como Haití (HTI) y Honduras (HND) lo cual al contrastarlo con los datos reales evidencia que son correctos. Ya que los indicadores corresponden a: 41.3 y 19.3 para PMP y de 21.8 y 22.3 para el indicador de PVMP para Haití y Honduras cada uno respectivamente.
2. El Gasto Sanitario como porcentaje del PIB (GS) es de gran incidencia para Cuba (12.2%) siendo este el porcentaje más alto para todos los países en el análisis. Si bien este es un hecho que ya se había analizado en el ejercicio con Erika es algo que no se puede obviar.
3. Pese a que las cifras en términos de contagios y de muertes no son nada favorables para BRA (Brasil) se puede haber dicho que en términos de Enfermeras por cada 10.000 personas era el país que mejores condiciones tenía en este tema. Las malas decisiones políticas y la subestimación del Covid han hecho que la población de este país se está viendo fuertemente afectada por esto, no por nada este país es el epicentro de la pandemia.
4. Colombia por su parte (COL) se muestra como un país muy céntrico (promedio) en cuanto a los demás países pues no sobresale en ningún indicador (ni para bien, ni para mal) es por eso que se ubica más hacia el centro de las variables.
5. Como se planteó al inicio del trabajo: las condiciones de salubridad y las vulnerabilidades económicas de los países latinoamericanos si pudieron determinar el grado de afectación de la pandemia en sus territorios. Variables como PMP y PVMP sin duda son de gran relevancia para la explicación de las 2 primeras componentes al mismo tiempo que el IDH tienen sus efectos sobre qué tan preparados están los países. Esto se debe principalmente a que a los países con un mayor número de personas en estado de pobreza multidimensional o en mayor riesgo de serlo son quienes más sufren, toda vez que se encuentran en un estado de desatención completa por el Estado lo que aunado por supuesto a sus niveles de ingresos precarios van generando los círculos viciosos que se hablaron anteriormente.
6. Si bien ningún país (ni rico, ni pobre) está preparado completamente para afrontar esta crisis lo cierto que esta crisis profundizó los estado iniciales de los países, es decir, los países con altos % de personas vulnerables o en estado de pobreza presentaron mayores números de personas en este estado, lo que hace que superar o librarse de los círculo de trampa de pobreza sea una tarea más compleja de lo que era inicialmente.