Contexto y consecuencias del COVID-19
No cabe duda que la aparición de la enfermedad del coronavirus (COVID-19), declarada oficialmente como pandemia el 11 de marzo del año 2020 por la Organización Mundial de la Salud (OMS), se ha expandido para traer al mundo estragos sensibles en la vida humana y focos de alerta para todas las economías. Sin distinguir entre sus niveles de desarrollo o de riqueza, este virus ha atacado a todas las naciones.
Si bien desde el 2019 ya se registraban situaciones adversas en la actividad económica mundial, lo cual se puede constatar en la persistente desaceleración del producto; el 2020 ha sido una película diferente, pues ha llevado a los agentes económicos a un escenario donde se vive con una incertidumbre constante, que conlleva a presenciar nuevas formas de trabajo, de movilidad y de interactuar, sin omitir algunos eventos ilustrativos como lo ha sido la alta volatilidad registrada en los mercados financieros y la caída abrupta en el precio del petróleo en marzo de 2020.
Sin embargo, lo más alarmante en términos económicos, es la contracción del crecimiento que representa el COVID-19, pues conlleva a un menor consumo, menor inversión, más desempleo y exposición a la pobreza, sin dejar de lado las vidas que se han perdido a nivel mundial y las limitaciones a las que se ha tenido que afrontar un sistema de salud (a nivel mundial) que no estaba preparado para una pandemia.
Por tal motivo, el presente documento tiene por objetivo presentar un análisis a través de la visualización y descripción de datos macroeconómicos y de COVID-19, con la finalidad de contextualizar y dar un mejor entendimiento de cómo la economía se ha visto afectada por el COVID-19 y a su vez, se realizan propuestas de pronósticos (tanto para el número de infecciones como para crecimiento económico) para conocer la trayectoria que puede seguir la economía mexicana.
En los siguientes apartados, se hace uso de mapas térmicos para verificar el nivel de incidencias de los crímenes que aquejan a los estados y la forma en como la pobreza se ha acentuado. Posteriormente, el análisis se centra en datos relevantes respecto al COVID-19, exponiendo la forma en como ha afectado al sistema de salud mexicano.
Finalmente, se presentan los pronósticos para el Indicador Global de la Actividad Económica (IGAE) utilizando distintas especificaciones de modelos de Machine Learning, el cual muestra una paulatina recuperación, pero no suficiente para regresar a los niveles de crecimiento previo a la pandemia.
Crimen y pobreza
Para exponer el análisis de análisis y pobreza, se hace uso de mapas térmicos. Comenzando con la sección de crimen, se visualizan los delitos que han tenido mayor número de incidencias en el 2020, los crímenes que se presentan son:
* Daño a Propiedad
* Robo
* Violencia Familiar
* Feminicidio
* Homicidio
* Allanamiento
* Narcomenudeo
* Extorsion
A cada crimen se le asigna un componente denominado \(x(l,k,t)\), donde \(l\) es el indicador específico, \(k\) es cada componente y \(t\) es el periodo de estudio del indicador. Para estandarizar los indicadores, a cada uno se le resta la media y se divide entre la desviación estándar, el indicador estandarizado se denota como \(\tilde{x} (l,k,t)\). Cada índice de componente, V(k,t), se genera como el promedio simple no ponderado de los indicadores estandarizado [1]:
\[V(k,t)= \frac{1}{L}\sum_{l=1}^{L}\tilde{x}\left (l,k,t \right ) \]
Los resultados indican que el crimen mayor incidencia en 2020 es el robo, presentando un registro importante en el Estado de México, seguido de la CDMX y en tercer lugar Jalisco. La violencia familiar y el daño a propiedad también registran valores por encima de otros tipos de crímenes. Finalmente, el mapa térmico está segmentado en 6 partes, ordenando de mayor a menor los estados en función al número de delitos.
Figura 1. Mapa térmico de crímenes por estado en 2020
Fuente: elaboración de los autores con datos de DataMéxico
Respecto a la pobreza, se ha observado que en 2020 el estado que presenta un mayor porcentaje de pobreza extrema respecto a su número de habitantes es Chiapas, Guerrero y Puebla. De acuerdo con el Consejo Nacional de Evaluación de la Política de Desarrollo Social (CONEVAL), una persona cae en una situación de pobreza extrema cuando tiene tres o más carencias, y que, además, se encuentra por debajo de la línea de bienestar mínimo.
Para obtener las proporciones de la Figura 2 y 3, se divide el número de personas en condiciones de pobreza y de vulnerabilidad entre el total de la población de cada estado.
Figura 2. Pobreza extrema por estado en 2020 (Porcentaje respecto a la población total estatal)
Fuente: elaboración de los autores con datos de DataMéxico
Asimismo, las cifras representadas en la Figura 3 son preocupantes puesto que en 2020 la mayoría de los estados cayeron en una situación de mayor vulnerabilidad, con porcentajes cercanos al 30% respecto a la proporción de personas que caen en este rango. Esto se define como aquella población que no presenta carencias sociales pero cuyo ingreso es inferior o igual a la línea de bienestar de acuerdo con la CONEVAL.
Figura 3. Vulnerabilidad por estado en 2020 (Porcentaje respecto a la población total estatal)
Fuente: elaboración de los autores con datos de DataMéxico
Situación e impacto del COVID19 en la nación.
México es de los principales países afectados a nivel mundial con mayor casos acumulados y tasa de mortalidad por SARS-COV2, esto debido a que buena parte de la población padece alguna enfermedad crónica como obesidad, diabetes, asma o enfermedades cardiovasculares lo que complica su situación al ser portador de SARS-COV2 y que afecta al sistema de salud del país al existir más población en riesgo que pueda necesitar un respirador, así como personas de escasos recursos que no poseen los recursos para afrontar la enfermedad.
A continuación observamos la evolución de la pandemía por COVID19 en México.
Tabla 1. Evolución del COVID-19
Meses Casos Acumulados Muertes por COVID19 Hospitalizados por COVID19
1 2020-01 26 0 0
2 2020-02 141 0 28
3 2020-03 22998 378 7072
4 2020-04 394905 39962 169270
5 2020-05 2183016 307590 849080
6 2020-06 5883259 790333 1932188
7 2020-07 11813092 1437026 3354567
8 2020-08 17775922 2046535 4634552
9 2020-09 21932409 2395709 5366103
10 2020-10 27257016 2801334 6318493
11 2020-11 27000950 2633171 5977812
Fuente: elaboración de los autores con datos de DataMéxico
Al igual que en otras partes del mundo, el distanciamiento social ha sido un esfuerzo por parte de la población y gobiernos para contener la pandemia en sus menores cifras de afectados, pero con ello las economías caen ante la falta de consumo, la incertidumbre financiera y la modificación de los patrones de consumo tanto en preferencias como pasar de bienes duraderos a bienes de consumo inmediato como el volumen de algunos productos, como productos de higiene, alimentos y tipos de servicios. En conjunto esta situación es un factor que dificulta el esfuerzo internacional por contener la pandemia y que al mismo tiempo no se pierdan empleos o se cause mas pobreza en el mundo.
Con datos de GOOGLE se observa en la siguiente tabla como es que el distanciamiento social ha disminuido la congregación de personas en sitios públicos y se compara con otros países para su análisis.
Tabla 2. Distanciamiento social 2020
Comercios Supermercados y Farmacias Parques Estaciones de transito
India -50.98693 -2.185007 -30.99626 -37.49001
México -40.55092 -14.202020 -35.71634 -42.05112
EUA -11.01315 2.952712 40.45843 -12.13248
Brasil -36.65688 -1.790804 -35.90825 -39.37102
Oficinas Residencias
India -20.69918 14.574087
México -28.51946 14.077000
EUA -25.52440 9.128443
Brasil -11.70903 11.791578
Fuente: elaboración de los autores con datos de DataMéxico
Actualmente, la mayoría de los casos acumulados se concentra en la Ciudad de México y el Estado de México, esto debido a que son las principales áreas metropolitanas del país, donde se concentran importantes redes de distribución comerciales, lugares turísticos y población, lo que aumenta el factor de contagio.
La variación de los nuevos casos se presenta a continuación, la información de Our World in Data (https://ourworldindata.org/) y se toman las primeras diferencias de los nuevos casos para México:
\[\Delta NC = NC_t - NC_{t-1}\] Donde \(\Delta NC\) representa la variación de los nuevos casos de COVID en México.
Figura 4. Variación de nuevos casos del COVID-19 del 10/03/2020 al 13/11/2020)
Fuente: elaboración de los autores con datos de Our World in Data
La Figura 4 muestra que la mayor variación de COVID-19 se presentó el 18 de octubre de 2020 con un incremento del 6.37%.
Situación e impacto del COVID19 en estados.
Los estados con mayor afectación respecto a porcentaje de personas fallecidas a causa de COVID19 son estados del centro, noroeste del país. Aunque estos estados poseen una mejor estructura de su sistema de salud, existen estados donde la población se encuentra en pobreza y que es en estos estados donde debería concentrarse el apoyo por parte del gobierno federal, con el fin de evitar una mayor tasa de mortalidad en estados como Chiapas, Tabasco, Guerrero y parte sur del país.
Tabla 3. Porcentaje de muertes con respecto a casos acumulados
Porcentaje de muertes
Aguascalientes 7.73
Baja California 17.92
Baja C. Sur 5.05
Campeche 13.76
Coahuila 7.21
Colima 10.60
Chiapas 15.25
Chihuahua 12.01
CDMX 8.48
Durango 6.60
Guanajuato 7.40
Guerrero 11.96
Hidalgo 15.09
Jalisco 11.88
EDOMEX 15.00
Michoacan 8.34
Morelos 18.94
Nayarit 12.43
Nuevo Leon 7.24
Oaxaca 8.90
Puebla 13.86
Queretaro 8.96
Quintana Roo 14.34
San Luis 7.14
Sinaloa 17.10
Sonora 8.90
Tabasco 9.37
Tamaulipas 8.34
Tlaxcala 15.13
Veracruz 14.99
Yucatan 9.40
Zacatecas 9.06
Fuente: elaboración de los autores con datos de DataMéxico
En la siguiente tabla observamos que porcentaje de la población total se encuentra catalogado en situación de pobreza de acuerdo con criterios del CONEVAL.
Tabla 4. Porcentaje de población en pobreza
Porcentaje de población en pobreza
Aguascalientes 34.41
Baja California 30.32
Baja C. Sur 29.34
Campeche 46.13
Coahuila 26.07
Colima 33.94
Chiapas 75.41
Chihuahua 33.94
CDMX 28.16
Durango 45.26
Guanajuato 45.20
Guerrero 67.33
Hidalgo 51.94
Jalisco 35.88
EDOMEX 45.31
Michoacan 55.99
Morelos 45.92
Nayarit 39.72
Nuevo Leon 19.91
Oaxaca 67.56
Puebla 61.22
Queretaro 36.13
Quintana Roo 33.98
San Luis 48.94
Sinaloa 34.40
Sonora 30.87
Tabasco 51.08
Tamaulipas 38.93
Tlaxcala 56.13
Veracruz 57.42
Yucatan 44.98
Zacatecas 55.80
Fuente: elaboración de los autores con datos de DataMéxico
Finalmente dentro de esta sección se analiza el porcentaje de las personas hospitalizadas en relación a las personas aseguradas al IMSS que cuentan con salud publica gratuita, lo que nos indica que existen estados donde los hospitalizados ya rebasan el número de asegurados y con esto se busca analizar que tanto ha sito utilizada la estructura de la salud publica en lo que llevamos de pandemia, ya que cada persona hospitalizada representa un costo de mantenimiento de equipo y renovación de materiales para los trabajadores en hospitales públicos.
Tabla 5. Ocupación hospitalaria
Porcentaje de utilización hospitalaria
Aguascalientes 3.60
Baja California 5.74
Baja C. Sur 5.55
Campeche 7.68
Coahuila 3.55
Colima 5.35
Chiapas 5.22
Chihuahua 6.97
CDMX 4.14
Durango 3.46
Guanajuato 3.86
Guerrero 10.87
Hidalgo 8.84
Jalisco 2.71
EDOMEX 11.36
Michoacan 4.67
Morelos 7.67
Nayarit 6.03
Nuevo Leon 2.64
Oaxaca 7.42
Puebla 6.82
Queretaro 2.72
Quintana Roo 14.33
San Luis 3.64
Sinaloa 6.78
Sonora 6.37
Tabasco 11.68
Tamaulipas 3.64
Tlaxcala 7.37
Veracruz 6.52
Yucatan 5.72
Zacatecas 1.57
Fuente: elaboración de los autores con datos de DataMéxico
Desempeño y pronóstico de la actividad económica
Se realiza un pronóstico de la actividad económica mediante algoritmos de Machine Learning (ML) del tipo de regresión para determinar el nivel de importancia de las variables, la diferencia elemental entre los modelos presentados y los modelos econométricos clásicos reside en el trade-off entre agregar sesgo a los parámetros con el fin de reducir la varianza de los datos.
En este punto cabe recalcar que todos los modelos que se contemplan provienen de alguna variación del modelo de regresión lineal múltiple que presenta la siguiente forma:
\[\beta = Min \sum_{i=1}^n\left (y_i-\beta_0-\sum_{j=1}^p\beta_jx_{ij}\right)^2 \] De acuerdo con (Hastie, Tibshirani, & Friedman, 2017), la regresión Ridge penaliza las variables introduciendo la ecuación original el cuadrado del valor de la pendiente de las de las variables de modo que minimice suma de los residuos al cuadrado de la siguiente manera.
\[\beta = Min \sum_{i=1}^n\left (y_i-\beta_0-\sum_{j=1}^p\beta_jx_{ij}\right)^2+\lambda\sum_{j=1}^p\beta_j^2 \] Dónde \(\lambda\) representa el tamaño de la regularización: mientras más grande, más grande será la regularización. El tercer tipo de regulariación que se abordó para medir la relación entre las variables es el tipo de regularización Elastic-Net introducida por primera vez por (Zou & Hastie, 2005) que es una combinación de las penalizaciones lasso y ridge. Donde tenemos ahora un parámetro adicional \(\alpha\) que tiene un rango de valores entre 0 y 1. Si \(\alpha=0\), ElasticNet se comportará como Ridge, y si \(\alpha=1\), se comportará como Lasso. Por lo tanto, nos brinda todo el espectro lineal de posibles combinaciones entre estos dos extremos. Otro tipo de modelos que se aplica un tipo de regresión del tipo robusto la cual reduce la sensibilidad sobre outliers . Para este caso en particular se utiliza una función de pérdidas o de error conocido como Huber y que según (Huber & Ronchetti, 2009).
La función de pérdidas de Huber es cuadratica si los errores son pequeños y lineal si son grandes, en ese sentido si alcanza el umbral \(\epsilon\geq 0\), entonces los datos son tratados como atipicos y regularizados para disminuir su influencia.
Según (Hastie, Tibshirani y Friedman, 2009), los algoritmos Random forest y arboles aleatorios, dichos modelos también se especificaron para el pronóstico del IGAE al igual que los modelos Gradient Boosting Trees que son una suma de dicho árbol, pero con la particularidad de que se induce de manera progresiva por etapas. En cada paso del procedimiento progresivo por etapas.
En este sentido el modelo tiene por objetivo pronósticar el desempeño del Indice Global de Actividad Económica (IGAE) mediante 21 variables de entrada preoprocesadas mediante análiis de componentes principales y posteriormente estandarizadas para formar 14 componentes principales para pronósticar.
Las variables utilizadas para pronosticar son los siguientes indicadores: el Indicador del consumo en el mercado inetrior, actividad industrial, el indicador adelantado del sistema de componentes ciclicos, la inversión fija bruta residencial, en construcción maquinaria y equipo, la actividad industrial en construcción, manufacturera, el indice nacional de precios (INPC) subayacente de mercancias del componente no subyacente: el indice de agropecuarios y energeticos, así como las exportaciones manufactureras, petróleras y automotrices.
Para desarrollar el modelo, se dividió la base de datos en set pruebas con el 80% de la base original y el restante se utilizó para validar los resultados, ajustar los hiperparametros de los modelos y finalmente pronósticar. Para validar los modelos se utilizó k-fold Cross Validation, debido a que el ajuste que se realiza dentro de los arboles quean los modelos de Gradient Boosting Trees y Random Forest asume que cada fila de datos es independiente entre sí y en este sentido la estimación podría ’ignorar’ la tendencia de la serie, al utilizar validación cruzada se toman diferentes ventanas temporales asegurando que no se pierda la tendencia de la variable. Dicha técnica consiste en dividir los datos de forma aleatoria en k grupos de aproximadamente el mismo tamaño (7 para este caso), k-1 grupos se emplean para entrenar el modelo y uno de los grupos se emplea como test, este proceso se repite k veces utilizando un grupo distinto como test en cada iteración. En este sentido, se elige el modelo que minimiza el error cuadrático medio (Mean Square Error MSE).
Posteriormente se realizó el pronóstico para los meses posteriores hasta el mes de febrero de 2021. El algoritmo se llevo a cabo en Python y a continuación se muestran los resultados del performance:
Tabla 6. Resultados de los modelos
| Modelo | MSE | R^2 (%) |
|---|---|---|
| Ridge | 0.018939 | 97.76 |
| Elastic-Net | 0.023317 | 97.4 |
| Huber | 0.022824 | 97.45 |
| Random Forest | 0.0263 | 99.60 |
| Gradient Boosting | 0.03221 | 99.99 |
Fuente: elaboración de los autores con datos de DataMéxico
En el caso de los modelos parámetricos no se muestran los coeficientes debido a que al ser procesado mediante Análisis de Componentes Principales, se pierde por completo la interpretación de los parámetros. En el siguiente gráfico se aprecia el pronóstico de validación del IGAE, cabe destacar que los modelos no son entrenados con estos datos por lo que no conocen estos datos.
Figura 5. Validación de los modelos
Fuente: elaboración de los autores con datos de DataMéxico
Finalmente se aprecia el pronóstico con los diferentes modelos en el siguiente gráfico.
Figura 6. Pronóstico de la actividad económica
Fuente: elaboración de los autores con datos de DataMéxico
Dados los resultados del pronóstico, se concluye que el último repunte de la actividad económica fue por efecto rebote después de la contracción historica provocada por la pandemia Covid-19, en ese sentido se espera que la actividad económica recupere su ritmo de crecimiento hasta el primer mes de 2021. Encontramos un área de oportunidad en la inversión fija bruta pública ya que según (Moreno-Brid, Pérez-Caldentey, Sandoval, & Valverde, 2016), la inversión pública cuenta con un gran efecto de arrastre sobre la actividad económica, esto aunado a que el sector de la construcción lleva varios meses contrayendose y es uno de los sectores que implica altos niveles de empleo y producción.
Referencias
[1] Aikman, D., Kiley, M., Jung Lee, S., Palumbo, M., & Warusawitharana, M. (2017). Mapping heat in the U.S. financial system. Journal of Banking & Finance, 81, 36-64.
[2] Hastie, T., Tibshirani, R., & Friedman, J. (2017). The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Stanford: Springer.
[3]Moreno-Brid, J. C., Pérez-Caldentey, E., Sandoval, J. K., & Valverde, I. (2016). Inversión Cambio Estructural y crecimiento . Revista de Economía Mexicana, 215-258.
[4] Zou, H., & Hastie, T. (2005). Regularization and variable selection via the elastic net,. Journal of the Royal Statistical Society Series B, 301-320.