Contexto y consecuencias del COVID-19

No cabe duda que la aparición de la enfermedad del coronavirus (COVID-19), declarada oficialmente como pandemia el 11 de marzo del año 2020 por la Organización Mundial de la Salud (OMS), se ha expandido para traer al mundo estragos sensibles en la vida humana y focos de alerta para todas las economías. Sin distinguir entre sus niveles de desarrollo o de riqueza, este virus ha atacado a todas las naciones.

Si bien desde el 2019 ya se registraban situaciones adversas en la actividad económica mundial, lo cual se puede constatar en la persistente desaceleración del producto; el 2020 ha sido una película diferente, pues ha llevado a los agentes económicos a un escenario donde se vive con una incertidumbre constante, que conlleva a presenciar nuevas formas de trabajo, de movilidad y de interactuar, sin omitir algunos eventos ilustrativos como lo ha sido la alta volatilidad registrada en los mercados financieros y la caída abrupta en el precio del petróleo en marzo de 2020.

Sin embargo, lo más alarmante en términos económicos, es la contracción del crecimiento que representa el COVID-19, pues conlleva a un menor consumo, menor inversión, más desempleo y exposición a la pobreza, sin dejar de lado las vidas que se han perdido a nivel mundial y las limitaciones a las que se ha tenido que afrontar un sistema de salud (a nivel mundial) que no estaba preparado para una pandemia.

Por tal motivo, el presente documento tiene por objetivo presentar un análisis a través de la visualización y descripción de datos macroeconómicos y de COVID-19, con la finalidad de contextualizar y dar un mejor entendimiento de cómo la economía se ha visto afectada por el COVID-19 y a su vez, se realizan propuestas de pronósticos (tanto para el número de infecciones como para crecimiento económico) para conocer la trayectoria que puede seguir la economía mexicana.

En los siguientes apartados, se hace uso de mapas térmicos para verificar el nivel de incidencias de los crímenes que aquejan a los estados y la forma en como la pobreza se ha acentuado. Posteriormente, el análisis se centra en datos relevantes respecto al COVID-19, exponiendo la forma en como ha afectado al sistema de salud mexicano.

Finalmente, se presentan los pronósticos para el Indicador Global de la Actividad Económica (IGAE) utilizando distintas especificaciones de modelos de Machine Learning, el cual muestra una paulatina recuperación, pero no suficiente para regresar a los niveles de crecimiento previo a la pandemia.

Crimen y pobreza

Para exponer el análisis de análisis y pobreza, se hace uso de mapas térmicos. Comenzando con la sección de crimen, se visualizan los delitos que han tenido mayor número de incidencias en el 2020, los crímenes que se presentan son:

* Daño a Propiedad
* Robo
* Violencia Familiar
* Feminicidio
* Homicidio
* Allanamiento
* Narcomenudeo
* Extorsion

A cada crimen se le asigna un componente denominado \(x(l,k,t)\), donde \(l\) es el indicador específico, \(k\) es cada componente y \(t\) es el periodo de estudio del indicador. Para estandarizar los indicadores, a cada uno se le resta la media y se divide entre la desviación estándar, el indicador estandarizado se denota como \(\tilde{x} (l,k,t)\). Cada índice de componente, V(k,t), se genera como el promedio simple no ponderado de los indicadores estandarizado [1]:

\[V(k,t)= \frac{1}{L}\sum_{l=1}^{L}\tilde{x}\left (l,k,t \right ) \]

Los resultados indican que el crimen mayor incidencia en 2020 es el robo, presentando un registro importante en el Estado de México, seguido de la CDMX y en tercer lugar Jalisco. La violencia familiar y el daño a propiedad también registran valores por encima de otros tipos de crímenes. Finalmente, el mapa térmico está segmentado en 6 partes, ordenando de mayor a menor los estados en función al número de delitos.

Figura 1. Mapa térmico de crímenes por estado en 2020

Fuente: elaboración de los autores con datos de DataMéxico

Respecto a la pobreza, se ha observado que en 2020 el estado que presenta un mayor porcentaje de pobreza extrema respecto a su número de habitantes es Chiapas, Guerrero y Puebla. De acuerdo con el Consejo Nacional de Evaluación de la Política de Desarrollo Social (CONEVAL), una persona cae en una situación de pobreza extrema cuando tiene tres o más carencias, y que, además, se encuentra por debajo de la línea de bienestar mínimo.

Para obtener las proporciones de la Figura 2 y 3, se divide el número de personas en condiciones de pobreza y de vulnerabilidad entre el total de la población de cada estado.

Figura 2. Pobreza extrema por estado en 2020 (Porcentaje respecto a la población total estatal)

Fuente: elaboración de los autores con datos de DataMéxico

Asimismo, las cifras representadas en la Figura 3 son preocupantes puesto que en 2020 la mayoría de los estados cayeron en una situación de mayor vulnerabilidad, con porcentajes cercanos al 30% respecto a la proporción de personas que caen en este rango. Esto se define como aquella población que no presenta carencias sociales pero cuyo ingreso es inferior o igual a la línea de bienestar de acuerdo con la CONEVAL.

Figura 3. Vulnerabilidad por estado en 2020 (Porcentaje respecto a la población total estatal)

Fuente: elaboración de los autores con datos de DataMéxico

Situación e impacto del COVID19 en la nación.

México es de los principales países afectados a nivel mundial con mayor casos acumulados y tasa de mortalidad por SARS-COV2, esto debido a que buena parte de la población padece alguna enfermedad crónica como obesidad, diabetes, asma o enfermedades cardiovasculares lo que complica su situación al ser portador de SARS-COV2 y que afecta al sistema de salud del país al existir más población en riesgo que pueda necesitar un respirador, así como personas de escasos recursos que no poseen los recursos para afrontar la enfermedad.

A continuación observamos la evolución de la pandemía por COVID19 en México.

Tabla 1. Evolución del COVID-19

     Meses Casos Acumulados Muertes por COVID19 Hospitalizados por COVID19
1  2020-01               26                   0                          0
2  2020-02              141                   0                         28
3  2020-03            22998                 378                       7072
4  2020-04           394905               39962                     169270
5  2020-05          2183016              307590                     849080
6  2020-06          5883259              790333                    1932188
7  2020-07         11813092             1437026                    3354567
8  2020-08         17775922             2046535                    4634552
9  2020-09         21932409             2395709                    5366103
10 2020-10         27257016             2801334                    6318493
11 2020-11         27000950             2633171                    5977812

Fuente: elaboración de los autores con datos de DataMéxico

Al igual que en otras partes del mundo, el distanciamiento social ha sido un esfuerzo por parte de la población y gobiernos para contener la pandemia en sus menores cifras de afectados, pero con ello las economías caen ante la falta de consumo, la incertidumbre financiera y la modificación de los patrones de consumo tanto en preferencias como pasar de bienes duraderos a bienes de consumo inmediato como el volumen de algunos productos, como productos de higiene, alimentos y tipos de servicios. En conjunto esta situación es un factor que dificulta el esfuerzo internacional por contener la pandemia y que al mismo tiempo no se pierdan empleos o se cause mas pobreza en el mundo.

Con datos de GOOGLE se observa en la siguiente tabla como es que el distanciamiento social ha disminuido la congregación de personas en sitios públicos y se compara con otros países para su análisis.

Tabla 2. Distanciamiento social 2020

       Comercios Supermercados y Farmacias   Parques Estaciones de transito
India  -50.98693                 -2.185007 -30.99626              -37.49001
México -40.55092                -14.202020 -35.71634              -42.05112
EUA    -11.01315                  2.952712  40.45843              -12.13248
Brasil -36.65688                 -1.790804 -35.90825              -39.37102
        Oficinas Residencias
India  -20.69918   14.574087
México -28.51946   14.077000
EUA    -25.52440    9.128443
Brasil -11.70903   11.791578

Fuente: elaboración de los autores con datos de DataMéxico

Actualmente, la mayoría de los casos acumulados se concentra en la Ciudad de México y el Estado de México, esto debido a que son las principales áreas metropolitanas del país, donde se concentran importantes redes de distribución comerciales, lugares turísticos y población, lo que aumenta el factor de contagio.

La variación de los nuevos casos se presenta a continuación, la información de Our World in Data (https://ourworldindata.org/) y se toman las primeras diferencias de los nuevos casos para México:

\[\Delta NC = NC_t - NC_{t-1}\] Donde \(\Delta NC\) representa la variación de los nuevos casos de COVID en México.

Figura 4. Variación de nuevos casos del COVID-19 del 10/03/2020 al 13/11/2020)

Fuente: elaboración de los autores con datos de Our World in Data

La Figura 4 muestra que la mayor variación de COVID-19 se presentó el 18 de octubre de 2020 con un incremento del 6.37%.

Situación e impacto del COVID19 en estados.

Los estados con mayor afectación respecto a porcentaje de personas fallecidas a causa de COVID19 son estados del centro, noroeste del país. Aunque estos estados poseen una mejor estructura de su sistema de salud, existen estados donde la población se encuentra en pobreza y que es en estos estados donde debería concentrarse el apoyo por parte del gobierno federal, con el fin de evitar una mayor tasa de mortalidad en estados como Chiapas, Tabasco, Guerrero y parte sur del país.

Tabla 3. Porcentaje de muertes con respecto a casos acumulados

                Porcentaje de muertes
Aguascalientes                   7.73
Baja California                 17.92
Baja C. Sur                      5.05
Campeche                        13.76
Coahuila                         7.21
Colima                          10.60
Chiapas                         15.25
Chihuahua                       12.01
CDMX                             8.48
Durango                          6.60
Guanajuato                       7.40
Guerrero                        11.96
Hidalgo                         15.09
Jalisco                         11.88
EDOMEX                          15.00
Michoacan                        8.34
Morelos                         18.94
Nayarit                         12.43
Nuevo Leon                       7.24
Oaxaca                           8.90
Puebla                          13.86
Queretaro                        8.96
Quintana Roo                    14.34
San Luis                         7.14
Sinaloa                         17.10
Sonora                           8.90
Tabasco                          9.37
Tamaulipas                       8.34
Tlaxcala                        15.13
Veracruz                        14.99
Yucatan                          9.40
Zacatecas                        9.06

Fuente: elaboración de los autores con datos de DataMéxico

En la siguiente tabla observamos que porcentaje de la población total se encuentra catalogado en situación de pobreza de acuerdo con criterios del CONEVAL.

Tabla 4. Porcentaje de población en pobreza

                Porcentaje de población en pobreza
Aguascalientes                               34.41
Baja California                              30.32
Baja C. Sur                                  29.34
Campeche                                     46.13
Coahuila                                     26.07
Colima                                       33.94
Chiapas                                      75.41
Chihuahua                                    33.94
CDMX                                         28.16
Durango                                      45.26
Guanajuato                                   45.20
Guerrero                                     67.33
Hidalgo                                      51.94
Jalisco                                      35.88
EDOMEX                                       45.31
Michoacan                                    55.99
Morelos                                      45.92
Nayarit                                      39.72
Nuevo Leon                                   19.91
Oaxaca                                       67.56
Puebla                                       61.22
Queretaro                                    36.13
Quintana Roo                                 33.98
San Luis                                     48.94
Sinaloa                                      34.40
Sonora                                       30.87
Tabasco                                      51.08
Tamaulipas                                   38.93
Tlaxcala                                     56.13
Veracruz                                     57.42
Yucatan                                      44.98
Zacatecas                                    55.80

Fuente: elaboración de los autores con datos de DataMéxico

Finalmente dentro de esta sección se analiza el porcentaje de las personas hospitalizadas en relación a las personas aseguradas al IMSS que cuentan con salud publica gratuita, lo que nos indica que existen estados donde los hospitalizados ya rebasan el número de asegurados y con esto se busca analizar que tanto ha sito utilizada la estructura de la salud publica en lo que llevamos de pandemia, ya que cada persona hospitalizada representa un costo de mantenimiento de equipo y renovación de materiales para los trabajadores en hospitales públicos.

Tabla 5. Ocupación hospitalaria

                Porcentaje de utilización hospitalaria
Aguascalientes                                    3.60
Baja California                                   5.74
Baja C. Sur                                       5.55
Campeche                                          7.68
Coahuila                                          3.55
Colima                                            5.35
Chiapas                                           5.22
Chihuahua                                         6.97
CDMX                                              4.14
Durango                                           3.46
Guanajuato                                        3.86
Guerrero                                         10.87
Hidalgo                                           8.84
Jalisco                                           2.71
EDOMEX                                           11.36
Michoacan                                         4.67
Morelos                                           7.67
Nayarit                                           6.03
Nuevo Leon                                        2.64
Oaxaca                                            7.42
Puebla                                            6.82
Queretaro                                         2.72
Quintana Roo                                     14.33
San Luis                                          3.64
Sinaloa                                           6.78
Sonora                                            6.37
Tabasco                                          11.68
Tamaulipas                                        3.64
Tlaxcala                                          7.37
Veracruz                                          6.52
Yucatan                                           5.72
Zacatecas                                         1.57

Fuente: elaboración de los autores con datos de DataMéxico

Desempeño y pronóstico de la actividad económica

Se realiza un pronóstico de la actividad económica mediante algoritmos de Machine Learning (ML) del tipo de regresión para determinar el nivel de importancia de las variables, la diferencia elemental entre los modelos presentados y los modelos econométricos clásicos reside en el trade-off entre agregar sesgo a los parámetros con el fin de reducir la varianza de los datos.

En este punto cabe recalcar que todos los modelos que se contemplan provienen de alguna variación del modelo de regresión lineal múltiple que presenta la siguiente forma:

\[\beta = Min \sum_{i=1}^n\left (y_i-\beta_0-\sum_{j=1}^p\beta_jx_{ij}\right)^2 \] De acuerdo con (Hastie, Tibshirani, & Friedman, 2017), la regresión Ridge penaliza las variables introduciendo la ecuación original el cuadrado del valor de la pendiente de las de las variables de modo que minimice suma de los residuos al cuadrado de la siguiente manera.

\[\beta = Min \sum_{i=1}^n\left (y_i-\beta_0-\sum_{j=1}^p\beta_jx_{ij}\right)^2+\lambda\sum_{j=1}^p\beta_j^2 \] Dónde \(\lambda\) representa el tamaño de la regularización: mientras más grande, más grande será la regularización. El tercer tipo de regulariación que se abordó para medir la relación entre las variables es el tipo de regularización Elastic-Net introducida por primera vez por (Zou & Hastie, 2005) que es una combinación de las penalizaciones lasso y ridge. Donde tenemos ahora un parámetro adicional \(\alpha\) que tiene un rango de valores entre 0 y 1. Si \(\alpha=0\), ElasticNet se comportará como Ridge, y si \(\alpha=1\), se comportará como Lasso. Por lo tanto, nos brinda todo el espectro lineal de posibles combinaciones entre estos dos extremos. Otro tipo de modelos que se aplica un tipo de regresión del tipo robusto la cual reduce la sensibilidad sobre outliers . Para este caso en particular se utiliza una función de pérdidas o de error conocido como Huber y que según (Huber & Ronchetti, 2009).

La función de pérdidas de Huber es cuadratica si los errores son pequeños y lineal si son grandes, en ese sentido si alcanza el umbral \(\epsilon\geq 0\), entonces los datos son tratados como atipicos y regularizados para disminuir su influencia.

Según (Hastie, Tibshirani y Friedman, 2009), los algoritmos Random forest y arboles aleatorios, dichos modelos también se especificaron para el pronóstico del IGAE al igual que los modelos Gradient Boosting Trees que son una suma de dicho árbol, pero con la particularidad de que se induce de manera progresiva por etapas. En cada paso del procedimiento progresivo por etapas.

En este sentido el modelo tiene por objetivo pronósticar el desempeño del Indice Global de Actividad Económica (IGAE) mediante 21 variables de entrada preoprocesadas mediante análiis de componentes principales y posteriormente estandarizadas para formar 14 componentes principales para pronósticar.

Las variables utilizadas para pronosticar son los siguientes indicadores: el Indicador del consumo en el mercado inetrior, actividad industrial, el indicador adelantado del sistema de componentes ciclicos, la inversión fija bruta residencial, en construcción maquinaria y equipo, la actividad industrial en construcción, manufacturera, el indice nacional de precios (INPC) subayacente de mercancias del componente no subyacente: el indice de agropecuarios y energeticos, así como las exportaciones manufactureras, petróleras y automotrices.

Para desarrollar el modelo, se dividió la base de datos en set pruebas con el 80% de la base original y el restante se utilizó para validar los resultados, ajustar los hiperparametros de los modelos y finalmente pronósticar. Para validar los modelos se utilizó k-fold Cross Validation, debido a que el ajuste que se realiza dentro de los arboles quean los modelos de Gradient Boosting Trees y Random Forest asume que cada fila de datos es independiente entre sí y en este sentido la estimación podría ’ignorar’ la tendencia de la serie, al utilizar validación cruzada se toman diferentes ventanas temporales asegurando que no se pierda la tendencia de la variable. Dicha técnica consiste en dividir los datos de forma aleatoria en k grupos de aproximadamente el mismo tamaño (7 para este caso), k-1 grupos se emplean para entrenar el modelo y uno de los grupos se emplea como test, este proceso se repite k veces utilizando un grupo distinto como test en cada iteración. En este sentido, se elige el modelo que minimiza el error cuadrático medio (Mean Square Error MSE).

Posteriormente se realizó el pronóstico para los meses posteriores hasta el mes de febrero de 2021. El algoritmo se llevo a cabo en Python y a continuación se muestran los resultados del performance:

Tabla 6. Resultados de los modelos

Modelo MSE R^2 (%)
Ridge 0.018939 97.76
Elastic-Net 0.023317 97.4
Huber 0.022824 97.45
Random Forest 0.0263 99.60
Gradient Boosting 0.03221 99.99

Fuente: elaboración de los autores con datos de DataMéxico

En el caso de los modelos parámetricos no se muestran los coeficientes debido a que al ser procesado mediante Análisis de Componentes Principales, se pierde por completo la interpretación de los parámetros. En el siguiente gráfico se aprecia el pronóstico de validación del IGAE, cabe destacar que los modelos no son entrenados con estos datos por lo que no conocen estos datos.

Figura 5. Validación de los modelos

validacion

Fuente: elaboración de los autores con datos de DataMéxico

Finalmente se aprecia el pronóstico con los diferentes modelos en el siguiente gráfico.

Figura 6. Pronóstico de la actividad económica

pronostico

Fuente: elaboración de los autores con datos de DataMéxico

Dados los resultados del pronóstico, se concluye que el último repunte de la actividad económica fue por efecto rebote después de la contracción historica provocada por la pandemia Covid-19, en ese sentido se espera que la actividad económica recupere su ritmo de crecimiento hasta el primer mes de 2021. Encontramos un área de oportunidad en la inversión fija bruta pública ya que según (Moreno-Brid, Pérez-Caldentey, Sandoval, & Valverde, 2016), la inversión pública cuenta con un gran efecto de arrastre sobre la actividad económica, esto aunado a que el sector de la construcción lleva varios meses contrayendose y es uno de los sectores que implica altos niveles de empleo y producción.

Referencias

[1] Aikman, D., Kiley, M., Jung Lee, S., Palumbo, M., & Warusawitharana, M. (2017). Mapping heat in the U.S. financial system. Journal of Banking & Finance, 81, 36-64.

[2] Hastie, T., Tibshirani, R., & Friedman, J. (2017). The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Stanford: Springer.

[3]Moreno-Brid, J. C., Pérez-Caldentey, E., Sandoval, J. K., & Valverde, I. (2016). Inversión Cambio Estructural y crecimiento . Revista de Economía Mexicana, 215-258.

[4] Zou, H., & Hastie, T. (2005). Regularization and variable selection via the elastic net,. Journal of the Royal Statistical Society Series B, 301-320.