Este estudio se inició con el propósito de investigar el impacto del COVID relacionándolo, a nivel espacial, con las condiciones climáticas en los diferentes territorios españoles.
El hecho de la derivación de competencias sanitarias a las comunidades autónomas (CCAA) ha revertido en la implementación de sistemas de información independientes que, a la hora de requerir de recopilaciones y acciones centralizadas y globales, dificulta gravemente el acopio de información efectiva para la toma de decisiones rápidas. Es más, ni todas las CCAA recopilan el mismo tipo de información bajo estándares protocolarizados comunes, ni se publican uniformemente bajo principios básicos de transparencia a la comunidad, obstaculizando en consecuencia, el análisis por la comunidad científica y la posibilidad de que la Administración pueda abastecerse de dichos análisis para la toma de decisiones efectivas.
La búsqueda de información se inició a nivel de Ministerio, que sólo poseía información agregada por CCAA. Para conseguir información desagregada por región, fue necesario acceder a las páginas web de las consejerías de sanidad en cada CCAA. Sólo se consiguió información accesible pública en seis CCAA. Además, la única información común susceptible de ser tratada de forma conjunta fue la relativa a casos confirmados de contagio por COVID, en ocasiones disponible por departamento de salud y en otras agregada por municipio. Ni siquiera existe homogeneidad en los periodos disponibles con captación/registro de información sobre la pandemia por COVID. En lo que sigue, el aglomerado geográfico mínimo para el que existe información desagregada pública será referido como “zona”.
La información climatológica se recopiló atendiendo a la información disponible para cada CCAA, localizando la estación meteorológica más próxima a cada zona, así como los datos registrados durante el período de captación de contagios.
La información sobre el volumen habitanteslacional de las diversas zonas disponibles fue extraída del INE.
Finalmente, los objetivos de realizar un estudio espacial que permitiera identificar patrones de la epidemia explicados por las condiciones climáticas, hubo de ser desestimado por la inexistencia de datos públicos en territorios contiguos, además de por la heterogeneidad en las fechas de registro de datos, y la ausencia de más información compartida adicional al número de contagios confirmados y que pudiera utilizarse como variables complementarias para visualizar el impacto real de la pandemia.
Se muestra a continuación, para las únicas CCAA en las que se ha localizado información desagregada, el número de registros disponibles, así como las fechas de inicio y fin para los datos accesibles, y el ordinal de la semana de inicio (de datos) y la final.
| CCAA | Nºregistros | Desde | Hasta | Semana.ini | Semana.fin |
|---|---|---|---|---|---|
| Castilla y Leon | 13554 | 2020-03-01 | 2020-05-29 | 09 | 22 |
| Euskadi | 12917 | 2020-03-21 | 2020-05-29 | 12 | 22 |
| Catalunya | 7470 | 2020-02-28 | 2020-05-29 | 09 | 22 |
| Madrid | 15681 | 2020-02-27 | 2020-05-29 | 09 | 22 |
| Navarra | 1624 | 2020-03-26 | 2020-05-29 | 13 | 22 |
| Comunitat Valenciana | 1012 | 2020-04-13 | 2020-05-26 | 16 | 22 |
Así pues, el único periodo común en el registro de información para todas las CCAA disponibles es del 13 de abril al 12 de mayo. Excluyendo la Comunidad Valenciana, en las cinco restantes se comparte información durante el período del 21 de marzo al 12 de mayo del año 2020 (esto es, entre las semanas 12 a la 20 del año 2020).
Este hecho dificulta sin duda, la comparación temporal entre comunidades, con el agravante para la C.Valenciana, en la que no se dispone de información durante el primer mes crítico de confinamiento, en el que el volumen de contagios fue mayor.
Los objetivos de este estudio se confinan pues, a mostrar, de modo global y en los territorios (CCAA) disponibles, el impacto del COVID19, y encontrar relaciones con variables climatológicas que puedan predecir qué zonas/condiciones son más y menos propicias para la propagación de la pandemia.
Para ello, se muestran de modo global y deslocalizado por zona en cada CCAA:
Se muestran a continuación las series temporales disponibles para las tasas por días (por 1.000 habitantes, calculadas a partir del cociente entre el número de casos diarios y la habitanteslación en cada zona) a lo largo del período accesible a nivel global (toda España) y para cada CCAA. Sólo hay información completa para las 6 CCAA entre el 13 de abril y el 12 de mayo de 2020. Se distinguen en los gráficos, una zona blanca central para el período de confinamiento total, y zonas sombreadas en gris para las restantes.
Los gráficos a continuación son interactivos (en formato web) y permiten hacer zoom sobre el periodo temporal de registro.
Es preciso incidir de nuevo en que no se disponen de datos globales (para todas las zonas incluidas en el estudio) durante el periodo completo visualizado de modo global sobre el territorio español. Hay fechas en las que se dispone de datos sólo para algunas CCAA.
En la Comunitat Valenciana se aborda un análisis pormenorizado por provincias durante el período de datos disponibles, y se muestra a continuación. Como puede comprobarse, la provincia muestra picos de contagios más severos es Castellón.
A la vista de los gráficos presentados, es evidente la fuerte componente estacional apreciada cada una de las semanas, en las que se dan picos de casos entre el lunes y el viernes, y se produce un descenso considerable el fin de semana. No se ha dado una justificación sanitaria a este descenso. La cadencia de un día en la publicación de lo registrado, provoca que fueran los domingos y lunes los días en los que el número de contagios reportados era más bajo. Esta estacionalidad semanal nos remite a la necesidad de replantear el estudio desde una perspectiva temporal agregada por semanas, que nos hace perder en consecuencia la información climatológica individual de cada uno de los días disponibles.
Se presenta a continuación la incidencia final (el último día reportado en la base de datos para cada zona) del COVID, representada en tasas de incidencia de contagios confirmados por cada 1000 habitantes, y geolocalizada (longitud-latitud) en las zonas disponibles.
Remarcar de nuevo la interpretación sesgada de estos gráficos, restringidos a los periodos y datos registrados para cada zona, en algunas de ellas como la Comunidad Valenciana, sin las cifras más voluminosas de contagios durante el primer mes de confinamiento.
Al representar conjuntamente todos los datos, en términos de tasas (casos por cada 1000 habitantes) surge el esquema espacial que se visualiza en el siguiente mapa a continuación. La desconexión entre CCAA con datos públicos, la divergencia temporal de los datos disponibles y el hecho añadido de que dichos datos se refieren a contagios detectados durante la etapa de confinamiento total, con mínimas salidas de los hogares y mínimos desplazamientos, reduce sustantivamente la posible detección de un patrón de contagios con componente espacial con interrelación entre zonas colindantes, incluso siquiera en la misma CCAA.
## OGR data source with driver: ESRI Shapefile
## Source: "/Users/asunmayoral/Dropbox/ESTADISTICA/COVID-ua-umh/mapas/ESP_adm/ESP_adm1.shp", layer: "ESP_adm1"
## with 18 features
## It has 9 fields
## Integer64 fields read as strings: ID_0 ID_1
## OGR data source with driver: ESRI Shapefile
## Source: "/Users/asunmayoral/Dropbox/ESTADISTICA/COVID-ua-umh/mapas/ESP_adm/ESP_adm2.shp", layer: "ESP_adm2"
## with 52 features
## It has 11 fields
## Integer64 fields read as strings: ID_0 ID_1 ID_2
La CCAA con mayor calidad en los datos es Castilla-León, que proporciona datos en el mayor rango de fechas de los disponibles. La incidencia en dicha CCAA viene pues bien representada a través de la Figura.i2, en la que se aprecia un impacto alto en términos de tasas de contagio, en comparación con el resto de CCAA. La comparación no obstante es inviable realizarla a efectos de valorar el impacto de la pandemia, al no disponer de todos los datos para el periodo completo de recogida de información en todas las zonas. El impacto tan bajo en la C.Valenciana, aparentemente patente en la Figura.i7, no es real, al contener exclusivamente los datos de contagios a partir de mitad del mes de abril.
Ante la fuerte componente estacional debida al día de la semana en el número de contagios registrados, se planteó agrupar por semanas y representar así la información agrupada por número total de contagios registrados durante una semana completa, de lunes a domingo, en cada una de las zonas en la base de datos. Los resultados se muestran a continuación.
A lo largo de las semanas para las que se dispone de información, se visualiza en la Figura.e1, todas las tasas (por zona) agregadas para cada semana. La variabilidad, como se comprueba en dicha figura, es muy grande entre las distintas zonas de una misma CCAA, salvo en las CCAA de Navarra y C.Valenciana. La Figura.e2 contiene la información agregada por semana y por CCAA; a través de esta representación se observa con claridad el alto impacto de la pandemia en la Comunidad de Castilla y León, diferenciado claramente del resto de CCAA entre las semanas 12 y 17, esto es, entre el 16 de marzo y el 26 de abril.
Visualizamos así mismo, las características climáticas que podrían ser más relevantes al correlacionarlas con los contagios. Del estudio realizado por el equipo UA, se propone la utilización de la temperatura mínima. Añadimos como posible condicionante, la máxima diferencia de temperatura registrada en cada semana. Al haber agregado por semana, esta información se queda reducida a las temperaturas: mínima temperatura registrada (de entre las mínimas diarias), máxima diferencia de temperaturas registrada en la semana (diferencia entre la máxima de todas las máximas diarias y la mínima de las mínimas diarias). Las características geográficas no se alteran tras la agregación.
A partir de la visualización de las tasas de incidencia de contagios -en escala logarítmica-, agregadas por semanas y diferenciadas por zonas, en función de la temperatura mínima, se aprecia en la Fig.c1, mayor intensidad de color en la zona de Castilla y León para los datos registrados en semanas con temperaturas mínimas por debajo de 0ºC (mapa superior izquierdo). El color pierde intensidad con la tasa de incidencia, y se vuelve muy ténue (menos rigor de la pandemia) cuando la temperatura mínima está por encima de 10ºC (mapa inferior izquierdo).
El mapa etiquetado “NA” corresponde a registros sin datos climáticos.
A la hora de correlacionar tasas y condiciones climáticas, se consideran las tasas en escala logarítmica. Las tendencias apreciadas se muestran en la Fig.c2: a mayor temperatura mínima, menor es la incidencia, a pesar de la gran variabilidad. Navarra y Comunitat Valenciana no muestran una tendencia clara, como era de esperar, al no ofrecer datos de valor durante la etapa más crítica de la pandemia. Este hecho estaría avalando una menor incidencia del COVID en las zonas más cálidas.
Al representar las tasas agregadas (por semana y CCAA) en términos de la máxima diferencia de temperatura en cada semana, se observa una acumulación de datos y aumento de intensidad, cuando la diferencia es superior a 10 e inferior a 20 (mapa superior derecho en la Fig.c3), que identifica a zonas con alta variación de temperatura. Sin embargo no se aprecia un patrón claro de comportamiento.
El mapa etiquetado “NA” en la Fig.c3 corresponde a registros sin datos climáticos.
Repetimos el graficado de condiciones climáticas versus incidencia, ahora con la máxima diferencia de temperaturas diarias registradas en una semana y el logaritmo de las tasas de incidencia acumuladas por semana (ver Figura c4). Se aprecia cierta tendencia ligeramente creciente en todas las CCAA salvo en Madrid, pero una gran variabilidad, por lo que sería preciso completar la información que proporciona esta variable climática, con otra geográfica complementaria como la altitud, que podría ayudar a distinguir zonas más cálidas de zonas más frías.
A la vista de los análisis descriptivos previos, se proponen sendas modelizaciones con la finalidad de predecir la incidencia de la pandemia por COVID19 (por semana) en función de factores temporales, geográficos y climáticos.
Se ha optado por modelos lineales sencillos que estiman la incidencia para cada semana y en cada zona geográfica, en función de las condiciones climáticas y geográficas observadas.
Se predice la incidencia de la pandemia en términos de tasas de incidencia (por 1000 habitantes), transformadas previamente por el logaritmo. Para evitar indefiniciones (log(0)), las tasas se calculan a partir del número de casos incrementado en una unidad, y dividido por el tamaño de la población.
El efecto geográfico estará descrito por la CCAA o por la provincia.
El efecto temporal estará descrito por la semana, con la que se pretende captar la evolución de la pandemia a lo largo del tiempo. Puesto que no todas las zonas geográficos ofrecen datos todas las semanas tratadas, el efecto temporal ha de especificarse anidado en la zona geográfica, de modo que sólo se estime el contagio para cada zona en aquellas semanas en las que hay datos disponibles.
El efecto climático estará descrito en cada uno de los dos modelos propuestos por:
## $tmin_sem
##
## $ccaa_sem
##
## $Semana
Según este modelo, cuanto mayor es la temperatura mínima, menor es la incidencia de la pandemia (ver la Fig.m1). Este efecto de la temperatura ha sido mayor o menor dependiendo de la CCAA, como se muestra en la Fig.m4, con líneas de colores diferentes (todas decrecientes) para las diferentes CCAA. Tan solo en la Comunidad Valenciana el efecto es distinto al resto debido a las deficiencias/limitaciones de la información disponible.
Cataluña de forma destacada manifiesta una variabilidad notoria (Fig.m2) que no es capaz de ser cuantificada por el modelo ajustado. También Navarra y Comunidad Valenciana muestran una variabilidad superior al resto de CCAA por la escasez y variabilidad de los datos disponibles durante el periodo estudiado. . La calidad de los datos es superior en Castilla-León, Euskadi y Madrid, que son bien explicadas por el modelo.
El modelo es capaz de estimar eficientemente la evolución de la pandemia a lo largo de las semanas disponibles (ver Figura m3), siendo la semana 13 en la que se alcanzó el pico y a partir de la cual comenzó
Según este modelo, cuanto mayor es la diferencia de temperaturas extremas en una semana, mayor es la incidencia de la pandemia (ver la Fig.m5). También a mayor altitud, mayor incidencia de la enfermedad (ver Fig.m6), al estar asociadas las altitudes grandes con zonas de clima más frío.
El modelo es capaz de captar la evolución de la pandemia a lo largo de las semanas disponibles (ver Fig.m7), siendo la semana 13 en la que se alcanzó el pico y a partir de la cual comenzó la desescalada, con un leve repunte durante la semana 19.
Los modelos considerados muestran el efecto de las variables climáticas sobre la tasa de contagios. Aunque se parten de diferentes variables para construirlos en ambos casos se obtienen resultados significativos.
En el primero de ellos se demuestra el efecto negativo de la temperatura mínima durante la etapa de confinamiento: temperaturas bajas propician los contagios, mientras que temperaturas altas los reducen.
En el segundo modelo, cuanto mayor es la diferencia diaria de temperaturas y mayor es la altitud de una región, mayor es la incidencia de contagios.
En consecuencia, ambos modelos favorecen para una menor tasa de contagios, regiones con altas temperaturas, mínima variación diaria y bajas altitudes.
El informe completo realizado en colaboración Universidad de Alicante y Universidad Miguel Hernández, está disponible en este enlace.