Universidad del Norte
Maestría en estadística Aplicada
Visualización de Datos en R y python
Docente:
Mauricio Alejandro Mazo Lopera
Autores:
Juan Jacob Daza Giraldo
Martin Jose Morales Jimenez
Diciembre 2020
Introducción
La pandemia de COVID-19 no tiene precedentes en los últimos tiempos en términos de mortalidad, morbilidad, discapacidad y costo monetario. En Colombia se han adoptado diferentes medidas de prevención y control para frenar la transmisión y así reducir los efectos asociados. Conforme avanza la pandemia las ciudades del país se enfrentan a los diferentes escenarios de transmisión bajo los cuales algunas han intensificado las medidas al tiempo que otros las relajan.
Para el propósito de este informe de indicadores se trabajará con la ciudad de Barranquilla, entendiendo que es una de las principales capitales en el país, por tanto, presenta más riesgo de propagación por sus densidades poblacionales, mayor conectividad y mayor actividad económica.
El siguiente informe contiene resultados comparativos de los casos de COVID-19 en Colombia, los datos que se van a analizar en este documento, proceden de la compilación hecha por el Instituto Nacional de Salud INS. La fecha de este informe de indicadores epidemiológicos del COVID19 en Barranquilla se da 30 de Septiembre de 2020, utilizando la versión de compilación de datos del 30 de Noviembre de 2020.La información presentada por el INS muestra datos de sexo, edad, procedencia, estado y tipo de contagio, como también fechas relevantes para el seguimiento de la pandemia.
Barranquilla Población urbana: 1.274.250 habs
Objetivo General
Realizar un estudio descriptivo de indicadores epidemiológicos utilizando los registros de casos atribuidos a COVID-19 publicados por el Ministerio de Salud de Colombia para la ciudad de Barranquilla.
Objetivos especificos
Realizar una contextualización de la base de datos y de cada una de las variables dentro de ella.
Identificar y analizar valores faltantes, atípicos y posibles problemas de la base de datos planteando decisiones en torno a las situaciones presentadas.
Caracterizar la frecuencia de los casos de contagio de acuerdo a las variables sexo y edad con fin de establecer los grupos focales de mayor presencia.
Caracterizar la frecuencia de los casos de contagio de acuerdo a la variable tipo de atención recibida.
Determinar las tasas de incidencia, letalidad y mortalidad a partir de la distribución de casos fallecidos desde el primer día de contagio.
Análisis de los datos
El manejo, preparación y análisis de los datos fue realizado utilizando el programa Rstudio.
El procedimiento técnico fue el siguiente:
Lectura e identificación de variables, nombres y estructura de la base de datos, y se hizo una limpieza de los nombres, así como el paso a minúsculas de los mismos. Para esto se utilizó la función Clean_names del paquete janitor. A partir de este paso se hizo una segunda lectura y se verificó la naturaleza de las variables y la forma como el programa las estaba tipificando.
Las variables de reporte, notificación, inicio de síntomas, fecha de muerte, fecha de diagnóstico, fecha de recuperación, se transformaron para ser expresadas en año, mes, día, de tal forma tengan la misma organización y esten en formato date.
Sexo, tipo_de_contagio, ubicacion_del_caso, estado, nombre_del_pais, recuperado, tipo_de_recuperacion, nombre_del_grupo_etnico.
Se revisó la variable sexo, y sus respectivos niveles para identificar errores, el mismo procedimiento ocurrió con la variable tipo de contagio, donde se hizo una corrección de uno de sus niveles que presentaba errores. Para la variable Ubicación del caso se encontró que el nivel “Casa” estaba escrita de diferentes maneras y se realizó una unificación de su sintaxis. En la variable Estado del paciente correspondió el mismo proceso con el nivel “Leve”. En la variable Recuperado, encontramos el nivel “Fallecido” con diferentes escrituras.
Análisis de NA
Para el análisis de los NA se identificaron filas inicialmente, luego se completaron casos faltantes, y en el tercer paso se graficaron dichos valores. En el análisis de la variable recuperado remplazamos algunos NA de la variable con fallecidos utilizando aquellos que presentaban fecha de muerte, el resto NA de la variable recuperados se ubicaron en el nivel “activos” debido están en proceso de estudio.
No se encontraron datos atípicos en las variables que se escogieron para el estudio.
| Sexo | Porcentaje |
|---|---|
| F | 48.44 |
| M | 51.56 |
En barranquilla el porcentaje de Mujeres contagiadas de acuerdo a la población total de contagiados es del 48,44%, y el porcentaje de hombres es del 51,56% con respecto a la misma población.
| R. Feminidad | R. Masculinidad |
|---|---|
| 0.94 | 1.06 |
En Barranquilla durante el año 2020, la razón de feminidad fue 0.94 a 1. Es decir, por cada 9 mujeres contagiadas, tenemos 10 hombres contagiados.
Tabla 3. Distribución porcentual por edad en rangos de 10 años
| Rango de Edad(años) | Frec | Frec Rel | Porcentaje | F acum | % acum |
|---|---|---|---|---|---|
| [0,10) | 1729 | 0.04 | 3.54 | 1729 | 3.54 |
| [10,20) | 3043 | 0.06 | 6.23 | 4772 | 9.78 |
| [20,30) | 9861 | 0.20 | 20.20 | 14633 | 29.98 |
| [30,40) | 11403 | 0.23 | 23.36 | 26036 | 53.33 |
| [40,50) | 7987 | 0.16 | 16.36 | 34023 | 69.70 |
| [50,60) | 6755 | 0.14 | 13.84 | 40778 | 83.53 |
| [60,70) | 4410 | 0.09 | 9.03 | 45188 | 92.57 |
| [70,80) | 2228 | 0.05 | 4.56 | 47416 | 97.13 |
| [80,90) | 1128 | 0.02 | 2.31 | 48544 | 99.44 |
| [90,100) | 264 | 0.01 | 0.54 | 48808 | 99.98 |
La Distribución porcentual por edad en rangos de 10 años permite determinar que en el grupo de edades de 20 a 60 años se concentra aproximadamente el 73% de la población contagiada. De este gran grupo encontramos que el intervalo de edad de 30 a 40 años presenta el porcentaje más alto de contagio con un valor del 23,36%, y el intervalo de edad con menor porcentaje se encuentra en el rango de lo 90 a 100 con un 0,54%.
Tabla 4. Porcentaje de Tipo de Atención a Contagiados
| % de Casa | % de Hospitalizados | % de UCI |
|---|---|---|
| 95.692 | 0.1536 | 0.0369 |
El porcentaje de casos hospitalizados de la población total de casos positivos es del 0,1536, lo que indica que por cada 10000 casos positivos tenemos 1536 de esos casos que llegan a proceso de hospitalización.
El porcentaje de casos asignados a la unidad de cuidados intensivos de la población total de casos positivos es del 0,0369, lo que indica que por cada 10000 casos positivos tenemos 369 de esos casos que llegan a proceso de UCI.
El porcentaje de casos atendidos en casa de la población total de casos positivos es del 95,692%, lo que indica que 9569 de cada 10000 personas contagiadas de covid-19, logra recuperarse.
Tabla 5. TASA (Incidencia, Letalidad y Mortalidad)
| Incidencia General | General | Hombre | Mujer | Mortalidad |
|---|---|---|---|---|
| 3.83 | 4.05 | 2.56 | 1.48 | 154.99 |
La tasa de incidencia general de contagios indica que la probabilidad de riesgo o contagio de la población Barranquillera total a la fecha es del 3,83%.
Para calcular la tasa de letalidad general por COVID 19 a la fecha del reporte trabajado en la base de datos Casos_positivos_de_COVID-19_en_Colombia.csv, se revisa el número de datos clasificados como muertos entre el número total de contagiados, por 100, lo que arroja un valor de 4,05%. Lo que indica que en Barranquilla para el año 2020, la tasa de letalidad general fue de 405 fallecidos por cada 10000 habitantes.
Para el caso de los hombres, en Barranquilla para el año 2020, la tasa de letalidad es del 2,56%, lo que indica que de 2 hombres por cada 100 habitantes.
Para el caso de los mujeres, en Barranquilla para el año 2020, la tasa de letalidad es de 1,48%, lo que indica que 14 mujeres por cada 1000 habitantes.
Para conocer el denominador de la tasa de mortalidad, se consultó la proyección del DANE para la población Barranquillera a la fecha de Diciembre de 2020: Población Total Barranquilla = 1274250 habitantes Para 2020 en la ciudad de Barranquilla la tasa de mortalidad por covid-19 es de 154 fallecidos por cada 100000 habitantes.
| Fecha Notificación |
|---|
| 140 |
Por último, se tiene como media de casos reportados diarios en los últimos 7 días en la ciudad de Barranquilla un total de 15 casos teniendo en cuenta que se evaluó a partir de la variable Fecha de notificacón, dado que los datos que esta nos permite visualizar son reportado en tiempo real, con respecto a la variable fecha de reporte web, que tiene algunos márgenes de retraso al reportar los casos diarios.
Concluciones
La frecuencia de casos atribuido a COVID-19 en hombre y mujeres fue heterogénea, no se encontraron diferencias significativas para la ciudad de Barranquilla. Durante el año 2020, la razón de feminidad fue 0.94a 1. Es decir, por cada 9 mujeres contagiadas, tenemos 10 hombres contagiados.
La variabilidad en los casos positivos atribuidos a COVID-19 en la ciudad están principalmente concentrados entres los 20 y 40 años donde se ubican casi el 50% de los casos. Es un indicador interesante para la toma de decisiones en torno al aislamiento que puede usar la administración de la ciudad para explicar causas y factores que incidan en estos aspectos. Por ejemplo, factores epidemiológicos y sociales de cada Barrio de la ciudad; así como por la etapa de la pandemia en la que se encontraban durante la fecha de recolección de datos.
Si bien las proporciones en niños y adolescentes no son altas al comparar con la población adulta, no dejan de ser datos importantes para la toma de decisiones. A pesar de reportar menos letalidad, es un grupo que tiene implicaciones por la posible capacidad de transmisibilidad a otros grupos de riesgo.
Esto se vuelve más pertinente por ser un grupo vulnerable, que se enfrenta a medidas de distanciamiento social especialmente en hogares de bajos recursos económicos, donde la falta de un trabajo estable, régimen de salud y protección social debida a la pobreza y al sector informal, lo exponen a una posibilidad más alta de riesgo.
Por último, se recomienda para futuros estudios evaluar el patrón de comportamiento de esta enfermedad de manera poblacional, mediante análisis de prevalencia o prevalencia cero. Siguiendo esta idea, podría explorarse si su ocurrencia será estacional, como ocurre con otras enfermedades virales.