Presentación

Column

Presentación

Universidad del Norte

Maestría en estadística Aplicada

Visualización de Datos en R y python

Docente:

Mauricio Alejandro Mazo Lopera

Autores:

Juan Jacob Daza Giraldo

Martin Jose Morales Jimenez

Diciembre 2020

Column

Introducción

Introducción

La pandemia de COVID-19 no tiene precedentes en los últimos tiempos en términos de mortalidad, morbilidad, discapacidad y costo monetario. En Colombia se han adoptado diferentes medidas de prevención y control para frenar la transmisión y así reducir los efectos asociados. Conforme avanza la pandemia las ciudades del país se enfrentan a los diferentes escenarios de transmisión bajo los cuales algunas han intensificado las medidas al tiempo que otros las relajan.

Para el propósito de este informe de indicadores se trabajará con la ciudad de Barranquilla, entendiendo que es una de las principales capitales en el país, por tanto, presenta más riesgo de propagación por sus densidades poblacionales, mayor conectividad y mayor actividad económica.

Contexto

El siguiente informe contiene resultados comparativos de los casos de COVID-19 en Colombia, los datos que se van a analizar en este documento, proceden de la compilación hecha por el Instituto Nacional de Salud INS. La fecha de este informe de indicadores epidemiológicos del COVID19 en Barranquilla se da 30 de Septiembre de 2020, utilizando la versión de compilación de datos del 30 de Noviembre de 2020.La información presentada por el INS muestra datos de sexo, edad, procedencia, estado y tipo de contagio, como también fechas relevantes para el seguimiento de la pandemia.

Barranquilla Población urbana: 1.274.250 habs

Objetivos

Column

Objetivos

Objetivo General

Realizar un estudio descriptivo de indicadores epidemiológicos utilizando los registros de casos atribuidos a COVID-19 publicados por el Ministerio de Salud de Colombia para la ciudad de Barranquilla.

Objetivos especificos

  • Realizar una contextualización de la base de datos y de cada una de las variables dentro de ella.

  • Identificar y analizar valores faltantes, atípicos y posibles problemas de la base de datos planteando decisiones en torno a las situaciones presentadas.

  • Caracterizar la frecuencia de los casos de contagio de acuerdo a las variables sexo y edad con fin de establecer los grupos focales de mayor presencia.

  • Caracterizar la frecuencia de los casos de contagio de acuerdo a la variable tipo de atención recibida.

  • Determinar las tasas de incidencia, letalidad y mortalidad a partir de la distribución de casos fallecidos desde el primer día de contagio.

Column

data

Análisis

Column

Análisis de los datos

Análisis de los datos

El manejo, preparación y análisis de los datos fue realizado utilizando el programa Rstudio.

El procedimiento técnico fue el siguiente:

  • Importación de la base de datos Casos_positivos_de_COVID-19_en_Colombia (1).csv", la cuál posteriormente se filtró por el municipio de Barranquilla.

Lectura e identificación de variables, nombres y estructura de la base de datos, y se hizo una limpieza de los nombres, así como el paso a minúsculas de los mismos. Para esto se utilizó la función Clean_names del paquete janitor. A partir de este paso se hizo una segunda lectura y se verificó la naturaleza de las variables y la forma como el programa las estaba tipificando.

  • Revisión de variables tipo fecha

Las variables de reporte, notificación, inicio de síntomas, fecha de muerte, fecha de diagnóstico, fecha de recuperación, se transformaron para ser expresadas en año, mes, día, de tal forma tengan la misma organización y esten en formato date.

  • Transformación de las siguientes variables tipificadas como caracteres a factores:

Sexo, tipo_de_contagio, ubicacion_del_caso, estado, nombre_del_pais, recuperado, tipo_de_recuperacion, nombre_del_grupo_etnico.

  • Revisión de variables por nivel

Se revisó la variable sexo, y sus respectivos niveles para identificar errores, el mismo procedimiento ocurrió con la variable tipo de contagio, donde se hizo una corrección de uno de sus niveles que presentaba errores. Para la variable Ubicación del caso se encontró que el nivel “Casa” estaba escrita de diferentes maneras y se realizó una unificación de su sintaxis. En la variable Estado del paciente correspondió el mismo proceso con el nivel “Leve”. En la variable Recuperado, encontramos el nivel “Fallecido” con diferentes escrituras.

Análisis de NA

Para el análisis de los NA se identificaron filas inicialmente, luego se completaron casos faltantes, y en el tercer paso se graficaron dichos valores. En el análisis de la variable recuperado remplazamos algunos NA de la variable con fallecidos utilizando aquellos que presentaban fecha de muerte, el resto NA de la variable recuperados se ubicaron en el nivel “activos” debido están en proceso de estudio.

No se encontraron datos atípicos en las variables que se escogieron para el estudio.

Column

data

% y Razones por Género

Column

Gráfico 1

Column

Tabla 1. Porcentaje de hombres y mujeres

Tabla 1. Porcentaje de hombres y mujeres
Sexo Porcentaje
F 48.44
M 51.56

En barranquilla el porcentaje de Mujeres contagiadas de acuerdo a la población total de contagiados es del 48,44%, y el porcentaje de hombres es del 51,56% con respecto a la misma población.

Tabla 2. Razones de Feminidad y Masculinidad

R. Feminidad R. Masculinidad
0.94 1.06

En Barranquilla durante el año 2020, la razón de feminidad fue 0.94 a 1. Es decir, por cada 9 mujeres contagiadas, tenemos 10 hombres contagiados.

% por edad

Column

Gráfico 2

Column

Tabla 3. Distribución porcentual por edad en rangos de 10 años

Tabla 3. Distribución porcentual por edad en rangos de 10 años

Rango de Edad(años) Frec Frec Rel Porcentaje F acum % acum
[0,10) 1729 0.04 3.54 1729 3.54
[10,20) 3043 0.06 6.23 4772 9.78
[20,30) 9861 0.20 20.20 14633 29.98
[30,40) 11403 0.23 23.36 26036 53.33
[40,50) 7987 0.16 16.36 34023 69.70
[50,60) 6755 0.14 13.84 40778 83.53
[60,70) 4410 0.09 9.03 45188 92.57
[70,80) 2228 0.05 4.56 47416 97.13
[80,90) 1128 0.02 2.31 48544 99.44
[90,100) 264 0.01 0.54 48808 99.98

La Distribución porcentual por edad en rangos de 10 años permite determinar que en el grupo de edades de 20 a 60 años se concentra aproximadamente el 73% de la población contagiada. De este gran grupo encontramos que el intervalo de edad de 30 a 40 años presenta el porcentaje más alto de contagio con un valor del 23,36%, y el intervalo de edad con menor porcentaje se encuentra en el rango de lo 90 a 100 con un 0,54%.

% Tipos de Atención

Column

Gráfico 3

Column

Tabla 4. Porcentaje de Tipo de Atención a Contagiados

Tabla 4. Porcentaje de Tipo de Atención a Contagiados

% de Casa % de Hospitalizados % de UCI
95.692 0.1536 0.0369

El porcentaje de casos hospitalizados de la población total de casos positivos es del 0,1536, lo que indica que por cada 10000 casos positivos tenemos 1536 de esos casos que llegan a proceso de hospitalización.

El porcentaje de casos asignados a la unidad de cuidados intensivos de la población total de casos positivos es del 0,0369, lo que indica que por cada 10000 casos positivos tenemos 369 de esos casos que llegan a proceso de UCI.

El porcentaje de casos atendidos en casa de la población total de casos positivos es del 95,692%, lo que indica que 9569 de cada 10000 personas contagiadas de covid-19, logra recuperarse.

Tasas y Promedio

Column

Gráfico 4

Column

Tabla 5. TASA (Incidencia, Letalidad y Mortalidad)

Tabla 5. TASA (Incidencia, Letalidad y Mortalidad)

Tasas
Letalidad
Incidencia General General Hombre Mujer Mortalidad
3.83 4.05 2.56 1.48 154.99

La tasa de incidencia general de contagios indica que la probabilidad de riesgo o contagio de la población Barranquillera total a la fecha es del 3,83%.

Para calcular la tasa de letalidad general por COVID 19 a la fecha del reporte trabajado en la base de datos Casos_positivos_de_COVID-19_en_Colombia.csv, se revisa el número de datos clasificados como muertos entre el número total de contagiados, por 100, lo que arroja un valor de 4,05%. Lo que indica que en Barranquilla para el año 2020, la tasa de letalidad general fue de 405 fallecidos por cada 10000 habitantes.

Para el caso de los hombres, en Barranquilla para el año 2020, la tasa de letalidad es del 2,56%, lo que indica que de 2 hombres por cada 100 habitantes.

Para el caso de los mujeres, en Barranquilla para el año 2020, la tasa de letalidad es de 1,48%, lo que indica que 14 mujeres por cada 1000 habitantes.

Para conocer el denominador de la tasa de mortalidad, se consultó la proyección del DANE para la población Barranquillera a la fecha de Diciembre de 2020: Población Total Barranquilla = 1274250 habitantes Para 2020 en la ciudad de Barranquilla la tasa de mortalidad por covid-19 es de 154 fallecidos por cada 100000 habitantes.

Tabla 6. Promedio de casos reportados en los últimos 7 días

Promedio de reportes últimos 7 días
Fecha Notificación
140

Por último, se tiene como media de casos reportados diarios en los últimos 7 días en la ciudad de Barranquilla un total de 15 casos teniendo en cuenta que se evaluó a partir de la variable Fecha de notificacón, dado que los datos que esta nos permite visualizar son reportado en tiempo real, con respecto a la variable fecha de reporte web, que tiene algunos márgenes de retraso al reportar los casos diarios.

Conclusiones

Column

Column

Concluciones

Concluciones

La frecuencia de casos atribuido a COVID-19 en hombre y mujeres fue heterogénea, no se encontraron diferencias significativas para la ciudad de Barranquilla. Durante el año 2020, la razón de feminidad fue 0.94a 1. Es decir, por cada 9 mujeres contagiadas, tenemos 10 hombres contagiados.

La variabilidad en los casos positivos atribuidos a COVID-19 en la ciudad están principalmente concentrados entres los 20 y 40 años donde se ubican casi el 50% de los casos. Es un indicador interesante para la toma de decisiones en torno al aislamiento que puede usar la administración de la ciudad para explicar causas y factores que incidan en estos aspectos. Por ejemplo, factores epidemiológicos y sociales de cada Barrio de la ciudad; así como por la etapa de la pandemia en la que se encontraban durante la fecha de recolección de datos.

Si bien las proporciones en niños y adolescentes no son altas al comparar con la población adulta, no dejan de ser datos importantes para la toma de decisiones. A pesar de reportar menos letalidad, es un grupo que tiene implicaciones por la posible capacidad de transmisibilidad a otros grupos de riesgo.

Esto se vuelve más pertinente por ser un grupo vulnerable, que se enfrenta a medidas de distanciamiento social especialmente en hogares de bajos recursos económicos, donde la falta de un trabajo estable, régimen de salud y protección social debida a la pobreza y al sector informal, lo exponen a una posibilidad más alta de riesgo.

Por último, se recomienda para futuros estudios evaluar el patrón de comportamiento de esta enfermedad de manera poblacional, mediante análisis de prevalencia o prevalencia cero. Siguiendo esta idea, podría explorarse si su ocurrencia será estacional, como ocurre con otras enfermedades virales.