INTRODUCCIÓN

La pandemia del COVID-19 generó una gran cantidad de información que permitió analizar el comportamiento de la enfermedad desde diferentes perspectivas demográficas, temporales y geográficas. El uso de técnicas de visualización de datos facilita la exploración de estos conjuntos de información, permitiendo identificar patrones, tendencias y relaciones que apoyan la comprensión del fenómeno epidemiológico.

En el presente trabajo se realiza un análisis exploratorio de datos sobre los casos de COVID-19 reportados en Colombia, utilizando diferentes herramientas de visualización y técnicas estadísticas. A través de diagramas de caja, gráficos temporales, mapas geográficos y análisis de agrupamiento, se examinan variables relacionadas con la edad de los pacientes, estado de los casos, origen del contagio y distribución territorial de la enfermedad.

El propósito de este análisis es identificar comportamientos relevantes en la evolución del COVID-19, reconocer las regiones con mayor afectación y evidenciar diferencias entre departamentos a partir de sus características epidemiológicas. De esta manera, se busca demostrar cómo la visualización de datos constituye una herramienta fundamental para transformar datos en información útil, facilitando la interpretación de resultados y apoyando la toma de decisiones basada en evidencia.

PREGUNTA DE INVESTIGACIÓN

¿Cómo se distribuyeron y comportaron los casos de COVID-19 en Colombia desde una perspectiva demográfica, temporal y geográfica, y qué patrones pueden identificarse mediante técnicas de visualización de datos?

ANÁLISIS EXPLORATORIO DE VARIABLES DEMOGRÁFICAS Y EPIDEMIOLÓGICAS COVID 19

Los hallazgos exploratorios obtenidos a partir de los diagramas de caja y bigotes evidencian que los pacientes fallecidos presentan edades significativamente mayores, mientras que los casos asintomáticos se concentran principalmente en población joven. Asimismo, se observa que los casos importados predominaron durante las etapas iniciales de la pandemia. En cuanto a la distribución geográfica, Bogotá, Cali y Medellín registran la mayor concentración de casos, y, en términos generales, la mayoría de los pacientes reportados corresponden a casos recuperados.

EVOLUCIÓN TEMPORAL Y DISTRIBUCIÓN TERRITORIAL DE LOS CASOS DE COVID-19 EN COLOMBIA

El análisis muestra que los casos de COVID‑19 en Colombia fueron bajos al inicio, pero aumentaron rápidamente desde el segundo semestre, alcanzando picos superiores a 12.000 casos diarios y presentando alta variabilidad asociada a factores como movilidad y medidas sanitarias.

La distribución de los contagios fue desigual entre departamentos: Bogotá concentró la mayor cantidad de casos, seguida por Antioquia y Valle del Cauca, debido a su alta densidad poblacional y actividad económica. Otros departamentos presentaron niveles intermedios o bajos, evidenciando que la propagación se concentró principalmente en grandes centros urbanos.

En conclusión, la evolución de la pandemia estuvo fuertemente influenciada por factores demográficos y geográficos, destacando a las principales ciudades como focos de transmisión y áreas clave para la toma de decisiones en salud pública.

ANÁLISIS GEOESPACIAL DE LA DISTRIBUCIÓN DE CASOS DE COVID-19 EN COLOMBIA

El análisis geoespacial muestra que los casos de COVID‑19 en Colombia se concentraron principalmente en los grandes centros urbanos, destacando Bogotá D.C., Antioquia y Valle del Cauca, siendo Bogotá el territorio con mayor número de contagios. Esta concentración se asocia a factores como alta densidad poblacional, movilidad y actividad económica, que favorecen la transmisión del virus. La distribución no fue homogénea, ya que las regiones menos urbanizadas y periféricas presentaron menor incidencia, posiblemente por menor conectividad y movilidad. En general, la propagación se concentró en el centro y occidente del país, evidenciando un patrón principalmente urbano. En conclusión, este análisis permite identificar las zonas más afectadas y resalta la importancia de estos resultados para orientar decisiones en salud pública y priorizar estrategias de control.

AGRUPAMIENTO DE REGIONES SEGÚN CARACTERÍSTICAS EPIDEMIOLÓGICAS

El análisis de clustering muestra que los departamentos de Colombia presentan comportamientos epidemiológicos diferenciados según variables como casos, fallecidos y recuperados. Se identifican grupos con características similares, lo que permite clasificar los territorios en clusters.

Un grupo pequeño, como Amazonas y Antioquia, presenta patrones atípicos frente al resto: Antioquia por su alta concentración de casos y Amazonas por sus condiciones de vulnerabilidad. Otro conjunto agrupa departamentos con niveles intermedios de contagio y dinámica poblacional similar, mientras que un tercer grupo incluye territorios con mayor interacción social y mayor intensidad de la pandemia, destacando Bogotá D.C.

En general, el análisis evidencia que el impacto del COVID‑19 fue heterogéneo y estuvo influenciado por factores como urbanización, densidad y movilidad. Esta segmentación es útil para orientar estrategias de salud pública y focalizar recursos según las características de cada región.

CONCLUSIONES

• Los casos de COVID 19 en Colombia se distribuyeron de manera desigual, concentrándose principalmente en Bogotá D.C., Antioquia y Valle del Cauca.

• Las visualizaciones temporales muestran un crecimiento acelerado de contagios entre junio, julio y agosto de 2020, periodo en el cual se alcanzaron los picos más altos de casos diarios.

• El análisis geográfico evidenció que las regiones con mayor urbanización, conectividad y movilidad presentaron mayores niveles de propagación del virus.

• El análisis demográfico mostró que los fallecimientos se concentraron principalmente en personas de mayor edad, indicando una mayor vulnerabilidad en este grupo poblacional.

• El clustering jerárquico permitió identificar patrones y segmentar los departamentos en grupos con comportamientos epidemiológicos similares.

• Se identificaron comportamientos atípicos en departamentos como Antioquia y Amazonas frente al resto del país.

• Las técnicas de visualización facilitaron la identificación de patrones espaciales y focos de contagio en el territorio nacional.

• En conjunto, el análisis permitió identificar patrones demográficos, temporales y geográficos del COVID 19, evidenciando la influencia de factores como densidad poblacional y movilidad, y demostrando la utilidad de la visualización y minería de datos para apoyar la toma de decisiones en salud pública.