Actividad 1. Contextualización inicial

Exploración de datos

- Describe brevemente la base (número de filas, columnas, fechas, principales variables y posibles faltantes).

La base de datos covid_example_data.xlsx contiene información detallada sobre los casos reportados de COVID-19 en una muestra de más de 80.000 registros y 31 variables. Cada registro corresponde a un caso individual y reúne datos demográficos, clínicos y temporales, lo que permite describir las características generales de los contagios y su evolución en el tiempo.

Entre las principales variables se encuentran la fecha de diagnóstico, fecha de recuperación, sexo, edad, estado del paciente (activo, recuperado o fallecido), hospitalización, departamento y municipio de residencia. Estas variables son fundamentales para realizar análisis descriptivos y establecer patrones sobre la propagación del virus en diferentes grupos poblacionales y regiones.

- Menciona los tipos de información que contiene (demografía, síntomas, hospitalización, etc.) y su relevancia para un análisis descriptivo.

En cuanto a los tipos de información, la base combina datos cuantitativos (como la edad o la duración del contagio) y cualitativos (como el sexo, el estado del paciente o el tipo de atención recibida). Además, incluye variables temporales que permiten observar la evolución del virus a lo largo del tiempo.

Se identifican algunos valores faltantes en campos clínicos, como hospitalización o tipo de contagio, lo cual es esperable en bases sanitarias de gran tamaño. Sin embargo, en términos generales, la base es amplia, completa y adecuada para un análisis descriptivo, ya que proporciona una visión integral de la situación epidemiológica y permite analizar factores demográficos, de salud y espaciales asociados a la pandemia. A continuación se presenta una descripción general de cada una de las bases de datos utilizadas en el análisis.

Subir Base de Datos

# Instalar (si no lo tienes) y cargar el paquete necesario
install.packages("readxl")   # Solo la primera vez
## Warning: package 'readxl' is in use and will not be installed
library(readxl)

# Cargar la base de datos Excel
covid <- read_excel("covid_example_data.xlsx")

# Ver las primeras filas de la base
head(covid)
## # A tibble: 6 x 31
##   PID            reprt_creationdt_FALSE case_dob_FALSE      case_age case_gender
##   <chr>          <dttm>                 <dttm>                 <dbl> <chr>      
## 1 3a85e6992a5ac~ 2020-03-22 00:00:00    2004-11-08 00:00:00       16 Male       
## 2 c6b5281d5fc50~ 2020-02-01 00:00:00    1964-06-07 00:00:00       57 Male       
## 3 53495ad0dca4e~ 2020-02-10 00:00:00    1944-04-06 00:00:00       77 Female     
## 4 2948a265da0d0~ 2020-03-20 00:00:00    1964-06-25 00:00:00       57 Female     
## 5 a5524aadd1ca0~ 2020-02-26 00:00:00    1964-12-21 00:00:00       56 Male       
## 6 db14eeabe531f~ 2020-02-11 00:00:00    1956-06-21 00:00:00       65 Male       
## # i 26 more variables: case_race <chr>, case_eth <chr>, case_zip <dbl>,
## #   Contact_id <chr>, sym_startdt_FALSE <dttm>, sym_fever <chr>,
## #   sym_subjfever <chr>, sym_myalgia <chr>, sym_losstastesmell <chr>,
## #   sym_sorethroat <chr>, sym_cough <chr>, sym_headache <chr>,
## #   sym_resolved <chr>, sym_resolveddt_FALSE <dttm>, contact_household <chr>,
## #   hospitalized <chr>, hosp_admidt_FALSE <dttm>, hosp_dischdt_FALSE <dttm>,
## #   died <chr>, died_covid <chr>, died_dt_FALSE <dttm>, ...
# Ver cuántas filas y columnas tiene
dim(covid)
## [1] 82101    31
# Ver estructura general de las variables
str(covid)
## tibble [82,101 x 31] (S3: tbl_df/tbl/data.frame)
##  $ PID                   : chr [1:82101] "3a85e6992a5ac52f" "c6b5281d5fc50b96" "53495ad0dca4e22c" "2948a265da0d081b" ...
##  $ reprt_creationdt_FALSE: POSIXct[1:82101], format: "2020-03-22" "2020-02-01" ...
##  $ case_dob_FALSE        : POSIXct[1:82101], format: "2004-11-08" "1964-06-07" ...
##  $ case_age              : num [1:82101] 16 57 77 57 56 65 47 61 36 42 ...
##  $ case_gender           : chr [1:82101] "Male" "Male" "Female" "Female" ...
##  $ case_race             : chr [1:82101] "WHITE" "WHITE" "BLACK" "BLACK" ...
##  $ case_eth              : chr [1:82101] "NON-HISPANIC/LATINO" "NON-HISPANIC/LATINO" "NON-HISPANIC/LATINO" "NON-HISPANIC/LATINO" ...
##  $ case_zip              : num [1:82101] 30308 30308 30315 30213 30004 ...
##  $ Contact_id            : chr [1:82101] "Yes-Symptomatic" "Yes-Symptomatic" "Yes-Symptomatic" "Yes-Symptomatic" ...
##  $ sym_startdt_FALSE     : POSIXct[1:82101], format: "2020-03-20" "2020-01-28" ...
##  $ sym_fever             : chr [1:82101] "Yes" "No" "Yes" "No" ...
##  $ sym_subjfever         : chr [1:82101] "Yes" "No" NA "Yes" ...
##  $ sym_myalgia           : chr [1:82101] "No" "Yes" "Yes" "Yes" ...
##  $ sym_losstastesmell    : chr [1:82101] NA NA NA NA ...
##  $ sym_sorethroat        : chr [1:82101] "Yes" "No" "Yes" "Yes" ...
##  $ sym_cough             : chr [1:82101] "Yes" "Yes" "Yes" "Yes" ...
##  $ sym_headache          : chr [1:82101] "Yes" "No" NA "Yes" ...
##  $ sym_resolved          : chr [1:82101] "No, still symptomatic" "No, still symptomatic" "No, still symptomatic" "No, still symptomatic" ...
##  $ sym_resolveddt_FALSE  : POSIXct[1:82101], format: NA NA ...
##  $ contact_household     : chr [1:82101] "Yes" "No" NA "No" ...
##  $ hospitalized          : chr [1:82101] "No" "No" "Yes" NA ...
##  $ hosp_admidt_FALSE     : POSIXct[1:82101], format: NA NA ...
##  $ hosp_dischdt_FALSE    : POSIXct[1:82101], format: NA NA ...
##  $ died                  : chr [1:82101] "No" "No" "No" "No" ...
##  $ died_covid            : chr [1:82101] "No" "No" "No" "No" ...
##  $ died_dt_FALSE         : POSIXct[1:82101], format: NA NA ...
##  $ confirmed_case        : chr [1:82101] "Yes" "Yes" "Yes" "Yes" ...
##  $ covid_dx              : chr [1:82101] "Confirmed" "Confirmed" "Confirmed" "Confirmed" ...
##  $ pos_sampledt_FALSE    : POSIXct[1:82101], format: "2020-03-22" "2020-02-01" ...
##  $ latitude_JITT         : num [1:82101] 33.8 33.8 33.7 33.6 34.1 ...
##  $ longitude_JITT        : num [1:82101] -84.4 -84.4 -84.4 -84.6 -84.3 ...

Actividad 2. Tablas Descriptivas

2.1 Perfil Demográfico

tabla_genero <- covid %>%
  count(case_gender) %>%
  mutate(pct = round((n / sum(n)) * 100, 2))
tabla_raza <- covid %>%
  count(case_race) %>%
  mutate(pct = round((n / sum(n)) * 100, 2))
tabla_etnia <- covid %>%
  count(case_eth) %>%
  mutate(pct = round((n / sum(n)) * 100, 2))
covid <- covid %>%
  mutate(age_group = case_when(
    case_age >= 0 & case_age <= 17 ~ "0-17",
    case_age >= 18 & case_age <= 29 ~ "18-29",
    case_age >= 30 & case_age <= 44 ~ "30-44",
    case_age >= 45 & case_age <= 64 ~ "45-64",
    case_age >= 65 ~ "65+",
    TRUE ~ NA_character_
  ))

table(covid$age_group, useNA = "ifany")
## 
##  0-17 18-29 30-44 45-64   65+  <NA> 
##  8009 20656 22685 21495  9207    49

El grupo más afectado corresponde al rango de 30 a 44 años (27.6%), seguido de 45 a 64 años (26.2%) y 18 a 29 años (25.2%). Esto indica que la población económicamente activa (18–64 años) concentra casi el 80% de los contagios, lo cual sugiere que la exposición laboral y social fue un factor determinante durante la pandemia. Los menores de 17 años y los mayores de 65 representan proporciones menores, aunque siguen siendo poblaciones de interés por su vulnerabilidad.

tabla_cruzada <- covid %>%
  tabyl(age_group, case_gender) %>%
  adorn_totals(where = c("row", "col")) %>%
  adorn_percentages("row") %>%
  adorn_pct_formatting(digits = 1) %>%
  adorn_ns()  # agrega los conteos (n)

tabla_cruzada
##  age_group         Female           Male     Unknown       NA_           Total
##       0-17 50.1%  (4,014) 49.3%  (3,948)  0.5%  (38) 0.1%  (9) 100.0%  (8,009)
##      18-29 54.4% (11,227) 45.2%  (9,333)  0.4%  (84) 0.1% (12) 100.0% (20,656)
##      30-44 52.6% (11,935) 46.9% (10,639)  0.4%  (96) 0.1% (15) 100.0% (22,685)
##      45-64 51.0% (10,969) 48.5% (10,432)  0.4%  (79) 0.1% (15) 100.0% (21,495)
##        65+ 55.7%  (5,132) 43.7%  (4,026)  0.4%  (38) 0.1% (11) 100.0%  (9,207)
##       <NA> 44.9%     (22) 30.6%     (15) 22.4%  (11) 2.0%  (1) 100.0%     (49)
##      Total 52.7% (43,299) 46.8% (38,393)  0.4% (346) 0.1% (63) 100.0% (82,101)

Se observa una ligera predominancia del sexo femenino, con una diferencia de aproximadamente 6 puntos porcentuales frente al masculino. Este patrón puede estar asociado a la mayor proporción de mujeres en el sector salud, educativo y de servicios, actividades con alta exposición al contagio.

La distribución conjunta por edad y sexo sugiere que las mujeres jóvenes y de mediana edad (18–44 años) concentran la mayor parte de los contagios. Esto podría estar vinculado a su mayor participación laboral y social durante la pandemia, mientras que en edades avanzadas se mantiene el patrón de mayor supervivencia femenina.

2.2 Síntomas

sintomas <- covid %>%
  select(starts_with("sym_"))
sintomas_validos <- sintomas %>%
  select(where(~ any(.x %in% c("Yes", "No"), na.rm = TRUE)))
resumen_sintomas <- sintomas_validos %>%
  summarise(across(
    everything(),
    ~mean(.x == "Yes", na.rm = TRUE) * 100
  )) %>%
  pivot_longer(cols = everything(),
               names_to = "sintoma",
               values_to = "porcentaje") %>%
  arrange(desc(porcentaje))
head(resumen_sintomas, 7)
## # A tibble: 7 x 2
##   sintoma            porcentaje
##   <chr>                   <dbl>
## 1 sym_cough                43.5
## 2 sym_headache             43.3
## 3 sym_losstastesmell       40.6
## 4 sym_myalgia              39.1
## 5 sym_fever                29.9
## 6 sym_subjfever            28.8
## 7 sym_sorethroat           25.1

Los resultados muestran que los síntomas más frecuentes son los de tipo respiratorio y sistémico, coherentes con la sintomatología típica del COVID-19 reportada en la literatura médica.

La tos y el dolor de cabeza se presentan como los principales signos clínicos, seguidos por la pérdida del gusto/olfato, considerada una manifestación distintiva de la enfermedad y altamente específica del SARS-CoV-2.

En conjunto, los datos evidencian que la mayoría de los pacientes presentaron síntomas leves a moderados, predominando aquellos relacionados con el sistema respiratorio superior y las respuestas inflamatorias generales.

Esto respalda la necesidad de mantener vigilancia clínica en síntomas inespecíficos como la tos o el dolor de cabeza, que pueden ser los primeros indicadores de contagio.

2.3 Resultados Clínicos

hospitalizacion <- covid %>%
  filter(hospitalized %in% c("Yes", "No")) %>%
  group_by(age_group) %>%
  summarise(
    total = n(),
    hospitalizados = sum(hospitalized == "Yes"),
    tasa_hosp = round((hospitalizados / total) * 100, 2)
  )

hospitalizacion
## # A tibble: 6 x 4
##   age_group total hospitalizados tasa_hosp
##   <chr>     <int>          <int>     <dbl>
## 1 0-17       5446            106      1.95
## 2 18-29     11843            365      3.08
## 3 30-44     13666            861      6.3 
## 4 45-64     12949           1769     13.7 
## 5 65+        5703           2194     38.5 
## 6 <NA>         12              2     16.7

La probabilidad de hospitalización aumenta de manera progresiva con la edad. Los menores de 17 años presentan una tasa baja (1.9%), lo que indica cuadros mayormente leves.

En cambio, los adultos mayores (65+) presentan una tasa de 38.5%, lo que significa que casi 4 de cada 10 pacientes en este grupo requirieron hospitalización. Esto refleja la mayor vulnerabilidad del adulto mayor frente a complicaciones respiratorias y comorbilidades.

letalidad <- covid %>%
  filter(confirmed_case == "Yes" & died %in% c("Yes", "No")) %>%
  group_by(age_group) %>%
  summarise(
    total_confirmados = n(),
    fallecidos = sum(died == "Yes"),
    tasa_letalidad = round((fallecidos / total_confirmados) * 100, 2)
  )

letalidad
## # A tibble: 6 x 4
##   age_group total_confirmados fallecidos tasa_letalidad
##   <chr>                 <int>      <int>          <dbl>
## 1 0-17                   4976          2           0.04
## 2 18-29                 10720         13           0.12
## 3 30-44                 12384         54           0.44
## 4 45-64                 11755        304           2.59
## 5 65+                    5243       1329          25.4 
## 6 <NA>                      7          0           0

La tasa de letalidad también presenta un patrón ascendente con la edad. En los menores de 45 años, las cifras son muy bajas (<0.5%), lo que indica una alta tasa de recuperación y menor gravedad clínica.

A partir de los 45 años, la letalidad se incrementa de forma notoria, alcanzando 2.6% en adultos medios y un valor crítico de 25.35% en los mayores de 65 años.

resultados_clinicos <- hospitalizacion %>%
  left_join(letalidad, by = "age_group") %>%
  select(age_group, tasa_hosp, tasa_letalidad)

resultados_clinicos
## # A tibble: 6 x 3
##   age_group tasa_hosp tasa_letalidad
##   <chr>         <dbl>          <dbl>
## 1 0-17           1.95           0.04
## 2 18-29          3.08           0.12
## 3 30-44          6.3            0.44
## 4 45-64         13.7            2.59
## 5 65+           38.5           25.4 
## 6 <NA>          16.7            0

Los resultados reflejan que tanto la hospitalización como la letalidad siguen una tendencia exponencial con la edad.

Mientras que la mayoría de los casos en jóvenes son leves y se manejan ambulatoriamente, los adultos mayores presentan mayores probabilidades de complicaciones graves y mortalidad.

Estos hallazgos son coherentes con la evidencia epidemiológica internacional y destacan la importancia de:

  • Priorizar la vacunación y el monitoreo clínico en los grupos de mayor edad.

  • Reforzar la atención hospitalaria para pacientes mayores de 45 años.

  • Mantener estrategias de prevención diferenciadas por grupo etario.

Actividad 3. Análisis Gráfico

3.1 Casos Diarios y Tendencia

covid <- covid %>%
  mutate(reprt_creationdt_FALSE = as.Date(reprt_creationdt_FALSE))
casos_diarios <- covid %>%
  filter(!is.na(reprt_creationdt_FALSE)) %>%
  group_by(reprt_creationdt_FALSE) %>%
  summarise(casos = n()) %>%
  arrange(reprt_creationdt_FALSE)
library(zoo)
## 
## Adjuntando el paquete: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
casos_diarios <- casos_diarios %>%
  mutate(media_movil = rollmean(casos, k = 7, fill = NA, align = "right"))
ggplot(casos_diarios, aes(x = reprt_creationdt_FALSE)) +
  geom_col(aes(y = casos), fill = "#6baed6", alpha = 0.7) +  # barras azules
  geom_line(aes(y = media_movil), color = "red", size = 1) + # línea roja
  labs(
    title = "Evolución diaria de casos COVID-19",
    subtitle = "Con línea de media móvil de 7 días",
    x = "Fecha de reporte",
    y = "Número de casos"
  ) +
  theme_minimal() +
  theme(
    plot.title = element_text(size = 14, face = "bold"),
    axis.text.x = element_text(angle = 45, hjust = 1)
  )
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## i Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
## Warning: Removed 6 rows containing missing values or values outside the scale range
## (`geom_line()`).

Al observar la gráfica, se pueden identificar claros periodos de aumento y disminución en el número de casos:

Primer periodo de aumento:

Desde marzo hasta julio de 2020.

Se observa un crecimiento sostenido en el número de casos, alcanzando el primer pico alrededor de julio de 2020.

Este incremento corresponde a la primera ola de contagios, probablemente asociada a la expansión inicial del virus y la limitada capacidad de control al inicio de la pandemia.

Primer periodo de disminución:

Entre agosto y octubre de 2020.

Los casos comienzan a descender de forma gradual, reflejando los efectos de medidas sanitarias como el confinamiento, el distanciamiento social o restricciones de movilidad.

Segundo periodo de aumento:

De noviembre de 2020 a enero de 2021.

Se presenta un segundo pico más alto que el primero, posiblemente influido por la temporada decembrina y el aumento de interacciones sociales.

La curva roja muestra un ascenso más pronunciado y un máximo en enero de 2021.

Segundo periodo de disminución:

Desde febrero de 2021 en adelante.

Los casos decrecen de manera sostenida hasta mediados de 2021, indicando el fin de la segunda ola y una mejora general en el control epidemiológico.

Conclusión general

La gráfica evidencia dos grandes olas epidémicas:

La primera a mediados de 2020.

La segunda a comienzos de 2021.

Cada una de ellas se caracteriza por un ascenso rápido y un descenso más lento, patrón típico de las epidemias cuando las medidas de control comienzan a hacer efecto después del pico.

3.2 Distribución Demográfica

covid_filtrado <- covid %>%
  filter(!is.na(case_gender), !is.na(age_group))
ggplot(covid_filtrado, aes(x = age_group, fill = case_gender)) +
  geom_bar(position = "fill") +  # Usa "stack" para número absoluto o "fill" para % relativo
  scale_y_continuous(labels = scales::percent_format()) +
  scale_fill_brewer(palette = "Set2") +
  labs(
    title = "Distribución de casos COVID-19 por grupo de edad y género",
    x = "Grupo de edad",
    y = "Proporción (%)",
    fill = "Género"
  ) +
  theme_minimal() +
  theme(
    plot.title = element_text(size = 14, face = "bold"),
    axis.text.x = element_text(size = 11)
  )

El gráfico muestra la proporción (%) de casos confirmados de COVID-19 segmentados por grupo de edad y género. Las barras apiladas permiten comparar la participación relativa de hombres, mujeres y casos sin información (“Unknown”) dentro de cada grupo etario.

Grupos predominantes por edad y género:

En todos los grupos de edad (0–17, 18–29, 30–44, 45–64, 65+), se observa una distribución equilibrada entre hombres y mujeres, aunque:

Las mujeres (Female) representan una proporción ligeramente mayor de casos en casi todos los grupos etarios.

Los hombres (Male) mantienen una presencia cercana, pero generalmente por debajo del 50 %.

El grupo de 30–44 años parece tener una de las mayores proporciones de casos totales, lo que puede deberse a que es la población más activa laboral y socialmente durante el periodo analizado.

Los casos “Unknown” (sin información de género) son mínimos, lo que indica una buena calidad en la recolección de datos.

En los grupos de mayor edad (65+), aunque la proporción entre géneros se mantiene, este grupo representa una fracción menor del total de casos, lo que sugiere menor exposición o mejores medidas de protección en adultos mayores.

Conclusión general

En términos proporcionales:

Las mujeres presentan una ligera predominancia en todos los grupos de edad.

Los adultos jóvenes (18–44 años) concentran la mayor parte de los casos, coincidiendo con la población económicamente activa.

Las diferencias por género no son drásticas, pero sí consistentes a favor del grupo femenino.

3.3 Hospitalización y Letalidad

resultados_clinicos <- data.frame(
  age_group = c("0-17", "18-29", "30-44", "45-64", "65+"),
  tasa_hosp = c(1.95, 3.08, 6.30, 13.66, 38.47),
  tasa_letalidad = c(0.04, 0.12, 0.44, 2.59, 25.35)
)
resultados_long <- resultados_clinicos %>%
  pivot_longer(cols = c(tasa_hosp, tasa_letalidad),
               names_to = "tipo_tasa",
               values_to = "porcentaje")
ggplot(resultados_long, aes(x = age_group, y = porcentaje, fill = tipo_tasa)) +
  geom_col(position = "dodge") +
  geom_text(aes(label = round(porcentaje, 2)),
            position = position_dodge(width = 0.9),
            vjust = -0.3, size = 3) +
  scale_fill_manual(values = c("#6baed6", "#de2d26"),
                    labels = c("Tasa de hospitalización", "Tasa de letalidad (CFR)")) +
  labs(
    title = "Tasas de hospitalización y letalidad (CFR) por grupo etario",
    x = "Grupo de edad",
    y = "Porcentaje (%)",
    fill = "Indicador"
  ) +
  theme_minimal() +
  theme(
    plot.title = element_text(size = 14, face = "bold"),
    axis.text.x = element_text(size = 11)
  )

3.4 Síntomas Principales

sintomas_other <- covid %>%
  select(age_group, sym_fever, sym_subjfever, sym_myalgia,
         sym_losstastesmell, sym_sorethroat, sym_cough,
         sym_headache, sym_resolved)
sintomas_long <- sintomas_other %>%
  pivot_longer(cols = -age_group, names_to = "Sintoma", values_to = "Respuesta") %>%
  filter(!is.na(Respuesta)) %>%
  group_by(age_group, Sintoma) %>%
  summarise(Proporcion_Si = mean(Respuesta == "Yes", na.rm = TRUE) * 100, .groups = "drop")
diccionario_sintomas <- c(
  "sym_fever" = "Fiebre",
  "sym_subjfever" = "Fiebre subjetiva",
  "sym_myalgia" = "Dolor muscular",
  "sym_losstastesmell" = "Pérdida del gusto/olfato",
  "sym_sorethroat" = "Dolor de garganta",
  "sym_cough" = "Tos",
  "sym_headache" = "Dolor de cabeza",
  "sym_resolved" = "Síntomas resueltos"
)
sintomas_long <- sintomas_long %>%
  mutate(Sintoma = ifelse(Sintoma %in% names(diccionario_sintomas),
                          diccionario_sintomas[Sintoma],
                          Sintoma))
ggplot(sintomas_long, aes(x = age_group, y = Sintoma, fill = Proporcion_Si)) +
  geom_tile(color = "white") +
  scale_fill_gradient(low = "pink", high = "blue", name = "% Síntomas") +
  labs(
    title = "Prevalencia de síntomas por grupo de edad",
    x = "Grupo de edad",
    y = "Síntoma"
  ) +
  theme_minimal() +
  theme(
    plot.title = element_text(hjust = 0.5, face = "bold", color = "#003366", size = 14),
    axis.title = element_text(color = "#003366", face = "bold"),
    axis.text.x = element_text(color = "black"),
    axis.text.y = element_text(color = "black", face = "bold")
  )

Análisis de prevalencia de síntomas por grupo de edad Grupo 0–17 años

Los síntomas son menos frecuentes que en los adultos.

Predominan dolor de garganta y dolor de cabeza, aunque con valores moderados.

La tos y la fiebre están presentes, pero en proporciones bajas.

Grupo 18–29 años

Presenta una mayor intensidad de síntomas respiratorios.

Los más comunes son tos, dolor muscular y dolor de cabeza.

También se observa una presencia significativa de pérdida del gusto/olfato, típica en pacientes jóvenes con COVID-19.

Grupo 30–44 años

Este grupo muestra una alta prevalencia general de síntomas.

Destacan especialmente:

Tos (uno de los síntomas más marcados).

Dolor muscular y dolor de cabeza.

También hay incidencia notable de pérdida del gusto/olfato.

Grupo 45–64 años

Continúa el patrón de síntomas fuertes, pero con un ligero descenso en algunos.

Tos y fiebre siguen siendo predominantes.

También se mantiene una frecuencia importante de dolor muscular.

Grupo 65+ años

En adultos mayores, la tos vuelve a ser el síntoma más común.

También destacan fiebre y dolor muscular, aunque la pérdida del gusto/olfato es menos frecuente que en adultos jóvenes.

El color azul oscuro en “tos” muestra su alta prevalencia en este grupo.

NA (sin información de edad)

Se observan valores altos en tos y pérdida del gusto/olfato, posiblemente por mezcla de casos sin clasificación etaria.

Conclusión general

La tos es el síntoma más común en casi todos los grupos etarios, especialmente en adultos y mayores.

El dolor de cabeza y muscular son frecuentes en adultos jóvenes.

La pérdida del gusto/olfato predomina en edades intermedias (18–44 años).

Los niños y adolescentes (0–17) presentan cuadros más leves, con síntomas menos prevalentes.