1. Contexto

Este análisis forma parte del sub-análisis realizado incluido en el Trabajo de Fin de Máster de Katherine J. Victorio-Suberví, presentado en el Máster Universitario en Investigación en Ciencias Sociosanitarias de la Facultad de Enfermería, Universidad de Murcia.

Uso académico exclusivo:
Todos los resultados y datasets han sido anonimizados y se emplean ÚNICAMENTE con fines formativos. Cualquier uso adicional (publicación, decisiones clínicas, etc.) requiere autorización expresa de las fuentes originales.

Descargo de responsabilidad:
Este documento es responsabilidad de los autores y no refleja necesariamente las posiciones oficiales de Fundación Etikos ni del Ministerio de Salud Pública de la República Dominicana.

Responsabilidad de los/as participantes:
Las conclusiones y códigos aquí generados son fruto de su propio trabajo grupal, guiadas por el tutor. Eviten el plagio y, en caso de reutilizar fragmentos de este material en futuros proyectos académicos, citen de la siguiente forma:

Patricio-Baldera J., Victorio-Suberví K. J. (2025). Características clínicas y epidemiológicas de los casos de dengue en adultos en la República Dominicana (2022). Taller de análisis de datos secundarios en Salud Pública. Fundación Etikos. Accedido el: “Colocar Fecha”. Disponible en: “Colocar Enlace”.


2. Resultados de aprendizaje del taller

En este taller exploraremos cómo aprovechar datos secundarios para generar evidencia útil en Salud Pública. Partiendo de un caso real —el dengue en adultos en la República Dominicana entre 2018 y 2022— aprenderemos a:

  1. Identificar fuentes de información relevantes para el evento a analizar.
  2. Importar y depurar datos con tidyverse.
  3. Visualizar patrones espaciales mediante tablas y mapas con dplyr y ggplot2.
  4. Realizar análisis inferenciales, para conocer asociaciones entre variables mediante pruebas de hipótesis.
  5. Interpretar y discutir Los resultados del taller.

Cada etapa incluirá preguntas dirigidas y retos prácticos para fomentar la discusión en equipo. Al final, cada grupo presentará un breve resumen interpretativo de sus hallazgos, reforzando la capacidad crítica y colaborativa de los participantes.

Tips para resolver el taller

- Leer detenidamente cada sección para estar contextualizadas con el evento y las cuestiones del taller.
- Copien y peguen el código en sus computadores para obtener los resultados y responder a las preguntas realizadas.
- Anoten dudas o descubrimientos: ¡Las preguntas enriquecen el debate!  
- Al finalizar, tendremos secciones de presentación grupal analizando  debatiendo los hallazgos. 

😊🦟 Empecemos 🦟😊


3. Breve introducción

La República Dominicana constituye un foco endémico para el dengue, el cual causa brotes cíclicos con elevada carga asistencial. En 2022 el país notificó 10 784 casos y 39 defunciones según el Centro para el Control y la Prevención de Enfermedades (CDC) [^1]. Durante el gran brote de 2019 la incidencia se disparó a 194,9 casos por 100 000 habitantes, un incremento del 1 145 % respecto a 2018 y un 142 % por encima del promedio histórico 2005-2014 [^2].

Aunque la vigilancia nacional cubre todas las edades, la mayor parte de la literatura local y regional se ha centrado en población pediátrica [^3]. Sin embargo, revisiones latinoamericanas estiman que los adultos concentran ~50 % de las infecciones y >90 % de las defunciones por dengue [^4]. Estudios comparativos demuestran que los adultos presentan mayor riesgo de dengue grave (7,6 % vs. 3,5 %) y mayor frecuencia de hospitalización (14,4 % vs. 6,3 %) que los niños [^5].

Esta brecha de conocimiento motiva el presente estudio, enfocado exclusivamente en casos adultos (≥ 18 años) notificados por SINAVE entre 2018 y 2022.


4. Objetivos del taller

General

Analizar las Características clínicas y epidemiológicas de los casos de dengue en adultos en la República Dominicana durante el período 2018-2022.

Específicos

  1. Describir las características demográficas y clínicas de los casos de dengue en adultos en la República Dominicana durante el período 2018-2022.
  2. Cuantificar la letalidad de los casos de dengue en adultos en la República Dominicana durante el período 2018-2022.
  3. Explorar la distribución espacial mediante tasas por provincias de los casos de dengue en adultos en la República Dominicana durante el período 2018-2022.
  4. Discutir críticamente los hallazgos encontrados.

5. Fuentes de Información Disponibles

Antes de cargar y depurar el dataset, reflexionemos sobre qué fuentes podríamos utilizar para un análisis robusto del dengue en adultos.

Ejercicio 1: Identificar Fuentes

De acuerdo a los grupos conformados, respondan en un máximo de 5 minutos por escrito:

  1. ¿Cuál o cuáles son la(s) fuente(s) de información con las cuales podríamos responder a los objetivos planteados en el taller.
  2. ¿Cuál es el tipo de fuente? (p. ej., primaria, secundaria, administrativa…)
  3. ¿Qué ventajas o atributos tiene esta fuente?
  4. ¿Cuáles son las limitaciones que presenta esta fuente?


Luego de anotar por escrito sus respuestas.

👉 Haz clic aquí para conocer posibles respuestas al ejercicio:
👉 ¡No hagan trampa!. Solo si terminaron hacer clic aquí:

Posibles Respuestas

1. Fuentes de información
- SINAVE (Sistema Nacional de Vigilancia Epidemiológica): base de datos administrativa de casos notificados.
- OPS/PAHO: boletines regionales de dengue que resumen casos y tendencias, útil para discutir nuestros resultados.
- Censo Nacional de Población (ONE): datos de población para cálculo de tasas.
- Red de Hospitales/egresos: registros de hospitalización por dengue.

2. Tipo de fuente
- SINAVE: administrativa, secundaria (datos recogidos rutinariamente).
- OPS/PAHO: institucional, secundaria agregada.
- Censo: estatal, primaria para denominadores.
- Hospitales: clínica, primaria de egresos.

3. Ventajas / atributos (SINAVE)
- Cobertura amplia: SINAVE cubre todo el territorio y años de estudio.
- Actualización continua: datos disponibles semanalmente.
- Accesibilidad: muchas veces públicos o por solicitud.
- Consistencia metodológica: mismas definiciones caso tras caso.

4. Limitaciones (SINAVE)
- Sub-notificación: no todos los casos llegan a registro oficial (Sub-registro).
- Retrasos: demoras entre la ocurrencia y la notificación.
- Datos faltantes: variables clínicas o demográficas incompletas.
- Calidad variable: diferencias en la capacidad de laboratorio o reporte local.


🦟 ¡Ahora sí, pasemos a los datos! 🦟


6. Identificación de Variables

Luego de identificar el SINAVE como la fuente de información a utilizar para responder a los objetivos planteados. Exploremos las variables disponibles de acuerdo al Formulario Único de Notificación Individual de Caso (v.2024) en el que se basa SINAVE para registrar este y otros eventos.

Esta es una captura del Formulario Único de Notificación Individual de Caso (v.2024):

Figura 1: Fragmento del Formulario Único de Notificación Individual de Caso (v.2024).

En el Formulario Único de Notificación Individual de Caso (v.2024) se encuentran los datos del notificador, información socio-demográfica, información clínica, entre otros elementos relacionados con el evento a notificar.

Descargar el Formulario Completo (v.2024) aquí
Formulario Único de Notificación Individual de Caso (PDF)


Ejercicio 2: Identificar las variables

De acuerdo a los grupos conformados, respondan en un máximo de 10 minutos por escrito:

  1. Liste aquí las variables demográficas (p. ej., edad, sexo…) que considere relevantes utilizar para dar respuesta a los objetivos planteados.
  2. Liste las variables clínicas (p. ej., clasificación, síntomas…) que considere relevantes utilizar para dar respuesta a los objetivos planteados.
  3. Liste las variables temporales/geográficas (p. ej., provincia, semana epidemiológica…) que considere relevantes utilizar para dar respuesta a los objetivos planteados.
  4. Liste cualquier otra variable necesaria para el análisis.
  5. ¿Podría decir que todas las variables están relacionadas con el evento (Dengue) que estamos analizando? Justifique la respuesta.


4. Variables y Escalas de Medición

A continuación se presenta el listado de variables seleccionadas en el análisis, su escala de medición y categorías asociadas, tal como en el trabajo original:

Mirar luego de haber realizado el ejercicio 2

👉 Mostrar listado de variables y escalas de medición
Variable Escala Categorías / Valores
Características sociodemográficas
Edad Razón
Grupos de edad Nominal 1. < 20 años 2. 20–39 años 3. 40–59 años 4. ≥ 60 años
Sexo Nominal 1. Masculino 2. Femenino
Nacionalidad Nominal 1. Dominicana 2. Haitiana 3. Otra
Provincia Nominal División territorial de la República Dominicana
Municipio Nominal División territorial de la República Dominicana
Nivel Educativo Nominal 1. Sin educación 2. Primaria 3. Secundaria 4. Superior
Afiliación al SFS Nominal 1. Contributivo 2. Subsidiado 3. No afiliado
Datos clínicos de la enfermedad
Generales o sistémicos
Fiebre Nominal 0. No 1. Sí
Escalofríos Nominal 0. No 1. Sí
Malestar general / Debilidad / Dolor muscular Nominal 0. No 1. Sí
Dolor en los ojos Nominal 0. No 1. Sí
Mucosa y Piel
Hiperemia conjuntival Nominal 0. No 1. Sí
Torniquete positivo Nominal 0. No 1. Sí
Erupción maculopapular Nominal 0. No 1. Sí
Erupción en tórax Nominal 0. No 1. Sí
Ojos rojos / irritados Nominal 0. No 1. Sí
Respiratorios y cardiovasculares
Derrame pleural Nominal 0. No 1. Sí
Frote pericárdico Nominal 0. No 1. Sí
Gastrointestinales y renales
Náuseas Nominal 0. No 1. Sí
Dolor / Distensión abdominal Nominal 0. No 1. Sí
Vómitos Nominal 0. No 1. Sí
Hepatomegalia Nominal 0. No 1. Sí
Esplenomegalia Nominal 0. No 1. Sí
Insuficiencia renal Nominal 0. No 1. Sí
Neurológicos
Convulsiones Nominal 0. No 1. Sí
Somnolencia Nominal 0. No 1. Sí
Alteraciones de conducta Nominal 0. No 1. Sí
Alteraciones de la conciencia Nominal 0. No 1. Sí
Hemorrágicos / Hemáticos
Sangrado conjuntival, nasal o por encías Nominal 0. No 1. Sí
Vómitos de sangre Nominal 0. No 1. Sí
Sangre en heces Nominal 0. No 1. Sí
Orina color café Nominal 0. No 1. Sí
Petequias Nominal 0. No 1. Sí
Equimosis Nominal 0. No 1. Sí
Púrpura / Ascitis Nominal 0. No 1. Sí
Hemoconcentración Nominal 0. No 1. Sí
Leucopenia Nominal 0. No 1. Sí
Leucocitosis Nominal 0. No 1. Sí
Trombocitopenia Nominal 0. No 1. Sí
Clasificación del Dengue
Gravedad Nominal 1. Sin signos de alarma 2. Con signos de alarma 3. Grave


7. Carga y exploración de datos

En esta sección instalaremos y llamaremos las librerías requeridas, leeremos y exploraremos el archivo que contiene los microdatos con los “casos” de dengue reportados al SINAVE durante el periodo 2018-2022.

Paquetes necesarios

Los siguientes paquetes, disponibles en CRAN o github, son necesarios para este análisis. Para instalarlos, ejecute los siguientes códigos:

install.packages("readxl") # para leer Excel
install.packages("dplyr") # para manipulación básica
install.packages("ggplot2") # para gráficos
install.packages("table1") # para gráficos

Una vez instalados los paquetes, es posible que deba abrir una nueva sesión de R. Ahora cargue las bibliotecas de la siguiente manera:

library(readxl)   # para leer Excel
library(dplyr)    # para manipulación básica
library(ggplot2)  # para gráficos
library(knitr)    # para gráficos
library(table1)   # para elaborar tablas descriptivas

Datos iniciales (lectura de datos en R)

Descarga de datos:
Para trabajar con el conjunto de datos en este taller, por favor descarguen el archivo haciendo clic en el siguiente enlace y guárdenlo en su directorio de trabajo de R:

“Disculpe, los datos para la descarga han sido inhabilitados temporalmente; Sin embargo, acá puede ver el detalle y paso a paso de la construcción de los resultados obtenidos.


A continuación cargaremos localmente el archivo que descargaron y haremos una exploración básica de las variables clave.

Tiene varias opciones, una de ellas es haciendo clic en el botón Import ubicado en el enviroment o con el código mostrado a continuación:

# Ejecutar el código para leer los datos
Datos <- read_excel("DENGUE_2018_2022_SINAVE_v1.3.xlsx")

1. ¿Cuántos registros (filas) contiene el objeto Datos?

nrow(Datos)

2. ¿Cuántas variables (columnas) tiene?

ncol(Datos)

3. Al ejecutar la siguiente línea de código podrá ver la estructura de los datos ¿Qué observa en las variables incluidas (sus categorías, valores…)?

# Verificar la estructura del data frame
glimpse(Datos)
## Rows: 7,915
## Columns: 79
## $ Sospecha                                    <chr> "DENGUE", "DENGUE", "DENGU…
## $ Sexo                                        <chr> "Masculino", "Femenino", "…
## $ Edad1                                       <dbl> 19, 20, 22, 18, 36, 22, 52…
## $ `Grupo edad`                                <chr> "10_19", "20_29", "20_29",…
## $ `Categoría de afiliación`                   <chr> "Contributivo", "Contribut…
## $ ARS                                         <chr> "HUMANO", "SENASA", NA, "S…
## $ `Nivel educativo`                           <chr> "Superior", "Secundaria", …
## $ Embarazada                                  <chr> NA, "No", "No", "No", "No"…
## $ `Semanas amenorrea`                         <dbl> NA, NA, NA, NA, NA, NA, NA…
## $ `Etapa gestación`                           <chr> NA, NA, NA, NA, NA, NA, NA…
## $ `Tipo de parto`                             <chr> NA, NA, NA, NA, NA, NA, NA…
## $ `Región residencia`                         <chr> "O Metropolitana", "O Metr…
## $ Region_cod                                  <chr> "O", "O", "I", "O", "II", …
## $ Provincia                                   <chr> "01 Distrito Nacional", "3…
## $ Provincia_cod                               <chr> "01", "32", "31", "32", "1…
## $ Municipio                                   <chr> "0101 Santo Domingo de Guz…
## $ Municipio_cod                               <chr> "0101", "3201", "3101", "3…
## $ `País procedencia`                          <chr> "República Dominicana", "R…
## $ `Semana inicio síntomas`                    <dbl> 8, 20, 7, 35, 45, 23, 35, …
## $ `Mes inicio síntomas`                       <dbl> 2, 5, 2, 9, 11, 6, 8, 9, 9…
## $ `Año inicio síntomas`                       <dbl> 2020, 2019, 2022, 2022, 20…
## $ `Fecha inicio síntomas`                     <chr> "2/18/2020", "43598", "446…
## $ `Semana atención`                           <dbl> 9, 20, 7, 36, 46, 24, 35, …
## $ `Mes atención`                              <dbl> 2, 5, 2, 9, 11, 6, 9, 9, 9…
## $ `Año atención`                              <dbl> 2020, 2019, 2022, 2022, 20…
## $ `Fecha atención`                            <chr> "2/23/2020", "43601", "446…
## $ `Semana toma muestra`                       <dbl> NA, NA, 7, NA, 46, 24, 35,…
## $ `Fecha toma muestra`                        <chr> NA, NA, "44611", NA, "4487…
## $ Región                                      <chr> "O Metropolitana", "O Metr…
## $ Institución                                 <chr> "PRIVADO", "PRIVADO", "SNS…
## $ Establecimiento                             <chr> "Centro Médico Moderno", "…
## $ `DAS/DPS establecimiento`                   <chr> "DN-Area V", "SD-Area II",…
## $ `Tipo atención`                             <chr> "Internamiento", "Internam…
## $ `Semana notificación`                       <dbl> 11, 20, 8, 36, 46, 24, 35,…
## $ `Fecha notificación`                        <chr> "44077", "43602", "44614",…
## $ `Signos y síntomas`                         <chr> "VOMITOS, NAUSEAS, CANSANC…
## $ Fiebre                                      <dbl> 1, 1, 1, 1, 1, 1, 1, 1, 1,…
## $ Escalofrio                                  <dbl> 1, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ `Malestar General/debilidad-Dolor muscular` <dbl> 1, 0, 1, 1, 0, 1, 1, 1, 1,…
## $ `Dolor en los ojos`                         <dbl> 0, 0, 0, 0, 0, 1, 0, 0, 0,…
## $ `Hiperemia conjuntival`                     <dbl> 1, 1, 1, 1, 1, 1, 1, 1, 1,…
## $ Torniquete_positivo                         <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Erupción_maculopapular                      <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Erupción_tórax                              <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Ojos_rojos_irritados                        <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Derrame_pleural                             <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ `Frote pericárdico`                         <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Nauseas                                     <dbl> 1, 0, 0, 0, 0, 1, 0, 0, 0,…
## $ Dolor_abdominal                             <dbl> 1, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Vómitos                                     <dbl> 1, 1, 1, 1, 1, 1, 0, 0, 0,…
## $ Hepatomegalia                               <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Esplenomegalia                              <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Insuficiencia_renal                         <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Convulsiones                                <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Somnolencia                                 <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Alteraciones_conducta                       <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ `Alteraciones de la conciencia`             <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Sangrado_conjuntival                        <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Sangrado_nasal                              <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Sangrado_encías                             <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Vómitos_sangre                              <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Sangre_heces                                <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Orina_color_café                            <dbl> 0, 0, 0, 0, 0, 1, 0, 0, 0,…
## $ Petequias                                   <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Equimosis                                   <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Púrpura                                     <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Ascitis                                     <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Hemoconcentracion                           <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Leucopenia                                  <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Leucocitosis                                <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Trombocitopenia                             <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ `Resultado final`                           <chr> "Sospechoso", "Sospechoso"…
## $ Condición                                   <chr> "Vivo", "Vivo", "Vivo", "V…
## $ Gravedad                                    <chr> "Con signos de alarma", "C…
## $ `Semana defunción`                          <dbl> NA, NA, NA, NA, NA, NA, NA…
## $ `Mes defunción`                             <dbl> NA, NA, NA, NA, NA, NA, NA…
## $ `Año defunción`                             <dbl> NA, NA, NA, NA, NA, NA, NA…
## $ `Fecha defunción`                           <chr> NA, NA, NA, NA, NA, NA, NA…
## $ `Edad fecha defunción`                      <chr> NA, NA, NA, NA, NA, NA, NA…

Exploremos un poco lo observado:

¿Observan datos faltantes en alguna de las variables?

# Para variables numéricas puede utilizar el siguiente código:
summary(Datos$Edad1)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   18.00   22.00   29.00   36.18   47.00  106.00
boxplot(Datos$Edad1)

# Para variables categóricas puede utilizar el siguiente código:
table(Datos$Sexo, useNA = "always")
## 
##  Femenino Masculino      <NA> 
##      3072      4843         0
barplot(
  table(Datos$Sexo),
  main   = "Distribución de Casos por Sexo",
  xlab   = "Sexo",
  ylab   = "Número de casos",
  col    = c("skyblue", "salmon"),
  border = "white"
)

Nota: barplot() necesita un vector numérico de alturas, por eso primero table(Datos$Sexo) para obtener el conteo de cada categoría.


🙌 Continúe con las demás variables para conocer los datos faltantes y categorías no deseadas. 🙌


8. Selección de los casos (criterios de inclusión y exclusión)

Aunque podríamos aplicar criterios muy estrictos sobre los criterios de inclusión y exclusión. Para fines de este taller, solo lo haremos a modo de ejemplo para continuar con otros apartados del taller.

Criterios de inclusión

  • Casos de dengue reportados por el SINAVE.
  • Edad igual o superior a los 18 años.
  • Pacientes residentes en la República Dominicana.

Criterios de exclusión

  • Pacientes con información incompleta en su información sociodemográficas:

    • Edad
    • Sexo
    • Nacionalidad
    • Nivel educativo
    • Categoría de afiliación el seguro familiar de salud.

Ejercicio 3. En un máximo de 10 minutos, Cree un diagrama que ilustre el tamaño de muestra de acuerdo a los criterios de inclusión.

Con base en la siguiente información, estaremos contando cuantas personas cumplen con los criterios de inclusión y exclusión para la construcción del diagrama.

Evaluando los criterios de inclusión:

# Personas incluidas en el conjunto de datos con casos de dengue reportados. 
Datos %>% summarise(Casos = n()) %>% kable()
Casos
7915
# ¿Todas las personas son mayores de edad?
Datos %>% filter(Edad1 < 18) %>% summarise(Casos = n()) %>% kable()
Casos
0
# ¿Cuántas personas no son residentes (provincia de residencia codificada como "extranjero")?

Datos %>% filter(Provincia == "99 Extranjero") %>%  group_by(Provincia) %>% summarise(Casos = n()) %>% kable()
Provincia Casos
99 Extranjero 1
# Aquí dejaremos la base lista de acuerdo a los criterios de inclusión
Datos <-  Datos %>% filter(Edad1 > 17 & Provincia != "99 Extranjero")

¿Cuántas personas se incluyeron para el análisis de acuerdo a los criterios de inclusión?

# Personas incluidas en el conjunto de datos con casos de dengue reportados. 
Datos %>% summarise(Casos = n()) %>% kable()
Casos
7914

Evaluando los criterios de exclusión:

# Personas con información de sexo desconocida 
Datos %>% filter(is.na(Sexo)) %>%  summarise(Casos = n()) %>% kable()
Casos
0
# Personas con información de edad desconocida 
Datos %>% filter(is.na(Sexo)) %>%  summarise(Casos = n()) %>% kable()
Casos
0
# Personas con información de edad desconocida 
Datos %>% filter(is.na(`Nivel educativo`) | `Nivel educativo` == "No sabe / Sin información" ) %>%  summarise(Casos = n()) %>% kable()
Casos
1201
# Excluiremos a los registros sin información en nivel educativo o sin información.
Datos <-  Datos %>% filter(!is.na(`Nivel educativo`) & `Nivel educativo` != "No sabe / Sin información" )


# Personas con información de seguro familiar de salud desconocida
Datos %>% filter(is.na(`Categoría de afiliación`) | `Categoría de afiliación` == "Desconocida" ) %>%  summarise(Casos = n()) %>% kable()
Casos
530
# Excluiremos a los registros sin información de seguro familiar de salud.
Datos <-  Datos %>% filter(`Categoría de afiliación` != "Desconocida")

¿Cuántas personas se incluyeron en la muestra final para el análisis?

# Personas incluidas en el conjunto de datos con casos de dengue reportados. 
Datos %>% summarise(Casos = n()) %>% kable()
Casos
6183

Recuerde construir el diagrama que explique el tamaño de muestra final, las personas incluidas y excluidas de acuerdo a los criterios establecidos.


9. Categorizando las variables

Luego de conocer la distribución (variables numéricas) y las categorías (variables categóricas) de las variables, debemos de recodificar las variables de acuerdo a su naturaleza.

En apartado anterior, vimos que las variables estaban categorizadas tipo , acá convertimos las que son numéricas a numeric y las categóricas a factor, que es como el software entiende y trabaja con este tipo de variables.

Una opción que podemos utilizar es categorizar variable por variable de acuerdo al tipo y categorías, como se muestra a continuación

# variables categóricas
# Datos$Sexo <- factor(Datos$Sexo)

# Variables numéricas
# Datos$Edad1 <- numeric(Datos$Edad1)

Otra opción es convertirlas todas por grupo. Para lo siguiente ejecute los siguientes códigos:

# 1) Definir vectores de nombres de columnas para ambos tipos de variables:
Variables_numericas <- c("Edad1", "Semana atención", "Semana inicio síntomas", 
                         "Semana notificación", "Semana toma muestra", "Semana defunción" )       

variables_categoricas <- setdiff(names(Datos), Variables_numericas) # Esta función convierte las demás variables restantes en categóricas. Por este momento, no trabajaremos con fechas, por lo que omitiremos la correcta clasificación de las fechas. 

# 2) Convertir con dplyr::across
Datos <- Datos %>%
  mutate(
    across(all_of(Variables_numericas), ~ as.numeric(.)),
    across(all_of(variables_categoricas), ~ as.factor(.))
  )

# 3) Verificar nuevamente la estructura resultante
glimpse(Datos)
## Rows: 6,183
## Columns: 79
## $ Sospecha                                    <fct> DENGUE, DENGUE, DENGUE, DE…
## $ Sexo                                        <fct> Masculino, Femenino, Femen…
## $ Edad1                                       <dbl> 19, 20, 22, 18, 36, 22, 52…
## $ `Grupo edad`                                <fct> 10_19, 20_29, 20_29, 10_19…
## $ `Categoría de afiliación`                   <fct> Contributivo, Contributivo…
## $ ARS                                         <fct> HUMANO, SENASA, NA, SENASA…
## $ `Nivel educativo`                           <fct> Superior, Secundaria, Secu…
## $ Embarazada                                  <fct> NA, No, No, No, No, No, NA…
## $ `Semanas amenorrea`                         <fct> NA, NA, NA, NA, NA, NA, NA…
## $ `Etapa gestación`                           <fct> NA, NA, NA, NA, NA, NA, NA…
## $ `Tipo de parto`                             <fct> NA, NA, NA, NA, NA, NA, NA…
## $ `Región residencia`                         <fct> O Metropolitana, O Metropo…
## $ Region_cod                                  <fct> O, O, I, O, II, II, II, II…
## $ Provincia                                   <fct> 01 Distrito Nacional, 32 S…
## $ Provincia_cod                               <fct> 01, 32, 31, 32, 18, 25, 18…
## $ Municipio                                   <fct> 0101 Santo Domingo de Guzm…
## $ Municipio_cod                               <fct> 0101, 3201, 3101, 3205, 18…
## $ `País procedencia`                          <fct> República Dominicana, Repú…
## $ `Semana inicio síntomas`                    <dbl> 8, 20, 7, 35, 45, 23, 35, …
## $ `Mes inicio síntomas`                       <fct> 2, 5, 2, 9, 11, 6, 8, 9, 9…
## $ `Año inicio síntomas`                       <fct> 2020, 2019, 2022, 2022, 20…
## $ `Fecha inicio síntomas`                     <fct> 2/18/2020, 43598, 44608, 4…
## $ `Semana atención`                           <dbl> 9, 20, 7, 36, 46, 24, 35, …
## $ `Mes atención`                              <fct> 2, 5, 2, 9, 11, 6, 9, 9, 9…
## $ `Año atención`                              <fct> 2020, 2019, 2022, 2022, 20…
## $ `Fecha atención`                            <fct> 2/23/2020, 43601, 44608, 4…
## $ `Semana toma muestra`                       <dbl> NA, NA, 7, NA, 46, 24, 35,…
## $ `Fecha toma muestra`                        <fct> NA, NA, 44611, NA, 44878, …
## $ Región                                      <fct> O Metropolitana, O Metropo…
## $ Institución                                 <fct> PRIVADO, PRIVADO, SNS, SNS…
## $ Establecimiento                             <fct> "Centro Médico Moderno", "…
## $ `DAS/DPS establecimiento`                   <fct> DN-Area V, SD-Area II, San…
## $ `Tipo atención`                             <fct> Internamiento, Internamien…
## $ `Semana notificación`                       <dbl> 11, 20, 8, 36, 46, 24, 35,…
## $ `Fecha notificación`                        <fct> 44077, 43602, 44614, 44810…
## $ `Signos y síntomas`                         <fct> "VOMITOS, NAUSEAS, CANSANC…
## $ Fiebre                                      <fct> 1, 1, 1, 1, 1, 1, 1, 1, 1,…
## $ Escalofrio                                  <fct> 1, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ `Malestar General/debilidad-Dolor muscular` <fct> 1, 0, 1, 1, 0, 1, 1, 1, 1,…
## $ `Dolor en los ojos`                         <fct> 0, 0, 0, 0, 0, 1, 0, 0, 0,…
## $ `Hiperemia conjuntival`                     <fct> 1, 1, 1, 1, 1, 1, 1, 1, 1,…
## $ Torniquete_positivo                         <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Erupción_maculopapular                      <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Erupción_tórax                              <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Ojos_rojos_irritados                        <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Derrame_pleural                             <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ `Frote pericárdico`                         <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Nauseas                                     <fct> 1, 0, 0, 0, 0, 1, 0, 0, 0,…
## $ Dolor_abdominal                             <fct> 1, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Vómitos                                     <fct> 1, 1, 1, 1, 1, 1, 0, 0, 0,…
## $ Hepatomegalia                               <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Esplenomegalia                              <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Insuficiencia_renal                         <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Convulsiones                                <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Somnolencia                                 <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Alteraciones_conducta                       <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ `Alteraciones de la conciencia`             <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Sangrado_conjuntival                        <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Sangrado_nasal                              <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Sangrado_encías                             <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Vómitos_sangre                              <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Sangre_heces                                <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Orina_color_café                            <fct> 0, 0, 0, 0, 0, 1, 0, 0, 0,…
## $ Petequias                                   <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Equimosis                                   <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Púrpura                                     <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Ascitis                                     <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Hemoconcentracion                           <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Leucopenia                                  <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Leucocitosis                                <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Trombocitopenia                             <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ `Resultado final`                           <fct> Sospechoso, Sospechoso, Pr…
## $ Condición                                   <fct> Vivo, Vivo, Vivo, Vivo, Vi…
## $ Gravedad                                    <fct> Con signos de alarma, Con …
## $ `Semana defunción`                          <dbl> NA, NA, NA, NA, NA, NA, NA…
## $ `Mes defunción`                             <fct> NA, NA, NA, NA, NA, NA, NA…
## $ `Año defunción`                             <fct> NA, NA, NA, NA, NA, NA, NA…
## $ `Fecha defunción`                           <fct> NA, NA, NA, NA, NA, NA, NA…
## $ `Edad fecha defunción`                      <fct> NA, NA, NA, NA, NA, NA, NA…

Recodifiquemos la variable Nacionalidad, agrupando como Dominicana, haitiana y otra nacionalidad

Primero, conozcamos la distribución de frecuencia de la variable sobre nacionalidad:

table(Datos$`País procedencia`) %>% kable()
Var1 Freq
Alemania 4
Argentina 1
Bélgica 1
Bulgaria 1
Canadá 3
China 9
Colombia 1
Corea del Sur 1
Croacia 1
Cuba 2
Dominica 1
Eritrea 1
España 4
Estados Unidos 2
Francia 1
Haití 179
Honduras 1
Hong Kong 1
Italia 9
México 2
Países Bajos 1
Panamá 1
Perú 1
Puerto Rico 3
Reino Unido 1
República Democrática del Congo 5
República Dominicana 5927
Ruanda 1
Rusia 1
Suiza 1
Ucrania 1
Venezuela 15

La siguiente línea de código realiza la categorización:

Datos$nacionalidad <- if_else(condition = Datos$`País procedencia` == "República Dominicana", true = "Dominicana", false = if_else(condition = Datos$`País procedencia` == "Haití", true = "Haitiana", false = "Otra"))

#Verificamos que la categorización se haya realizado bien.
table(Datos$nacionalidad)
## 
## Dominicana   Haitiana       Otra 
##       5927        179         77

Ahora con la variable sobre afiliación al Seguro familiar de salud:

table(Datos$`Categoría de afiliación`) %>% kable()
Var1 Freq
Contributivo 1835
Contributivo-subsidiado 28
No afiliado 3266
Subsidiado 1054
Datos$afiliacion <- if_else(condition = Datos$`Categoría de afiliación` == "Contributivo" | Datos$`Categoría de afiliación` == "Contributivo-subsidiado", true = "Contributivo", false = Datos$`Categoría de afiliación`)


#Verificamos que la categorización se haya realizado bien.
table(Datos$afiliacion)
## 
## Contributivo  No afiliado   Subsidiado 
##         1863         3266         1054

Ahora con la variable sobre nivel educativo:

table(Datos$`Nivel educativo`) %>% kable()
Var1 Freq
Primaria (1-4) 554
Primaria (5-8) 1034
Secundaria 2820
Sin educación 458
Superior 1317
Datos$Nivel_educativo <- if_else(condition = Datos$`Nivel educativo` == "Primaria (1-4)" | Datos$`Nivel educativo` == "Primaria (5-8)", true = "Primaria", false = Datos$`Nivel educativo`)

#Verificamos que la categorización se haya realizado bien.
table(Datos$Nivel_educativo)
## 
##      Primaria    Secundaria Sin educación      Superior 
##          1588          2820           458          1317

10. Análisis descriptivo

En esta sección realizaremos un análisis descriptivo de los casos que cumplen con los criterios de inclusión y exclusión para entender mejor las características sociodemográficas y clínicas de los adultos con dengue. Para las variables numéricas, calcularemos estadísticos resumen (media, mediana, rangos). Para variables categóricas obtendremos frecuencias absolutas y relativas. Para una mejor ilustración Generaremos tablas y gráficos que permitan visualizar la distribución de los datos y detectar patrones iniciales.

El objetivo es familiarizarnos con la forma de los datos y sentar las bases para los análisis posteriores. Una vez completada esta etapa, estaremos en condiciones de identificar las relaciones más relevantes y plantear hipótesis de trabajo.

Utilizando la librería table1 elaboraremos las tablas descriptivas.

Información sociodemográfica

table1( ~ Edad1 + nacionalidad + Nivel_educativo + afiliacion + Condición | Sexo , data = Datos, render.continuous=c(.="Mean (SD)", .="Median [Q1, Q3]"))
Femenino
(N=2389)
Masculino
(N=3794)
Overall
(N=6183)
Edad1
Mean (SD) 35.4 (17.4) 35.9 (18.0) 35.7 (17.8)
Median [Q1, Q3] 29.0 [22.0, 45.0] 29.0 [21.0, 47.0] 29.0 [21.0, 46.0]
nacionalidad
Dominicana 2313 (96.8%) 3614 (95.3%) 5927 (95.9%)
Haitiana 53 (2.2%) 126 (3.3%) 179 (2.9%)
Otra 23 (1.0%) 54 (1.4%) 77 (1.2%)
Nivel_educativo
Primaria 553 (23.1%) 1035 (27.3%) 1588 (25.7%)
Secundaria 1106 (46.3%) 1714 (45.2%) 2820 (45.6%)
Sin educación 141 (5.9%) 317 (8.4%) 458 (7.4%)
Superior 589 (24.7%) 728 (19.2%) 1317 (21.3%)
afiliacion
Contributivo 735 (30.8%) 1128 (29.7%) 1863 (30.1%)
No afiliado 1206 (50.5%) 2060 (54.3%) 3266 (52.8%)
Subsidiado 448 (18.8%) 606 (16.0%) 1054 (17.0%)
Condición
Muerto 21 (0.9%) 37 (1.0%) 58 (0.9%)
Vivo 2368 (99.1%) 3757 (99.0%) 6125 (99.1%)
table1( ~ Edad1 + Nivel_educativo + afiliacion + Condición | nacionalidad , data = Datos, render.continuous=c(.="Mean (SD)", .="Median [Q1, Q3]"))
Dominicana
(N=5927)
Haitiana
(N=179)
Otra
(N=77)
Overall
(N=6183)
Edad1
Mean (SD) 35.8 (17.9) 32.0 (13.6) 41.1 (18.5) 35.7 (17.8)
Median [Q1, Q3] 29.0 [21.0, 46.0] 28.0 [22.0, 36.0] 35.0 [26.0, 57.0] 29.0 [21.0, 46.0]
Nivel_educativo
Primaria 1503 (25.4%) 74 (41.3%) 11 (14.3%) 1588 (25.7%)
Secundaria 2766 (46.7%) 22 (12.3%) 32 (41.6%) 2820 (45.6%)
Sin educación 375 (6.3%) 80 (44.7%) 3 (3.9%) 458 (7.4%)
Superior 1283 (21.6%) 3 (1.7%) 31 (40.3%) 1317 (21.3%)
afiliacion
Contributivo 1843 (31.1%) 4 (2.2%) 16 (20.8%) 1863 (30.1%)
No afiliado 3032 (51.2%) 173 (96.6%) 61 (79.2%) 3266 (52.8%)
Subsidiado 1052 (17.7%) 2 (1.1%) 0 (0%) 1054 (17.0%)
Condición
Muerto 54 (0.9%) 3 (1.7%) 1 (1.3%) 58 (0.9%)
Vivo 5873 (99.1%) 176 (98.3%) 76 (98.7%) 6125 (99.1%)

Ejercicio. Redacte una breve interpretación de los resultados mostrados en las tablas descriptivas.


Incidencia de casos graves y con signos de alarma.

En este ejercicio estimaremos la carga de las formas de dengue: con signos de alarma y graves en adultos (≥18 años) durante el periodo 2018–2022. Para ello:

Aquí está el número de casos por estado de resultado.

table1( ~ Gravedad  | `Año inicio síntomas`, data = Datos)
2018
(N=276)
2019
(N=2860)
2020
(N=815)
2021
(N=594)
2022
(N=1638)
Overall
(N=6183)
Gravedad
Con signos de alarma 86 (31.2%) 1240 (43.4%) 364 (44.7%) 197 (33.2%) 661 (40.4%) 2548 (41.2%)
Grave 2 (0.7%) 45 (1.6%) 70 (8.6%) 41 (6.9%) 65 (4.0%) 223 (3.6%)
Sin signos de alarma 186 (67.4%) 1555 (54.4%) 381 (46.7%) 356 (59.9%) 912 (55.7%) 3390 (54.8%)
Missing 2 (0.7%) 20 (0.7%) 0 (0%) 0 (0%) 0 (0%) 22 (0.4%)

¿Cómo calcularía la incidencia para cada uno de los años a partir de esto?

De acuerdo a los grupos conformados. Buscar cómo calcular la incidencia de casos grave o Con signos de alarma por año. Anote los resultados para discutir al final.

Características clínicas


En este apartado profundizaremos en el perfil clínico de los pacientes adultos con dengue.

Observar la distribución de los casos a través de tablas de frecuencia, identificaremos los signos y síntomas más frecuentes.

Generales o sistémicas

table1( ~ factor(Fiebre) + factor(Escalofrio) + factor(`Malestar General/debilidad-Dolor muscular`) + factor(`Dolor en los ojos`)  | Sexo , data = Datos)
Femenino
(N=2389)
Masculino
(N=3794)
Overall
(N=6183)
factor(Fiebre)
0 44 (1.8%) 58 (1.5%) 102 (1.6%)
1 2345 (98.2%) 3736 (98.5%) 6081 (98.4%)
factor(Escalofrio)
0 1898 (79.4%) 3032 (79.9%) 4930 (79.7%)
1 491 (20.6%) 762 (20.1%) 1253 (20.3%)
factor(`Malestar General/debilidad-Dolor muscular`)
0 786 (32.9%) 1225 (32.3%) 2011 (32.5%)
1 1603 (67.1%) 2569 (67.7%) 4172 (67.5%)
factor(`Dolor en los ojos`)
0 1961 (82.1%) 3142 (82.8%) 5103 (82.5%)
1 428 (17.9%) 652 (17.2%) 1080 (17.5%)

Nota: 0 = No; 1 = SI. En caso de no haber recodificado estas variables en etapas anteriores.


Muscosa y Piel

table1( ~ factor(`Hiperemia conjuntival`) + factor(Torniquete_positivo) + factor(Erupción_maculopapular) + factor(Erupción_tórax) + factor(Ojos_rojos_irritados) | Sexo , data = Datos)
Femenino
(N=2389)
Masculino
(N=3794)
Overall
(N=6183)
factor(`Hiperemia conjuntival`)
0 8 (0.3%) 6 (0.2%) 14 (0.2%)
1 2381 (99.7%) 3788 (99.8%) 6169 (99.8%)
factor(Torniquete_positivo)
0 2385 (99.8%) 3789 (99.9%) 6174 (99.9%)
1 4 (0.2%) 5 (0.1%) 9 (0.1%)
factor(Erupción_maculopapular)
0 2371 (99.2%) 3768 (99.3%) 6139 (99.3%)
1 18 (0.8%) 26 (0.7%) 44 (0.7%)
factor(Erupción_tórax)
0 2379 (99.6%) 3779 (99.6%) 6158 (99.6%)
1 10 (0.4%) 15 (0.4%) 25 (0.4%)
factor(Ojos_rojos_irritados)
0 2388 (100.0%) 3791 (99.9%) 6179 (99.9%)
1 1 (0.0%) 3 (0.1%) 4 (0.1%)

Nota: 0 = No; 1 = SI. En caso de no haber recodificado estas variables en etapas anteriores.


Respiratorios y cardiovasculares

table1( ~ factor( Derrame_pleural) + factor(`Frote pericárdico`) | Sexo , data = Datos)
Femenino
(N=2389)
Masculino
(N=3794)
Overall
(N=6183)
factor(Derrame_pleural)
0 2382 (99.7%) 3788 (99.8%) 6170 (99.8%)
1 7 (0.3%) 6 (0.2%) 13 (0.2%)
factor(`Frote pericárdico`)
0 2389 (100%) 3793 (100.0%) 6182 (100.0%)
1 0 (0%) 1 (0.0%) 1 (0.0%)

Nota: 0 = No; 1 = SI. En caso de no haber recodificado estas variables en etapas anteriores.


Gastrointestinales y renales

table1( ~ factor(Nauseas) + factor(Dolor_abdominal) + factor(Vómitos) + 
          factor(Hepatomegalia) + factor(Esplenomegalia) + factor(Insuficiencia_renal) | Sexo , data = Datos)
Femenino
(N=2389)
Masculino
(N=3794)
Overall
(N=6183)
factor(Nauseas)
0 1704 (71.3%) 2908 (76.6%) 4612 (74.6%)
1 685 (28.7%) 886 (23.4%) 1571 (25.4%)
factor(Dolor_abdominal)
0 1744 (73.0%) 2849 (75.1%) 4593 (74.3%)
1 645 (27.0%) 945 (24.9%) 1590 (25.7%)
factor(Vómitos)
0 1707 (71.5%) 2832 (74.6%) 4539 (73.4%)
1 682 (28.5%) 962 (25.4%) 1644 (26.6%)
factor(Hepatomegalia)
0 2389 (100%) 3790 (99.9%) 6179 (99.9%)
1 0 (0%) 4 (0.1%) 4 (0.1%)
factor(Esplenomegalia)
0 2389 (100%) 3791 (99.9%) 6180 (100.0%)
1 0 (0%) 3 (0.1%) 3 (0.0%)
factor(Insuficiencia_renal)
0 2386 (99.9%) 3792 (99.9%) 6178 (99.9%)
1 3 (0.1%) 2 (0.1%) 5 (0.1%)

Nota: 0 = No; 1 = SI. En caso de no haber recodificado estas variables en etapas anteriores.


Neurológicos

table1( ~ factor(Convulsiones) + factor(Somnolencia) + factor(Alteraciones_conducta) + factor(`Alteraciones de la conciencia`)  | Sexo , data = Datos)
Femenino
(N=2389)
Masculino
(N=3794)
Overall
(N=6183)
factor(Convulsiones)
0 2386 (99.9%) 3788 (99.8%) 6174 (99.9%)
1 3 (0.1%) 6 (0.2%) 9 (0.1%)
factor(Somnolencia)
0 2383 (99.7%) 3790 (99.9%) 6173 (99.8%)
1 6 (0.3%) 4 (0.1%) 10 (0.2%)
factor(Alteraciones_conducta)
0 2389 (100%) 3793 (100.0%) 6182 (100.0%)
1 0 (0%) 1 (0.0%) 1 (0.0%)
factor(`Alteraciones de la conciencia`)
0 2385 (99.8%) 3787 (99.8%) 6172 (99.8%)
1 4 (0.2%) 7 (0.2%) 11 (0.2%)

Nota: 0 = No; 1 = SI. En caso de no haber recodificado estas variables en etapas anteriores.


Hemorrágicos

table1( ~ factor(Sangrado_conjuntival) + factor(Sangrado_nasal) + factor(Sangrado_encías) + factor(Vómitos_sangre) + factor(Sangre_heces) + factor(Orina_color_café) + factor(Petequias) + factor(Equimosis) + factor(Púrpura) + factor(Ascitis) + factor(Hemoconcentracion) + factor(Leucopenia) + factor(Leucocitosis) + factor(Trombocitopenia)  | Sexo , data = Datos)
Femenino
(N=2389)
Masculino
(N=3794)
Overall
(N=6183)
factor(Sangrado_conjuntival)
0 2389 (100%) 3792 (99.9%) 6181 (100.0%)
1 0 (0%) 2 (0.1%) 2 (0.0%)
factor(Sangrado_nasal)
0 2360 (98.8%) 3756 (99.0%) 6116 (98.9%)
1 29 (1.2%) 38 (1.0%) 67 (1.1%)
factor(Sangrado_encías)
0 2373 (99.3%) 3776 (99.5%) 6149 (99.5%)
1 16 (0.7%) 18 (0.5%) 34 (0.5%)
factor(Vómitos_sangre)
0 2378 (99.5%) 3773 (99.4%) 6151 (99.5%)
1 11 (0.5%) 21 (0.6%) 32 (0.5%)
factor(Sangre_heces)
0 2386 (99.9%) 3788 (99.8%) 6174 (99.9%)
1 3 (0.1%) 6 (0.2%) 9 (0.1%)
factor(Orina_color_café)
0 2381 (99.7%) 3778 (99.6%) 6159 (99.6%)
1 8 (0.3%) 16 (0.4%) 24 (0.4%)
factor(Petequias)
0 2338 (97.9%) 3733 (98.4%) 6071 (98.2%)
1 51 (2.1%) 61 (1.6%) 112 (1.8%)
factor(Equimosis)
0 2388 (100.0%) 3792 (99.9%) 6180 (100.0%)
1 1 (0.0%) 2 (0.1%) 3 (0.0%)
factor(Púrpura)
0 2388 (100.0%) 3791 (99.9%) 6179 (99.9%)
1 1 (0.0%) 3 (0.1%) 4 (0.1%)
factor(Ascitis)
0 2379 (99.6%) 3777 (99.6%) 6156 (99.6%)
1 10 (0.4%) 17 (0.4%) 27 (0.4%)
factor(Hemoconcentracion)
0 2324 (97.3%) 3647 (96.1%) 5971 (96.6%)
1 65 (2.7%) 147 (3.9%) 212 (3.4%)
factor(Leucopenia)
0 2049 (85.8%) 3218 (84.8%) 5267 (85.2%)
1 340 (14.2%) 576 (15.2%) 916 (14.8%)
factor(Leucocitosis)
0 2370 (99.2%) 3747 (98.8%) 6117 (98.9%)
1 19 (0.8%) 47 (1.2%) 66 (1.1%)
factor(Trombocitopenia)
0 1514 (63.4%) 2372 (62.5%) 3886 (62.8%)
1 875 (36.6%) 1422 (37.5%) 2297 (37.2%)

Nota: 0 = No; 1 = SI. En caso de no haber recodificado estas variables en etapas anteriores.


11. Análisis inferencial

En un escenario ideal, las hipótesis o preguntas de investigación son planteadas en la propuesta de investigación/protocolo, es decir, antes de iniciar el análisis; sin embargo, para fines de este taller, pasemos esto por alto.

Entonces, luego de observar y analizar las características demográficas y clínicas en los casos, es momento de plantear hipótesis basadas en los patrones observados y ponerlas a prueba con métodos estadísticos.
En ese sentido, ¿les surge alguna hipótesis de asociación que les interese probar?


Ejercicio x. Plantee y contraste al menos 3 hipótesis para compartir y discutir con el resto de los participantes.

  1. ¿Qué tipo de hipótesis es el que desea probar?

  2. Plantee el sistema de hipótesis que desea contrastar.

  3. Seleccione un nivel de significación estadística para contrastar la hipótesis planteada

  4. Evalúe la hipótesis planteada.

  5. Interprete los resultados.



Ejemplo de cómo desarrollar el ejercicio:

Después de observar y analizar los descriptivos sobre las características demográficas y clínicas en los casos, surge la pregunta sobre ¿Existe algún tipo de relación entre la clasificación del dengue (Sin signos de alarma, con signos de alarma y grave) y el grupo de edad a la que pertenecen las personas?

Luego de esta interrogante, planteo la hipótesis:

1. Qué tipo de hipótesis es el que desea probar?

Para responder a esta pregunta, donde mediremos el nivel de asociación ente dos variables categóricas, utilizaremos el test estadístico Chi-cuadrado.

2. Plantee el sistema de hipótesis que desea contrastar.

  • H₀ (hipótesis nula): La clasificación del dengue es independiente del grupo de edad.
  • H₁ (hipótesis alternativa): Existe asociación entre la clasificación del dengue y el grupo de edad.

3. Seleccione un nivel de significación estadística para contrastar la hipótesis planteada

Asumiremos un Nivel de significación: α = 0.05

4. Evalúe la hipótesis planteada.

Para evaluar la hipótesis nos auxiliaremos del Software:

Primero, realizaremos una tabla de contingencia para mirar la distribución de los casos:

table1( ~ Gravedad  | `Grupo edad`, data = Datos[!is.na(Datos$Gravedad), ])
10_19
(N=937)
20_29
(N=2236)
30_39
(N=985)
40_49
(N=661)
50_59
(N=522)
60 o más
(N=820)
Overall
(N=6161)
Gravedad
Con signos de alarma 404 (43.1%) 957 (42.8%) 392 (39.8%) 267 (40.4%) 230 (44.1%) 298 (36.3%) 2548 (41.4%)
Grave 22 (2.3%) 59 (2.6%) 41 (4.2%) 22 (3.3%) 36 (6.9%) 43 (5.2%) 223 (3.6%)
Sin signos de alarma 511 (54.5%) 1220 (54.6%) 552 (56.0%) 372 (56.3%) 256 (49.0%) 479 (58.4%) 3390 (55.0%)

Realizaremos la prueba correspondiente:

tabla_edad_clasif <- table(Datos$Gravedad, Datos$`Grupo edad`)
chisq.test(tabla_edad_clasif)
## 
##  Pearson's Chi-squared test
## 
## data:  tabla_edad_clasif
## X-squared = 46.626, df = 10, p-value = 1.104e-06

5. Interprete los resultados.

Como el p-valor es mucho menor que α = 0.05, rechazamos la hipótesis nula Esto indica que sí existe una asociación estadísticamente significativa entre la edad del paciente y la gravedad del dengue. En otras palabras, la proporción de casos “sin signos de alarma”, “con signos de alarma” y “grave” varía según el grupo etario.


Partiendo de este ejemplo, realicen sus propias hipótesis y lleguen a sus propias conclusiones. 🙌

😎 ¡Sé que pueden, vamos! 😎


12. Reflexión y discusión final

Hallazgos y reflexiones

En esta última sección, invitamos a los grupos a compartir sus hallazgos, reflexionar sobre el proceso.

  1. Síntesis de resultados

    • Cada grupo resuma en 2–3 frases los principales patrones detectados (p. ej., grupos de edad con más casos graves, más prevalente en el sexo xxxx).
    • ¿Cómo concuerdan o difieren sus hallazgos de la literatura?
  2. Limitaciones del análisis

    • Discutan posibles sesgos: sub‐notificación, datos faltantes, calidad de las variables clínicas.
    • ¿Qué aspectos metodológicos reforzarían la validez de sus conclusiones (p. ej., ajuste de covariables adicionales…)?
  3. Implicaciones para Salud Pública

    • Basándose en los resultados, propongan al menos dos recomendaciones prácticas para mejorar la vigilancia y respuesta al dengue en República Dominicana.
    • ¿Cómo podrían las autoridades distribuir recursos de control vectorial o adecuar protocolos clínicos?
  4. Reproducibilidad y colaboración

    • ¿Han reflexionado sobre la reproducibilidad en la investigación?
    • ¿Qué acciones concretas implementarían para asegurar que sus futuros análisis sean replicables?

Dinámica Final

Dinámica: Cada grupo dispone de 5 min para exponer sus respuestas.

13. Referncias

  1. Centers for Disease Control and Prevention. Dominican Republic – Yellow Book. Atlanta: CDC; 2024 [citado 23 may 2025]. Disponible en: https://www.cdc.gov/yellow-book/hcp/americas-caribbean/dominican-republic.html :contentReferenceoaicite:0
  2. Freitas A, Rodrigues HS, Martins N, et al. Multiplicative mixed-effects modelling of dengue incidence: an analysis of the 2019 outbreak in the Dominican Republic. Axioms. 2023;12(2):150. doi:10.3390/axioms12020150 :contentReferenceoaicite:1
  3. Chao A, Su YC, Lu PL, et al. Comparison of clinical and laboratory characteristics between paediatric and adult dengue patients. PLoS Negl Trop Dis. 2023;17:e0011839. doi:10.1371/journal.pntd.0011839 :contentReferenceoaicite:4
  4. Añez G, Heisey DA, Espinal MA, et al. Dengue epidemiology and burden of disease in Latin America and the Caribbean: a systematic review. BMC Infect Dis. 2016;16:20. doi:10.1186/s12879-015-1058-x :contentReferenceoaicite:5
  5. Tomashek KM, Lorenzi OD, Muñoz-Jordán JL, et al. Clinical differences and risk factors for severe dengue infection in adults versus children. Trans R Soc Trop Med Hyg. 2012;106:123-132. doi:10.1093/trstmh/trs123 :contentReferenceoaicite:6