Este análisis forma parte del sub-análisis realizado incluido en el Trabajo de Fin de Máster de Katherine J. Victorio-Suberví, presentado en el Máster Universitario en Investigación en Ciencias Sociosanitarias de la Facultad de Enfermería, Universidad de Murcia.
Uso académico exclusivo:
Todos los resultados y datasets han sido anonimizados y se emplean ÚNICAMENTE con fines formativos. Cualquier uso adicional (publicación, decisiones clínicas, etc.) requiere autorización expresa de las fuentes originales.
Descargo de responsabilidad:
Este documento es responsabilidad de los autores y no refleja necesariamente las posiciones oficiales de Fundación Etikos ni del Ministerio de Salud Pública de la República Dominicana.
Responsabilidad de los/as participantes:
Las conclusiones y códigos aquí generados son fruto de su propio trabajo grupal, guiadas por el tutor. Eviten el plagio y, en caso de reutilizar fragmentos de este material en futuros proyectos académicos, citen de la siguiente forma:
Patricio-Baldera J., Victorio-Suberví K. J. (2025). Características clínicas y epidemiológicas de los casos de dengue en adultos en la República Dominicana (2022). Taller de análisis de datos secundarios en Salud Pública. Fundación Etikos. Accedido el: “Colocar Fecha”. Disponible en: “Colocar Enlace”.
En este taller exploraremos cómo aprovechar datos secundarios para generar evidencia útil en Salud Pública. Partiendo de un caso real —el dengue en adultos en la República Dominicana entre 2018 y 2022— aprenderemos a:
tidyverse
.dplyr
y ggplot2
.Cada etapa incluirá preguntas dirigidas y retos prácticos para fomentar la discusión en equipo. Al final, cada grupo presentará un breve resumen interpretativo de sus hallazgos, reforzando la capacidad crítica y colaborativa de los participantes.
Tips para resolver el taller
- Leer detenidamente cada sección para estar contextualizadas con el evento y las cuestiones del taller.
- Copien y peguen el código en sus computadores para obtener los resultados y responder a las preguntas realizadas.
- Anoten dudas o descubrimientos: ¡Las preguntas enriquecen el debate!
- Al finalizar, tendremos secciones de presentación grupal analizando debatiendo los hallazgos.
😊🦟 Empecemos 🦟😊
La República Dominicana constituye un foco endémico para el dengue, el cual causa brotes cíclicos con elevada carga asistencial. En 2022 el país notificó 10 784 casos y 39 defunciones según el Centro para el Control y la Prevención de Enfermedades (CDC) [^1]. Durante el gran brote de 2019 la incidencia se disparó a 194,9 casos por 100 000 habitantes, un incremento del 1 145 % respecto a 2018 y un 142 % por encima del promedio histórico 2005-2014 [^2].
Aunque la vigilancia nacional cubre todas las edades, la mayor parte de la literatura local y regional se ha centrado en población pediátrica [^3]. Sin embargo, revisiones latinoamericanas estiman que los adultos concentran ~50 % de las infecciones y >90 % de las defunciones por dengue [^4]. Estudios comparativos demuestran que los adultos presentan mayor riesgo de dengue grave (7,6 % vs. 3,5 %) y mayor frecuencia de hospitalización (14,4 % vs. 6,3 %) que los niños [^5].
Esta brecha de conocimiento motiva el presente estudio, enfocado exclusivamente en casos adultos (≥ 18 años) notificados por SINAVE entre 2018 y 2022.
Analizar las Características clínicas y epidemiológicas de los casos de dengue en adultos en la República Dominicana durante el período 2018-2022.
Antes de cargar y depurar el dataset, reflexionemos sobre qué fuentes podríamos utilizar para un análisis robusto del dengue en adultos.
De acuerdo a los grupos conformados, respondan en un máximo de 5 minutos por escrito:
Luego de anotar por escrito sus respuestas.
Posibles Respuestas
1. Fuentes de información
- SINAVE (Sistema Nacional de Vigilancia
Epidemiológica): base de datos administrativa de casos
notificados.
- OPS/PAHO: boletines regionales de dengue que resumen
casos y tendencias, útil para discutir nuestros resultados.
- Censo Nacional de Población (ONE): datos de población
para cálculo de tasas.
- Red de Hospitales/egresos: registros de
hospitalización por dengue.
2. Tipo de fuente
- SINAVE: administrativa, secundaria
(datos recogidos rutinariamente).
- OPS/PAHO: institucional, secundaria
agregada.
- Censo: estatal, primaria para
denominadores.
- Hospitales: clínica, primaria de
egresos.
3. Ventajas / atributos (SINAVE)
- Cobertura amplia: SINAVE cubre todo el territorio y
años de estudio.
- Actualización continua: datos disponibles
semanalmente.
- Accesibilidad: muchas veces públicos o por
solicitud.
- Consistencia metodológica: mismas definiciones caso
tras caso.
4. Limitaciones (SINAVE)
- Sub-notificación: no todos los casos llegan a
registro oficial (Sub-registro).
- Retrasos: demoras entre la ocurrencia y la
notificación.
- Datos faltantes: variables clínicas o demográficas
incompletas.
- Calidad variable: diferencias en la capacidad de
laboratorio o reporte local.
🦟 ¡Ahora sí, pasemos a los datos! 🦟
Luego de identificar el SINAVE como la fuente de información a utilizar para responder a los objetivos planteados. Exploremos las variables disponibles de acuerdo al Formulario Único de Notificación Individual de Caso (v.2024) en el que se basa SINAVE para registrar este y otros eventos.
Esta es una captura del Formulario Único de Notificación Individual de Caso (v.2024):
Figura 1: Fragmento del Formulario Único de Notificación Individual de Caso (v.2024).
En el Formulario Único de Notificación Individual de Caso (v.2024) se encuentran los datos del notificador, información socio-demográfica, información clínica, entre otros elementos relacionados con el evento a notificar.
Descargar el Formulario Completo (v.2024) aquí
Formulario Único de Notificación Individual de Caso (PDF)
De acuerdo a los grupos conformados, respondan en un máximo de 10 minutos por escrito:
A continuación se presenta el listado de variables seleccionadas en el análisis, su escala de medición y categorías asociadas, tal como en el trabajo original:
Mirar luego de haber realizado el ejercicio 2
Variable | Escala | Categorías / Valores |
---|---|---|
Características sociodemográficas | ||
Edad | Razón | — |
Grupos de edad | Nominal | 1. < 20 años 2. 20–39 años 3. 40–59 años 4. ≥ 60 años |
Sexo | Nominal | 1. Masculino 2. Femenino |
Nacionalidad | Nominal | 1. Dominicana 2. Haitiana 3. Otra |
Provincia | Nominal | División territorial de la República Dominicana |
Municipio | Nominal | División territorial de la República Dominicana |
Nivel Educativo | Nominal | 1. Sin educación 2. Primaria 3. Secundaria 4. Superior |
Afiliación al SFS | Nominal | 1. Contributivo 2. Subsidiado 3. No afiliado |
Datos clínicos de la enfermedad | ||
Generales o sistémicos | ||
Fiebre | Nominal | 0. No 1. Sí |
Escalofríos | Nominal | 0. No 1. Sí |
Malestar general / Debilidad / Dolor muscular | Nominal | 0. No 1. Sí |
Dolor en los ojos | Nominal | 0. No 1. Sí |
Mucosa y Piel | ||
Hiperemia conjuntival | Nominal | 0. No 1. Sí |
Torniquete positivo | Nominal | 0. No 1. Sí |
Erupción maculopapular | Nominal | 0. No 1. Sí |
Erupción en tórax | Nominal | 0. No 1. Sí |
Ojos rojos / irritados | Nominal | 0. No 1. Sí |
Respiratorios y cardiovasculares | ||
Derrame pleural | Nominal | 0. No 1. Sí |
Frote pericárdico | Nominal | 0. No 1. Sí |
Gastrointestinales y renales | ||
Náuseas | Nominal | 0. No 1. Sí |
Dolor / Distensión abdominal | Nominal | 0. No 1. Sí |
Vómitos | Nominal | 0. No 1. Sí |
Hepatomegalia | Nominal | 0. No 1. Sí |
Esplenomegalia | Nominal | 0. No 1. Sí |
Insuficiencia renal | Nominal | 0. No 1. Sí |
Neurológicos | ||
Convulsiones | Nominal | 0. No 1. Sí |
Somnolencia | Nominal | 0. No 1. Sí |
Alteraciones de conducta | Nominal | 0. No 1. Sí |
Alteraciones de la conciencia | Nominal | 0. No 1. Sí |
Hemorrágicos / Hemáticos | ||
Sangrado conjuntival, nasal o por encías | Nominal | 0. No 1. Sí |
Vómitos de sangre | Nominal | 0. No 1. Sí |
Sangre en heces | Nominal | 0. No 1. Sí |
Orina color café | Nominal | 0. No 1. Sí |
Petequias | Nominal | 0. No 1. Sí |
Equimosis | Nominal | 0. No 1. Sí |
Púrpura / Ascitis | Nominal | 0. No 1. Sí |
Hemoconcentración | Nominal | 0. No 1. Sí |
Leucopenia | Nominal | 0. No 1. Sí |
Leucocitosis | Nominal | 0. No 1. Sí |
Trombocitopenia | Nominal | 0. No 1. Sí |
Clasificación del Dengue | ||
Gravedad | Nominal | 1. Sin signos de alarma 2. Con signos de alarma 3. Grave |
En esta sección instalaremos y llamaremos las librerías requeridas, leeremos y exploraremos el archivo que contiene los microdatos con los “casos” de dengue reportados al SINAVE durante el periodo 2018-2022.
Los siguientes paquetes, disponibles en CRAN o github, son necesarios para este análisis. Para instalarlos, ejecute los siguientes códigos:
install.packages("readxl") # para leer Excel
install.packages("dplyr") # para manipulación básica
install.packages("ggplot2") # para gráficos
install.packages("table1") # para gráficos
Una vez instalados los paquetes, es posible que deba abrir una nueva sesión de R. Ahora cargue las bibliotecas de la siguiente manera:
library(readxl) # para leer Excel
library(dplyr) # para manipulación básica
library(ggplot2) # para gráficos
library(knitr) # para gráficos
library(table1) # para elaborar tablas descriptivas
Descarga de datos:
Para trabajar con el conjunto de datos en este taller, por favor descarguen el archivo haciendo clic en el siguiente enlace y guárdenlo en su directorio de trabajo de R:
“Disculpe, los datos para la descarga han sido inhabilitados temporalmente; Sin embargo, acá puede ver el detalle y paso a paso de la construcción de los resultados obtenidos.
A continuación cargaremos localmente el archivo que descargaron y haremos una exploración básica de las variables clave.
Tiene varias opciones, una de ellas es haciendo clic en el botón
Import
ubicado en el enviroment o con el código mostrado a
continuación:
# Ejecutar el código para leer los datos
Datos <- read_excel("DENGUE_2018_2022_SINAVE_v1.3.xlsx")
1. ¿Cuántos registros (filas) contiene el objeto
Datos
?
nrow(Datos)
2. ¿Cuántas variables (columnas) tiene?
ncol(Datos)
3. Al ejecutar la siguiente línea de código podrá ver la estructura de los datos ¿Qué observa en las variables incluidas (sus categorías, valores…)?
# Verificar la estructura del data frame
glimpse(Datos)
## Rows: 7,915
## Columns: 79
## $ Sospecha <chr> "DENGUE", "DENGUE", "DENGU…
## $ Sexo <chr> "Masculino", "Femenino", "…
## $ Edad1 <dbl> 19, 20, 22, 18, 36, 22, 52…
## $ `Grupo edad` <chr> "10_19", "20_29", "20_29",…
## $ `Categoría de afiliación` <chr> "Contributivo", "Contribut…
## $ ARS <chr> "HUMANO", "SENASA", NA, "S…
## $ `Nivel educativo` <chr> "Superior", "Secundaria", …
## $ Embarazada <chr> NA, "No", "No", "No", "No"…
## $ `Semanas amenorrea` <dbl> NA, NA, NA, NA, NA, NA, NA…
## $ `Etapa gestación` <chr> NA, NA, NA, NA, NA, NA, NA…
## $ `Tipo de parto` <chr> NA, NA, NA, NA, NA, NA, NA…
## $ `Región residencia` <chr> "O Metropolitana", "O Metr…
## $ Region_cod <chr> "O", "O", "I", "O", "II", …
## $ Provincia <chr> "01 Distrito Nacional", "3…
## $ Provincia_cod <chr> "01", "32", "31", "32", "1…
## $ Municipio <chr> "0101 Santo Domingo de Guz…
## $ Municipio_cod <chr> "0101", "3201", "3101", "3…
## $ `País procedencia` <chr> "República Dominicana", "R…
## $ `Semana inicio síntomas` <dbl> 8, 20, 7, 35, 45, 23, 35, …
## $ `Mes inicio síntomas` <dbl> 2, 5, 2, 9, 11, 6, 8, 9, 9…
## $ `Año inicio síntomas` <dbl> 2020, 2019, 2022, 2022, 20…
## $ `Fecha inicio síntomas` <chr> "2/18/2020", "43598", "446…
## $ `Semana atención` <dbl> 9, 20, 7, 36, 46, 24, 35, …
## $ `Mes atención` <dbl> 2, 5, 2, 9, 11, 6, 9, 9, 9…
## $ `Año atención` <dbl> 2020, 2019, 2022, 2022, 20…
## $ `Fecha atención` <chr> "2/23/2020", "43601", "446…
## $ `Semana toma muestra` <dbl> NA, NA, 7, NA, 46, 24, 35,…
## $ `Fecha toma muestra` <chr> NA, NA, "44611", NA, "4487…
## $ Región <chr> "O Metropolitana", "O Metr…
## $ Institución <chr> "PRIVADO", "PRIVADO", "SNS…
## $ Establecimiento <chr> "Centro Médico Moderno", "…
## $ `DAS/DPS establecimiento` <chr> "DN-Area V", "SD-Area II",…
## $ `Tipo atención` <chr> "Internamiento", "Internam…
## $ `Semana notificación` <dbl> 11, 20, 8, 36, 46, 24, 35,…
## $ `Fecha notificación` <chr> "44077", "43602", "44614",…
## $ `Signos y síntomas` <chr> "VOMITOS, NAUSEAS, CANSANC…
## $ Fiebre <dbl> 1, 1, 1, 1, 1, 1, 1, 1, 1,…
## $ Escalofrio <dbl> 1, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ `Malestar General/debilidad-Dolor muscular` <dbl> 1, 0, 1, 1, 0, 1, 1, 1, 1,…
## $ `Dolor en los ojos` <dbl> 0, 0, 0, 0, 0, 1, 0, 0, 0,…
## $ `Hiperemia conjuntival` <dbl> 1, 1, 1, 1, 1, 1, 1, 1, 1,…
## $ Torniquete_positivo <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Erupción_maculopapular <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Erupción_tórax <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Ojos_rojos_irritados <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Derrame_pleural <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ `Frote pericárdico` <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Nauseas <dbl> 1, 0, 0, 0, 0, 1, 0, 0, 0,…
## $ Dolor_abdominal <dbl> 1, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Vómitos <dbl> 1, 1, 1, 1, 1, 1, 0, 0, 0,…
## $ Hepatomegalia <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Esplenomegalia <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Insuficiencia_renal <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Convulsiones <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Somnolencia <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Alteraciones_conducta <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ `Alteraciones de la conciencia` <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Sangrado_conjuntival <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Sangrado_nasal <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Sangrado_encías <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Vómitos_sangre <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Sangre_heces <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Orina_color_café <dbl> 0, 0, 0, 0, 0, 1, 0, 0, 0,…
## $ Petequias <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Equimosis <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Púrpura <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Ascitis <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Hemoconcentracion <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Leucopenia <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Leucocitosis <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Trombocitopenia <dbl> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ `Resultado final` <chr> "Sospechoso", "Sospechoso"…
## $ Condición <chr> "Vivo", "Vivo", "Vivo", "V…
## $ Gravedad <chr> "Con signos de alarma", "C…
## $ `Semana defunción` <dbl> NA, NA, NA, NA, NA, NA, NA…
## $ `Mes defunción` <dbl> NA, NA, NA, NA, NA, NA, NA…
## $ `Año defunción` <dbl> NA, NA, NA, NA, NA, NA, NA…
## $ `Fecha defunción` <chr> NA, NA, NA, NA, NA, NA, NA…
## $ `Edad fecha defunción` <chr> NA, NA, NA, NA, NA, NA, NA…
Exploremos un poco lo observado:
¿Observan datos faltantes en alguna de las variables?
# Para variables numéricas puede utilizar el siguiente código:
summary(Datos$Edad1)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 18.00 22.00 29.00 36.18 47.00 106.00
boxplot(Datos$Edad1)
# Para variables categóricas puede utilizar el siguiente código:
table(Datos$Sexo, useNA = "always")
##
## Femenino Masculino <NA>
## 3072 4843 0
barplot(
table(Datos$Sexo),
main = "Distribución de Casos por Sexo",
xlab = "Sexo",
ylab = "Número de casos",
col = c("skyblue", "salmon"),
border = "white"
)
Nota: barplot()
necesita un vector
numérico de alturas, por eso primero table(Datos$Sexo)
para
obtener el conteo de cada categoría.
🙌 Continúe con las demás variables para conocer los datos faltantes y categorías no deseadas. 🙌
Aunque podríamos aplicar criterios muy estrictos sobre los criterios de inclusión y exclusión. Para fines de este taller, solo lo haremos a modo de ejemplo para continuar con otros apartados del taller.
Pacientes con información incompleta en su información sociodemográficas:
Con base en la siguiente información, estaremos contando cuantas personas cumplen con los criterios de inclusión y exclusión para la construcción del diagrama.
# Personas incluidas en el conjunto de datos con casos de dengue reportados.
Datos %>% summarise(Casos = n()) %>% kable()
Casos |
---|
7915 |
# ¿Todas las personas son mayores de edad?
Datos %>% filter(Edad1 < 18) %>% summarise(Casos = n()) %>% kable()
Casos |
---|
0 |
# ¿Cuántas personas no son residentes (provincia de residencia codificada como "extranjero")?
Datos %>% filter(Provincia == "99 Extranjero") %>% group_by(Provincia) %>% summarise(Casos = n()) %>% kable()
Provincia | Casos |
---|---|
99 Extranjero | 1 |
# Aquí dejaremos la base lista de acuerdo a los criterios de inclusión
Datos <- Datos %>% filter(Edad1 > 17 & Provincia != "99 Extranjero")
¿Cuántas personas se incluyeron para el análisis de acuerdo a los criterios de inclusión?
# Personas incluidas en el conjunto de datos con casos de dengue reportados.
Datos %>% summarise(Casos = n()) %>% kable()
Casos |
---|
7914 |
# Personas con información de sexo desconocida
Datos %>% filter(is.na(Sexo)) %>% summarise(Casos = n()) %>% kable()
Casos |
---|
0 |
# Personas con información de edad desconocida
Datos %>% filter(is.na(Sexo)) %>% summarise(Casos = n()) %>% kable()
Casos |
---|
0 |
# Personas con información de edad desconocida
Datos %>% filter(is.na(`Nivel educativo`) | `Nivel educativo` == "No sabe / Sin información" ) %>% summarise(Casos = n()) %>% kable()
Casos |
---|
1201 |
# Excluiremos a los registros sin información en nivel educativo o sin información.
Datos <- Datos %>% filter(!is.na(`Nivel educativo`) & `Nivel educativo` != "No sabe / Sin información" )
# Personas con información de seguro familiar de salud desconocida
Datos %>% filter(is.na(`Categoría de afiliación`) | `Categoría de afiliación` == "Desconocida" ) %>% summarise(Casos = n()) %>% kable()
Casos |
---|
530 |
# Excluiremos a los registros sin información de seguro familiar de salud.
Datos <- Datos %>% filter(`Categoría de afiliación` != "Desconocida")
¿Cuántas personas se incluyeron en la muestra final para el análisis?
# Personas incluidas en el conjunto de datos con casos de dengue reportados.
Datos %>% summarise(Casos = n()) %>% kable()
Casos |
---|
6183 |
Recuerde construir el diagrama que explique el tamaño de muestra final, las personas incluidas y excluidas de acuerdo a los criterios establecidos.
Luego de conocer la distribución (variables numéricas) y las categorías (variables categóricas) de las variables, debemos de recodificar las variables de acuerdo a su naturaleza.
En apartado anterior, vimos que las variables estaban categorizadas
tipo numeric
y las categóricas a
factor
, que es como el software entiende y trabaja con este
tipo de variables.
Una opción que podemos utilizar es categorizar variable por variable de acuerdo al tipo y categorías, como se muestra a continuación
# variables categóricas
# Datos$Sexo <- factor(Datos$Sexo)
# Variables numéricas
# Datos$Edad1 <- numeric(Datos$Edad1)
Otra opción es convertirlas todas por grupo. Para lo siguiente ejecute los siguientes códigos:
# 1) Definir vectores de nombres de columnas para ambos tipos de variables:
Variables_numericas <- c("Edad1", "Semana atención", "Semana inicio síntomas",
"Semana notificación", "Semana toma muestra", "Semana defunción" )
variables_categoricas <- setdiff(names(Datos), Variables_numericas) # Esta función convierte las demás variables restantes en categóricas. Por este momento, no trabajaremos con fechas, por lo que omitiremos la correcta clasificación de las fechas.
# 2) Convertir con dplyr::across
Datos <- Datos %>%
mutate(
across(all_of(Variables_numericas), ~ as.numeric(.)),
across(all_of(variables_categoricas), ~ as.factor(.))
)
# 3) Verificar nuevamente la estructura resultante
glimpse(Datos)
## Rows: 6,183
## Columns: 79
## $ Sospecha <fct> DENGUE, DENGUE, DENGUE, DE…
## $ Sexo <fct> Masculino, Femenino, Femen…
## $ Edad1 <dbl> 19, 20, 22, 18, 36, 22, 52…
## $ `Grupo edad` <fct> 10_19, 20_29, 20_29, 10_19…
## $ `Categoría de afiliación` <fct> Contributivo, Contributivo…
## $ ARS <fct> HUMANO, SENASA, NA, SENASA…
## $ `Nivel educativo` <fct> Superior, Secundaria, Secu…
## $ Embarazada <fct> NA, No, No, No, No, No, NA…
## $ `Semanas amenorrea` <fct> NA, NA, NA, NA, NA, NA, NA…
## $ `Etapa gestación` <fct> NA, NA, NA, NA, NA, NA, NA…
## $ `Tipo de parto` <fct> NA, NA, NA, NA, NA, NA, NA…
## $ `Región residencia` <fct> O Metropolitana, O Metropo…
## $ Region_cod <fct> O, O, I, O, II, II, II, II…
## $ Provincia <fct> 01 Distrito Nacional, 32 S…
## $ Provincia_cod <fct> 01, 32, 31, 32, 18, 25, 18…
## $ Municipio <fct> 0101 Santo Domingo de Guzm…
## $ Municipio_cod <fct> 0101, 3201, 3101, 3205, 18…
## $ `País procedencia` <fct> República Dominicana, Repú…
## $ `Semana inicio síntomas` <dbl> 8, 20, 7, 35, 45, 23, 35, …
## $ `Mes inicio síntomas` <fct> 2, 5, 2, 9, 11, 6, 8, 9, 9…
## $ `Año inicio síntomas` <fct> 2020, 2019, 2022, 2022, 20…
## $ `Fecha inicio síntomas` <fct> 2/18/2020, 43598, 44608, 4…
## $ `Semana atención` <dbl> 9, 20, 7, 36, 46, 24, 35, …
## $ `Mes atención` <fct> 2, 5, 2, 9, 11, 6, 9, 9, 9…
## $ `Año atención` <fct> 2020, 2019, 2022, 2022, 20…
## $ `Fecha atención` <fct> 2/23/2020, 43601, 44608, 4…
## $ `Semana toma muestra` <dbl> NA, NA, 7, NA, 46, 24, 35,…
## $ `Fecha toma muestra` <fct> NA, NA, 44611, NA, 44878, …
## $ Región <fct> O Metropolitana, O Metropo…
## $ Institución <fct> PRIVADO, PRIVADO, SNS, SNS…
## $ Establecimiento <fct> "Centro Médico Moderno", "…
## $ `DAS/DPS establecimiento` <fct> DN-Area V, SD-Area II, San…
## $ `Tipo atención` <fct> Internamiento, Internamien…
## $ `Semana notificación` <dbl> 11, 20, 8, 36, 46, 24, 35,…
## $ `Fecha notificación` <fct> 44077, 43602, 44614, 44810…
## $ `Signos y síntomas` <fct> "VOMITOS, NAUSEAS, CANSANC…
## $ Fiebre <fct> 1, 1, 1, 1, 1, 1, 1, 1, 1,…
## $ Escalofrio <fct> 1, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ `Malestar General/debilidad-Dolor muscular` <fct> 1, 0, 1, 1, 0, 1, 1, 1, 1,…
## $ `Dolor en los ojos` <fct> 0, 0, 0, 0, 0, 1, 0, 0, 0,…
## $ `Hiperemia conjuntival` <fct> 1, 1, 1, 1, 1, 1, 1, 1, 1,…
## $ Torniquete_positivo <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Erupción_maculopapular <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Erupción_tórax <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Ojos_rojos_irritados <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Derrame_pleural <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ `Frote pericárdico` <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Nauseas <fct> 1, 0, 0, 0, 0, 1, 0, 0, 0,…
## $ Dolor_abdominal <fct> 1, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Vómitos <fct> 1, 1, 1, 1, 1, 1, 0, 0, 0,…
## $ Hepatomegalia <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Esplenomegalia <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Insuficiencia_renal <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Convulsiones <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Somnolencia <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Alteraciones_conducta <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ `Alteraciones de la conciencia` <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Sangrado_conjuntival <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Sangrado_nasal <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Sangrado_encías <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Vómitos_sangre <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Sangre_heces <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Orina_color_café <fct> 0, 0, 0, 0, 0, 1, 0, 0, 0,…
## $ Petequias <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Equimosis <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Púrpura <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Ascitis <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Hemoconcentracion <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Leucopenia <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Leucocitosis <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ Trombocitopenia <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ `Resultado final` <fct> Sospechoso, Sospechoso, Pr…
## $ Condición <fct> Vivo, Vivo, Vivo, Vivo, Vi…
## $ Gravedad <fct> Con signos de alarma, Con …
## $ `Semana defunción` <dbl> NA, NA, NA, NA, NA, NA, NA…
## $ `Mes defunción` <fct> NA, NA, NA, NA, NA, NA, NA…
## $ `Año defunción` <fct> NA, NA, NA, NA, NA, NA, NA…
## $ `Fecha defunción` <fct> NA, NA, NA, NA, NA, NA, NA…
## $ `Edad fecha defunción` <fct> NA, NA, NA, NA, NA, NA, NA…
Recodifiquemos la variable Nacionalidad, agrupando como Dominicana, haitiana y otra nacionalidad
Primero, conozcamos la distribución de frecuencia de la variable sobre nacionalidad:
table(Datos$`País procedencia`) %>% kable()
Var1 | Freq |
---|---|
Alemania | 4 |
Argentina | 1 |
Bélgica | 1 |
Bulgaria | 1 |
Canadá | 3 |
China | 9 |
Colombia | 1 |
Corea del Sur | 1 |
Croacia | 1 |
Cuba | 2 |
Dominica | 1 |
Eritrea | 1 |
España | 4 |
Estados Unidos | 2 |
Francia | 1 |
Haití | 179 |
Honduras | 1 |
Hong Kong | 1 |
Italia | 9 |
México | 2 |
Países Bajos | 1 |
Panamá | 1 |
Perú | 1 |
Puerto Rico | 3 |
Reino Unido | 1 |
República Democrática del Congo | 5 |
República Dominicana | 5927 |
Ruanda | 1 |
Rusia | 1 |
Suiza | 1 |
Ucrania | 1 |
Venezuela | 15 |
La siguiente línea de código realiza la categorización:
Datos$nacionalidad <- if_else(condition = Datos$`País procedencia` == "República Dominicana", true = "Dominicana", false = if_else(condition = Datos$`País procedencia` == "Haití", true = "Haitiana", false = "Otra"))
#Verificamos que la categorización se haya realizado bien.
table(Datos$nacionalidad)
##
## Dominicana Haitiana Otra
## 5927 179 77
Ahora con la variable sobre afiliación al Seguro familiar de salud:
table(Datos$`Categoría de afiliación`) %>% kable()
Var1 | Freq |
---|---|
Contributivo | 1835 |
Contributivo-subsidiado | 28 |
No afiliado | 3266 |
Subsidiado | 1054 |
Datos$afiliacion <- if_else(condition = Datos$`Categoría de afiliación` == "Contributivo" | Datos$`Categoría de afiliación` == "Contributivo-subsidiado", true = "Contributivo", false = Datos$`Categoría de afiliación`)
#Verificamos que la categorización se haya realizado bien.
table(Datos$afiliacion)
##
## Contributivo No afiliado Subsidiado
## 1863 3266 1054
Ahora con la variable sobre nivel educativo:
table(Datos$`Nivel educativo`) %>% kable()
Var1 | Freq |
---|---|
Primaria (1-4) | 554 |
Primaria (5-8) | 1034 |
Secundaria | 2820 |
Sin educación | 458 |
Superior | 1317 |
Datos$Nivel_educativo <- if_else(condition = Datos$`Nivel educativo` == "Primaria (1-4)" | Datos$`Nivel educativo` == "Primaria (5-8)", true = "Primaria", false = Datos$`Nivel educativo`)
#Verificamos que la categorización se haya realizado bien.
table(Datos$Nivel_educativo)
##
## Primaria Secundaria Sin educación Superior
## 1588 2820 458 1317
En esta sección realizaremos un análisis descriptivo de los casos que cumplen con los criterios de inclusión y exclusión para entender mejor las características sociodemográficas y clínicas de los adultos con dengue. Para las variables numéricas, calcularemos estadísticos resumen (media, mediana, rangos). Para variables categóricas obtendremos frecuencias absolutas y relativas. Para una mejor ilustración Generaremos tablas y gráficos que permitan visualizar la distribución de los datos y detectar patrones iniciales.
El objetivo es familiarizarnos con la forma de los datos y sentar las bases para los análisis posteriores. Una vez completada esta etapa, estaremos en condiciones de identificar las relaciones más relevantes y plantear hipótesis de trabajo.
Utilizando la librería table1
elaboraremos las tablas
descriptivas.
table1( ~ Edad1 + nacionalidad + Nivel_educativo + afiliacion + Condición | Sexo , data = Datos, render.continuous=c(.="Mean (SD)", .="Median [Q1, Q3]"))
Femenino (N=2389) |
Masculino (N=3794) |
Overall (N=6183) |
|
---|---|---|---|
Edad1 | |||
Mean (SD) | 35.4 (17.4) | 35.9 (18.0) | 35.7 (17.8) |
Median [Q1, Q3] | 29.0 [22.0, 45.0] | 29.0 [21.0, 47.0] | 29.0 [21.0, 46.0] |
nacionalidad | |||
Dominicana | 2313 (96.8%) | 3614 (95.3%) | 5927 (95.9%) |
Haitiana | 53 (2.2%) | 126 (3.3%) | 179 (2.9%) |
Otra | 23 (1.0%) | 54 (1.4%) | 77 (1.2%) |
Nivel_educativo | |||
Primaria | 553 (23.1%) | 1035 (27.3%) | 1588 (25.7%) |
Secundaria | 1106 (46.3%) | 1714 (45.2%) | 2820 (45.6%) |
Sin educación | 141 (5.9%) | 317 (8.4%) | 458 (7.4%) |
Superior | 589 (24.7%) | 728 (19.2%) | 1317 (21.3%) |
afiliacion | |||
Contributivo | 735 (30.8%) | 1128 (29.7%) | 1863 (30.1%) |
No afiliado | 1206 (50.5%) | 2060 (54.3%) | 3266 (52.8%) |
Subsidiado | 448 (18.8%) | 606 (16.0%) | 1054 (17.0%) |
Condición | |||
Muerto | 21 (0.9%) | 37 (1.0%) | 58 (0.9%) |
Vivo | 2368 (99.1%) | 3757 (99.0%) | 6125 (99.1%) |
table1( ~ Edad1 + Nivel_educativo + afiliacion + Condición | nacionalidad , data = Datos, render.continuous=c(.="Mean (SD)", .="Median [Q1, Q3]"))
Dominicana (N=5927) |
Haitiana (N=179) |
Otra (N=77) |
Overall (N=6183) |
|
---|---|---|---|---|
Edad1 | ||||
Mean (SD) | 35.8 (17.9) | 32.0 (13.6) | 41.1 (18.5) | 35.7 (17.8) |
Median [Q1, Q3] | 29.0 [21.0, 46.0] | 28.0 [22.0, 36.0] | 35.0 [26.0, 57.0] | 29.0 [21.0, 46.0] |
Nivel_educativo | ||||
Primaria | 1503 (25.4%) | 74 (41.3%) | 11 (14.3%) | 1588 (25.7%) |
Secundaria | 2766 (46.7%) | 22 (12.3%) | 32 (41.6%) | 2820 (45.6%) |
Sin educación | 375 (6.3%) | 80 (44.7%) | 3 (3.9%) | 458 (7.4%) |
Superior | 1283 (21.6%) | 3 (1.7%) | 31 (40.3%) | 1317 (21.3%) |
afiliacion | ||||
Contributivo | 1843 (31.1%) | 4 (2.2%) | 16 (20.8%) | 1863 (30.1%) |
No afiliado | 3032 (51.2%) | 173 (96.6%) | 61 (79.2%) | 3266 (52.8%) |
Subsidiado | 1052 (17.7%) | 2 (1.1%) | 0 (0%) | 1054 (17.0%) |
Condición | ||||
Muerto | 54 (0.9%) | 3 (1.7%) | 1 (1.3%) | 58 (0.9%) |
Vivo | 5873 (99.1%) | 176 (98.3%) | 76 (98.7%) | 6125 (99.1%) |
En este ejercicio estimaremos la carga de las formas de dengue: con signos de alarma y graves en adultos (≥18 años) durante el periodo 2018–2022. Para ello:
Aquí está el número de casos por estado de resultado.
table1( ~ Gravedad | `Año inicio síntomas`, data = Datos)
2018 (N=276) |
2019 (N=2860) |
2020 (N=815) |
2021 (N=594) |
2022 (N=1638) |
Overall (N=6183) |
|
---|---|---|---|---|---|---|
Gravedad | ||||||
Con signos de alarma | 86 (31.2%) | 1240 (43.4%) | 364 (44.7%) | 197 (33.2%) | 661 (40.4%) | 2548 (41.2%) |
Grave | 2 (0.7%) | 45 (1.6%) | 70 (8.6%) | 41 (6.9%) | 65 (4.0%) | 223 (3.6%) |
Sin signos de alarma | 186 (67.4%) | 1555 (54.4%) | 381 (46.7%) | 356 (59.9%) | 912 (55.7%) | 3390 (54.8%) |
Missing | 2 (0.7%) | 20 (0.7%) | 0 (0%) | 0 (0%) | 0 (0%) | 22 (0.4%) |
¿Cómo calcularía la incidencia para cada uno de los años a partir de esto?
De acuerdo a los grupos conformados. Buscar cómo calcular la incidencia de casos grave o Con signos de alarma por año. Anote los resultados para discutir al final.
En este apartado profundizaremos en el perfil clínico de los pacientes adultos con dengue.
Observar la distribución de los casos a través de tablas de frecuencia, identificaremos los signos y síntomas más frecuentes.
table1( ~ factor(Fiebre) + factor(Escalofrio) + factor(`Malestar General/debilidad-Dolor muscular`) + factor(`Dolor en los ojos`) | Sexo , data = Datos)
Femenino (N=2389) |
Masculino (N=3794) |
Overall (N=6183) |
|
---|---|---|---|
factor(Fiebre) | |||
0 | 44 (1.8%) | 58 (1.5%) | 102 (1.6%) |
1 | 2345 (98.2%) | 3736 (98.5%) | 6081 (98.4%) |
factor(Escalofrio) | |||
0 | 1898 (79.4%) | 3032 (79.9%) | 4930 (79.7%) |
1 | 491 (20.6%) | 762 (20.1%) | 1253 (20.3%) |
factor(`Malestar General/debilidad-Dolor muscular`) | |||
0 | 786 (32.9%) | 1225 (32.3%) | 2011 (32.5%) |
1 | 1603 (67.1%) | 2569 (67.7%) | 4172 (67.5%) |
factor(`Dolor en los ojos`) | |||
0 | 1961 (82.1%) | 3142 (82.8%) | 5103 (82.5%) |
1 | 428 (17.9%) | 652 (17.2%) | 1080 (17.5%) |
Nota: 0 = No; 1 = SI. En caso de no haber recodificado estas variables en etapas anteriores.
table1( ~ factor(`Hiperemia conjuntival`) + factor(Torniquete_positivo) + factor(Erupción_maculopapular) + factor(Erupción_tórax) + factor(Ojos_rojos_irritados) | Sexo , data = Datos)
Femenino (N=2389) |
Masculino (N=3794) |
Overall (N=6183) |
|
---|---|---|---|
factor(`Hiperemia conjuntival`) | |||
0 | 8 (0.3%) | 6 (0.2%) | 14 (0.2%) |
1 | 2381 (99.7%) | 3788 (99.8%) | 6169 (99.8%) |
factor(Torniquete_positivo) | |||
0 | 2385 (99.8%) | 3789 (99.9%) | 6174 (99.9%) |
1 | 4 (0.2%) | 5 (0.1%) | 9 (0.1%) |
factor(Erupción_maculopapular) | |||
0 | 2371 (99.2%) | 3768 (99.3%) | 6139 (99.3%) |
1 | 18 (0.8%) | 26 (0.7%) | 44 (0.7%) |
factor(Erupción_tórax) | |||
0 | 2379 (99.6%) | 3779 (99.6%) | 6158 (99.6%) |
1 | 10 (0.4%) | 15 (0.4%) | 25 (0.4%) |
factor(Ojos_rojos_irritados) | |||
0 | 2388 (100.0%) | 3791 (99.9%) | 6179 (99.9%) |
1 | 1 (0.0%) | 3 (0.1%) | 4 (0.1%) |
Nota: 0 = No; 1 = SI. En caso de no haber recodificado estas variables en etapas anteriores.
table1( ~ factor( Derrame_pleural) + factor(`Frote pericárdico`) | Sexo , data = Datos)
Femenino (N=2389) |
Masculino (N=3794) |
Overall (N=6183) |
|
---|---|---|---|
factor(Derrame_pleural) | |||
0 | 2382 (99.7%) | 3788 (99.8%) | 6170 (99.8%) |
1 | 7 (0.3%) | 6 (0.2%) | 13 (0.2%) |
factor(`Frote pericárdico`) | |||
0 | 2389 (100%) | 3793 (100.0%) | 6182 (100.0%) |
1 | 0 (0%) | 1 (0.0%) | 1 (0.0%) |
Nota: 0 = No; 1 = SI. En caso de no haber recodificado estas variables en etapas anteriores.
table1( ~ factor(Nauseas) + factor(Dolor_abdominal) + factor(Vómitos) +
factor(Hepatomegalia) + factor(Esplenomegalia) + factor(Insuficiencia_renal) | Sexo , data = Datos)
Femenino (N=2389) |
Masculino (N=3794) |
Overall (N=6183) |
|
---|---|---|---|
factor(Nauseas) | |||
0 | 1704 (71.3%) | 2908 (76.6%) | 4612 (74.6%) |
1 | 685 (28.7%) | 886 (23.4%) | 1571 (25.4%) |
factor(Dolor_abdominal) | |||
0 | 1744 (73.0%) | 2849 (75.1%) | 4593 (74.3%) |
1 | 645 (27.0%) | 945 (24.9%) | 1590 (25.7%) |
factor(Vómitos) | |||
0 | 1707 (71.5%) | 2832 (74.6%) | 4539 (73.4%) |
1 | 682 (28.5%) | 962 (25.4%) | 1644 (26.6%) |
factor(Hepatomegalia) | |||
0 | 2389 (100%) | 3790 (99.9%) | 6179 (99.9%) |
1 | 0 (0%) | 4 (0.1%) | 4 (0.1%) |
factor(Esplenomegalia) | |||
0 | 2389 (100%) | 3791 (99.9%) | 6180 (100.0%) |
1 | 0 (0%) | 3 (0.1%) | 3 (0.0%) |
factor(Insuficiencia_renal) | |||
0 | 2386 (99.9%) | 3792 (99.9%) | 6178 (99.9%) |
1 | 3 (0.1%) | 2 (0.1%) | 5 (0.1%) |
Nota: 0 = No; 1 = SI. En caso de no haber recodificado estas variables en etapas anteriores.
table1( ~ factor(Convulsiones) + factor(Somnolencia) + factor(Alteraciones_conducta) + factor(`Alteraciones de la conciencia`) | Sexo , data = Datos)
Femenino (N=2389) |
Masculino (N=3794) |
Overall (N=6183) |
|
---|---|---|---|
factor(Convulsiones) | |||
0 | 2386 (99.9%) | 3788 (99.8%) | 6174 (99.9%) |
1 | 3 (0.1%) | 6 (0.2%) | 9 (0.1%) |
factor(Somnolencia) | |||
0 | 2383 (99.7%) | 3790 (99.9%) | 6173 (99.8%) |
1 | 6 (0.3%) | 4 (0.1%) | 10 (0.2%) |
factor(Alteraciones_conducta) | |||
0 | 2389 (100%) | 3793 (100.0%) | 6182 (100.0%) |
1 | 0 (0%) | 1 (0.0%) | 1 (0.0%) |
factor(`Alteraciones de la conciencia`) | |||
0 | 2385 (99.8%) | 3787 (99.8%) | 6172 (99.8%) |
1 | 4 (0.2%) | 7 (0.2%) | 11 (0.2%) |
Nota: 0 = No; 1 = SI. En caso de no haber recodificado estas variables en etapas anteriores.
table1( ~ factor(Sangrado_conjuntival) + factor(Sangrado_nasal) + factor(Sangrado_encías) + factor(Vómitos_sangre) + factor(Sangre_heces) + factor(Orina_color_café) + factor(Petequias) + factor(Equimosis) + factor(Púrpura) + factor(Ascitis) + factor(Hemoconcentracion) + factor(Leucopenia) + factor(Leucocitosis) + factor(Trombocitopenia) | Sexo , data = Datos)
Femenino (N=2389) |
Masculino (N=3794) |
Overall (N=6183) |
|
---|---|---|---|
factor(Sangrado_conjuntival) | |||
0 | 2389 (100%) | 3792 (99.9%) | 6181 (100.0%) |
1 | 0 (0%) | 2 (0.1%) | 2 (0.0%) |
factor(Sangrado_nasal) | |||
0 | 2360 (98.8%) | 3756 (99.0%) | 6116 (98.9%) |
1 | 29 (1.2%) | 38 (1.0%) | 67 (1.1%) |
factor(Sangrado_encías) | |||
0 | 2373 (99.3%) | 3776 (99.5%) | 6149 (99.5%) |
1 | 16 (0.7%) | 18 (0.5%) | 34 (0.5%) |
factor(Vómitos_sangre) | |||
0 | 2378 (99.5%) | 3773 (99.4%) | 6151 (99.5%) |
1 | 11 (0.5%) | 21 (0.6%) | 32 (0.5%) |
factor(Sangre_heces) | |||
0 | 2386 (99.9%) | 3788 (99.8%) | 6174 (99.9%) |
1 | 3 (0.1%) | 6 (0.2%) | 9 (0.1%) |
factor(Orina_color_café) | |||
0 | 2381 (99.7%) | 3778 (99.6%) | 6159 (99.6%) |
1 | 8 (0.3%) | 16 (0.4%) | 24 (0.4%) |
factor(Petequias) | |||
0 | 2338 (97.9%) | 3733 (98.4%) | 6071 (98.2%) |
1 | 51 (2.1%) | 61 (1.6%) | 112 (1.8%) |
factor(Equimosis) | |||
0 | 2388 (100.0%) | 3792 (99.9%) | 6180 (100.0%) |
1 | 1 (0.0%) | 2 (0.1%) | 3 (0.0%) |
factor(Púrpura) | |||
0 | 2388 (100.0%) | 3791 (99.9%) | 6179 (99.9%) |
1 | 1 (0.0%) | 3 (0.1%) | 4 (0.1%) |
factor(Ascitis) | |||
0 | 2379 (99.6%) | 3777 (99.6%) | 6156 (99.6%) |
1 | 10 (0.4%) | 17 (0.4%) | 27 (0.4%) |
factor(Hemoconcentracion) | |||
0 | 2324 (97.3%) | 3647 (96.1%) | 5971 (96.6%) |
1 | 65 (2.7%) | 147 (3.9%) | 212 (3.4%) |
factor(Leucopenia) | |||
0 | 2049 (85.8%) | 3218 (84.8%) | 5267 (85.2%) |
1 | 340 (14.2%) | 576 (15.2%) | 916 (14.8%) |
factor(Leucocitosis) | |||
0 | 2370 (99.2%) | 3747 (98.8%) | 6117 (98.9%) |
1 | 19 (0.8%) | 47 (1.2%) | 66 (1.1%) |
factor(Trombocitopenia) | |||
0 | 1514 (63.4%) | 2372 (62.5%) | 3886 (62.8%) |
1 | 875 (36.6%) | 1422 (37.5%) | 2297 (37.2%) |
Nota: 0 = No; 1 = SI. En caso de no haber recodificado estas variables en etapas anteriores.
En un escenario ideal, las hipótesis o preguntas de investigación son planteadas en la propuesta de investigación/protocolo, es decir, antes de iniciar el análisis; sin embargo, para fines de este taller, pasemos esto por alto.
Entonces, luego de observar y analizar las características
demográficas y clínicas en los casos, es momento de plantear
hipótesis basadas en los patrones observados y ponerlas a
prueba con métodos estadísticos.
En ese sentido, ¿les surge alguna hipótesis de asociación que
les interese probar?
¿Qué tipo de hipótesis es el que desea probar?
Plantee el sistema de hipótesis que desea contrastar.
Seleccione un nivel de significación estadística para contrastar la hipótesis planteada
Evalúe la hipótesis planteada.
Interprete los resultados.
Ejemplo de cómo desarrollar el ejercicio:
Después de observar y analizar los descriptivos sobre las características demográficas y clínicas en los casos, surge la pregunta sobre ¿Existe algún tipo de relación entre la clasificación del dengue (Sin signos de alarma, con signos de alarma y grave) y el grupo de edad a la que pertenecen las personas?
Luego de esta interrogante, planteo la hipótesis:
1. Qué tipo de hipótesis es el que desea probar?
Para responder a esta pregunta, donde mediremos el nivel de asociación ente dos variables categóricas, utilizaremos el test estadístico Chi-cuadrado.
2. Plantee el sistema de hipótesis que desea contrastar.
3. Seleccione un nivel de significación estadística para contrastar la hipótesis planteada
Asumiremos un Nivel de significación: α = 0.05
4. Evalúe la hipótesis planteada.
Para evaluar la hipótesis nos auxiliaremos del Software:
Primero, realizaremos una tabla de contingencia para mirar la distribución de los casos:
table1( ~ Gravedad | `Grupo edad`, data = Datos[!is.na(Datos$Gravedad), ])
10_19 (N=937) |
20_29 (N=2236) |
30_39 (N=985) |
40_49 (N=661) |
50_59 (N=522) |
60 o más (N=820) |
Overall (N=6161) |
|
---|---|---|---|---|---|---|---|
Gravedad | |||||||
Con signos de alarma | 404 (43.1%) | 957 (42.8%) | 392 (39.8%) | 267 (40.4%) | 230 (44.1%) | 298 (36.3%) | 2548 (41.4%) |
Grave | 22 (2.3%) | 59 (2.6%) | 41 (4.2%) | 22 (3.3%) | 36 (6.9%) | 43 (5.2%) | 223 (3.6%) |
Sin signos de alarma | 511 (54.5%) | 1220 (54.6%) | 552 (56.0%) | 372 (56.3%) | 256 (49.0%) | 479 (58.4%) | 3390 (55.0%) |
Realizaremos la prueba correspondiente:
tabla_edad_clasif <- table(Datos$Gravedad, Datos$`Grupo edad`)
chisq.test(tabla_edad_clasif)
##
## Pearson's Chi-squared test
##
## data: tabla_edad_clasif
## X-squared = 46.626, df = 10, p-value = 1.104e-06
5. Interprete los resultados.
Como el p-valor es mucho menor que α = 0.05, rechazamos la hipótesis nula Esto indica que sí existe una asociación estadísticamente significativa entre la edad del paciente y la gravedad del dengue. En otras palabras, la proporción de casos “sin signos de alarma”, “con signos de alarma” y “grave” varía según el grupo etario.
Partiendo de este ejemplo, realicen sus propias hipótesis y lleguen a sus propias conclusiones. 🙌
😎 ¡Sé que pueden, vamos! 😎
En esta última sección, invitamos a los grupos a compartir sus hallazgos, reflexionar sobre el proceso.
Síntesis de resultados
Limitaciones del análisis
Implicaciones para Salud Pública
Reproducibilidad y colaboración
Dinámica: Cada grupo dispone de 5 min para exponer sus respuestas.