El documento Datos abiertos históricos ETV 2024, disponible en el portal del gobierno de México (https://www.gob.mx/cms/uploads/attachment/file/965318/Datos_abiertos_historicos_etv_2024.pdf), es un recurso que proporciona información histórica y actualizada sobre las Enfermedades Transmitidas por Vectores (ETV), como el dengue, zika y chikungunya. Contiene información sobre casos registrados, distribución geográfica, tendencias temporales y otros indicadores relevantes para el análisis epidemiológico.
En este análisis, se empleó el último reporte disponible del 2024, correspondiente al 4 de diciembre, como fuente principal de datos.
data <- read.csv("datos abiertos dengue.csv")
# Mostrar solo las primeras tres filas
head(data, 3L)
## FECHA_ACTUALIZACION ID_REGISTRO SEXO EDAD_ANOS ENTIDAD_RES MUNICIPIO_RES
## 1 03/12/2024 1311108 1 35 12 1
## 2 03/12/2024 1346161 2 1 4 9
## 3 03/12/2024 1346164 1 70 30 39
## HABLA_LENGUA_INDIG INDIGENA ENTIDAD_UM_NOTIF MUNICIPIO_UM_NOTIF
## 1 2 2 12 1
## 2 2 2 4 9
## 3 2 2 30 39
## INSTITUCION_UM_NOTIF FECHA_SIGN_SINTOMAS TIPO_PACIENTE HEMORRAGICOS DIABETES
## 1 4 15/01/2024 1 2 2
## 2 20 12/03/2024 1 2 2
## 3 8 11/03/2024 1 2 2
## HIPERTENSION ENFERMEDAD_ULC_PEPTICA ENFERMEDAD_RENAL INMUNOSUPR
## 1 2 2 2 2
## 2 2 2 2 2
## 3 2 2 2 2
## CIRROSIS_HEPATICA EMBARAZO DEFUNCION DICTAMEN TOMA_MUESTRA RESULTADO_PCR
## 1 2 2 2 5 1 3
## 2 2 2 2 5 2 5
## 3 2 2 2 5 2 5
## ESTATUS_CASO ENTIDAD_ASIG MUNICIPIO_ASIG
## 1 2 12 1
## 2 1 4 9
## 3 1 30 39
# Mostrar las dimensiones del dataframe
dim(data)
## [1] 532153 28
La base de datos utilizada en este estudio está compuesta por un total de 532,153 observaciones y 28 variables. Las variables incluyen información clave como:
| NOMBRE DE VARIABLE | DESCRIPCION |
|---|---|
| FECHA_ACTUALIZACION | PERMITE IDENTIFICAR LA ÚLTIMA ACTUALIZACIÓN |
| ID_REGISTRO | NÚMERO DE INDETIFICADOR DEL CASO |
| SEXO | IDENTIFICA EL SEXO DEL PACIENTE |
| EDAD_ANOS | IDENTIFICA LA EDAD EN AÑOS DEL PACIENTE |
| ENTIDAD_RES | IDENTIFICA LA ENTIDAD DE RESIDENCIA DEL PACIENTE |
| MUNICIPIO_RES | IDENTIFICA EL MUNICIPIO DE RESIDENCIA DEL PACIENTE |
| HABLA_LENGUA_INDIG | IDENTIFICA SI EL PACIENTE HABLA LENGUA INDIGENA |
| INDIGENA | IDENTIFICA SI EL PACIENTE SE AUTOIDENTIFICA COMO PERSONA INDIGENA |
| ENTIDAD_UM_NOTIF | IDENTIFICA LA ENTIDAD DONDE SE ENCUENTRA LA UNIDAD MEDICA NOTIFICANTE |
| MUNICIPIO_UM_NOTIF | IDENTIFICA EL MUNICIPIO DONDE SE ENCUENTRA LA UNIDAD MEDICA NOTIFICANTE |
| INSTITUCION_UM_NOTIF | IDENTIFICA LA INSTITUCIÓN DE LA UNIDAD MEDICA NOTIFICANTE |
| FECHA_SIGN_SINTOMAS | IDENTIFICA LA FECHA DE INICIO DE SIGNOS Y SINTOMAS DEL CUADRO CLÍNICO ACTUAL |
| TIPO_PACIENTE | IDENTIFICA EL TIPO DE ATENCIÓN QUE RECIBIÓ EL PACIENTE EN LA UNIDAD |
| HEMORRAGICOS | PRESENCIA DE TRASTORNOS HEMORRÁGICOS |
| DIABETES | PRESENCIA DE DIABETES |
| HIPERTENSION | PRESENCIA DE HIPERTENSIÓN |
| ENFERMEDAD ULC_PEPTICA | PRESENCIA DE ENFERMEDAD ULCERO PÉPTICA |
| ENFERMEDAD_RENAL | PRESENCIA DE ENFERMEDAD RENAL |
| INMUNOSUPR | PRESENCIA DE INMUNOSUPRESIÓN |
| CIRROSIS_HEPATICA | PRESENCIA DE CIRROSIS HEPÁTICA |
| EMBARAZO | IDENTIFICA SI LA PACIENTE ESTÁ EMBARAZADA |
| DEFUNCION | INDICA SI EL PACIENTE FALLECIÓ |
| DICTAMEN | IDENTIFICA EL RESULTADO DE LA DICTAMINACIÓN PARA EL PACIENTE |
| TOMA_MUESTRA | IDENTIFICA SI AL PACIENTE SE LE TOMÓ MUESTRA |
| RESULTADO_PCR | IDENTIFICA EL RESULTADO DE LA PRUEBA PCR |
| ESTATUS_CASO | ESTATUS DEL CASO |
| ENTIDAD_ASIG | IDENTIFICA LA ENTIDAD A LA QUE SE ASIGNÓ EL CASO |
| MUNICIPIO_ASIG | IDENTIFICA EL MUNICIPIO AL QUE SE ASIGNÓ EL CASO |
Para el análisis de comorbilidades en este estudio, se consideraron las siguientes columnas de la base de datos: “DIABETES”, “HIPERTENSION”, “ENFERMEDAD_ULC_PEPTICA”, “ENFERMEDAD_RENAL”, “INMUNOSUPR”, “CIRROSIS_HEPATICA”. Estas variables están codificadas de manera binaria, donde:
# Sumar los valores de las columnas de comorbilidad para cada fila
comorbilidad <- apply(data[,15:20],1,sum)
# Restar del valor máximo (12) la suma de los valores calculados en la linea anterior
comorbilidad <- 12 - comorbilidad
# Tabla de la distribucción de frecuencias
com <- table(comorbilidad)
com
## comorbilidad
## 0 1 2 3 4 5 6
## 510666 15991 5096 367 27 1 5
Observamos que la mayoria de los individuos de estudio no presentan ninguna comorbilidad y, a medida que aumenta el número de comorbilidades, la cantidad de personas disminuye. Sin embargo, se identificó un caso particular que llama la atención: hay más personas con 6 comorbilidades que con 5.
Para este punto, se requirió el catálogo de la base de datos. Es un archivo EXCEL el cual contiene las definiciones, estructuras y metadatos de cada una de las variables de la base de datos. Este documento se encuentra en: https://datosabiertos.salud.gob.mx/gobmx/salud/datos_abiertos/etv/diccionario_datos_dengue.zip
Dentro del catálogo, una hoja específica proporciona la codificación de los estados de México(“CATÁLOGO ENTIDAD”), lo cual es esencial para identificar y clasificar correctamente la entidad federativa de residencia o notificación de los casos.
library(readxl)
# Lectura de las entidades
catalogo <- read_excel("Catálogos_Dengue.xlsx", sheet = "CATÁLOGO ENTIDAD")
# Mostrar solo las primeras tres filas
head(catalogo, 3L)
## # A tibble: 3 × 3
## CLAVE_ENTIDAD ENTIDAD_FEDERATIVA ABREVIATURA
## <chr> <chr> <chr>
## 1 01 AGUASCALIENTES AS
## 2 02 BAJA CALIFORNIA BC
## 3 03 BAJA CALIFORNIA SUR BS
Una vez cargado el catalogo, se procedió a realizar el análisis de los datos:
# Conversión de CLAVE_ENTIDAD a numérico
catalogo$CLAVE_ENTIDAD <- as.numeric(catalogo$CLAVE_ENTIDAD)
# Crear un dataframe con etiquetas de sexo
sexo <- data.frame(Codigo=c(1,2),Etiqueta=c("MUJER","HOMBRE"))
# Unir el dataframe 'data' con el catálogo por la clave de entidad
sexo_entidad <- merge(x=data[,c(3,5)], y=catalogo[,c(1,2)], by.x="ENTIDAD_RES",by.y="CLAVE_ENTIDAD",sort = F,all.x = T)
# Unir el dataframe resultante con el dataframe 'sexo' por el código de sexo
sexo_entidad <- merge(x=sexo_entidad, y=sexo, by.x="SEXO",by.y="Codigo",sort = F,all.x = T)
# Crear una tabla de contingencia y calcular los porcentajes por entidad y etiqueta de sexo
sexo_x_entidad <- prop.table(table(sexo_entidad$ENTIDAD_FEDERATIVA,sexo_entidad$Etiqueta), 1) * 100
sexo_x_entidad
##
## HOMBRE MUJER
## AGUASCALIENTES 42.84020 57.15980
## BAJA CALIFORNIA 43.68132 56.31868
## BAJA CALIFORNIA SUR 47.74787 52.25213
## CAMPECHE 48.22064 51.77936
## CHIAPAS 47.98418 52.01582
## CHIHUAHUA 44.54545 55.45455
## CIUDAD DE MÉXICO 47.19101 52.80899
## COAHUILA DE ZARAGOZA 44.38250 55.61750
## COLIMA 47.54676 52.45324
## DURANGO 43.67232 56.32768
## ESTADOS UNIDOS DE AMERICA 50.00000 50.00000
## GUANAJUATO 43.54915 56.45085
## GUERRERO 46.31967 53.68033
## HIDALGO 40.61592 59.38408
## JALISCO 43.65475 56.34525
## MÉXICO 44.93835 55.06165
## MICHOACÁN DE OCAMPO 43.65045 56.34955
## MORELOS 45.37534 54.62466
## NAYARIT 44.99080 55.00920
## NUEVO LEÓN 47.34467 52.65533
## OAXACA 44.09785 55.90215
## OTROS PAISES 100.00000 0.00000
## OTROS PAISES DE LATINOAMERICA 54.54545 45.45455
## PUEBLA 43.78061 56.21939
## QUERÉTARO 42.97151 57.02849
## QUINTANA ROO 47.84697 52.15303
## SAN LUIS POTOSÍ 41.55692 58.44308
## SINALOA 43.94544 56.05456
## SONORA 42.10736 57.89264
## TABASCO 46.50426 53.49574
## TAMAULIPAS 43.93396 56.06604
## TLAXCALA 53.62319 46.37681
## VERACRUZ DE IGNACIO DE LA LLAVE 45.29903 54.70097
## YUCATÁN 47.00298 52.99702
## ZACATECAS 46.17564 53.82436
En el análisis de la distribución de casos de dengue por sexo, se observó que, excepto en los pacientes registrados en Estados Unidos y otros países, las mujeres presentan una mayor frecuencia de enfermos por dengue en comparación con los hombres. Esto puede deberse, en parte, por el hecho de que, en general, hay una mayor proporción de mujeres que de hombres en la población. Sin embargo, también podrían influir otros factores, como diferencias biológicas, comportamiento y exposición o acceso a servicios de salud.
El análisis de la edad promedio de los pacientes registrados con dengue, desglosado por sexo, proporciona información valiosa sobre las características demográficas de la población afectada. Este enfoque permite identificar posibles diferencias en la distribución de la enfermedad entre hombres y mujeres, lo que puede estar relacionado con factores biológicos, comportamentales o sociales.
# Emparejamiento de los datos
sexo_edad <- merge(x=data[,c(3,4)], y=sexo[,c(1,2)], by.x="SEXO",by.y="Codigo",sort = F,all.x = T)
# Calculo del promedio por edad y sexo
edad_x_sexo <- aggregate(sexo_edad$EDAD_ANOS~sexo_edad$Etiqueta,FUN = mean)
colnames(edad_x_sexo) <- c("SEXO","PROM_EDAD")
edad_x_sexo
## SEXO PROM_EDAD
## 1 HOMBRE 28.03076
## 2 MUJER 30.94481
Con base en los datos analizados, se observa que existe una diferencia (pero no mucha) en la edad promedio de los pacientes registrados con dengue según su sexo. En el caso de las mujeres, la edad promedio es de casi 31 años, mientras que, para los hombres, la edad promedio es de 28 años.
Identificar los estados con mayor número de casos registrados de dengue es fundamental para comprender la distribución geográfica de la enfermedad y focalizar los esfuerzos de prevención y control en las regiones más afectadas. Para ello, se enlistaron los 5 Con este propósito, se elaboró un listado de los 5 estados de México con el mayor número de casos de dengue registrados, lo que proporciona una perspectiva clara de las áreas que requieren atención prioritaria y la implementación de medidas específicas para mitigar la propagación de la enfermedad.
# Creación de la tabla de frecuencia
estados <- table(sexo_entidad$ENTIDAD_FEDERATIVA)
# Ordenamiento de la tabla de mayor a menor
estados <- estados[order(estados, decreasing = T)]
# Mostrar las primeras 5 filas
head(estados, 5L)
##
## JALISCO GUERRERO NUEVO LEÓN NAYARIT OAXACA
## 82282 45879 35457 33698 31192
Los resultados muestran que los 5 estados con mayor número de casos registrados de dengue son Jalisco (82,282 casos), Guerrero (45,879 casos), Nuevo León (35,457 casos), Nayarit (33,698 casos) y Oaxaca (31,192 casos). Estos resultados pueden deberse a factores como el clima, la densidad poblacional y las condiciones socioeconómicas de estos estados en particular.
El análisis de la distribución de casos de dengue según la Institución de Unidad Médica (UM) que los notificó, junto con los casos de defunción asociados, proporciona información crucial sobre el papel de las diferentes instituciones de salud en la atención y registro de la enfermedad. Este enfoque permite identificar qué instituciones manejan la mayor carga de casos, así como evaluar la efectividad en la atención médica y el manejo de los pacientes.
# Lectura de las Intituciones UM
um <- read_excel("Catálogos_Dengue.xlsx", sheet = "CATÁLOGO INSTITUCION")
# Crear un dataframe con etiquetas de defunción
defuncion <- data.frame(CODIGO=c(1,2),ETIQUETA=c("DEFUNCION","NO DEFUNCION"))
# Emparejamiento de los datos
casos_um <- merge(x = data[,c(11,22)], y = um, by.x = "INSTITUCION_UM_NOTIF", by.y = "CLAVE")
casos_um <- merge(x = casos_um, y = defuncion, by.x = "DEFUNCION", by.y = "CODIGO")
# Creación de tabla de porcentajes de defunciiones por UM
prop.table(table(casos_um$DESCRIPCIÓN, casos_um$ETIQUETA), 1)*100
##
## DEFUNCION NO DEFUNCION
## CRUZ ROJA 0.0000000 100.0000000
## DIF 0.0000000 100.0000000
## ESTATAL 0.2045920 99.7954080
## IMSS 0.2532741 99.7467259
## IMSS-BIENESTAR 0.3239916 99.6760084
## ISSSTE 0.4434258 99.5565742
## MUNICIPAL 0.2539683 99.7460317
## NO ESPECIFICADO 1.4167651 98.5832349
## PEMEX 0.2148228 99.7851772
## PRIVADA 0.9427953 99.0572047
## SEDENA 1.2084592 98.7915408
## SEMAR 0.4761905 99.5238095
## SSA 0.4792662 99.5207338
## UNIVERSITARIO 2.3510972 97.6489028
Con base en los datos analizados, se puede concluir que, en términos generales, el porcentaje de defunciones por institución es relativamente bajo, lo que sugiere que la mayoría de las instituciones de salud están manejando de manera efectiva los casos de dengue. Sin embargo, se observa que la Institución de Unidad Médica (UM) Universitaria presenta el mayor porcentaje de defunciones, con un 2.35%. Este valor, aunque bajo en comparación con el total de casos, es significativamente más alto que el de otras instituciones.