Datos

El documento Datos abiertos históricos ETV 2024, disponible en el portal del gobierno de México (https://www.gob.mx/cms/uploads/attachment/file/965318/Datos_abiertos_historicos_etv_2024.pdf), es un recurso que proporciona información histórica y actualizada sobre las Enfermedades Transmitidas por Vectores (ETV), como el dengue, zika y chikungunya. Contiene información sobre casos registrados, distribución geográfica, tendencias temporales y otros indicadores relevantes para el análisis epidemiológico.

En este análisis, se empleó el último reporte disponible del 2024, correspondiente al 4 de diciembre, como fuente principal de datos.

data <- read.csv("datos abiertos dengue.csv")
# Mostrar solo las primeras tres filas
head(data, 3L)
##   FECHA_ACTUALIZACION ID_REGISTRO SEXO EDAD_ANOS ENTIDAD_RES MUNICIPIO_RES
## 1          03/12/2024     1311108    1        35          12             1
## 2          03/12/2024     1346161    2         1           4             9
## 3          03/12/2024     1346164    1        70          30            39
##   HABLA_LENGUA_INDIG INDIGENA ENTIDAD_UM_NOTIF MUNICIPIO_UM_NOTIF
## 1                  2        2               12                  1
## 2                  2        2                4                  9
## 3                  2        2               30                 39
##   INSTITUCION_UM_NOTIF FECHA_SIGN_SINTOMAS TIPO_PACIENTE HEMORRAGICOS DIABETES
## 1                    4          15/01/2024             1            2        2
## 2                   20          12/03/2024             1            2        2
## 3                    8          11/03/2024             1            2        2
##   HIPERTENSION ENFERMEDAD_ULC_PEPTICA ENFERMEDAD_RENAL INMUNOSUPR
## 1            2                      2                2          2
## 2            2                      2                2          2
## 3            2                      2                2          2
##   CIRROSIS_HEPATICA EMBARAZO DEFUNCION DICTAMEN TOMA_MUESTRA RESULTADO_PCR
## 1                 2        2         2        5            1             3
## 2                 2        2         2        5            2             5
## 3                 2        2         2        5            2             5
##   ESTATUS_CASO ENTIDAD_ASIG MUNICIPIO_ASIG
## 1            2           12              1
## 2            1            4              9
## 3            1           30             39
# Mostrar las dimensiones del dataframe
dim(data)
## [1] 532153     28

La base de datos utilizada en este estudio está compuesta por un total de 532,153 observaciones y 28 variables. Las variables incluyen información clave como:

NOMBRE DE VARIABLE DESCRIPCION
FECHA_ACTUALIZACION PERMITE IDENTIFICAR LA ÚLTIMA ACTUALIZACIÓN
ID_REGISTRO NÚMERO DE INDETIFICADOR DEL CASO
SEXO IDENTIFICA EL SEXO DEL PACIENTE
EDAD_ANOS IDENTIFICA LA EDAD EN AÑOS DEL PACIENTE
ENTIDAD_RES IDENTIFICA LA ENTIDAD DE RESIDENCIA DEL PACIENTE
MUNICIPIO_RES IDENTIFICA EL MUNICIPIO DE RESIDENCIA DEL PACIENTE
HABLA_LENGUA_INDIG IDENTIFICA SI EL PACIENTE HABLA LENGUA INDIGENA
INDIGENA IDENTIFICA SI EL PACIENTE SE AUTOIDENTIFICA COMO PERSONA INDIGENA
ENTIDAD_UM_NOTIF IDENTIFICA LA ENTIDAD DONDE SE ENCUENTRA LA UNIDAD MEDICA NOTIFICANTE
MUNICIPIO_UM_NOTIF IDENTIFICA EL MUNICIPIO DONDE SE ENCUENTRA LA UNIDAD MEDICA NOTIFICANTE
INSTITUCION_UM_NOTIF IDENTIFICA LA INSTITUCIÓN DE LA UNIDAD MEDICA NOTIFICANTE
FECHA_SIGN_SINTOMAS IDENTIFICA LA FECHA DE INICIO DE SIGNOS Y SINTOMAS DEL CUADRO CLÍNICO ACTUAL
TIPO_PACIENTE IDENTIFICA EL TIPO DE ATENCIÓN QUE RECIBIÓ EL PACIENTE EN LA UNIDAD
HEMORRAGICOS PRESENCIA DE TRASTORNOS HEMORRÁGICOS
DIABETES PRESENCIA DE DIABETES
HIPERTENSION PRESENCIA DE HIPERTENSIÓN
ENFERMEDAD ULC_PEPTICA PRESENCIA DE ENFERMEDAD ULCERO PÉPTICA
ENFERMEDAD_RENAL PRESENCIA DE ENFERMEDAD RENAL
INMUNOSUPR PRESENCIA DE INMUNOSUPRESIÓN
CIRROSIS_HEPATICA PRESENCIA DE CIRROSIS HEPÁTICA
EMBARAZO IDENTIFICA SI LA PACIENTE ESTÁ EMBARAZADA
DEFUNCION INDICA SI EL PACIENTE FALLECIÓ
DICTAMEN IDENTIFICA EL RESULTADO DE LA DICTAMINACIÓN PARA EL PACIENTE
TOMA_MUESTRA IDENTIFICA SI AL PACIENTE SE LE TOMÓ MUESTRA
RESULTADO_PCR IDENTIFICA EL RESULTADO DE LA PRUEBA PCR
ESTATUS_CASO ESTATUS DEL CASO
ENTIDAD_ASIG IDENTIFICA LA ENTIDAD A LA QUE SE ASIGNÓ EL CASO
MUNICIPIO_ASIG IDENTIFICA EL MUNICIPIO AL QUE SE ASIGNÓ EL CASO

Estudio de las comorbilidades en el total de la población

Para el análisis de comorbilidades en este estudio, se consideraron las siguientes columnas de la base de datos: “DIABETES”, “HIPERTENSION”, “ENFERMEDAD_ULC_PEPTICA”, “ENFERMEDAD_RENAL”, “INMUNOSUPR”, “CIRROSIS_HEPATICA”. Estas variables están codificadas de manera binaria, donde:

# Sumar los valores de las columnas de comorbilidad para cada fila
comorbilidad <- apply(data[,15:20],1,sum)
# Restar del valor máximo (12) la suma de los valores calculados en la linea anterior
comorbilidad <- 12 - comorbilidad
# Tabla de la distribucción de frecuencias
com <- table(comorbilidad)
com
## comorbilidad
##      0      1      2      3      4      5      6 
## 510666  15991   5096    367     27      1      5

Observamos que la mayoria de los individuos de estudio no presentan ninguna comorbilidad y, a medida que aumenta el número de comorbilidades, la cantidad de personas disminuye. Sin embargo, se identificó un caso particular que llama la atención: hay más personas con 6 comorbilidades que con 5.

Distribución porcentual de cada estado de los casos de dengue por sexo.

Para este punto, se requirió el catálogo de la base de datos. Es un archivo EXCEL el cual contiene las definiciones, estructuras y metadatos de cada una de las variables de la base de datos. Este documento se encuentra en: https://datosabiertos.salud.gob.mx/gobmx/salud/datos_abiertos/etv/diccionario_datos_dengue.zip

Dentro del catálogo, una hoja específica proporciona la codificación de los estados de México(“CATÁLOGO ENTIDAD”), lo cual es esencial para identificar y clasificar correctamente la entidad federativa de residencia o notificación de los casos.

library(readxl)
# Lectura de las entidades
catalogo <- read_excel("Catálogos_Dengue.xlsx", sheet = "CATÁLOGO ENTIDAD")
# Mostrar solo las primeras tres filas
head(catalogo, 3L)
## # A tibble: 3 × 3
##   CLAVE_ENTIDAD ENTIDAD_FEDERATIVA  ABREVIATURA
##   <chr>         <chr>               <chr>      
## 1 01            AGUASCALIENTES      AS         
## 2 02            BAJA CALIFORNIA     BC         
## 3 03            BAJA CALIFORNIA SUR BS

Una vez cargado el catalogo, se procedió a realizar el análisis de los datos:

# Conversión de CLAVE_ENTIDAD a numérico
catalogo$CLAVE_ENTIDAD <- as.numeric(catalogo$CLAVE_ENTIDAD)
# Crear un dataframe con etiquetas de sexo
sexo <- data.frame(Codigo=c(1,2),Etiqueta=c("MUJER","HOMBRE"))
# Unir el dataframe 'data' con el catálogo por la clave de entidad
sexo_entidad <- merge(x=data[,c(3,5)], y=catalogo[,c(1,2)], by.x="ENTIDAD_RES",by.y="CLAVE_ENTIDAD",sort = F,all.x = T)
# Unir el dataframe resultante con el dataframe 'sexo' por el código de sexo
sexo_entidad <- merge(x=sexo_entidad, y=sexo, by.x="SEXO",by.y="Codigo",sort = F,all.x = T)
# Crear una tabla de contingencia y calcular los porcentajes por entidad y etiqueta de sexo
sexo_x_entidad <- prop.table(table(sexo_entidad$ENTIDAD_FEDERATIVA,sexo_entidad$Etiqueta), 1) * 100
sexo_x_entidad
##                                  
##                                      HOMBRE     MUJER
##   AGUASCALIENTES                   42.84020  57.15980
##   BAJA CALIFORNIA                  43.68132  56.31868
##   BAJA CALIFORNIA SUR              47.74787  52.25213
##   CAMPECHE                         48.22064  51.77936
##   CHIAPAS                          47.98418  52.01582
##   CHIHUAHUA                        44.54545  55.45455
##   CIUDAD DE MÉXICO                 47.19101  52.80899
##   COAHUILA DE ZARAGOZA             44.38250  55.61750
##   COLIMA                           47.54676  52.45324
##   DURANGO                          43.67232  56.32768
##   ESTADOS UNIDOS DE AMERICA        50.00000  50.00000
##   GUANAJUATO                       43.54915  56.45085
##   GUERRERO                         46.31967  53.68033
##   HIDALGO                          40.61592  59.38408
##   JALISCO                          43.65475  56.34525
##   MÉXICO                           44.93835  55.06165
##   MICHOACÁN DE OCAMPO              43.65045  56.34955
##   MORELOS                          45.37534  54.62466
##   NAYARIT                          44.99080  55.00920
##   NUEVO LEÓN                       47.34467  52.65533
##   OAXACA                           44.09785  55.90215
##   OTROS PAISES                    100.00000   0.00000
##   OTROS PAISES DE LATINOAMERICA    54.54545  45.45455
##   PUEBLA                           43.78061  56.21939
##   QUERÉTARO                        42.97151  57.02849
##   QUINTANA ROO                     47.84697  52.15303
##   SAN LUIS POTOSÍ                  41.55692  58.44308
##   SINALOA                          43.94544  56.05456
##   SONORA                           42.10736  57.89264
##   TABASCO                          46.50426  53.49574
##   TAMAULIPAS                       43.93396  56.06604
##   TLAXCALA                         53.62319  46.37681
##   VERACRUZ DE IGNACIO DE LA LLAVE  45.29903  54.70097
##   YUCATÁN                          47.00298  52.99702
##   ZACATECAS                        46.17564  53.82436

En el análisis de la distribución de casos de dengue por sexo, se observó que, excepto en los pacientes registrados en Estados Unidos y otros países, las mujeres presentan una mayor frecuencia de enfermos por dengue en comparación con los hombres. Esto puede deberse, en parte, por el hecho de que, en general, hay una mayor proporción de mujeres que de hombres en la población. Sin embargo, también podrían influir otros factores, como diferencias biológicas, comportamiento y exposición o acceso a servicios de salud.

Edad promedio de los enfermos registrados

El análisis de la edad promedio de los pacientes registrados con dengue, desglosado por sexo, proporciona información valiosa sobre las características demográficas de la población afectada. Este enfoque permite identificar posibles diferencias en la distribución de la enfermedad entre hombres y mujeres, lo que puede estar relacionado con factores biológicos, comportamentales o sociales.

# Emparejamiento de los datos 
sexo_edad <- merge(x=data[,c(3,4)], y=sexo[,c(1,2)], by.x="SEXO",by.y="Codigo",sort = F,all.x = T)
# Calculo del promedio  por edad y sexo
edad_x_sexo <- aggregate(sexo_edad$EDAD_ANOS~sexo_edad$Etiqueta,FUN = mean)
colnames(edad_x_sexo) <- c("SEXO","PROM_EDAD")
edad_x_sexo
##     SEXO PROM_EDAD
## 1 HOMBRE  28.03076
## 2  MUJER  30.94481

Con base en los datos analizados, se observa que existe una diferencia (pero no mucha) en la edad promedio de los pacientes registrados con dengue según su sexo. En el caso de las mujeres, la edad promedio es de casi 31 años, mientras que, para los hombres, la edad promedio es de 28 años.

Estados con mayor casos registrados

Identificar los estados con mayor número de casos registrados de dengue es fundamental para comprender la distribución geográfica de la enfermedad y focalizar los esfuerzos de prevención y control en las regiones más afectadas. Para ello, se enlistaron los 5 Con este propósito, se elaboró un listado de los 5 estados de México con el mayor número de casos de dengue registrados, lo que proporciona una perspectiva clara de las áreas que requieren atención prioritaria y la implementación de medidas específicas para mitigar la propagación de la enfermedad.

# Creación de la tabla de frecuencia
estados <- table(sexo_entidad$ENTIDAD_FEDERATIVA)
# Ordenamiento de la tabla de mayor a menor
estados <- estados[order(estados, decreasing = T)]
# Mostrar las primeras 5 filas
head(estados, 5L)
## 
##    JALISCO   GUERRERO NUEVO LEÓN    NAYARIT     OAXACA 
##      82282      45879      35457      33698      31192

Los resultados muestran que los 5 estados con mayor número de casos registrados de dengue son Jalisco (82,282 casos), Guerrero (45,879 casos), Nuevo León (35,457 casos), Nayarit (33,698 casos) y Oaxaca (31,192 casos). Estos resultados pueden deberse a factores como el clima, la densidad poblacional y las condiciones socioeconómicas de estos estados en particular.

Distribución de defunciones por Institución UM

El análisis de la distribución de casos de dengue según la Institución de Unidad Médica (UM) que los notificó, junto con los casos de defunción asociados, proporciona información crucial sobre el papel de las diferentes instituciones de salud en la atención y registro de la enfermedad. Este enfoque permite identificar qué instituciones manejan la mayor carga de casos, así como evaluar la efectividad en la atención médica y el manejo de los pacientes.

# Lectura de las Intituciones UM
um <- read_excel("Catálogos_Dengue.xlsx", sheet = "CATÁLOGO INSTITUCION")
# Crear un dataframe con etiquetas de defunción
defuncion <- data.frame(CODIGO=c(1,2),ETIQUETA=c("DEFUNCION","NO DEFUNCION"))
# Emparejamiento de los datos 
casos_um <- merge(x = data[,c(11,22)], y = um, by.x = "INSTITUCION_UM_NOTIF", by.y = "CLAVE")
casos_um <- merge(x = casos_um, y = defuncion, by.x = "DEFUNCION", by.y = "CODIGO")
# Creación de tabla de porcentajes de defunciiones por UM
prop.table(table(casos_um$DESCRIPCIÓN, casos_um$ETIQUETA), 1)*100
##                  
##                     DEFUNCION NO DEFUNCION
##   CRUZ ROJA         0.0000000  100.0000000
##   DIF               0.0000000  100.0000000
##   ESTATAL           0.2045920   99.7954080
##   IMSS              0.2532741   99.7467259
##   IMSS-BIENESTAR    0.3239916   99.6760084
##   ISSSTE            0.4434258   99.5565742
##   MUNICIPAL         0.2539683   99.7460317
##   NO ESPECIFICADO   1.4167651   98.5832349
##   PEMEX             0.2148228   99.7851772
##   PRIVADA           0.9427953   99.0572047
##   SEDENA            1.2084592   98.7915408
##   SEMAR             0.4761905   99.5238095
##   SSA               0.4792662   99.5207338
##   UNIVERSITARIO     2.3510972   97.6489028

Con base en los datos analizados, se puede concluir que, en términos generales, el porcentaje de defunciones por institución es relativamente bajo, lo que sugiere que la mayoría de las instituciones de salud están manejando de manera efectiva los casos de dengue. Sin embargo, se observa que la Institución de Unidad Médica (UM) Universitaria presenta el mayor porcentaje de defunciones, con un 2.35%. Este valor, aunque bajo en comparación con el total de casos, es significativamente más alto que el de otras instituciones.