U2A11

Jorge Valenzuela Parra

8/11/2020

Caso de estudio de la 2da unidad de probabilidad y estadística: Enfermedades crónicas y su relación con los fallecimientos por COVID-19
- Enfermedades crónicas en Sonora
- Redacción

Caso de estudio de la 2da unidad de probabilidad y estadística: Enfermedades crónicas y su relación con los fallecimientos por COVID-19

Importar bibliotecas:

setwd("~/PyE3")
library(pacman)
p_load("base64enc", "htmltools", "mime", "xfun", "prettydoc","readr", "knitr","DT","dplyr", "ggplot2","plotly", "gganimate","gifski","scales")

¿Que tanp probable es que un munucipio con alta cantidad de diagnósticos por enfermedades crónicas también sea un municipio con tasas elevadas de mortalidad por COVID-19?
Dado que los pacientes con enfermedades crónicas tienen mayor probabilidad de desarrollar complicaciones si se contagian.

Enfermedades crónicas en Sonora

Fuente de los datos Obtenida de: https://datos.gob.mx/busca/dataset/expediente-clinico-electronico-unemes-enfermedades-cronicas--2018
URL de datos CSV crudos: http://www.cenaprece.salud.gob.mx/descargas/Excel/Diagnosticos18.csv

Expediente Clínico Electrónico UNEMES (unidades de especialidades médicas) Enfermedades Crónicas 2018

El Centro Nacional de Programas Preventivos y Control de Enfermedades (CENAPRECE), es el órgano desconcentrado de la Secretaría de Salud responsable de conducir e implementar los programas sustantivos para la prevención y control de enfermedades, para reducir la morbilidad y mortalidad en la población mexicana.

Importar datos

datos2 <- read.csv("Diagnosticos18 (2).csv",encoding = "UTF-8")
class(datos2)

## [1] "data.frame"

head(datos2)

##       Estado Jurisdiccion             Uneme        CLUES Cve.Persona Genero
## 1 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN5910  Mujer
## 2 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN5953  Mujer
## 3 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN6045  Mujer
## 4 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN6091  Mujer
## 5 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN6138  Mujer
## 6 Guanajuato     IRAPUATO UNEME EC IRAPUATO GTSSA017250   GuIRUN5706 Hombre
##   Cve.Diagn.f3.stico   Diagnostico Fecha.Diagnostico
## 1              E78.2 Dislipidemias        02/01/2018
## 2              E78.2 Dislipidemias        02/01/2018
## 3              E78.2 Dislipidemias        02/01/2018
## 4              E78.2 Dislipidemias        02/01/2018
## 5              E78.2 Dislipidemias        02/01/2018
## 6              E78.2 Dislipidemias        02/01/2018

Formatear datos

SonoraS <- t(datos2 [datos2$Estado == "Sonora", ])
SonoraS <- (datos2 [datos2$Estado == "Sonora", ])

Visualización

# Grouped
ggplot(SonoraS, aes(fill=Jurisdiccion, y=Diagnostico)) + 
    geom_bar(position="dodge", stat="count") +
    xlab ("Número de casos") +
    ylab ("Diagnóstico") +
  ggtitle(" Enfermedades crónicas en Sonora, 2018 (CENAPRECE)")

Ahora que se tienen los datos, podemos estimar la cantidad de personas diagnosticadas por jurisdicción (Ciudad):

cdobregon <- SonoraS$Jurisdiccion

¿Por qué razones si la población de Ciudad Obregón es más grande que la Santa Ana y de Caborca, existen más personas con diagnóstico de enfermedades crónicas estas últimas?

Existen varias razones principales, en Ciudad Obregón existe mucha gente que tiene hábitos que se usan mucho en pueblos, como lo son ejercitarse, caminar, comer más saludable, y esto previene parte de las enfermedades, además Santa Ana y Caborca tienen muy cerca la frontera con EUA, lo cuál influye mucho la publicidad y los hábitos estadounidenses en ese sector de la población, como comer más comida rápida, sedentarismo, etc. Lo que hace que sean más las personas con enfermedades crónicas.

¿Cuánta gente habita en cada ciudad? Fuente: http://cuentame.inegi.org.mx/monografias/informacion/son/territorio/div_municipal.aspx?tema=me&e=26

017 Caborca 85631 058 Santa Ana 16248 018 Cajeme 433050 030 Hermosillo 884 273

Municipio Poblacion2015 Cronicas Fallecidos Caborca 85631 95 Santa Ana 16248 13 Cajeme 433050 625 Hermosillo 884273 1010

Si hacemos una relación de número de personas fallecidas por cada 10000 habitantes, para poder comparar en proporción.

Defunción por COVID-19

datos3 <- read_csv("Casos_Diarios_Municipio_Defunciones_20201104.csv")

## Parsed with column specification:
## cols(
##   .default = col_double(),
##   cve_ent = col_character(),
##   nombre = col_character()
## )

## See spec(...) for full column specifications.

defunciones <- read_csv("deff.csv", col_types = cols(Caborca = col_number(), 
    Cajeme = col_number(), Hermosillo = col_number(), 
    Santa = col_number()))

Fecha = seq(from = as.Date("2020-03-02"), to = as.Date("2020-11-04"), by = 'day')

vec1 <- as.vector(defunciones$Caborca)
vec2 <-vec1[2:249]
num1 <- as.numeric(vec2)
cab <- as.vector(num1)
cab <- cumsum(cab)

vec1 <- as.vector(defunciones$Cajeme)
vec2 <-vec1[2:249]
num1 <- as.numeric(vec2)
caj <- as.vector(num1)
caj <- cumsum(caj)

vec1 <- as.vector(defunciones$Hermosillo)
vec2 <-vec1[2:249]
num1 <- as.numeric(vec2)
her <- as.vector(num1)
her <- cumsum(her)

vec1 <- as.vector(defunciones$Santa)
vec2 <-vec1[2:249]
num1 <- as.numeric(vec2)
san <- as.vector(num1)
san <- cumsum(san)

#generacion de un data frame
datos4 <- data.frame(Fecha, cab, caj, her, san)

Visualización

defun <- ggplot(data = datos4)+
  geom_line(aes(Fecha, cab, colour = 'Caborca'))+
  geom_line(aes(Fecha, caj, colour = 'Cajeme'))+
  geom_line(aes(Fecha, her, colour = 'Hermosillo'))+
  geom_line(aes(Fecha, san, colour = 'Santa'))+
  xlab('Fecha')+
  ylab('Defunciones')+
  labs(colour = 'Cantidad')+
  ggtitle("Cantidad de defunciones por COVID-19 en Sonora")+
  scale_y_continuous(labels = comma)
defun

## Warning: Removed 1 row(s) containing missing values (geom_path).

## Warning: Removed 1 row(s) containing missing values (geom_path).

## Warning: Removed 1 row(s) containing missing values (geom_path).

## Warning: Removed 1 row(s) containing missing values (geom_path).

Fallecidos: https://datos.covid-19.conacyt.mx/#DownZCSV

Con esta forma de comparar, ¿Cuál ciudad tiene proporcionalmente más fallecidos? ¿Las ciudades con más personas diagnosticadas son las que proporcionalmente presentan más fallecidos?

Hermosillo es el municipio que está más proporcionado en fallecidos por COVID-19 en relación a su población con enfermedades crónicas, sin embargo la ciudad con más personas fallecidas por COVID-19 por cada habitante con alguna enfermedad crónica sería Ciudad Obregón pues es la que tiene menos enfermedades crónicas en su población pero presenta un gran número de fallecidos, caso contrario con Caborca y Santa Ana, que presentan muchos habitantes con enfermedades crónicas pero pocas defunciones por COVID-19 registradas.

Asignación 11 https://datos.covid-19.conacyt.mx/#DownZCSV

¿De qué manera podemos saber qué variables hacen que el número de fallecidos por ciudad aumente o disminuya?

Hacer una matriz de diagramas de dispersión para poder saber qué variables se correlacionan mejor entre sí, para esto será indispensable que no solamente use las variables que fueron proporcionadas, sino también variables que consideren que influyen.

¿Tiene que ver además de la educación y la salud la pobreza de las personas como incidente en la probabilidad de generar complicaciones por COVID-19? índice de pobreza en Sonora:

https://www.coneval.org.mx/coordinacion/entidades/Sonora/Paginas/pobreza_municipal2015.aspx

u2a11 <- read_csv("u2a11.csv", col_types = cols(poblacion = col_number(), 
    IM = col_number(), RezagoE = col_number(), 
    CarenciasSalud = col_number(), IngresoMenor = col_number(), 
    defunciones = col_number(), CarenciaAccesoAlim = col_number(), 
    CarenciaCalidadVivienda = col_number(), 
    vulning = col_number()))

## Warning: 2 parsing failures.
## row          col expected actual        file
##  70 IngresoMenor a number      . 'u2a11.csv'
##  70 vulning      a number      . 'u2a11.csv'

datatable(u2a11)

marg <- as.numeric(u2a11$IM)
rescolar <- as.numeric(u2a11$RezagoE)
carsalud <- as.numeric(u2a11$CarenciasSalud)
ingmenor <- as.numeric(u2a11$IngresoMenor)
def <- as.numeric(u2a11$defunciones)
caralim <- as.numeric(u2a11$CarenciaAccesoAlim)
carviv <- as.numeric(u2a11$CarenciaCalidadVivienda)
vuln <- as.numeric(u2a11$vulning)
datos0 <- data.frame(marg, rescolar, carsalud, ingmenor, def, caralim, carviv, vuln)

cor(datos0)

##                  marg  rescolar     carsalud ingmenor        def    caralim
## marg      1.000000000 0.0338783 -0.001733269       NA 0.01126118 0.02550838
## rescolar  0.033878295 1.0000000  0.984403689       NA 0.98400641 0.99099084
## carsalud -0.001733269 0.9844037  1.000000000       NA 0.97009094 0.97368402
## ingmenor           NA        NA           NA        1         NA         NA
## def       0.011261178 0.9840064  0.970090941       NA 1.00000000 0.98672407
## caralim   0.025508383 0.9909908  0.973684017       NA 0.98672407 1.00000000
## carviv    0.024566417 0.9682044  0.937470743       NA 0.93221080 0.95913086
## vuln               NA        NA           NA       NA         NA         NA
##              carviv vuln
## marg     0.02456642   NA
## rescolar 0.96820437   NA
## carsalud 0.93747074   NA
## ingmenor         NA   NA
## def      0.93221080   NA
## caralim  0.95913086   NA
## carviv   1.00000000   NA
## vuln             NA    1

Nota: La correlación de ingmenor y de vuln con con las defunciones son de 0.02 y de 0.38 respectivamente.

¿Qué características tendría un municipio que tuviera menos defunciones?

Son los municipios con menos población del Estado, además que tienen población con ingresos inferiores para el bienestar según CONAVAL menor que las ciudades más grandes, proporcionalmente hablando.

¿Qué variables se correlacionan con el número de defunciones?

Las de carencias en calidad de viviendas y de carencias en accesos a los alimentos, y tiene sentido, pues serían las personas que más estarían ganandose la vida en empleos en los que se tenga que estar en la calle constantemente.

¿Los municipios que tienen más gente escolarizada son los que menos tienen defunciones?

No, son los que tienen más pobreza y carencias en servicios o calidad de vida, esto según las correlaciones analizadas. Y esto es así generalmente pero también los municipios con más trafico de personas en las calles y con más población sufren más defunciones como lo son Cajeme y Hermosillo.

¿Qué otras variables podemos añadir al análisis?

Datos de personas en común asistiendo a espacios públicos o eventos públicos masivos como estadios abiertos, torneos deportivos en colonias, gimnasios, antros que estuvieron abiertos, etc. En los que no hubo un control higiénico con un seguimiento o un control estricto (en la mayoría de los casos fue así). Cosas las cuales suceden más en municipios más poblados como Hermosillo y Cajeme.

Redacción

Existen muchas variables involucradas en la frecuencia con la que fallecen personas por COVID en ciertos municipios, como la pobreza en proporción a la población que se tiene, o a la carencia de servicios que se tengan, aunque esto no siempre es así, por lo que no se puede inferir que sea directamente con esas variables las razones por las que fallecen más personas por COVID.