setwd("~/PyE3")
library(pacman)
p_load("base64enc", "htmltools", "mime", "xfun", "prettydoc","readr", "knitr","DT","dplyr", "ggplot2","plotly", "gganimate","gifski","scales")¿Que tanp probable es que un munucipio con alta cantidad de diagnósticos por enfermedades crónicas también sea un municipio con tasas elevadas de mortalidad por COVID-19?
Dado que los pacientes con enfermedades crónicas tienen mayor probabilidad de desarrollar complicaciones si se contagian.
Fuente de los datos Obtenida de: https://datos.gob.mx/busca/dataset/expediente-clinico-electronico-unemes-enfermedades-cronicas--2018
URL de datos CSV crudos: http://www.cenaprece.salud.gob.mx/descargas/Excel/Diagnosticos18.csv
Expediente Clínico Electrónico UNEMES (unidades de especialidades médicas) Enfermedades Crónicas 2018
## [1] "data.frame"
## Estado Jurisdiccion Uneme CLUES Cve.Persona Genero
## 1 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN5910 Mujer
## 2 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN5953 Mujer
## 3 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN6045 Mujer
## 4 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN6091 Mujer
## 5 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN6138 Mujer
## 6 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN5706 Hombre
## Cve.Diagn.f3.stico Diagnostico Fecha.Diagnostico
## 1 E78.2 Dislipidemias 02/01/2018
## 2 E78.2 Dislipidemias 02/01/2018
## 3 E78.2 Dislipidemias 02/01/2018
## 4 E78.2 Dislipidemias 02/01/2018
## 5 E78.2 Dislipidemias 02/01/2018
## 6 E78.2 Dislipidemias 02/01/2018
# Grouped
ggplot(SonoraS, aes(fill=Jurisdiccion, y=Diagnostico)) +
geom_bar(position="dodge", stat="count") +
xlab ("Número de casos") +
ylab ("Diagnóstico") +
ggtitle(" Enfermedades crónicas en Sonora, 2018 (CENAPRECE)") Ahora que se tienen los datos, podemos estimar la cantidad de personas diagnosticadas por jurisdicción (Ciudad):
Existen varias razones principales, en Ciudad Obregón existe mucha gente que tiene hábitos que se usan mucho en pueblos, como lo son ejercitarse, caminar, comer más saludable, y esto previene parte de las enfermedades, además Santa Ana y Caborca tienen muy cerca la frontera con EUA, lo cuál influye mucho la publicidad y los hábitos estadounidenses en ese sector de la población, como comer más comida rápida, sedentarismo, etc. Lo que hace que sean más las personas con enfermedades crónicas.
017 Caborca 85631 058 Santa Ana 16248 018 Cajeme 433050 030 Hermosillo 884 273
Municipio Poblacion2015 Cronicas Fallecidos Caborca 85631 95 Santa Ana 16248 13 Cajeme 433050 625 Hermosillo 884273 1010
Si hacemos una relación de número de personas fallecidas por cada 10000 habitantes, para poder comparar en proporción.
Defunción por COVID-19
## Parsed with column specification:
## cols(
## .default = col_double(),
## cve_ent = col_character(),
## nombre = col_character()
## )
## See spec(...) for full column specifications.
defunciones <- read_csv("deff.csv", col_types = cols(Caborca = col_number(),
Cajeme = col_number(), Hermosillo = col_number(),
Santa = col_number()))Fecha = seq(from = as.Date("2020-03-02"), to = as.Date("2020-11-04"), by = 'day')
vec1 <- as.vector(defunciones$Caborca)
vec2 <-vec1[2:249]
num1 <- as.numeric(vec2)
cab <- as.vector(num1)
cab <- cumsum(cab)
vec1 <- as.vector(defunciones$Cajeme)
vec2 <-vec1[2:249]
num1 <- as.numeric(vec2)
caj <- as.vector(num1)
caj <- cumsum(caj)
vec1 <- as.vector(defunciones$Hermosillo)
vec2 <-vec1[2:249]
num1 <- as.numeric(vec2)
her <- as.vector(num1)
her <- cumsum(her)
vec1 <- as.vector(defunciones$Santa)
vec2 <-vec1[2:249]
num1 <- as.numeric(vec2)
san <- as.vector(num1)
san <- cumsum(san)
#generacion de un data frame
datos4 <- data.frame(Fecha, cab, caj, her, san)defun <- ggplot(data = datos4)+
geom_line(aes(Fecha, cab, colour = 'Caborca'))+
geom_line(aes(Fecha, caj, colour = 'Cajeme'))+
geom_line(aes(Fecha, her, colour = 'Hermosillo'))+
geom_line(aes(Fecha, san, colour = 'Santa'))+
xlab('Fecha')+
ylab('Defunciones')+
labs(colour = 'Cantidad')+
ggtitle("Cantidad de defunciones por COVID-19 en Sonora")+
scale_y_continuous(labels = comma)
defun## Warning: Removed 1 row(s) containing missing values (geom_path).
## Warning: Removed 1 row(s) containing missing values (geom_path).
## Warning: Removed 1 row(s) containing missing values (geom_path).
## Warning: Removed 1 row(s) containing missing values (geom_path).
Fallecidos: https://datos.covid-19.conacyt.mx/#DownZCSV
Hermosillo es el municipio que está más proporcionado en fallecidos por COVID-19 en relación a su población con enfermedades crónicas, sin embargo la ciudad con más personas fallecidas por COVID-19 por cada habitante con alguna enfermedad crónica sería Ciudad Obregón pues es la que tiene menos enfermedades crónicas en su población pero presenta un gran número de fallecidos, caso contrario con Caborca y Santa Ana, que presentan muchos habitantes con enfermedades crónicas pero pocas defunciones por COVID-19 registradas.
¿De qué manera podemos saber qué variables hacen que el número de fallecidos por ciudad aumente o disminuya?
Hacer una matriz de diagramas de dispersión para poder saber qué variables se correlacionan mejor entre sí, para esto será indispensable que no solamente use las variables que fueron proporcionadas, sino también variables que consideren que influyen.
¿Tiene que ver además de la educación y la salud la pobreza de las personas como incidente en la probabilidad de generar complicaciones por COVID-19? índice de pobreza en Sonora:
https://www.coneval.org.mx/coordinacion/entidades/Sonora/Paginas/pobreza_municipal2015.aspx
u2a11 <- read_csv("u2a11.csv", col_types = cols(poblacion = col_number(),
IM = col_number(), RezagoE = col_number(),
CarenciasSalud = col_number(), IngresoMenor = col_number(),
defunciones = col_number(), CarenciaAccesoAlim = col_number(),
CarenciaCalidadVivienda = col_number(),
vulning = col_number()))## Warning: 2 parsing failures.
## row col expected actual file
## 70 IngresoMenor a number . 'u2a11.csv'
## 70 vulning a number . 'u2a11.csv'
marg <- as.numeric(u2a11$IM)
rescolar <- as.numeric(u2a11$RezagoE)
carsalud <- as.numeric(u2a11$CarenciasSalud)
ingmenor <- as.numeric(u2a11$IngresoMenor)
def <- as.numeric(u2a11$defunciones)
caralim <- as.numeric(u2a11$CarenciaAccesoAlim)
carviv <- as.numeric(u2a11$CarenciaCalidadVivienda)
vuln <- as.numeric(u2a11$vulning)
datos0 <- data.frame(marg, rescolar, carsalud, ingmenor, def, caralim, carviv, vuln)## marg rescolar carsalud ingmenor def caralim
## marg 1.000000000 0.0338783 -0.001733269 NA 0.01126118 0.02550838
## rescolar 0.033878295 1.0000000 0.984403689 NA 0.98400641 0.99099084
## carsalud -0.001733269 0.9844037 1.000000000 NA 0.97009094 0.97368402
## ingmenor NA NA NA 1 NA NA
## def 0.011261178 0.9840064 0.970090941 NA 1.00000000 0.98672407
## caralim 0.025508383 0.9909908 0.973684017 NA 0.98672407 1.00000000
## carviv 0.024566417 0.9682044 0.937470743 NA 0.93221080 0.95913086
## vuln NA NA NA NA NA NA
## carviv vuln
## marg 0.02456642 NA
## rescolar 0.96820437 NA
## carsalud 0.93747074 NA
## ingmenor NA NA
## def 0.93221080 NA
## caralim 0.95913086 NA
## carviv 1.00000000 NA
## vuln NA 1
Nota: La correlación de ingmenor y de vuln con con las defunciones son de 0.02 y de 0.38 respectivamente.
¿Qué características tendría un municipio que tuviera menos defunciones?
Son los municipios con menos población del Estado, además que tienen población con ingresos inferiores para el bienestar según CONAVAL menor que las ciudades más grandes, proporcionalmente hablando.
¿Qué variables se correlacionan con el número de defunciones?
Las de carencias en calidad de viviendas y de carencias en accesos a los alimentos, y tiene sentido, pues serían las personas que más estarían ganandose la vida en empleos en los que se tenga que estar en la calle constantemente.
¿Los municipios que tienen más gente escolarizada son los que menos tienen defunciones?
No, son los que tienen más pobreza y carencias en servicios o calidad de vida, esto según las correlaciones analizadas. Y esto es así generalmente pero también los municipios con más trafico de personas en las calles y con más población sufren más defunciones como lo son Cajeme y Hermosillo.
¿Qué otras variables podemos añadir al análisis?
Datos de personas en común asistiendo a espacios públicos o eventos públicos masivos como estadios abiertos, torneos deportivos en colonias, gimnasios, antros que estuvieron abiertos, etc. En los que no hubo un control higiénico con un seguimiento o un control estricto (en la mayoría de los casos fue así). Cosas las cuales suceden más en municipios más poblados como Hermosillo y Cajeme.
Existen muchas variables involucradas en la frecuencia con la que fallecen personas por COVID en ciertos municipios, como la pobreza en proporción a la población que se tiene, o a la carencia de servicios que se tengan, aunque esto no siempre es así, por lo que no se puede inferir que sea directamente con esas variables las razones por las que fallecen más personas por COVID.