library(pacman)
setwd("~/3er Semestre/ProbYEst")
p_load('fdth','readr','readxl','DT','ggplot2','dplyr')
datosSalud <- read_excel("datosdalud.xlsx")## Warning in read_fun(path = enc2native(normalizePath(path)), sheet_i = sheet, :
## Expecting numeric in H5 / R5C8: got a date
## Warning in instance$preRenderHook(instance): It seems your data is too big
## for client-side DataTables. You may consider server-side processing: https://
## rstudio.github.io/DT/server.html
## Estado Jurisdiccion Uneme CLUES Cve.Persona Genero
## 1 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN5910 Mujer
## 2 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN5953 Mujer
## 3 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN6045 Mujer
## 4 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN6091 Mujer
## 5 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN6138 Mujer
## 6 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN5706 Hombre
## Cve.Diagnóstico Diagnostico Fecha.Diagnostico
## 1 E78.2 Dislipidemias 02/01/2018
## 2 E78.2 Dislipidemias 02/01/2018
## 3 E78.2 Dislipidemias 02/01/2018
## 4 E78.2 Dislipidemias 02/01/2018
## 5 E78.2 Dislipidemias 02/01/2018
## 6 E78.2 Dislipidemias 02/01/2018
En base a la información del Programa de gestión para mejorar la calidad del aire del estado de sonora
https://cedes.gob.mx/images/pdf/ProAireSonora.pdf
Porcentaje de generación de PM10 en sonora
Porcentaje de generación de NOx en sonora
Caso de estudio
¿Qué variables hacen que aumente o disminuyan las defunciones por covid-19 en Sonora?
Las defunciones por covid-19 en sonora pueden ser causadas por enfermedades cronicas, la calidad del aire, el consumo de drogas, o incluso la probreza.
Sonora <- t(datos [datos$Estado == "Sonora", ])
Sonora <- (datos [datos$Estado == "Sonora", ])
ggplot(Sonora, aes(fill=Jurisdiccion, y=Diagnostico)) + geom_bar(position="dodge", stat="count") + xlab ("Número de casos") + ylab ("Diagnóstico") + ggtitle(" Enfermedades crónicas en Sonora, 2018 (CENAPRECE)") ## # A tibble: 4 x 9
## Municipio Poblacion2015 Fallecidos Dx10000 Aleer `Asistencia Esc~
## <chr> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 Caborca 85631 95 11.1 14882 80708
## 2 Santa Ana 16248 13 8.00 2809 15374
## 3 Cajeme 433050 625 14.4 66782 411496
## 4 Hermosil~ 884273 1010 11.4 140278 837720
## # ... with 3 more variables: NoAsistencia <dbl>, IngresoInf <dbl>,
## # PobrezaModerada <dbl>
## Estado Jurisdiccion Uneme CLUES Cve.Persona Genero
## 240 Sonora SANTA ANA UNEME EC AGUA PRIETA SRSSA018453 SoSAUN1253 Mujer
## 241 Sonora SANTA ANA UNEME EC AGUA PRIETA SRSSA018453 SoSAUN1735 Hombre
## 588 Sonora CABORCA UNEME EC RIO COLORADO SRSSA018441 SoCAUN910 Mujer
## 589 Sonora CABORCA UNEME EC RIO COLORADO SRSSA018441 SoCAUN930 Mujer
## 627 Sonora SANTA ANA UNEME EC AGUA PRIETA SRSSA018453 SoSAUN1801 Mujer
## 628 Sonora SANTA ANA UNEME EC NOGALES SRSSA018465 SoSAUN77 Mujer
## Cve.Diagnóstico Diagnostico Fecha.Diagnostico
## 240 I10.X Hipertension 04/01/2018
## 241 I10.X Hipertension 04/01/2018
## 588 E10.9 Diabetes 08/01/2018
## 589 E10.9 Diabetes 08/01/2018
## 627 I10.X Hipertension 08/01/2018
## 628 E11.9 Diabetes 08/01/2018
No, pero se puede ver reflejado ya que en Hermosillo hay mas personas que en otras ciudades, ya que la ciudad es grande y por eso se ve reflejado en ese porcentaje, pero las muertes por covid se pueden deber mas factores aparte de las enfermedades cronicas.
Para responder esto tenemos el dato más nuevo de número de personas con diagnóstico de enfermedades crónicas, para esto usamos datos provenientes de:
www.cenaprece.salud.gob.mx/descargas/Excel/Diagnosticos18.csv https://datos.gob.mx/busca/dataset/expediente-clinico-electronico-unemes-enfermedades-cronicas--2018
Podemos ver la gráfica y código aquí: https://rpubs.com/jigbadouin/MSDatos
¿Por qué razones si la población de Ciudad Obregón es más grande que la santa ana y de caborca, existen más personas con diagnóstico de enfermedades crónicas ?
Ordene en una tabla: Municipio, Población2015, Diabetes, dislipidemias, hipertensión, obesidad, Defunciones por cada 10mil habitantes, defunciones
SonoraS <- t(datos [datos$Estado == "Sonora", ])
SonoraS <- (datos [datos$Estado == "Sonora", ])
ggplot(SonoraS, aes(fill=Jurisdiccion, y=Diagnostico)) + geom_bar(position="dodge",
stat="count") + xlab ("Número de casos") + ylab ("Diagnóstico") +
ggtitle(" Enfermedades crónicas en Sonora, 2018 (CENAPRECE)") ¿Son los lugares que proporcionalmente tienen más defunciones, los lugares que también tienen más diagnósticos?
No, necesariamente, los datos varian.
¿por qué si en cajeme hay menos enfermedades crónicas, proporcionalmente a su población hay más defunciones?
Debido a que no se toman las suficientes medidas o sanciones a la hora de no cumplir con las normas que se establecen, la ignorancia de parte de la gente, falta de información que se tienen o interes, gracias a opiniones publicas de parte de otra gente, se deja llevar mucho de las opiniones publicas.
¿Que otra variable o variables nos pueden ayudar a entender este fenómeno?
La contaminacion y el consumo de drogas, podrian ser factores que nos puedan ayudar.
¿Cuánta gente habita en cada ciudad? Fuente: http://cuentame.inegi.org.mx/monografias/informacion/son/territorio/div_municipal.aspx?tema=me&e=26
Si hacemos una relación de número de personas fallecidas por cada 10000 habitantes, para poder comparar en proporción
Con esta forma de comparar, ¿Cuál ciudad tiene proporcionalmente más fallecidos? ¿Las ciudades con más personas diagnosticadas son las que proporcionalmente presentan más fallecidos?
El municipio con más fallecidos es Cajeme y la ciudad es Ciudad Obregón, con un indice de 14 personas por cada 10000 habitantes.
Asignación
¿Qué características tendría un municipio que tuviera menos defunciones?
Se puede deber por la menos contaminación, mayor información y respeto a las normas sanitarias.
¿Qué variables se correlacionan con el número de defunciones?
Se puede apreciar como los fallecidos se muestra con una creciente con la asistencia a la escuela, pero en cambio con la NoAsistencia se muestra una decreciente esto quiere decir que este es un factor importante en los fallecidos, ya que posiblemente se tiene contacto con otras personas y por ende mas contagio.
## Poblacion2015 Fallecidos Dx10000 Aleer
## Poblacion2015 1.0000000 0.9901336 0.4729004 0.9998013
## Fallecidos 0.9901336 1.0000000 0.5749140 0.9873561
## Dx10000 0.4729004 0.5749140 1.0000000 0.4621700
## Aleer 0.9998013 0.9873561 0.4621700 1.0000000
## Asistencia Escolar 0.9999983 0.9903827 0.4740514 0.9997630
## NoAsistencia -0.9749900 -0.9442162 -0.2737888 -0.9763320
## IngresoInf 0.8885340 0.8160450 0.0469653 0.8962680
## PobrezaModerada 0.9737072 0.9954549 0.6497718 0.9697187
## Asistencia Escolar NoAsistencia IngresoInf PobrezaModerada
## Poblacion2015 0.9999983 -0.9749900 0.8885340 0.9737072
## Fallecidos 0.9903827 -0.9442162 0.8160450 0.9954549
## Dx10000 0.4740514 -0.2737888 0.0469653 0.6497718
## Aleer 0.9997630 -0.9763320 0.8962680 0.9697187
## Asistencia Escolar 1.0000000 -0.9747956 0.8877476 0.9740857
## NoAsistencia -0.9747956 1.0000000 -0.9448974 -0.9086051
## IngresoInf 0.8877476 -0.9448974 1.0000000 0.7608148
## PobrezaModerada 0.9740857 -0.9086051 0.7608148 1.0000000
¿Los municipios que tienen más gente escolarizada son los que menos tienen defunciones?
https://datos.covid-19.conacyt.mx/#DownZCSV
Bosque aleatorio: https://fervilber.github.io/Aprendizaje-supervisado-en-R/bosques.html
https://datos.gob.mx/busca/dataset?theme=Salud
¿Qué otras variables podemos añadir al análisis? https://datos.gob.mx/
Añada variables a este análisis y explique porque hacen que aumente la cantidad de defunciones por municipio. añada estos datos al excel datossalud
borrar <- c("areakm2","clave","municipio", "GM")
datosEvaluar <- datosDefunciones[ , !(names(datosDefunciones) %in% borrar)]
head(datosEvaluar)## # A tibble: 6 x 10
## poblacion IM RezagoE CarenciasSalud IngresoMenor defunciones Dx10mil
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 2756 -1.09 555 271 1.58 3 10.9
## 2 82918 -1.83 11620 18751 1.42 78 9.41
## 3 25694 -0.029 6026 1654 2.35 2 0.778
## 4 9578 -0.936 2073 1640 1.63 2 2.09
## 5 1163 -0.848 306 154 2.42 0 0
## 6 2677 -0.837 595 506 1.48 1 3.74
## # ... with 3 more variables: CarenciaAliemtacion <dbl>,
## # CarenciaServicioVivienda <dbl>, PobrezaModerada <dbl>
## poblacion IM RezagoE CarenciasSalud IngresoMenor
## poblacion 1.00000000 NA 0.99047932 0.97010790 -0.09421275
## IM NA 1 NA NA NA
## RezagoE 0.99047932 NA 1.00000000 0.98433483 -0.05267524
## CarenciasSalud 0.97010790 NA 0.98433483 1.00000000 -0.07740579
## IngresoMenor -0.09421275 NA -0.05267524 -0.07740579 1.00000000
## defunciones 0.99268971 NA 0.98401459 0.97006148 -0.10629077
## Dx10mil 0.30582924 NA 0.33334330 0.32979896 -0.13680001
## CarenciaAliemtacion -0.08708683 NA -0.10635644 -0.09970514 0.03949067
## CarenciaServicioVivienda -0.17944892 NA -0.19765271 -0.19392546 0.01031189
## PobrezaModerada -0.10011799 NA -0.12976312 -0.10819491 0.07139898
## defunciones Dx10mil CarenciaAliemtacion
## poblacion 0.99268971 0.3058292 -0.08708683
## IM NA NA NA
## RezagoE 0.98401459 0.3333433 -0.10635644
## CarenciasSalud 0.97006148 0.3297990 -0.09970514
## IngresoMenor -0.10629077 -0.1368000 0.03949067
## defunciones 1.00000000 0.3207860 -0.08395643
## Dx10mil 0.32078597 1.0000000 -0.14404158
## CarenciaAliemtacion -0.08395643 -0.1440416 1.00000000
## CarenciaServicioVivienda -0.18183681 -0.1818688 0.20663274
## PobrezaModerada -0.08616965 -0.1415895 -0.05510695
## CarenciaServicioVivienda PobrezaModerada
## poblacion -0.17944892 -0.10011799
## IM NA NA
## RezagoE -0.19765271 -0.12976312
## CarenciasSalud -0.19392546 -0.10819491
## IngresoMenor 0.01031189 0.07139898
## defunciones -0.18183681 -0.08616965
## Dx10mil -0.18186883 -0.14158954
## CarenciaAliemtacion 0.20663274 -0.05510695
## CarenciaServicioVivienda 1.00000000 0.01362693
## PobrezaModerada 0.01362693 1.00000000
## [1] 202.7395
##
## Call:
## lm(formula = Dx10mil ~ PobrezaModerada, data = datosDefunciones)
##
## Residuals:
## Min 1Q Median 3Q Max
## -6.3336 -5.1268 -0.6001 3.3024 20.6133
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 6.338004 0.873082 7.259 4.2e-10 ***
## PobrezaModerada -0.004095 0.003422 -1.197 0.235
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 5.846 on 70 degrees of freedom
## Multiple R-squared: 0.02005, Adjusted R-squared: 0.006048
## F-statistic: 1.432 on 1 and 70 DF, p-value: 0.2355
plot(datosDefunciones$PobrezaModerada, datosDefunciones$Dx10mil, xlab='Pobreza Extrema', ylab='Defunciones por cada 10000 habitantes')
abline(regresion)