## Warning in read_fun(path = enc2native(normalizePath(path)), sheet_i = sheet, :
## Expecting numeric in H5 / R5C8: got a date
## Estado Jurisdiccion Uneme CLUES Cve.Persona Genero
## 1 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN5910 Mujer
## 2 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN5953 Mujer
## 3 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN6045 Mujer
## 4 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN6091 Mujer
## 5 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN6138 Mujer
## 6 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN5706 Hombre
## Cve.Diagnóstico Diagnostico Fecha.Diagnostico
## 1 E78.2 Dislipidemias 02/01/2018
## 2 E78.2 Dislipidemias 02/01/2018
## 3 E78.2 Dislipidemias 02/01/2018
## 4 E78.2 Dislipidemias 02/01/2018
## 5 E78.2 Dislipidemias 02/01/2018
## 6 E78.2 Dislipidemias 02/01/2018
En base a la información del Programa de gestión para mejorar la calidad del aire del estado de sonora
https://cedes.gob.mx/images/pdf/ProAireSonora.pdf
Caso de estudio
¿Qué variables hacen que aumente o disminuyan las defunciones por covid-19 en Sonora?
El aumento de defunciones por covid-19 en Sonora se puede deber a enfermedades crónicas, contaminación, seguridad, uso de drogas, entre otras.
Sonora <- t(datosDiag [datosDiag$Estado == "Sonora", ])
Sonora <- (datosDiag [datosDiag$Estado == "Sonora", ])
ggplot(Sonora, aes(fill=Jurisdiccion, y=Diagnostico)) + geom_bar(position="dodge", stat="count") + xlab ("Número de casos") + ylab ("Diagnóstico") + ggtitle(" Enfermedades crónicas en Sonora, 2018 (CENAPRECE)") ## # A tibble: 4 x 9
## Municipio Poblacion2015 Fallecidos Dx10000 Aleer `Asistencia Esc~
## <chr> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 Caborca 85631 95 11.1 14882 80708
## 2 Santa Ana 16248 13 8.00 2809 15374
## 3 Cajeme 433050 625 14.4 66782 411496
## 4 Hermosil~ 884273 1010 11.4 140278 837720
## # ... with 3 more variables: NoAsistencia <dbl>, IngresoInf <dbl>,
## # PobrezaEx <dbl>
## Estado Jurisdiccion Uneme CLUES Cve.Persona Genero
## 240 Sonora SANTA ANA UNEME EC AGUA PRIETA SRSSA018453 SoSAUN1253 Mujer
## 241 Sonora SANTA ANA UNEME EC AGUA PRIETA SRSSA018453 SoSAUN1735 Hombre
## 588 Sonora CABORCA UNEME EC RIO COLORADO SRSSA018441 SoCAUN910 Mujer
## 589 Sonora CABORCA UNEME EC RIO COLORADO SRSSA018441 SoCAUN930 Mujer
## 627 Sonora SANTA ANA UNEME EC AGUA PRIETA SRSSA018453 SoSAUN1801 Mujer
## 628 Sonora SANTA ANA UNEME EC NOGALES SRSSA018465 SoSAUN77 Mujer
## Cve.Diagnóstico Diagnostico Fecha.Diagnostico
## 240 I10.X Hipertension 04/01/2018
## 241 I10.X Hipertension 04/01/2018
## 588 E10.9 Diabetes 08/01/2018
## 589 E10.9 Diabetes 08/01/2018
## 627 I10.X Hipertension 08/01/2018
## 628 E11.9 Diabetes 08/01/2018
Caso de estudio: Relación entre enfermedades crónicas y covid-19
¿Son lugares que tienen más personas reportadas con enfermedades crónicas los lugares que también tienen más personas fallecidas por covid-19?
Con respecto a los datos, la respuesta es no, ya que, Hermosillo es el municipio con más casos de enfermedades crónicas acumuladas, sin embargo, las muertes por covid se deben más factores que a solo las enfermedades crónicas, por lo que no hay más casos de defunciones por covid en los lugares donde se reportan más casos de enfermedades crónicas.
Para responder esto tenemos el dato más nuevo de número de personas con diagnóstico de enfermedades crónicas, para esto usamos datos provenientes de:
www.cenaprece.salud.gob.mx/descargas/Excel/Diagnosticos18.csv https://datos.gob.mx/busca/dataset/expediente-clinico-electronico-unemes-enfermedades-cronicas--2018
Podemos ver la gráfica y código aquí: https://rpubs.com/jigbadouin/MSDatos
¿Por qué razones si la población de Ciudad Obregón es más grande que la santa ana y de caborca, existen más personas con diagnóstico de enfermedades crónicas ?
Ordene en una tabla: Municipio, Población2015, Diabetes, dislipidemias, hipertensión, obesidad, Defunciones por cada 10mil habitantes, defunciones
SonoraS <- t(datosDiag [datosDiag$Estado == "Sonora", ])
SonoraS <- (datosDiag [datosDiag$Estado == "Sonora", ])
ggplot(SonoraS, aes(fill=Jurisdiccion, y=Diagnostico)) + geom_bar(position="dodge", stat="count") + xlab ("Número de casos") + ylab ("Diagnóstico") + ggtitle(" Enfermedades crónicas en Sonora, 2018 (CENAPRECE)") ¿Son los lugares que proporcionalmente tienen más defunciones, los lugares que también tienen más diagnósticos?
No, ya que, los datos muestran que puede variar.
¿por qué si en cajeme hay menos enfermedades crónicas, proporcionalmente a su población hay más defunciones?
Se debe a diferentes factores. Estos factores pueden ser la ignorancia de algunas personas al no creer en el virus, otra puede ser que unas personas necesitan trabajar para poder tener con que satisfacer los gastos del hogar, entre otros. Por ende, estos factores hacen que se propague más el virus y haya más defunciones conforme a la salud de la persona o variantes de cada caso particular.
¿Que otra variable o variables nos pueden ayudar a entender este fenómeno?
El consumo de sustancias, es decir, drogas, la contaminación,
¿Cuánta gente habita en cada ciudad? Fuente: http://cuentame.inegi.org.mx/monografias/informacion/son/territorio/div_municipal.aspx?tema=me&e=26
- Caborca 85631
- 058 Santa Ana 16248
- 018 Cajeme 433050
- 030 Hermosillo 884 273
Si hacemos una relación de número de personas fallecidas por cada 10000 habitantes, para poder comparar en proporción
Con esta forma de comparar, ¿Cuál ciudad tiene proporcionalmente más fallecidos? ¿Las ciudades con más personas diagnosticadas son las que proporcionalmente presentan más fallecidos?
El municipio con más fallecidos es Cajeme y la ciudad es Ciudad Obregón, con un indice de 14 personas por cada 10000 habitantes.
Asignación
¿Qué características tendría un municipio que tuviera menos defunciones?
Se puede deber por la menos contaminación, mayor seguridad, menor indice de pobreza, entre otros.
¿Qué variables se correlacionan con el número de defunciones?
Se puede observar que las defunciones se relacionan con la asistencia escolar y la pobreza extrema, esto es debido a la asistencia a la escuela y lugares publicos, donde haya mucho contagio, sin embargo, también se debe a factores externos a estos.
## Poblacion2015 Fallecidos Dx10000 Aleer
## Poblacion2015 1.0000000 0.9901336 0.4729004 0.9998013
## Fallecidos 0.9901336 1.0000000 0.5749140 0.9873561
## Dx10000 0.4729004 0.5749140 1.0000000 0.4621700
## Aleer 0.9998013 0.9873561 0.4621700 1.0000000
## Asistencia Escolar 0.9999983 0.9903827 0.4740514 0.9997630
## NoAsistencia -0.9749900 -0.9442162 -0.2737888 -0.9763320
## IngresoInf 0.8885340 0.8160450 0.0469653 0.8962680
## PobrezaEx 0.7332882 0.6771593 0.3399908 0.7440218
## Asistencia Escolar NoAsistencia IngresoInf PobrezaEx
## Poblacion2015 0.9999983 -0.9749900 0.8885340 0.7332882
## Fallecidos 0.9903827 -0.9442162 0.8160450 0.6771593
## Dx10000 0.4740514 -0.2737888 0.0469653 0.3399908
## Aleer 0.9997630 -0.9763320 0.8962680 0.7440218
## Asistencia Escolar 1.0000000 -0.9747956 0.8877476 0.7323855
## NoAsistencia -0.9747956 1.0000000 -0.9448974 -0.6724423
## IngresoInf 0.8877476 -0.9448974 1.0000000 0.7746847
## PobrezaEx 0.7323855 -0.6724423 0.7746847 1.0000000
Con los datos que se sacaron, podemos comprobar que la pobreza extrema está relacionada un 33% con las defunciones por cada 10000 habitantes, así como está relacionada con los fallecidos un 67%, y la asistencia escolar tiene una relación del 47% con las defunciones por cada 10000 habitantes y 99% con los fallecidos.
¿Los municipios que tienen más gente escolarizada son los que menos tienen defunciones?
https://datos.covid-19.conacyt.mx/#DownZCSV
Bosque aleatorio: https://fervilber.github.io/Aprendizaje-supervisado-en-R/bosques.html
https://datos.gob.mx/busca/dataset?theme=Salud
¿Qué otras variables podemos añadir al análisis? https://datos.gob.mx/
Añada variables a este análisis y explique porque hacen que aumente la cantidad de defunciones por municipio. añada estos datos al excel datossalud
- Pobreza extrema
- Drogas, consumo de sustancias
- Asistencia médica deficiente
borrar <- c("areakm2","clave","municipio", "GM")
datosEvaluar <- datosDefunciones[ , !(names(datosDefunciones) %in% borrar)]
head(datosEvaluar)## # A tibble: 6 x 10
## poblacion IM RezagoE CarenciasSalud IngresoMenor defunciones Dx10mil
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 2756 -1.09 555 271 1.58 3 10.9
## 2 82918 -1.83 11620 18751 1.42 78 9.41
## 3 25694 -0.029 6026 1654 2.35 2 0.778
## 4 9578 -0.936 2073 1640 1.63 2 2.09
## 5 1163 -0.848 306 154 2.42 0 0
## 6 2677 -0.837 595 506 1.48 1 3.74
## # ... with 3 more variables: CarenciaAliemtacion <dbl>,
## # CarenciaServicioVivienda <dbl>, PobrezaEx <dbl>
## poblacion IM RezagoE CarenciasSalud IngresoMenor
## poblacion 1.00000000 NA 0.99047932 0.97010790 -0.09421275
## IM NA 1 NA NA NA
## RezagoE 0.99047932 NA 1.00000000 0.98433483 -0.05267524
## CarenciasSalud 0.97010790 NA 0.98433483 1.00000000 -0.07740579
## IngresoMenor -0.09421275 NA -0.05267524 -0.07740579 1.00000000
## defunciones 0.99268971 NA 0.98401459 0.97006148 -0.10629077
## Dx10mil 0.30582924 NA 0.33334330 0.32979896 -0.13680001
## CarenciaAliemtacion -0.08708683 NA -0.10635644 -0.09970514 0.03949067
## CarenciaServicioVivienda -0.17944892 NA -0.19765271 -0.19392546 0.01031189
## PobrezaEx 0.09155437 NA 0.11984847 0.10127863 0.56255210
## defunciones Dx10mil CarenciaAliemtacion
## poblacion 0.99268971 0.3058292 -0.08708683
## IM NA NA NA
## RezagoE 0.98401459 0.3333433 -0.10635644
## CarenciasSalud 0.97006148 0.3297990 -0.09970514
## IngresoMenor -0.10629077 -0.1368000 0.03949067
## defunciones 1.00000000 0.3207860 -0.08395643
## Dx10mil 0.32078597 1.0000000 -0.14404158
## CarenciaAliemtacion -0.08395643 -0.1440416 1.00000000
## CarenciaServicioVivienda -0.18183681 -0.1818688 0.20663274
## PobrezaEx 0.08850082 0.1570354 0.14791924
## CarenciaServicioVivienda PobrezaEx
## poblacion -0.17944892 0.09155437
## IM NA NA
## RezagoE -0.19765271 0.11984847
## CarenciasSalud -0.19392546 0.10127863
## IngresoMenor 0.01031189 0.56255210
## defunciones -0.18183681 0.08850082
## Dx10mil -0.18186883 0.15703535
## CarenciaAliemtacion 0.20663274 0.14791924
## CarenciaServicioVivienda 1.00000000 0.15888879
## PobrezaEx 0.15888879 1.00000000
## [1] 0.7091847
##
## Call:
## lm(formula = Dx10mil ~ PobrezaEx, data = datosDefunciones)
##
## Residuals:
## Min 1Q Median 3Q Max
## -6.4662 -5.6166 -0.7472 4.0531 20.8162
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1.457 3.260 0.447 0.656
## PobrezaEx 1.298 0.976 1.330 0.188
##
## Residual standard error: 5.832 on 70 degrees of freedom
## Multiple R-squared: 0.02466, Adjusted R-squared: 0.01073
## F-statistic: 1.77 on 1 and 70 DF, p-value: 0.1877
plot(datosDefunciones$PobrezaEx, datosDefunciones$Dx10mil, xlab='Pobreza Extrema', ylab='Defunciones por cada 10000 habitantes')
abline(regresion)