## Estado Jurisdiccion Uneme CLUES Cve.Persona Genero
## 1 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN5910 Mujer
## 2 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN5953 Mujer
## 3 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN6045 Mujer
## 4 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN6091 Mujer
## 5 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN6138 Mujer
## 6 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN5706 Hombre
## Cve.Diagnóstico Diagnostico Fecha.Diagnostico
## 1 E78.2 Dislipidemias 02/01/2018
## 2 E78.2 Dislipidemias 02/01/2018
## 3 E78.2 Dislipidemias 02/01/2018
## 4 E78.2 Dislipidemias 02/01/2018
## 5 E78.2 Dislipidemias 02/01/2018
## 6 E78.2 Dislipidemias 02/01/2018
En base a la información del Programa de gestión para mejorar la calidad del aire del estado de sonora
Procentaje de generación de PM10 en sonora
Procentaje de generación de NOx en sonora
Caso de estudio
¿Qué variables hacen que aumente o disminuyan las defunciones por covid-19 en Sonora?
Las defunciones por covid-19 en sonora pueden ser causadas por enfermedades cronicas, la calidad del aire, el consumo de drogas, o incluso la probreza.
Sonora <- t(datos [datos$Estado == "Sonora", ])
Sonora <- (datos [datos$Estado == "Sonora", ])
ggplot(Sonora, aes(fill=Jurisdiccion, y=Diagnostico)) +
geom_bar(position="dodge", stat="count") +
xlab ("Número de casos") +
ylab ("Diagnóstico") +
ggtitle(" Enfermedades crónicas en Sonora, 2018 (CENAPRECE)") ## # A tibble: 4 x 9
## Municipio Poblacion2015 Fallecidos Dx10000 Aleer `Asistencia Esc~
## <chr> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 Caborca 85631 95 11.1 14882 80708
## 2 Santa Ana 16248 13 8.00 2809 15374
## 3 Cajeme 433050 625 14.4 66782 411496
## 4 Hermosil~ 884273 1010 11.4 140278 837720
## # ... with 3 more variables: NoAsistencia <dbl>,
## # ProcentajeIngresoMenorBienestar <dbl>, Pobreza <dbl>
## Estado Jurisdiccion Uneme CLUES Cve.Persona Genero
## 240 Sonora SANTA ANA UNEME EC AGUA PRIETA SRSSA018453 SoSAUN1253 Mujer
## 241 Sonora SANTA ANA UNEME EC AGUA PRIETA SRSSA018453 SoSAUN1735 Hombre
## 588 Sonora CABORCA UNEME EC RIO COLORADO SRSSA018441 SoCAUN910 Mujer
## 589 Sonora CABORCA UNEME EC RIO COLORADO SRSSA018441 SoCAUN930 Mujer
## 627 Sonora SANTA ANA UNEME EC AGUA PRIETA SRSSA018453 SoSAUN1801 Mujer
## 628 Sonora SANTA ANA UNEME EC NOGALES SRSSA018465 SoSAUN77 Mujer
## Cve.Diagnóstico Diagnostico Fecha.Diagnostico
## 240 I10.X Hipertension 04/01/2018
## 241 I10.X Hipertension 04/01/2018
## 588 E10.9 Diabetes 08/01/2018
## 589 E10.9 Diabetes 08/01/2018
## 627 I10.X Hipertension 08/01/2018
## 628 E11.9 Diabetes 08/01/2018
Caso de estudio: Relación entre enfermedades crónicas y covid-19
¿Son lugares que tienen más personas reportadas con enfermedades crónicas los lugares que también tienen más personas fallecidas por covid-19?
No Necesariamente, Hermosillo tiene una cantidad mayor de peronsas con enfermedades crónicas y no tiene tantas defunciones debido a Covid-19, lo que nos dice que las personas son mas propensas a enfermase, pero tienen una mejor atención al cuidarse.
Para responder esto tenemos el dato más nuevo de número de personas con diagnóstico de enfermedades crónicas, para esto usamos datos provenientes de:
www.cenaprece.salud.gob.mx/descargas/Excel/Diagnosticos18.csv https://datos.gob.mx/busca/dataset/expediente-clinico-electronico-unemes-enfermedades-cronicas--2018
Podemos ver la gráfica y código aquí: https://rpubs.com/jigbadouin/MSDatos
¿Por qué razones si la población de Ciudad Obregón es más grande que la santa ana y de caborca, existen más personas con diagnóstico de enfermedades crónicas ?
Ordene en una tabla: Municipio, Población2015, Diabetes, dislipidemias, hipertensión, obesidad, Defunciones por cada 10mil habitantes, defunciones
SonoraS <- t(datos [datos$Estado == "Sonora", ])
SonoraS <- (datos [datos$Estado == "Sonora", ])
ggplot(SonoraS, aes(fill=Jurisdiccion, y=Diagnostico)) +
geom_bar(position="dodge", stat="count") +
xlab ("Número de casos") +
ylab ("Diagnóstico") +
ggtitle(" Enfermedades crónicas en Sonora, 2018 (CENAPRECE)") ¿Son los lugares que proporcionalmente tienen más defunciones, los lugares que también tienen más diagnósticos?
No
¿por qué si en cajeme hay menos enfermedades crónicas, proporcionalmente a su población hay más defunciones?
Probablemente sea por la desigualdad económica, debido que en Cajeme existen una desigualdad económica muy grande, por ende muchas personas viven al día, lo cual significa que si un día no trabajan no comen, y para esas personas deben de trabajar todos los días, estas personas por lo general no tienen dinero para recibir atención medica, y como salen para poder trabajar se exponen demasiado.
¿Que otra variable o variables nos pueden ayudar a entender este fenómeno?
Probablemente la contaminación del aire y el consumo de drogas sean factores importantes
¿Cuánta gente habita en cada ciudad? Fuente: http://cuentame.inegi.org.mx/monografias/informacion/son/territorio/div_municipal.aspx?tema=me&e=26
017 Caborca 85631 058 Santa Ana 16248 018 Cajeme 433050 030 Hermosillo 884 273
Si hacemos una relación de número de personas fallecidas por cada 10000 habitantes, para poder comparar en proporción
Con esta forma de comparar, ¿Cuál ciudad tiene proporcionalmente más fallecidos? ¿Las ciudades con más personas diagnosticadas son las que proporcionalmente presentan más fallecidos?
La ciudad que presenta mas fallecidos es cajeme, presenta 14 fallecidos por cada 10,000 habitantes
Asignación
¿Qué características tendría un municipio que tuviera menos defunciones?
Parece ser que los municipios con menor probreza y menor cantidad de personas tienen una cantidad de defunciones menor.
¿Qué variables se correlacionan con el número de defunciones?
Se puede ver curiosamente las muertes se relacionan con las personas que asisten a la escuela, esto probablemente significa que en donde hay mas personas que asisten a la escuela hay mas muertes por Covid-19, pero esto debe de ser influenciado por algún otro factor.
## Poblacion2015 Fallecidos Dx10000 Aleer
## Poblacion2015 1.0000000 0.9901336 0.4729004 0.9998013
## Fallecidos 0.9901336 1.0000000 0.5749140 0.9873561
## Dx10000 0.4729004 0.5749140 1.0000000 0.4621700
## Aleer 0.9998013 0.9873561 0.4621700 1.0000000
## Asistencia Escolar 0.9999983 0.9903827 0.4740514 0.9997630
## NoAsistencia -0.9749900 -0.9442162 -0.2737888 -0.9763320
## ProcentajeIngresoMenorBienestar -0.4416841 -0.3382622 0.5743740 -0.4504018
## Pobreza 0.8630866 0.9246482 0.8201947 0.8542432
## Asistencia Escolar NoAsistencia
## Poblacion2015 0.9999983 -0.9749900
## Fallecidos 0.9903827 -0.9442162
## Dx10000 0.4740514 -0.2737888
## Aleer 0.9997630 -0.9763320
## Asistencia Escolar 1.0000000 -0.9747956
## NoAsistencia -0.9747956 1.0000000
## ProcentajeIngresoMenorBienestar -0.4406805 0.6274609
## Pobreza 0.8639466 -0.7544904
## ProcentajeIngresoMenorBienestar Pobreza
## Poblacion2015 -0.44168411 0.86308665
## Fallecidos -0.33826215 0.92464817
## Dx10000 0.57437403 0.82019469
## Aleer -0.45040183 0.85424316
## Asistencia Escolar -0.44068045 0.86394660
## NoAsistencia 0.62746091 -0.75449044
## ProcentajeIngresoMenorBienestar 1.00000000 0.01132924
## Pobreza 0.01132924 1.00000000
Se puede ver que las muertes por cada 10000 habitantes se relaciona en un 50% con la pobreza, esto podría significar que las muertes están relacionadas con la cantidad de pobreza, ademas de que la cantidad total de fallecidos tiene una relación de 92% con la cantidad total de pobreza, tambien se ve una relación entre la asistencia escular y la capacidad de leer que muestra que las defunciones estan relacionadas ariba del 90% de los fallecidos lo cual se me hace extraño.
¿Los municipios que tienen más gente escolarizada son los que menos tienen defunciones?
https://datos.covid-19.conacyt.mx/#DownZCSV
Bosque aleatorio: https://fervilber.github.io/Aprendizaje-supervisado-en-R/bosques.html
https://datos.gob.mx/busca/dataset?theme=Salud
¿Qué otras variables podemos añadir al análisis? https://datos.gob.mx/
Añada variables a este análisis y explique porque hacen que aumente la cantidad de defunciones por municipio. añada estos datos al excel datossalud
- Consumo de tabaco, alcohol, entre otras sustancias.
- El nivel de sobre peso / obesidad en las personas.
- Nivel de asistencia medica (Si hay hospitales, personal capacitado, etc).
#borrar <- c("areakm2","clave","municipio", "GM")
#datosAEvaluar <- datodefunciones[ , !(names(datodefunciones) %in% borrar)]
#head(datosAEvaluar)
#pairs(datosAEvaluar)Analisis de resultados
## poblacion areakm2 IM RezagoEducativo CarenciasSalud
## poblacion 1.0000000 0.6651925 NA NA NA
## areakm2 0.6651925 1.0000000 NA NA NA
## IM NA NA 1 NA NA
## RezagoEducativo NA NA NA 1 NA
## CarenciasSalud NA NA NA NA 1
## IngresoMenor NA NA NA NA NA
## defunciones 0.9926897 0.6469147 NA NA NA
## Dx10mil 0.3058292 0.2174239 NA NA NA
## CarenciaSeguridad NA NA NA NA NA
## CarenciaAlimentación NA NA NA NA NA
## CarenciaServiciosVivienda NA NA NA NA NA
## Pobreza (%) NA NA NA NA NA
## IngresoMenor defunciones Dx10mil CarenciaSeguridad
## poblacion NA 0.9926897 0.3058292 NA
## areakm2 NA 0.6469147 0.2174239 NA
## IM NA NA NA NA
## RezagoEducativo NA NA NA NA
## CarenciasSalud NA NA NA NA
## IngresoMenor 1 NA NA NA
## defunciones NA 1.0000000 0.3207860 NA
## Dx10mil NA 0.3207860 1.0000000 NA
## CarenciaSeguridad NA NA NA 1
## CarenciaAlimentación NA NA NA NA
## CarenciaServiciosVivienda NA NA NA NA
## Pobreza (%) NA NA NA NA
## CarenciaAlimentación CarenciaServiciosVivienda
## poblacion NA NA
## areakm2 NA NA
## IM NA NA
## RezagoEducativo NA NA
## CarenciasSalud NA NA
## IngresoMenor NA NA
## defunciones NA NA
## Dx10mil NA NA
## CarenciaSeguridad NA NA
## CarenciaAlimentación 1 NA
## CarenciaServiciosVivienda NA 1
## Pobreza (%) NA NA
## Pobreza (%)
## poblacion NA
## areakm2 NA
## IM NA
## RezagoEducativo NA
## CarenciasSalud NA
## IngresoMenor NA
## defunciones NA
## Dx10mil NA
## CarenciaSeguridad NA
## CarenciaAlimentación NA
## CarenciaServiciosVivienda NA
## Pobreza (%) 1
Se puede observar que el area por km2 y la población se relacionan un 64% y un 99% respectivamente con las defunciones por covid, lo que nos dice que entre mas grande sea el area avitada mayor la probabilidad de que la gente se contagíe (debatible) y por lo tanto mueran por el covid-19.
##
## Call:
## lm(formula = poblacion ~ defunciones, data = datodefunciones)
##
## Residuals:
## Min 1Q Median 3Q Max
## -83154 -2814 -1960 1174 52276
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 3554.33 1809.34 1.964 0.0535 .
## defunciones 820.24 11.92 68.814 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 14700 on 70 degrees of freedom
## Multiple R-squared: 0.9854, Adjusted R-squared: 0.9852
## F-statistic: 4735 on 1 and 70 DF, p-value: < 2.2e-16
plot (datodefunciones$defunciones, datodefunciones$poblacion, xlab='Defunciones', ylab='Población')
abline(regresion)Podemos ver una relativa relación lineal conforme a las defunciones por COVID-19 y la cantidad de población en los estados de Sonora