U2A3

JoaquinCastro

11/11/2020

setwd("~/PyEitson")
library(pacman)
p_load('fdth','readr','readxl','DT','ggplot2','dplyr','prettydoc')
datodefunciones <- read_excel("datodefunciones.xlsx")
## Warning in read_fun(path = enc2native(normalizePath(path)), sheet_i = sheet, :
## Expecting numeric in R71 / R71C18: got a date
## Warning in read_fun(path = enc2native(normalizePath(path)), sheet_i = sheet, :
## Expecting numeric in S71 / R71C19: got a date
datos2 <- read.csv("Diagnosticos18.csv",encoding = "UTF-8")
SonoraS <- t(datos2 [datos2$Estado == "Sonora", ])
SonoraS <- (datos2 [datos2$Estado == "Sonora", ])

Caso de estudio

¿Qué variables hacen que aumente o disminuyan las defunciones por covid-19 en Sonora?

Las defunciones por covid-19 en sonora pueden ser causadas por enfermedades crónicas, la calidad del aire, el consumo de drogas, o incluso la pobreza.

Caso de estudio: Relación entre enfermedades crónicas y covid-19

¿Son lugares que tienen más personas reportadas con enfermedades crónicas los lugares que también tienen más personas fallecidas por covid-19?

No, Hermosillo tiene una cantidad mayor de personas con enfermedades crónicas y no tiene tantas defunciones debido a Covid-19

Para responder esto tenemos el dato más nuevo de número de personas con diagnóstico de enfermedades crónicas, para esto usamos datos provenientes de: www.cenaprece.salud.gob.mx/descargas/Excel/Diagnosticos18.csv https://datos.gob.mx/busca/dataset/expediente-clinico-electronico-unemes-enfermedades-cronicas--2018

Podemos ver la gráfica y código aquí: https://rpubs.com/jigbadouin/MSDatos

¿Por qué razones si la población de Ciudad Obregón es más grande que la Santa Ana y de Caborca, existen más personas con diagnóstico de enfermedades crónicas ?

Ordene en una tabla: Municipio, Población2015, Diabetes, dislipidemias, hipertensión, obesidad, Defunciones por cada 10mil habitantes, defunciones

datatable(SonoraS)
## Warning in instance$preRenderHook(instance): It seems your data is too big
## for client-side DataTables. You may consider server-side processing: https://
## rstudio.github.io/DT/server.html

¿Son los lugares que proporcionalmente tienen más defunciones, los lugares que también tienen más diagnósticos?

No

¿por qué si en cajeme hay menos enfermedades crónicas, proporcionalmente a su población hay más defunciones?

por la desigualdad económica, en Cajeme existen una desigualdad económica muy grande, muchas personas viven al día, significa que si un día no trabajan no comen,y como salen para poder trabajar se exponen.

¿Que otra variable o variables nos pueden ayudar a entender este fenómeno?

la contaminación del aire, el consumo de drogas sean factores importantes

¿Cuánta gente habita en cada ciudad? Fuente: http://cuentame.inegi.org.mx/monografias/informacion/son/territorio/div_municipal.aspx?tema=me&e=26

017 Caborca 85631 058 Santa Ana 16248 018 Cajeme 433050 030 Hermosillo 884 273

Si hacemos una relación de número de personas fallecidas por cada 10000 habitantes, para poder comparar en proporción

Con esta forma de comparar, ¿Cuál ciudad tiene proporcionalmente más fallecidos? ¿Las ciudades con más personas diagnosticadas son las que proporcionalmente presentan más fallecidos?

ggplot(SonoraS, aes(fill=Jurisdiccion, y=Diagnostico)) + 
    geom_bar(position="dodge", stat="count") +
    xlab ("Número de casos") +
    ylab ("Diagnóstico") +
  ggtitle(" Enfermedades crónicas en Sonora, 2018 (CENAPRECE)") 

datatable(datodefunciones)

Se puede ver que algunas variables no se relacionan con nada, por ende estas no se pueden tomar en cuenta, pero en algunas otras si, por ejemplo las defunciones se relacionan un 64% con el área en kilometros ^2 y en un 99% con la cantidad de personas en esa área.

¿Los municipios que tienen más gente escolarizada son los que menos tienen defunciones?

https://datos.covid-19.conacyt.mx/#DownZCSV

datatable(select(datodefunciones,municipio,poblacion,RezagoE,CarenciasSalud,defunciones,Dx10mil))
modelo.lineal <- lm(poblacion ~ defunciones, data= datodefunciones )
summary(modelo.lineal )
## 
## Call:
## lm(formula = poblacion ~ defunciones, data = datodefunciones)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -83154  -2814  -1960   1174  52276 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  3554.33    1809.34   1.964   0.0535 .  
## defunciones   820.24      11.92  68.814   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 14700 on 70 degrees of freedom
## Multiple R-squared:  0.9854, Adjusted R-squared:  0.9852 
## F-statistic:  4735 on 1 and 70 DF,  p-value: < 2.2e-16
confint(modelo.lineal)
##                 2.5 %    97.5 %
## (Intercept) -54.29607 7162.9488
## defunciones 796.46670  844.0129
cor.test(x = datodefunciones$poblacion, y = datodefunciones$defunciones, method="pearson", digits=3)
## 
##  Pearson's product-moment correlation
## 
## data:  datodefunciones$poblacion and datodefunciones$defunciones
## t = 68.814, df = 70, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.9883071 0.9954335
## sample estimates:
##       cor 
## 0.9926897

Se puede ver que tienen una relación de 99% por ende están estrechamente relacionados entre si.

Se puede ver que no necesariamente los municipios con mayor rezago educativo son los que tiene mas muertes, por ejemplo, Cajeme tiene un rezago educativo muy bajo en relación a la cantidad de población, y es el que tiene mas muertes por cada 10 mil habitantes.

Conclusión

Se podría decir que la cantidad de personas en un área afecta directamente a la cantidad de defunciones, se puede suponer que entre mas personas haya en una zona mas muertes por covid-19 habrá, ademas de que la educación no es un factor importante, ya que en lugares con buena educación las muertes son mayores, también se puede decir que la pobreza es una factor, ya que la desigualdad económica hace que las personas salga a diario para trabajar, esto los expone a enfermarse, adema la pobreza causa que no se puedan atender en hospitales y esto causa que se agrave el problema.

Bosque aleatorio: https://fervilber.github.io/Aprendizaje-supervisado-en-R/bosques.html

https://datos.gob.mx/busca/dataset?theme=Salud

¿Qué otras variables podemos añadir al análisis? https://datos.gob.mx/