Caso de estudio de la 2da unidad de probabilidad y estadística: Enfermedades crónicas y su relación con los fallecimientos por COVID-19
- Importar bibliotecas:
library(pacman)
p_load("base64enc", "htmltools", "mime", "xfun", "prettydoc","readr", "knitr","DT","dplyr", "ggplot2","plotly", "gganimate","gifski","scales")Defunciones por COVID-19 en Sonora y variables que pueden estar relacionadas
- ¿Qué características tendría un municipio que tuviera menos defunciones?
Tendría menor cantidad de personas diágnosticadas con enfermedades crónicas, contar con buenos niveles económicos, contar con mayor información acerca de la problemática para todos.
- ¿Qué variables se correlacionan con el número de defunciones?
Las enfermedades, pobreza, escuela, marginación, entre otras.
Importar datos
## [1] "data.frame"
## clave municipio poblacion areakm2 IM GM RezagoE CarenciasSalud
## 1 1 Aconchi 2756 367,96 -1,091 Bajo 555 271
## 2 2 Agua Prieta 82918 3943,07 -1,83 Muy bajo 11620 18751
## 3 3 Álamos 25694 6426,22 -0,029 Medio 6026 1654
## 4 4 Altar 9578 4455,44 -0,936 Bajo 2073 1640
## 5 5 Arivechi 1163 662,58 -0,848 Bajo 306 154
## 6 6 Arizpe 2677 3073,17 -0,837 Bajo 595 506
## IngresoMenor defunciones Dx10mil CarenciaAccesoAlim
## 1 1,580353698 3 10,88534107 122
## 2 1,421973774 78 9,406883909 19293
## 3 2,348136578 2 0,7783918425 6289
## 4 1,6345309 2 2,088118605 1633
## 5 2,424131212 0 0 254
## 6 1,482035424 1 3,735524841 151
## CarenciaCalidadVivienda X..vulnerables.ingreso
## 1 310 2.9
## 2 7,145 9.5
## 3 4,554 2.1
## 4 1,11 5.0
## 5 66 1.8
## 6 162 2.4
- ¿Los municipios que tienen más gente escolarizada son los que menos tienen defunciones?
Según los datos si, debido a que los municipios con mayor rezago escolar son los que cuentan con más defunciones
- ¿Qué otras variables podemos añadir al análisis?
Carencia de acceso a la alimentación, a la calidad de vivencia, entre otras carencias.
Correlación de variables relacionadas a las defunciones por municipio en Sonora
Transformar datos
IM <- as.numeric(datos4$IM)
RezagoEscolar <- as.numeric(datos4$RezagoE)
CarenciasSalud <- as.numeric(datos4$CarenciasSalud)
IngresoMenor <- as.numeric(datos4$IngresoMenor)
Defunciones <- as.numeric(datos4$defunciones)
CarenciaAccesoAlim <- as.numeric(datos4$CarenciaAccesoAlim)
CarenciaCalidadVivienda <- as.numeric(datos4$CarenciaCalidadVivienda)
variables <- data.frame(IM, RezagoEscolar, CarenciasSalud, IngresoMenor, Defunciones, CarenciaAccesoAlim, CarenciaCalidadVivienda)Coeficiente de correlación
## IM RezagoEscolar CarenciasSalud IngresoMenor
## IM 1.00000000 0.11001844 0.10653456 -0.57951632
## RezagoEscolar 0.11001844 1.00000000 -0.09418151 0.11576307
## CarenciasSalud 0.10653456 -0.09418151 1.00000000 0.03122852
## IngresoMenor -0.57951632 0.11576307 0.03122852 1.00000000
## Defunciones 0.32435383 0.14960890 -0.04658712 -0.14401136
## CarenciaAccesoAlim 0.32318181 0.15791151 -0.08127906 -0.12121394
## CarenciaCalidadVivienda 0.04278325 0.02597114 -0.12808306 -0.04551509
## Defunciones CarenciaAccesoAlim CarenciaCalidadVivienda
## IM 0.32435383 0.32318181 0.04278325
## RezagoEscolar 0.14960890 0.15791151 0.02597114
## CarenciasSalud -0.04658712 -0.08127906 -0.12808306
## IngresoMenor -0.14401136 -0.12121394 -0.04551509
## Defunciones 1.00000000 0.98669528 0.02001789
## CarenciaAccesoAlim 0.98669528 1.00000000 0.02746756
## CarenciaCalidadVivienda 0.02001789 0.02746756 1.00000000
Con lo anterior podemos ver como la variable con una mayor correlación es la de carencia de acceso a la alimentación con un valor de 0.98669528