Análisis de datos diarios de COVID-19 de salud para tlaxcala y nayarit
Probabilidad
IMPORTAR
- Importar paquetes
library(pacman)
p_load("base64enc", "htmltools", "mime", "xfun", "prettydoc", "readr", "knitr", "DT", "tidyverse", "scales", "gridExtra", "modeest", "fdth")- Importar datos Se utilizarán datos abiertos del portal de coronavirus del gobierno de México, que se pueden encontrar en: https://coronavirus.gob.mx/datos/#DownZCSV
TRANSFORMAR
#Datos confirmados para tlaxcala (absolutos y acumulados)
tlaxcala<- t(datos[datos$nombre == "TLAXCALA" ,])
tlaxcala <- as.vector(tlaxcala)
tlaxcala <- tlaxcala[4:248]
tlaxcala <- as.numeric(tlaxcala)
tlaxcala <- as.vector(tlaxcala)
atlaxcala <- cumsum(tlaxcala)
#Datos confirmados para nayarit (absolutos y acumulados)
nayarit <- t(datos[datos$nombre == "NAYARIT" ,])
nayarit<- as.vector(nayarit)
nayarit<- nayarit[4:248]
nayarit<- as.numeric(nayarit)
nayarit<- as.vector(nayarit)
anayarit<- cumsum(nayarit)
#Vector de Fecha
Fecha <- seq(from = as.Date("2020-01-12"), to = as.Date("2020-09-12"), by = "day" )
#Estructura de datos en un data frame
tlanay <- data.frame(Fecha, tlaxcala, nayarit) #datos diarios absolutos
atlanay <- data.frame(Fecha, atlaxcala, anayarit) #datos acumulados Visualizar
Visualización en Tablas
Para esto se usará una tabla interactiva
Visualización en gráficas
Utilizando ggplot2
#Datos absolutos
ggplot(data=tlanay) +
geom_line(aes(Fecha, tlaxcala, colour="tlaxcala")) +
geom_line(aes(Fecha, nayarit, colour="nayarit")) +
xlab("Mes del año 2020") +
ylab ("Casos diarios Confirmados") +
ggtitle("Casos de COVID-19 en Tlaxcala y Nayarit") +
scale_y_continuous(labels = comma)#Datos acumulados
ggplot(data=atlanay) +
geom_line(aes(Fecha, atlaxcala, colour="tlaxcala")) +
geom_line(aes(Fecha, anayarit, colour="nayarit")) +
xlab("Mes del año 2020") +
ylab ("Casos diarios acumulados") +
ggtitle("Casos de COVID-19 en Tlaxcala y Nayarit") +
scale_y_continuous(labels = comma)Medidas de tendencia central
Resumen de tendencia central
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.0 0.0 16.0 28.2 51.0 103.0
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 0.00 15.00 22.39 42.00 85.00
Medidas de dispersión
Amplitud
Gráfico de dispersión
Tarea: Completar este análisis comparativo para tlaxcala y nayarit, incluyendo:
- Distribución de frecuencia en tabla
- Histogramas y polígonos para tlaxcala y nayarit
## Class limits f rf rf(%) cf cf(%)
## [0,11.5589) 107 0.44 43.67 107 43.67
## [11.5589,23.1178) 26 0.11 10.61 133 54.29
## [23.1178,34.6767) 21 0.09 8.57 154 62.86
## [34.6767,46.2356) 21 0.09 8.57 175 71.43
## [46.2356,57.7944) 22 0.09 8.98 197 80.41
## [57.7944,69.3533) 14 0.06 5.71 211 86.12
## [69.3533,80.9122) 14 0.06 5.71 225 91.84
## [80.9122,92.4711) 15 0.06 6.12 240 97.96
## [92.4711,104.03) 5 0.02 2.04 245 100.00
## Class limits f rf rf(%) cf cf(%)
## [0,9.5389) 115 0.47 46.94 115 46.94
## [9.5389,19.078) 21 0.09 8.57 136 55.51
## [19.078,28.617) 16 0.07 6.53 152 62.04
## [28.617,38.156) 25 0.10 10.20 177 72.24
## [38.156,47.694) 18 0.07 7.35 195 79.59
## [47.694,57.233) 23 0.09 9.39 218 88.98
## [57.233,66.772) 12 0.05 4.90 230 93.88
## [66.772,76.311) 8 0.03 3.27 238 97.14
## [76.311,85.85) 7 0.03 2.86 245 100.00
Histogramas y poligonos para tlaxcala
Histogramas y poligonos para nayarit
Conclusión
Con el uso de distintos graficos y medidas de tendencia, pudimos hacer una comparacion entre los estados de tlaxcala y nayarit. Dos estados que si bien detacan por ser poco conocidos dentro de la republica Mexicana, son estados perfectos para hacer un analisis de como funciona el coronavirus en estados con poca afluencia de poblacion en las calles. R nos permitio tranformar datos obtenidos de bases de informacion proporcionadas por el gobierno, y poder tranformarlas en tablas y graficas entendibles para cualquier persona.