Análisis comparativo de datos de salud y COVID-19 en Sonora
- Folder de trabajo
IMPORTAR
Importar paquetes
library(pacman)
p_load("base64enc", "htmltools", "mime", "xfun","prettydoc","readr","knitr","DT","tidyverse","scales", "gridExtra", "modeest", "fdth")Se importan desde un archivo local .csv los datos diarios de casos confirmados de COVID-19 para todo México desde la URL oficia: https://coronavirus.gob.mx/datos/#DownZCSV
TRANSFORMAR
Se realiza primeramente una extracción de los datos desde el data frame para Coahuila y Chihuahua para juntarlos en un data frame junto con un vector de fecha
#DATOS DIARIOS CONFIRMADOS PARA SONORA
durango <- t(datos[datos$nombre=="DURANGO",])
durango <- as.vector(durango)
durango <- durango[4:248]
durango <- as.numeric(durango) #datos absolutos
adurango <- cumsum(durango) #datos acumulados
#DATOS DIARIOS CONFIRMADOS PARA SINALOA
chihuahua <- t(datos[datos$nombre=="CHIHUAHUA",])
chihuahua <- as.vector(chihuahua)
chihuahua <- chihuahua[4:248]
chihuahua <- as.numeric(chihuahua) #datos absolutos
achihuahua <- cumsum(chihuahua) #datos acumulados
#Generar un vector de fecha
Fecha <- seq(from= as.Date("2020-01-12"), to= as.Date("2020-09-12"), by = "day")
#Estructurar dos datos en un marco de datos (data frame)
durchih <- data.frame(Fecha, durango, chihuahua)
adurchih <- data.frame(Fecha, adurango, achihuahua)VISUALIZAR
Visualizar datos en forma de tabla interactiva
Visualizar los datos con gráficas usando ggplot2
- Gráfica de datos absolutos (datos diarios de casos confirmados de COVID-19 en Durango y Chihuahua (desde el 12 de Enero al 12 de Septiembre de 2020))
ggplot(data=durchih) +
geom_line(aes(Fecha, durango, colour="Durango")) +
geom_line(aes(Fecha, chihuahua, colour="chihuahua")) +
xlab("Fecha") +
ylab("Casos diarios absolutos") +
labs(colour="Estados") +
ggtitle("Casos diarios confirmados de COVID-19 en Durango y Chihuahua") +
scale_y_continuous(labels=comma)ggplot(data=durchih) +
geom_line(aes(Fecha, adurango, colour="Durango")) +
geom_line(aes(Fecha, achihuahua, colour="chihuahua")) +
xlab("Fecha") +
ylab("Casos diarios acumulados") +
labs(colour="Estados") +
ggtitle("Casos diarios confirmados de COVID-19 en Durango y Chihuahua") +
scale_y_continuous(labels=comma)- Gráfica combinada de datos acumulados y datos absolutos.
durango1 <- data.frame(Fecha,durango,adurango)
g2 <- ggplot(data=durango1) +
geom_col(aes(Fecha,adurango)) +
xlab("Fecha") +
ylab("Casos acumulados") +
ggtitle("A) Confirmados de COVID-19 de Durango (acumulados)") +
scale_y_continuous(labels=comma)
g3 <- ggplot(data=durango1) +
geom_col(aes(Fecha,durango)) +
xlab("Fecha") +
ylab("Casos diarios") +
ggtitle("B) Confirmados de COVID-19 de Durango (absolutos)") +
scale_y_continuous(labels=comma)
grid.arrange(g2,g3)chih1 <- data.frame(Fecha,chihuahua,achihuahua)
g2 <- ggplot(data=chih1) +
geom_col(aes(Fecha,achihuahua)) +
xlab("Fecha") +
ylab("Casos acumulados") +
ggtitle("A) Confirmados de COVID-19 de Chihuahua (acumulados)") +
scale_y_continuous(labels=comma)
g3 <- ggplot(data=chih1) +
geom_col(aes(Fecha,chihuahua)) +
xlab("Fecha") +
ylab("Casos diarios") +
ggtitle("B) Confirmados de COVID-19 de Chihuahua (absolutos)") +
scale_y_continuous(labels=comma)
grid.arrange(g2,g3)Medidas de posición central
Durango
Cálculo individual de las medidas principales
## [1] 31.52245
## [1] 8
## [1] 0
Resumen estadístico
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 0.00 8.00 31.52 66.00 144.00
Medidas de dispersión
varianza
## [1] 1636.759
Desviación estándar
## [1] 40.45687
Tabla de distribuciones
## Class limits f rf rf(%) cf cf(%)
## [0,16.16) 137 0.56 55.92 137 55.92
## [16.16,32.32) 27 0.11 11.02 164 66.94
## [32.32,48.48) 9 0.04 3.67 173 70.61
## [48.48,64.64) 10 0.04 4.08 183 74.69
## [64.64,80.8) 17 0.07 6.94 200 81.63
## [80.8,96.96) 16 0.07 6.53 216 88.16
## [96.96,113.12) 19 0.08 7.76 235 95.92
## [113.12,129.28) 7 0.03 2.86 242 98.78
## [129.28,145.44) 3 0.01 1.22 245 100.00
Histogramas y polígonos de frecuencia
Redacción personal
Se extrajeron del archivo local “Casos_Diarios_Estado_Nacional_Confirmados_20200913.csv” los datos diarios de confirmados de COVID-19 para los estados de Durango y Chihuahua, con la finalidad de comparar su numero de casos en tablas y gráficas.Se puede notar que en Chihuahua se empezaron a elevar exponencialmente desde abril, mientras que en Durango a finales de mayo. También se puede ver que en Durango los casos son más inestables que en Chihuahua (Se pueden ver muchos un día y muy pocos al siguiente). Sin embargo, en Chihuahua se tienen casi 1000 casos mas que en Durango, al día 13/09/2020.