Ánalisis de datos diarios covid 19 en el estado de Sonora
- Importar paquetes
library(pacman)
p_load("base64enc", "htmltools", "mime", "xfun", "prettydoc", "readr", "knitr", "DT", "tidyverse", "scales", "gridExtra", "modeest", "fdth")- Importar datos
** Se utilizarán datos abiertos del portal de coronavirus del gobierno de mexico encontrable en:
https://coronavirus.gob.mx/datos/#DownZCSVhttps://coronavirus.gob.mx/datos/#DownZCSV
#leer datos del archivo local descargado
datos <- read.csv("Casos_Diarios_Estado_Nacional_Confirmados_20200913 (2).csv")Transformación de datos para Sonora y sinaloa
#datos absolutos y acumulados para sonora
sonora <- t(datos[datos$nombre == "SONORA" ,])
sonora <- as.vector(sonora)
sonora <- sonora[4:248]
sonora <- as.numeric(sonora)
sonora <- as.vector(sonora)
asonora <- cumsum(sonora)
#datos absolutos y acumulados para Sinaloa
sinaloa <- t(datos[datos$nombre == "SINALOA" ,])
sinaloa <- as.vector(sinaloa)
sinaloa <- sinaloa[4:248]
sinaloa <- as.numeric(sinaloa)
sinaloa <- as.vector(sinaloa)
asinaloa <- cumsum(sinaloa)
# vector fecha
Fecha <- seq(from = as.Date("2020-01-12"), to = as.Date("2020-09-12"), by = "day" )
#Estructura de datos en un data frame
sonsin <- data.frame(Fecha, sonora, sinaloa) # Datos absolutos
asonsin <- data.frame(Fecha, asonora, asinaloa) #Datos acumulados - NOTA: en cumsum se acumularon los datos que en un principio eran absolutos.
Tarea
Transformar datos para otros estados: Chihuahua y Chiapas.
#datos absolutos y acumulados para Chihuahua
chihuahua <- t(datos[datos$nombre == "CHIHUAHUA" ,])
chihuahua <- as.vector(chihuahua)
chihuahua <- chihuahua[4:248]
chihuahua <- as.numeric(chihuahua)
chihuahua <- as.vector(chihuahua)
achihuahua <- cumsum(chihuahua)
#datos absolutos y acumulados para Chiapas
chiapas <- t(datos[datos$nombre == "CHIAPAS" ,])
chiapas <- as.vector(chiapas)
chiapas <- chiapas[4:248]
chiapas <- as.numeric(chiapas)
chiapas <- as.vector(chiapas)
achiapas <- cumsum(chiapas)
# vector fecha
Fecha <- seq(from = as.Date("2020-01-12"), to = as.Date("2020-09-12"), by = "day" )
#Estructura de datos en un data frame
chichiap <- data.frame(Fecha, chihuahua, chiapas) #Datos diarios absolutos
achichiap <- data.frame(Fecha, achihuahua, achiapas) #datos acumulados Visualizar
Visualización en Tablas
Para esto se usará una tabla interactiva
Visualización en gráficas
Utilizando ggplot2
#Datos absolutos
ggplot(data=chichiap) +
geom_line(aes(Fecha, chihuahua, colour="chihuahua")) +
geom_line(aes(Fecha, chiapas, colour="chiapas")) +
xlab("Mes del año 2020") +
ylab ("Casos diarios Confirmados") +
ggtitle("Casos de COVID-19 en chihuahua y chiapas") +
scale_y_continuous(labels = comma)#Datos acumulados
ggplot(data=achichiap) +
geom_line(aes(Fecha, achihuahua, colour="chihuahua")) +
geom_line(aes(Fecha, achiapas, colour="chiapas")) +
xlab("Mes del año 2020") +
ylab ("Casos diarios acumulados") +
ggtitle("Casos de COVID-19 en chihuahua y chiapas") +
scale_y_continuous(labels = comma)Medidas de tendencia central
Resumen de tendencia central
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 0.00 31.00 36.66 68.00 114.00
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 0.00 10.00 26.04 33.00 146.00
Medidas de dispersión
Amplitud
Gráfico de dispersión
Tarea: Completar este análisis comparativo para chihuahua y chiapas, incluyendo:
- Distribución de frecuencia en tabla
- Histogramas y polígonos para Chihuahua y Chiapas
- conclusión
Tabla de distribución de frecuencias
## Class limits f rf rf(%) cf cf(%)
## [0,12.7933) 95 0.39 38.78 95 38.78
## [12.7933,25.5867) 17 0.07 6.94 112 45.71
## [25.5867,38.38) 21 0.09 8.57 133 54.29
## [38.38,51.1733) 21 0.09 8.57 154 62.86
## [51.1733,63.9667) 23 0.09 9.39 177 72.24
## [63.9667,76.76) 33 0.13 13.47 210 85.71
## [76.76,89.5533) 15 0.06 6.12 225 91.84
## [89.5533,102.347) 12 0.05 4.90 237 96.73
## [102.347,115.14) 8 0.03 3.27 245 100.00
## Class limits f rf rf(%) cf cf(%)
## [0,16.3844) 148 0.60 60.41 148 60.41
## [16.3844,32.7689) 33 0.13 13.47 181 73.88
## [32.7689,49.1533) 17 0.07 6.94 198 80.82
## [49.1533,65.5378) 9 0.04 3.67 207 84.49
## [65.5378,81.9222) 9 0.04 3.67 216 88.16
## [81.9222,98.3067) 12 0.05 4.90 228 93.06
## [98.3067,114.691) 7 0.03 2.86 235 95.92
## [114.691,131.076) 4 0.02 1.63 239 97.55
## [131.076,147.46) 6 0.02 2.45 245 100.00
Histogramas p/ Chihuahua y Chiapas
*P/chihuahua
*P/Chiapas
Conclusión:
Observando los histogramas y polígonos de frecuencia de los estados de Chiapas y Chihuahua podemos observar como, en Chihuahua y chiapas en un principio ambos fueron incrementando el número de contagiados, de estos dos Chiapas tenía un poco más de contagios que Chihuahua , pero después de cierto ambos estados llegaron a un nivel de estabilidad en el que en este caso Chihuhua iba teniendo un poco más de contagiados con respecto a Chiapas, esto se puede deber a muchos factores , ya que se puede suponer que más personas en Chiapas después del brote de covid-19 siguieron las indicaciones del sector salud, aún cuando la población de Chiapas es mayor que la de Chihuahua.