An谩lisis de datos diarios de COVID-19 y salud para Sonora
- Folder de trabajo setwd("~/estadistica aplicada")
IMPORTAR
- Importar paquetes
library(pacman)
p_load("base64enc", "htmltools", "mime", "xfun", "prettydoc", "readr", "knitr", "DT", "tidyverse", "scales", "gridExtra", "modeest", "fdth")
- Importar datos **Se utilizar谩n datos abiertos del portal de coronavirus del gobierno de M茅xico, que se pueden encontrar en: https://coronavirus.gob.mx/datos/#DownZCSV**
#Leer datos del archivo local descargado
datos <- read.csv("Casos_Diarios_Estado_Nacional_Confirmados_20200915.csv")
TRANSFORMAR
#Datos confirmados para Sonora (absolutos y acumulados)
sonora <- t(datos[datos$nombre == "SONORA" ,])
sonora <- as.vector(sonora)
sonora <- sonora[4:248]
sonora <- as.numeric(sonora)
sonora <- as.vector(sonora)
asonora <- cumsum(sonora)
#Datos confirmados para Sinaloa (absolutos y acumulados)
sinaloa <- t(datos[datos$nombre == "SINALOA" ,])
sinaloa <- as.vector(sinaloa)
sinaloa <- sinaloa[4:248]
sinaloa <- as.numeric(sinaloa)
sinaloa <- as.vector(sinaloa)
asinaloa <- cumsum(sinaloa)
#Vector de Fecha
Fecha <- seq(from = as.Date("2020-01-12"), to = as.Date("2020-09-12"), by = "day" )
#Estructura de datos en un data frame
sonsin <- data.frame(Fecha, sonora, sinaloa) #datos diarios absolutos
asonsin <- data.frame(Fecha, asonora, asinaloa) #datos acumulados
Visualizar
Visualizaci贸n en Tablas
Para esto se usar谩 una tabla interactiva
#Tabla de datos absolutos
datatable(sonsin)
#Tabla de datos acumulados
datatable(asonsin)
Visualizaci贸n en gr谩ficas
Utilizando ggplot2
#Datos absolutos
ggplot(data=sonsin) +
geom_line(aes(Fecha, sonora, colour="sonora")) +
geom_line(aes(Fecha, sinaloa, colour="sinaloa")) +
xlab("Mes del a帽o 2020") +
ylab ("Casos diarios Confirmados") +
ggtitle("Casos de COVID-19 en Sonora y Sinaloa") +
scale_y_continuous(labels = comma)
#Datos acumulados
ggplot(data=asonsin) +
geom_line(aes(Fecha, asonora, colour="sonora")) +
geom_line(aes(Fecha, asinaloa, colour="sinaloa")) +
xlab("Mes del a帽o 2020") +
ylab ("Casos diarios acumulados") +
ggtitle("Casos de COVID-19 en Sonora y Sinaloa") +
scale_y_continuous(labels = comma)
Medidas de tendencia central
Media
mean(sonora)
## [1] 95.30204
mean(sinaloa)
## [1] 71.31837
Mediana
median(sonora)
## [1] 46
median(sinaloa)
## [1] 57
Moda
mfv(sonora)
## [1] 0
mfv(sinaloa)
## [1] 0
Resumen de tendencia central
summary(sonora)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.0 0.0 46.0 95.3 154.0 482.0
summary(sinaloa)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 0.00 57.00 71.32 122.00 291.00
Gr谩fico de caja y bigote
boxplot(sonora)
boxplot(sinaloa)
Medidas de dispersi贸n
Amplitud
Varianza
var(sonora)
## [1] 13313.82
var(sinaloa)
## [1] 4716.357
Desviaci贸n est谩ndar
sd(sonora)
## [1] 115.3855
sd(sinaloa)
## [1] 68.67574
Gr谩fico de dispersi贸n
plot(sonora)
Tarea: Completar este an谩lisis comparativo para sonora y sinaloa, incluyendo:
- Distribuci贸n de frecuencia en tabla
- Histogramas y pol铆gonos para sonora y sinaloa
- conclusi贸n