Ánalisis de datos diarios covid 19 en el estado de Sonora

library(pacman)
p_load("base64enc", "htmltools", "mime", "xfun", "prettydoc", "readr", "knitr", "DT", "tidyverse", "scales", "gridExtra", "modeest", "fdth")

** Se utilizarán datos abiertos del portal de coronavirus del gobierno de mexico encontrable en:

https://coronavirus.gob.mx/datos/#DownZCSVhttps://coronavirus.gob.mx/datos/#DownZCSV

#leer datos del archivo local descargado
datos <- read.csv("Casos_Diarios_Estado_Nacional_Confirmados_20200913 (2).csv")

Transformación de datos para Sonora y sinaloa

#datos absolutos y acumulados para sonora
sonora <- t(datos[datos$nombre == "SONORA" ,])
sonora <- as.vector(sonora)
sonora <- sonora[4:248]
sonora <- as.numeric(sonora)
sonora <- as.vector(sonora)
asonora <- cumsum(sonora)

#datos absolutos y acumulados para Sinaloa
sinaloa <- t(datos[datos$nombre == "SINALOA" ,])
sinaloa <- as.vector(sinaloa)
sinaloa <- sinaloa[4:248]
sinaloa <- as.numeric(sinaloa)
sinaloa <- as.vector(sinaloa)
asinaloa <- cumsum(sinaloa)

# vector fecha

Fecha <- seq(from = as.Date("2020-01-12"), to = as.Date("2020-09-12"), by = "day" )
#Estructura de datos en un data frame 

sonsin <- data.frame(Fecha, sonora, sinaloa) # Datos absolutos
asonsin <- data.frame(Fecha, asonora, asinaloa)  #Datos acumulados 
  • NOTA: en cumsum se acumularon los datos que en un principio eran absolutos.

Tarea

Transformar datos para otros estados: Chihuahua y Chiapas.

#datos absolutos y acumulados para Chihuahua
chihuahua <- t(datos[datos$nombre == "CHIHUAHUA" ,])
chihuahua <- as.vector(chihuahua)
chihuahua <- chihuahua[4:248]
chihuahua <- as.numeric(chihuahua)
chihuahua <- as.vector(chihuahua)
achihuahua <- cumsum(chihuahua)

#datos absolutos y acumulados para Chiapas
chiapas <- t(datos[datos$nombre == "CHIAPAS" ,])
chiapas <- as.vector(chiapas)
chiapas <- chiapas[4:248]
chiapas <- as.numeric(chiapas)
chiapas <- as.vector(chiapas)
achiapas <- cumsum(chiapas)

# vector fecha

Fecha <- seq(from = as.Date("2020-01-12"), to = as.Date("2020-09-12"), by = "day" )

#Estructura de datos en un data frame 

chichiap <- data.frame(Fecha, chihuahua, chiapas) #Datos diarios absolutos
achichiap <- data.frame(Fecha, achihuahua, achiapas) #datos acumulados 

Visualizar

Visualización en Tablas

Para esto se usará una tabla interactiva

# Tabla de datos absolutos
datatable(chichiap)
# Tabla de datos acumulados
datatable(achichiap)

Visualización en gráficas

Utilizando ggplot2

#Datos absolutos
ggplot(data=chichiap) + 
  geom_line(aes(Fecha, chihuahua, colour="chihuahua")) +
  geom_line(aes(Fecha, chiapas, colour="chiapas")) +
  xlab("Mes del año 2020") +
  ylab ("Casos diarios Confirmados") +
  ggtitle("Casos de COVID-19 en chihuahua y chiapas") +
  scale_y_continuous(labels = comma)

#Datos acumulados
ggplot(data=achichiap) + 
  geom_line(aes(Fecha, achihuahua, colour="chihuahua")) +
  geom_line(aes(Fecha, achiapas, colour="chiapas")) +
  xlab("Mes del año 2020") +
  ylab ("Casos diarios acumulados") +
  ggtitle("Casos de COVID-19 en chihuahua y chiapas") +
  scale_y_continuous(labels = comma)

Medidas de tendencia central

Media

mean(chihuahua)
## [1] 36.65714
mean(chiapas)
## [1] 26.04082

Mediana

median(chihuahua)
## [1] 31
median(chiapas)
## [1] 10

Moda

mfv(chihuahua)
## [1] 0
mfv(chiapas)
## [1] 0

Resumen de tendencia central

summary(chihuahua)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00    0.00   31.00   36.66   68.00  114.00
summary(chiapas)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00    0.00   10.00   26.04   33.00  146.00

Gráfico de caja y bigote

boxplot(chihuahua)

boxplot(chiapas)

Medidas de dispersión

Amplitud

Varianza

var(chihuahua)
## [1] 1175.57
var(chiapas)
## [1] 1327.375

Desviación estándar

sd(chihuahua)
## [1] 34.28659
sd(chiapas)
## [1] 36.43316

Gráfico de dispersión

plot(chihuahua)

plot(chiapas)

Tarea: Completar este análisis comparativo para chihuahua y chiapas, incluyendo:

  • Distribución de frecuencia en tabla
  • Histogramas y polígonos para Chihuahua y Chiapas
  • conclusión

Tabla de distribución de frecuencias

#P/Chihuahua
distchihuahua <- fdt(chihuahua,breaks="Sturges") 
distchihuahua
##       Class limits  f   rf rf(%)  cf  cf(%)
##        [0,12.7933) 95 0.39 38.78  95  38.78
##  [12.7933,25.5867) 17 0.07  6.94 112  45.71
##    [25.5867,38.38) 21 0.09  8.57 133  54.29
##    [38.38,51.1733) 21 0.09  8.57 154  62.86
##  [51.1733,63.9667) 23 0.09  9.39 177  72.24
##    [63.9667,76.76) 33 0.13 13.47 210  85.71
##    [76.76,89.5533) 15 0.06  6.12 225  91.84
##  [89.5533,102.347) 12 0.05  4.90 237  96.73
##   [102.347,115.14)  8 0.03  3.27 245 100.00
# P/ Chiapas
distchiapas <- fdt(chiapas,breaks="Sturges") 
distchiapas
##       Class limits   f   rf rf(%)  cf  cf(%)
##        [0,16.3844) 148 0.60 60.41 148  60.41
##  [16.3844,32.7689)  33 0.13 13.47 181  73.88
##  [32.7689,49.1533)  17 0.07  6.94 198  80.82
##  [49.1533,65.5378)   9 0.04  3.67 207  84.49
##  [65.5378,81.9222)   9 0.04  3.67 216  88.16
##  [81.9222,98.3067)  12 0.05  4.90 228  93.06
##  [98.3067,114.691)   7 0.03  2.86 235  95.92
##  [114.691,131.076)   4 0.02  1.63 239  97.55
##   [131.076,147.46)   6 0.02  2.45 245 100.00

Histogramas p/ Chihuahua y Chiapas

*P/chihuahua

#1er histograma de frecuencias absolutas
hist(chihuahua)

#Histogramas de frecuencias absolutas
plot(distchihuahua, type="fh")

#poligono de frecuencias absolutas
plot(distchihuahua, type="fp")

#Histogramas de frecuencias relativo
plot(distchihuahua, type="rfh")

#poligono de frecuencias relativo
plot(distchihuahua, type="rfp")

#Histogramas de frecuencias acumulado
plot(distchihuahua, type="cfh")

#poligono de frecuencias acumulado
plot(distchihuahua, type="cfp")

*P/Chiapas

#1er histograma de frecuencias absolutas
hist(chiapas)

#Histogramas de frecuencias absolutas
plot(distchiapas, type="fh")

#poligono de frecuencias absolutas
plot(distchiapas, type="fp")

#Histogramas de frecuencias relativo
plot(distchiapas, type="rfh")

#poligono de frecuencias relativo
plot(distchiapas, type="rfp")

#Histogramas de frecuencias acumulado
plot(distchiapas, type="cfh")

#poligono de frecuencias acumulado
plot(distchiapas, type="cfp")

Panorama general de Coronavirus en México

Casos acumulados de coronavirus en México

Como podemos observar , el crecimiento en cuanto los casos de coronavirus en México ha ido incrementado de manera exponencial, por lo que siempre es recomendable seguir las recomendaciones gubernamentales , para evitar la saturación de los servivicios médicos, e de igual forma llevar un plan de alimentación y de ejercicio adecuado para cada persona.

Uso correcto de cubrebocas

Conclusión:

Observando los histogramas y polígonos de frecuencia de los estados de Chiapas y Chihuahua podemos observar como, en Chihuahua y chiapas en un principio ambos fueron incrementando el número de contagiados, de estos dos Chiapas tenía un poco más de contagios que Chihuahua , pero después de cierto ambos estados llegaron a un nivel de estabilidad en el que en este caso Chihuhua iba teniendo un poco más de contagiados con respecto a Chiapas, esto se puede deber a muchos factores , ya que se puede suponer que más personas en Chiapas después del brote de covid-19 siguieron las indicaciones del sector salud, aún cuando la población de Chiapas es mayor que la de Chihuahua.