Análisis de datos diarios de COVID-19 y salud para Sonora

library(pacman)
p_load("base64enc", "htmltools", "mime", "xfun", "prettydoc", "readr", "knitr", "DT", "tidyverse", "scales", "gridExtra", "modeest", "fdth")

*Importar los datos Se utilizaran datos abiertos del portal de coronavirus del gobierno de México, que se pueden encontar en: https://coronavirus.gob.mx/datos/#DownZCSV

# Leemos los datos del archivo descargado localizado en la carpeta local
datos <- read.csv("Casos_Diarios_Estado_Nacional_Confirmados_20200913.csv")

Transformar

# Datos confirmados para Nayarit (absolutos y acumulados)
nayarit <- t(datos[datos$nombre == "NAYARIT" ,])
nayarit <- as.vector(nayarit)
nayarit <- nayarit[4:248]
nayarit <- as.numeric(nayarit)
nayarit <- as.vector(nayarit)
anayarit <-cumsum(nayarit)

# Datos confirmados para Jalisco (absolutos y acumulados)
jalisco <- t(datos[datos$nombre == "JALISCO" ,])
jalisco <- as.vector(jalisco)
jalisco <- jalisco[4:248]
jalisco <- as.numeric(jalisco)
jalisco <- as.vector(jalisco)
ajalisco <-cumsum(jalisco)

# Vector de Fecha (Tomando los datos desde el 12 de enero hasta el 12 de septiembre todo esto durante el año en curso el cuál es 2020)

Fecha <- seq(from = as.Date("2020-01-12"), to = as.Date("2020-09-12"), by = "day")

#Estructura de datos en un data frame 

jalnay <- data.frame(Fecha, jalisco, nayarit) #datos diarios absolutos
ajalnay <- data.frame(Fecha, ajalisco, anayarit) #datos acumulados

Visualizar

Visualización en Tablas

Para esto se usará una tabla interactiva

#Tabla de datos absolutos
datatable(jalnay)
#Tabla de datos acumulados
datatable(ajalnay)

Visualización en gráficas

Utilizando ggplot2

#Datos absolutos
ggplot(data=jalnay) + 
  geom_line(aes(Fecha, jalisco, colour="jalisco")) +
  geom_line(aes(Fecha, nayarit, colour="nayarit")) +
  xlab("Mes del año 2020") +
  ylab ("Casos diarios Confirmados") +
  ggtitle("Casos de COVID-19 en Jalisco y Nayarit") +
  scale_y_continuous(labels = comma)

#Datos acumulados
ggplot(data=ajalnay) + 
  geom_line(aes(Fecha, ajalisco, colour="jalisco")) +
  geom_line(aes(Fecha, anayarit, colour="nayarit")) +
  xlab("Mes del año 2020") +
  ylab ("Casos diarios acumulados") +
  ggtitle("Casos de COVID-19 en Jalisco y Nayarit") +
  scale_y_continuous(labels = comma)

Medidas de tendencia central

Media

mean(jalisco)
## [1] 94.77959
mean(nayarit)
## [1] 22.39184

Mediana

median(jalisco)
## [1] 32
median(nayarit)
## [1] 15

Moda

mfv(jalisco)
## [1] 0
mfv(nayarit)
## [1] 0

Resumen de tendencia central

summary(jalisco)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00    2.00   32.00   94.78  208.00  333.00
summary(nayarit)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00    0.00   15.00   22.39   42.00   85.00

Gráfico de caja y bigote

boxplot(jalisco)

boxplot(nayarit)

Medidas de dispersión

Amplitud

Varianza

var(jalisco)
## [1] 10874.49
var(nayarit)
## [1] 594.3212

Desviación estándar

sd(jalisco)
## [1] 104.2808
sd(nayarit)
## [1] 24.3787

Gráfico de dispersión

plot(jalisco)

plot(nayarit)

Tabla de distribución de frecuencias absolutas para los estados de Jalisco y Nayarit

Jalisco

dist <- fdt(jalisco,breaks = "Sturges")
dist
##     Class limits   f   rf rf(%)  cf  cf(%)
##        [0,37.37) 123 0.50 50.20 123  50.20
##    [37.37,74.74)  11 0.04  4.49 134  54.69
##   [74.74,112.11)  20 0.08  8.16 154  62.86
##  [112.11,149.48)  15 0.06  6.12 169  68.98
##  [149.48,186.85)   6 0.02  2.45 175  71.43
##  [186.85,224.22)  22 0.09  8.98 197  80.41
##  [224.22,261.59)  31 0.13 12.65 228  93.06
##  [261.59,298.96)  10 0.04  4.08 238  97.14
##  [298.96,336.33)   7 0.03  2.86 245 100.00

Nayarit

dist2 <- fdt(nayarit,breaks = "Sturges")
dist2
##     Class limits   f   rf rf(%)  cf  cf(%)
##       [0,9.5389) 115 0.47 46.94 115  46.94
##  [9.5389,19.078)  21 0.09  8.57 136  55.51
##  [19.078,28.617)  16 0.07  6.53 152  62.04
##  [28.617,38.156)  25 0.10 10.20 177  72.24
##  [38.156,47.694)  18 0.07  7.35 195  79.59
##  [47.694,57.233)  23 0.09  9.39 218  88.98
##  [57.233,66.772)  12 0.05  4.90 230  93.88
##  [66.772,76.311)   8 0.03  3.27 238  97.14
##   [76.311,85.85)   7 0.03  2.86 245 100.00

Histogramas y Poligonos de frecuencia para los estados de Jalisco y Nayarit

Jalisco

#Primer histograma de frecuencias absolutas
hist(jalisco,col = "blue")

#histograma de frecuencias absolutas
plot(dist, type="fh",col = "blue")

#poligono de frecuencias absolutas
plot(dist, type="fp",col = "red")

#histograma de frecuencias relativas
plot(dist, type="rfh",col = "blue")

#poligono de frecuencias relativas
plot(dist, type="rfp",col = "red")

#histograma de frecuencias acumuladas
plot(dist, type="cfh",col = "blue")

#poligono de frecuencias acumuladas
plot(dist, type="cfp",col = "red")

Nayarit

#Primer histograma de frecuencias absolutas
hist(nayarit,col = "blue")

#histograma de frecuencias absolutas
plot(dist2, type="fh",col = "blue")

#poligono de frecuencias absolutas
plot(dist2, type="fp",col = "red")

#histograma de frecuencias relativas
plot(dist2, type="rfh",col = "blue")

#poligono de frecuencias relativas
plot(dist2, type="rfp",col = "red")

#histograma de frecuencias acumuladas
plot(dist2, type="cfh",col = "blue")

#poligono de frecuencias acumuladas
plot(dist2, type="cfp",col = "red")

Conclusión

Al obtener la media de ambos estados la del estado de Jalisco es tres veces mayor a la del estado de Nayarit aunque se podría considerar normal ya que Jalisco tiene casi el doble de territorio que Nayarit y tiene 7 millones de habitantes mas que su estado colindante más sin embargo al tener Jalisco una de las 3 ciudades mas grandes de México mucho importa las medidas que se toman y como comportan sus habitantes ante estas y gracias a las medidas de tendencia central podemos observar ese comportamiento representandolo con tablas de frecuencia obteniendo la moda, media y mediana y representandolo gráficamente por medio de los histogramas y poligonos de frecuencia.