U1A6

Isabel Valenzuela

14/9/2020

Análisis comparativo de datos de salud y COVID-19 en Sonora

  • Folder de trabajo
setwd("~/Pobabilidad y estadistica 11-12 agodic")

IMPORTAR

Importar paquetes

library(pacman)
p_load("base64enc", "htmltools", "mime", "xfun","prettydoc","readr","knitr","DT","tidyverse","scales", "gridExtra", "modeest", "fdth")

Se importan desde un archivo local .csv los datos diarios de casos confirmados de COVID-19 para todo México desde la URL oficia: https://coronavirus.gob.mx/datos/#DownZCSV

datos <- read.csv("Casos_Diarios_Estado_Nacional_Confirmados_20200913.csv")

TRANSFORMAR

Se realiza primeramente una extracción de los datos desde el data frame para Coahuila y Chihuahua para juntarlos en un data frame junto con un vector de fecha

#DATOS DIARIOS CONFIRMADOS PARA SONORA
durango <- t(datos[datos$nombre=="DURANGO",])
durango <- as.vector(durango)
durango <- durango[4:248]
durango <- as.numeric(durango) #datos absolutos
adurango <- cumsum(durango) #datos acumulados

#DATOS DIARIOS CONFIRMADOS PARA SINALOA
chihuahua <- t(datos[datos$nombre=="CHIHUAHUA",])
chihuahua <- as.vector(chihuahua)
chihuahua <- chihuahua[4:248]
chihuahua <- as.numeric(chihuahua) #datos absolutos
achihuahua <- cumsum(chihuahua) #datos acumulados


#Generar un vector de fecha
Fecha <- seq(from= as.Date("2020-01-12"), to= as.Date("2020-09-12"), by = "day")


#Estructurar dos datos en un marco de datos (data frame)
durchih <- data.frame(Fecha, durango, chihuahua)
adurchih <- data.frame(Fecha, adurango, achihuahua)

VISUALIZAR

Visualizar datos en forma de tabla interactiva

#Tabla de datos absolutos
datatable(durchih)
#Tabla de datos acumulados
datatable(adurchih)

Visualizar los datos con gráficas usando ggplot2

  • Gráfica de datos absolutos (datos diarios de casos confirmados de COVID-19 en Durango y Chihuahua (desde el 12 de Enero al 12 de Septiembre de 2020))
ggplot(data=durchih) +
  geom_line(aes(Fecha, durango, colour="Durango")) +
  geom_line(aes(Fecha, chihuahua, colour="chihuahua")) +
  xlab("Fecha") +
  ylab("Casos diarios absolutos") +
  labs(colour="Estados") +
  ggtitle("Casos diarios confirmados de COVID-19 en Durango y Chihuahua") +
  scale_y_continuous(labels=comma)

ggplot(data=durchih) +
  geom_line(aes(Fecha, adurango, colour="Durango")) +
  geom_line(aes(Fecha, achihuahua, colour="chihuahua")) +
  xlab("Fecha") +
  ylab("Casos diarios acumulados") +
  labs(colour="Estados") +
  ggtitle("Casos diarios confirmados de COVID-19 en Durango y Chihuahua") +
  scale_y_continuous(labels=comma)

  • Gráfica combinada de datos acumulados y datos absolutos.
durango1 <- data.frame(Fecha,durango,adurango)
g2 <- ggplot(data=durango1) +
  geom_col(aes(Fecha,adurango)) +
  xlab("Fecha") +
  ylab("Casos acumulados") +
  ggtitle("A) Confirmados de COVID-19 de Durango (acumulados)") +
  scale_y_continuous(labels=comma)


g3 <- ggplot(data=durango1) +
  geom_col(aes(Fecha,durango)) +
  xlab("Fecha") +
  ylab("Casos diarios") +
  ggtitle("B) Confirmados de COVID-19 de Durango (absolutos)") +
  scale_y_continuous(labels=comma)
grid.arrange(g2,g3)

chih1 <- data.frame(Fecha,chihuahua,achihuahua)
g2 <- ggplot(data=chih1) +
  geom_col(aes(Fecha,achihuahua)) +
  xlab("Fecha") +
  ylab("Casos acumulados") +
  ggtitle("A) Confirmados de COVID-19 de Chihuahua (acumulados)") +
  scale_y_continuous(labels=comma)


g3 <- ggplot(data=chih1) +
  geom_col(aes(Fecha,chihuahua)) +
  xlab("Fecha") +
  ylab("Casos diarios") +
  ggtitle("B) Confirmados de COVID-19 de Chihuahua (absolutos)") +
  scale_y_continuous(labels=comma)
grid.arrange(g2,g3)

Medidas de posición central

Durango

Cálculo individual de las medidas principales

mean(durango) #Media aritmética
## [1] 31.52245
median(durango) #Mediana
## [1] 8
mfv(durango)
## [1] 0

Resumen estadístico

summary(durango)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00    0.00    8.00   31.52   66.00  144.00

Gráfico de caja y bigote

boxplot(durango)

Medidas de dispersión

varianza

var(durango)
## [1] 1636.759

Desviación estándar

sd(durango)
## [1] 40.45687
plot(durango)

Tabla de distribuciones

dist <- fdt(durango, breaks = "Sturges")
dist
##     Class limits   f   rf rf(%)  cf  cf(%)
##        [0,16.16) 137 0.56 55.92 137  55.92
##    [16.16,32.32)  27 0.11 11.02 164  66.94
##    [32.32,48.48)   9 0.04  3.67 173  70.61
##    [48.48,64.64)  10 0.04  4.08 183  74.69
##     [64.64,80.8)  17 0.07  6.94 200  81.63
##     [80.8,96.96)  16 0.07  6.53 216  88.16
##   [96.96,113.12)  19 0.08  7.76 235  95.92
##  [113.12,129.28)   7 0.03  2.86 242  98.78
##  [129.28,145.44)   3 0.01  1.22 245 100.00

Histogramas y polígonos de frecuencia

plot(dist, type="fh") #Histograma de frecuencias 

plot(dist, type="cfh") #Histograma de frecuencias acumuladas

plot(dist, type="rfh") #Histograma de frecuencias relativas

plot(dist, type="fp") #Polígono de frecuencias

plot(dist, type="cfp") #Polígono de frecuencias acumuladas

plot(dist, type="rfp") #Polígono de frecuencias relativas

Redacción personal

Se extrajeron del archivo local “Casos_Diarios_Estado_Nacional_Confirmados_20200913.csv” los datos diarios de confirmados de COVID-19 para los estados de Durango y Chihuahua, con la finalidad de comparar su numero de casos en tablas y gráficas.Se puede notar que en Chihuahua se empezaron a elevar exponencialmente desde abril, mientras que en Durango a finales de mayo. También se puede ver que en Durango los casos son más inestables que en Chihuahua (Se pueden ver muchos un día y muy pocos al siguiente). Sin embargo, en Chihuahua se tienen casi 1000 casos mas que en Durango, al día 13/09/2020.