U1A6

Juan Valenzuela

14/9/2020

Analisis comparativo de casos confirmados de COVID-19 en Sonora y Sinaloa

  • Establecer folder de trabajo
setwd("~/PyE12")

IMPORTAR

IMPORTAR PAQUETES

library(pacman)
p_load("base54enc","htmltools", "mime", "xgun", "prettydoc", "readr", "knitr", "DT", "scales", "tidyverse", "gridExtra", "modeest","fdth")
## Installing package into 'C:/Users/brayam/Documents/R/win-library/3.6'
## (as 'lib' is unspecified)
## Warning: package 'base54enc' is not available (for R version 3.6.3)
## Warning: unable to access index for repository http://www.stats.ox.ac.uk/pub/RWin/bin/windows/contrib/3.6:
##   no fue posible abrir la URL 'http://www.stats.ox.ac.uk/pub/RWin/bin/windows/contrib/3.6/PACKAGES'
## Warning: 'BiocManager' not available.  Could not check Bioconductor.
## 
## Please use `install.packages('BiocManager')` and then retry.
## Warning in p_install(package, character.only = TRUE, ...):
## Warning in library(package, lib.loc = lib.loc, character.only = TRUE,
## logical.return = TRUE, : there is no package called 'base54enc'
## Installing package into 'C:/Users/brayam/Documents/R/win-library/3.6'
## (as 'lib' is unspecified)
## Warning: package 'xgun' is not available (for R version 3.6.3)
## Warning: unable to access index for repository http://www.stats.ox.ac.uk/pub/RWin/bin/windows/contrib/3.6:
##   no fue posible abrir la URL 'http://www.stats.ox.ac.uk/pub/RWin/bin/windows/contrib/3.6/PACKAGES'
## Warning: 'BiocManager' not available.  Could not check Bioconductor.
## 
## Please use `install.packages('BiocManager')` and then retry.
## Warning in p_install(package, character.only = TRUE, ...):
## Warning in library(package, lib.loc = lib.loc, character.only = TRUE,
## logical.return = TRUE, : there is no package called 'xgun'
## Warning in p_load("base54enc", "htmltools", "mime", "xgun", "prettydoc", : Failed to install/load:
## base54enc, xgun

IMPORTAR DATOS

datos <- read.csv("Casos_Diarios_Estado_Nacional_Confirmados_20200913.csv")

TRANSFORMAR Y FILTRAR

chihuahua <- t(datos[datos$nombre == "CHIHUAHUA" ,])
chihuahua <- as.vector(chihuahua)
chihuahua <- chihuahua[4:248]
chihuahua <- as.numeric(chihuahua)
chihuahua <- as.vector(chihuahua)
achihuahua <- cumsum(chihuahua)

durango <- t(datos[datos$nombre == "DURANGO" ,])
durango <- as.vector(durango)
durango <- durango[4:248]
durango <- as.numeric(durango)
durango <- as.vector(durango)
adurango <- cumsum(durango)

# Estructuracion de los datos en un marco de datos (Data frame)

Fecha <- seq(from = as.Date("2020-01-12"), to = as.Date("2020-09-12"), by= "day" )

# Data frame de datos absolutos
chidur <- data.frame(Fecha, chihuahua, durango)
# Data frame de datos acumulados
achidur <- data.frame(Fecha, achihuahua, adurango)

VISUALIZAR

TABLA

#Tabla interactiva de datos diarios absolutos
datatable(chidur)
#Tabla interactiva de datos diarios acumulados
datatable(achidur)

##GRAFICAS

Graficas utilizando ggplot

# Datos absolutos
ggplot(data=chidur) +
  geom_line(aes(Fecha, chihuahua, colour= "chihuahua"))+
geom_line(aes(Fecha, durango, colour= "durango"))+
  xlab("Mes del aƱo 2020")+
  ylab("Casos diarios")+
  ggtitle("Casos diarios confirmados de COVID-19 en Chihuahua y Durango") +
  scale_y_continuous(labels = comma) 

# Datos acumulados
ggplot(data=achidur) +
  geom_line(aes(Fecha, achihuahua, colour= "chihuahua"))+
geom_line(aes(Fecha, adurango, colour= "durango"))+
  xlab("Mes del aƱo 2020")+
  ylab("Casos diarios acumulados")+
  ggtitle("Casos diarios confirmados acumulados de COVID-19 en Chihuahua y Durango") +
  scale_y_continuous(labels = comma)

Grafica de datos acumulados y absolutos

chihuahua1 <- data.frame(Fecha, chihuahua, achihuahua)

g2 <- ggplot(data= chihuahua1) +
  geom_line(aes(Fecha, achihuahua)) +
  xlab("Mes del aƱo 2020") + 
  ylab("Casos acumulados") +
  ggtitle("Casos acumulados de COVID-19 en Chihuahua")

g3 <- ggplot(data= chihuahua1) +
  geom_line(aes(Fecha, chihuahua)) +
  xlab("Mes del aƱo 2020") + 
  ylab("Casos diarios") +
  ggtitle("Casos diarios acumulados de COVID-19 en Chihuahua")
grid.arrange (g2,g3)

durango1 <- data.frame(Fecha, durango, adurango)

g4 <- ggplot(data= durango1) +
  geom_line(aes(Fecha, adurango)) +
  xlab("Mes del aƱo 2020") + 
  ylab("Casos acumulados") +
  ggtitle("Casos acumulados de COVID-19 en Durango")

g5 <- ggplot(data= durango1) +
  geom_line(aes(Fecha, durango)) +
  xlab("Mes del aƱo 2020") + 
  ylab("Casos diarios") +
  ggtitle("Casos diarios acumulados de COVID-19 en Durango")
grid.arrange (g4,g5)

Medidas de posicion central

Chihuahua

Calculo individual de las medidas principales de valores de casos confirmados para Chihuahua

Media

mean(chihuahua) #media para chihuahua
## [1] 36.65714
mean(durango) #media para durango
## [1] 31.52245

Mediana

median(chihuahua) #mediana para chihuahua
## [1] 31
median(durango) #mediana para durango
## [1] 8

Moda

mfv(chihuahua) #moda para chihuahua
## [1] 0
mfv(durango) #moda para durango
## [1] 0

Resumen de posicion central

summary(chihuahua) #Resumen chihuahua
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00    0.00   31.00   36.66   68.00  114.00
summary(durango) #Resumen durango
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00    0.00    8.00   31.52   66.00  144.00

Grafico de caja y bigote

boxplot(chihuahua)

boxplot(durango)

Medidas de dispersion

Varianza

var(chihuahua)
## [1] 1175.57
var(durango)
## [1] 1636.759

Desviacion estandar

sd(chihuahua)
## [1] 34.28659
sd(durango)
## [1] 40.45687

Asignacion:

  • Agregar un analisis de tabla de frecuencia (fdth)
distdurango <- fdt(durango, breaks="Sturges")
distdurango
##     Class limits   f   rf rf(%)  cf  cf(%)
##        [0,16.16) 137 0.56 55.92 137  55.92
##    [16.16,32.32)  27 0.11 11.02 164  66.94
##    [32.32,48.48)   9 0.04  3.67 173  70.61
##    [48.48,64.64)  10 0.04  4.08 183  74.69
##     [64.64,80.8)  17 0.07  6.94 200  81.63
##     [80.8,96.96)  16 0.07  6.53 216  88.16
##   [96.96,113.12)  19 0.08  7.76 235  95.92
##  [113.12,129.28)   7 0.03  2.86 242  98.78
##  [129.28,145.44)   3 0.01  1.22 245 100.00
distadurango <- fdt(adurango, breaks="Sturges")
distadurango
##         Class limits   f   rf rf(%)  cf  cf(%)
##         [0,866.6922) 149 0.61 60.82 149  60.82
##  [866.6922,1733.384)  15 0.06  6.12 164  66.94
##  [1733.384,2600.077)  14 0.06  5.71 178  72.65
##  [2600.077,3466.769)  12 0.05  4.90 190  77.55
##  [3466.769,4333.461)  11 0.04  4.49 201  82.04
##  [4333.461,5200.153)  12 0.05  4.90 213  86.94
##  [5200.153,6066.846)  12 0.05  4.90 225  91.84
##  [6066.846,6933.538)   9 0.04  3.67 234  95.51
##   [6933.538,7800.23)  11 0.04  4.49 245 100.00
distchihuahua <- fdt(chihuahua, breaks="Sturges")
distchihuahua
##       Class limits  f   rf rf(%)  cf  cf(%)
##        [0,12.7933) 95 0.39 38.78  95  38.78
##  [12.7933,25.5867) 17 0.07  6.94 112  45.71
##    [25.5867,38.38) 21 0.09  8.57 133  54.29
##    [38.38,51.1733) 21 0.09  8.57 154  62.86
##  [51.1733,63.9667) 23 0.09  9.39 177  72.24
##    [63.9667,76.76) 33 0.13 13.47 210  85.71
##    [76.76,89.5533) 15 0.06  6.12 225  91.84
##  [89.5533,102.347) 12 0.05  4.90 237  96.73
##   [102.347,115.14)  8 0.03  3.27 245 100.00
distachihuahua <- fdt(achihuahua, breaks="Sturges")
distachihuahua
##         Class limits   f   rf rf(%)  cf  cf(%)
##         [0,1007.868) 112 0.46 45.71 112  45.71
##  [1007.868,2015.736)  16 0.07  6.53 128  52.24
##  [2015.736,3023.603)  17 0.07  6.94 145  59.18
##  [3023.603,4031.471)  21 0.09  8.57 166  67.76
##  [4031.471,5039.339)  16 0.07  6.53 182  74.29
##  [5039.339,6047.207)  12 0.05  4.90 194  79.18
##  [6047.207,7055.074)  13 0.05  5.31 207  84.49
##  [7055.074,8062.942)  15 0.06  6.12 222  90.61
##   [8062.942,9070.81)  23 0.09  9.39 245 100.00
  • Agregar los poligonos e histogramas absolutos, acumulados y de frecuencia para ambos estados
# Histograma datos diarios confirmados durango

hist(durango, breaks = "Sturges")

# Histograma datos acumulados durango

hist(adurango, breaks = "Sturges")

# Histograma datos diarios confirmados chihuahua

hist(chihuahua, breaks = "Sturges")

# Histograma datos acumulados chihuahua

hist(achihuahua, breaks = "Sturges")

# Histograma de frecuencias Durango

plot(distdurango, type = "cfh")

# Histograma de frecuencia acumulada durango

plot(distadurango, type = "cfh")

# Histograma de frecuencia Chihuahua

plot(distchihuahua, type = "cfh")

# Histograma de frecuencia acumulada chihuahua
plot(distachihuahua, type = "cfh")

# Poligono de frecuencias Durango

plot(distdurango, type = "cfp")

# Poligono de frecuencia acumulada durango

plot(distadurango, type = "cfp")

# Poligono de frecuencia Chihuahua

plot(distchihuahua, type = "cfp")

# Poligono de frecuencia acumulada chihuahua
plot(distachihuahua, type = "cfp")

  • Hacer una explicacion de los procedimientos y la interpretacion, aƱadir conclusion final

CONCLUSION

Puedo concluir que el analisis de datos en las pandemias da una idea de la magnitud del cambio de datos de un dia a otro