Analisis comparativo de casos confirmados de covid-19 en sonora y en sinaloa
*Establecer folder de trabajo
IMPORTAR
##importar paquetes
library(pacman)
p_load("base64enc", "htmltools", "mine", "xfun", "prettydoc", "readr", "knitr", "DT", "scales", "tidyverse", "gridExtra", "modeest", "fdth", "tdt")## Installing package into 'C:/Users/Usuario/Documents/R/win-library/3.6'
## (as 'lib' is unspecified)
## Warning: package 'mine' is not available (for R version 3.6.3)
## Warning: unable to access index for repository http://www.stats.ox.ac.uk/pub/RWin/bin/windows/contrib/3.6:
## no fue posible abrir la URL 'http://www.stats.ox.ac.uk/pub/RWin/bin/windows/contrib/3.6/PACKAGES'
## Warning: 'BiocManager' not available. Could not check Bioconductor.
##
## Please use `install.packages('BiocManager')` and then retry.
## Warning in p_install(package, character.only = TRUE, ...):
## Warning in library(package, lib.loc = lib.loc, character.only = TRUE,
## logical.return = TRUE, : there is no package called 'mine'
## Installing package into 'C:/Users/Usuario/Documents/R/win-library/3.6'
## (as 'lib' is unspecified)
## Warning: package 'tdt' is not available (for R version 3.6.3)
## Warning: unable to access index for repository http://www.stats.ox.ac.uk/pub/RWin/bin/windows/contrib/3.6:
## no fue posible abrir la URL 'http://www.stats.ox.ac.uk/pub/RWin/bin/windows/contrib/3.6/PACKAGES'
## Warning: 'BiocManager' not available. Could not check Bioconductor.
##
## Please use `install.packages('BiocManager')` and then retry.
## Warning in p_install(package, character.only = TRUE, ...):
## Warning in library(package, lib.loc = lib.loc, character.only = TRUE,
## logical.return = TRUE, : there is no package called 'tdt'
## Warning in p_load("base64enc", "htmltools", "mine", "xfun", "prettydoc", : Failed to install/load:
## mine, tdt
##importar datos
TRANSFORMAR Y FILTRAR
#==========================================
# EJEMPLOS
sonora = t(datos[datos$nombre == "SONORA" ,])
sonora = as.vector(sonora)
sonora = sonora[4:248]
sonora = as.numeric(sonora)
sonora = as.vector(sonora)
asonora = cumsum(sonora)
sinaloa = t(datos[datos$nombre == "SINALOA" ,])
sinaloa = as.vector(sinaloa)
sinaloa = sinaloa[4:248]
sinaloa = as.numeric(sinaloa)
sinaloa = as.vector(sinaloa)
asinaloa = cumsum(sinaloa)
# Estructuracion de los datos en un marco de datos (Data frame)
Fecha = seq(from=as.Date("2020-01-12"), to= as.Date("2020-09-12"), by="day")#Vector de fechas desde el 12 de enero al 12 de septiembre del 2020
#Data frame de datos absolutos
sonsin=data.frame(Fecha,sonora,sinaloa)
#Data frame de datos acumulados
asonsin=data.frame(Fecha,asonora,asinaloa)
#==========================================
# TAREA
tlaxcala = t(datos[datos$nombre == "TLAXCALA" ,])
tlaxcala = as.vector(tlaxcala)
tlaxcala = tlaxcala[4:248]
tlaxcala = as.numeric(tlaxcala)
tlaxcala = as.vector(tlaxcala)
tlaxcala = cumsum(tlaxcala)
yucatan = t(datos[datos$nombre == "YUCATAN" ,])
yucatan = as.vector(yucatan)
yucatan = yucatan[4:248]
yucatan = as.numeric(yucatan)
yucatan = as.vector(yucatan)
yucatan = cumsum(yucatan)
# EN CONCLUSION EL CRECIMIENTO DE LA ENFERMAEDAD ES MUY NOTORIA EN DIFERENTES ESTADOS Y POR ELLO TODAS LAS GRÁFICAS SUFREN DE UNA ALZA EN ELLATABLA
##GRAFICAS
Graficas utilizando ggplot
#Datos absolutos
ggplot(data=sonsin) + geom_line(aes(Fecha,sonora, colour="sonora")) + geom_line(aes(Fecha,sinaloa, colour="sinaloa")) + xlab("Mes del año 2020") + ylab("Casos diarios") + ggtitle("Casos diarios confirmados de COVID-19 en sonora y sinaloa")#Datos acumulados
ggplot(data=asonsin) + geom_line(aes(Fecha,asonora, colour="sonora")) + geom_line(aes(Fecha,asinaloa, colour="sinaloa")) + xlab("Mes del año 2020") + ylab("Casos diarios") + ggtitle("Casos diarios confirmados acumulados de COVID-19 en sonora y sinaloa") + scale_y_continuous(labels=comma)Gráfica combinada de datos acumulados y absolutos
sonora1 = data.frame(Fecha, sonora, asonora)
g2=ggplot(data=sonora1) + geom_col(aes(Fecha,asonora)) +
xlab("Mes del año 2020") +
ylab("Casos diarios") +
ggtitle("A) Casos diarios confirmados acumulados de COVID-19 en sonora y sinaloa")
g3=ggplot(data=sonora1) + geom_line(aes(Fecha,sonora)) +
xlab("Mes del año 2020") +
ylab("Casos diarios") +
ggtitle("B) Casos diarios confirmados acumulados de COVID-19 en sonora y sinaloa")
grid.arrange(g2,g3) #### Gráfica para sinaloa
sinaloa1 = data.frame(Fecha, sinaloa, asinaloa)
g2=ggplot(data=sinaloa1) + geom_col(aes(Fecha,asinaloa)) +
xlab("Mes del año 2020") +
ylab("Casos diarios") +
ggtitle("A) Casos diarios confirmados acumulados de COVID-19 en sinaloa")
g3=ggplot(data=sinaloa1) + geom_line(aes(Fecha,sinaloa)) +
xlab("Mes del año 2020") +
ylab("Casos diarios") +
ggtitle("B) Casos diarios confirmados acumulados de COVID-19 en sinaloa")
grid.arrange(g2,g3)Medidas de posicion central
###Sonora
###Calculo individual de las medidas principales de valores de casos confirmados para sonora y sinaloa(MMM)
Media
## [1] 94.53061
## [1] 70.73469
Mediana
## [1] 45
## [1] 55
Resumen de posición central
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 0.00 45.00 94.53 154.00 482.00
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 0.00 55.00 70.73 122.00 291.00
Asignación:
Agregar un análisis de tabla de frecuencia (fdth) Agregar los polígonos e histogramas absolutos y de frecuencia para ambos estados *Hacer una explicación de los procedimientos y la interpretacion, añadir conclusión final.
##Tabla de frecuencia para sonora y sinaloa
## Class limits f rf rf(%) cf cf(%)
## [0,54.0911) 126 0.51 51.43 126 51.43
## [54.0911,108.182) 30 0.12 12.24 156 63.67
## [108.182,162.273) 31 0.13 12.65 187 76.33
## [162.273,216.364) 19 0.08 7.76 206 84.08
## [216.364,270.456) 13 0.05 5.31 219 89.39
## [270.456,324.547) 9 0.04 3.67 228 93.06
## [324.547,378.638) 10 0.04 4.08 238 97.14
## [378.638,432.729) 5 0.02 2.04 243 99.18
## [432.729,486.82) 2 0.01 0.82 245 100.00
## Class limits f rf rf(%) cf cf(%)
## [0,2599.067) 134 0.55 54.69 134 54.69
## [2599.067,5198.133) 11 0.04 4.49 145 59.18
## [5198.133,7797.2) 11 0.04 4.49 156 63.67
## [7797.2,10396.27) 9 0.04 3.67 165 67.35
## [10396.27,12995.33) 8 0.03 3.27 173 70.61
## [12995.33,15594.4) 7 0.03 2.86 180 73.47
## [15594.4,18193.47) 14 0.06 5.71 194 79.18
## [18193.47,20792.53) 20 0.08 8.16 214 87.35
## [20792.53,23391.6) 31 0.13 12.65 245 100.00
## Class limits f rf rf(%) cf cf(%)
## [0,32.6567) 98 0.40 40.00 98 40.00
## [32.6567,65.3133) 34 0.14 13.88 132 53.88
## [65.3133,97.97) 28 0.11 11.43 160 65.31
## [97.97,130.627) 32 0.13 13.06 192 78.37
## [130.627,163.283) 23 0.09 9.39 215 87.76
## [163.283,195.94) 18 0.07 7.35 233 95.10
## [195.94,228.597) 9 0.04 3.67 242 98.78
## [228.597,261.253) 2 0.01 0.82 244 99.59
## [261.253,293.91) 1 0.00 0.41 245 100.00
## Class limits f rf rf(%) cf cf(%)
## [0,1944.811) 122 0.50 49.80 122 49.80
## [1944.811,3889.622) 16 0.07 6.53 138 56.33
## [3889.622,5834.433) 11 0.04 4.49 149 60.82
## [5834.433,7779.244) 11 0.04 4.49 160 65.31
## [7779.244,9724.056) 12 0.05 4.90 172 70.20
## [9724.056,11668.87) 14 0.06 5.71 186 75.92
## [11668.87,13613.68) 17 0.07 6.94 203 82.86
## [13613.68,15558.49) 19 0.08 7.76 222 90.61
## [15558.49,17503.3) 23 0.09 9.39 245 100.00
##Histogramas de sonora y sinaloa
plot(distasinaloa,xlab="CASOS", ylab="Frecuencia confirmados COVID-19 Sinaloa(Acumulado)",type="cfh")##En conclusión, podemos observar de qué maneras se pueden interpretar la información con distintos métodos muy visuales para todo tipo de público que puedan tener ciertas preferencias visuales a la hora de interpretar información detallada.