U1A6

JoaquinCastro

14/9/2020

Analisis comparativo de casos confirmados de covid-19 en sonora y en sinaloa

*Establecer folder de trabajo

setwd("~/PyEitson")

IMPORTAR

##importar paquetes

library(pacman)
p_load("base64enc", "htmltools", "mine", "xfun", "prettydoc", "readr", "knitr", "DT", "scales", "tidyverse", "gridExtra", "modeest", "fdth", "tdt")
## Installing package into 'C:/Users/Usuario/Documents/R/win-library/3.6'
## (as 'lib' is unspecified)
## Warning: package 'mine' is not available (for R version 3.6.3)
## Warning: unable to access index for repository http://www.stats.ox.ac.uk/pub/RWin/bin/windows/contrib/3.6:
##   no fue posible abrir la URL 'http://www.stats.ox.ac.uk/pub/RWin/bin/windows/contrib/3.6/PACKAGES'
## Warning: 'BiocManager' not available.  Could not check Bioconductor.
## 
## Please use `install.packages('BiocManager')` and then retry.
## Warning in p_install(package, character.only = TRUE, ...):
## Warning in library(package, lib.loc = lib.loc, character.only = TRUE,
## logical.return = TRUE, : there is no package called 'mine'
## Installing package into 'C:/Users/Usuario/Documents/R/win-library/3.6'
## (as 'lib' is unspecified)
## Warning: package 'tdt' is not available (for R version 3.6.3)
## Warning: unable to access index for repository http://www.stats.ox.ac.uk/pub/RWin/bin/windows/contrib/3.6:
##   no fue posible abrir la URL 'http://www.stats.ox.ac.uk/pub/RWin/bin/windows/contrib/3.6/PACKAGES'
## Warning: 'BiocManager' not available.  Could not check Bioconductor.
## 
## Please use `install.packages('BiocManager')` and then retry.
## Warning in p_install(package, character.only = TRUE, ...):
## Warning in library(package, lib.loc = lib.loc, character.only = TRUE,
## logical.return = TRUE, : there is no package called 'tdt'
## Warning in p_load("base64enc", "htmltools", "mine", "xfun", "prettydoc", : Failed to install/load:
## mine, tdt

##importar datos

datos = read.csv("Casos_Diarios_Estado_Nacional_Confirmados_20200913.csv")

TRANSFORMAR Y FILTRAR

#==========================================
#                EJEMPLOS
sonora = t(datos[datos$nombre == "SONORA" ,])
sonora = as.vector(sonora)
sonora = sonora[4:248]
sonora = as.numeric(sonora)
sonora = as.vector(sonora)
asonora = cumsum(sonora)


sinaloa = t(datos[datos$nombre == "SINALOA" ,])
sinaloa = as.vector(sinaloa)
sinaloa = sinaloa[4:248]
sinaloa = as.numeric(sinaloa)
sinaloa = as.vector(sinaloa)
asinaloa = cumsum(sinaloa)

# Estructuracion de los datos en un marco de datos (Data frame)
Fecha = seq(from=as.Date("2020-01-12"), to= as.Date("2020-09-12"), by="day")#Vector de fechas desde el 12 de enero al 12 de septiembre del 2020

#Data frame de datos absolutos
sonsin=data.frame(Fecha,sonora,sinaloa)
#Data frame de datos acumulados
asonsin=data.frame(Fecha,asonora,asinaloa)
#==========================================
#                   TAREA
tlaxcala = t(datos[datos$nombre == "TLAXCALA" ,])
tlaxcala = as.vector(tlaxcala)
tlaxcala = tlaxcala[4:248]
tlaxcala = as.numeric(tlaxcala)
tlaxcala = as.vector(tlaxcala)
tlaxcala = cumsum(tlaxcala)

yucatan = t(datos[datos$nombre == "YUCATAN" ,])
yucatan = as.vector(yucatan)
yucatan = yucatan[4:248]
yucatan = as.numeric(yucatan)
yucatan = as.vector(yucatan)
yucatan = cumsum(yucatan)

# EN CONCLUSION EL CRECIMIENTO DE LA ENFERMAEDAD ES MUY NOTORIA EN DIFERENTES ESTADOS Y POR ELLO TODAS LAS GRÁFICAS SUFREN DE UNA ALZA EN ELLA

VISUALIZAR

plot(sinaloa)

plot(sonora)

plot(tlaxcala)

plot(yucatan)

TABLA

#Tabla interactiva de datos diarios absulutos
datatable(sonsin)
#Tabla interactiva de datos diarios acumulados
datatable(asonsin)

##GRAFICAS

Graficas utilizando ggplot

#Datos absolutos
ggplot(data=sonsin) + geom_line(aes(Fecha,sonora, colour="sonora")) + geom_line(aes(Fecha,sinaloa, colour="sinaloa")) + xlab("Mes del año 2020") + ylab("Casos diarios") + ggtitle("Casos diarios confirmados de COVID-19 en sonora y sinaloa")

#Datos acumulados
ggplot(data=asonsin) + geom_line(aes(Fecha,asonora, colour="sonora")) + geom_line(aes(Fecha,asinaloa, colour="sinaloa")) + xlab("Mes del año 2020") + ylab("Casos diarios") + ggtitle("Casos diarios confirmados acumulados de COVID-19 en sonora y sinaloa") + scale_y_continuous(labels=comma)

Gráfica combinada de datos acumulados y absolutos

sonora1 = data.frame(Fecha, sonora, asonora)

g2=ggplot(data=sonora1) + geom_col(aes(Fecha,asonora)) +
xlab("Mes del año 2020") + 
ylab("Casos diarios") + 
ggtitle("A) Casos diarios confirmados acumulados de COVID-19 en sonora y sinaloa") 

g3=ggplot(data=sonora1) + geom_line(aes(Fecha,sonora)) +
xlab("Mes del año 2020") + 
ylab("Casos diarios") + 
ggtitle("B) Casos diarios confirmados acumulados de COVID-19 en sonora y sinaloa") 

grid.arrange(g2,g3)

#### Gráfica para sinaloa

sinaloa1 = data.frame(Fecha, sinaloa, asinaloa)

g2=ggplot(data=sinaloa1) + geom_col(aes(Fecha,asinaloa)) +
xlab("Mes del año 2020") + 
ylab("Casos diarios") + 
ggtitle("A) Casos diarios confirmados acumulados de COVID-19 en sinaloa") 

g3=ggplot(data=sinaloa1) + geom_line(aes(Fecha,sinaloa)) +
xlab("Mes del año 2020") + 
ylab("Casos diarios") + 
ggtitle("B) Casos diarios confirmados acumulados de COVID-19 en sinaloa") 

grid.arrange(g2,g3)

Medidas de posicion central

###Sonora

###Calculo individual de las medidas principales de valores de casos confirmados para sonora y sinaloa(MMM)

Media

mean(sonora) #Media para sonora
## [1] 94.53061
mean(sinaloa) #Media para sinaloa
## [1] 70.73469

Mediana

median(sonora) #Mediana para sonora
## [1] 45
median(sinaloa) #Mediana para sinaloa
## [1] 55

Moda

mfv(sonora) #Moda para sonora
## [1] 0
mfv(sinaloa) #Moda para sinaloa
## [1] 0

Resumen de posición central

summary(sonora) #Resumen sonora
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00    0.00   45.00   94.53  154.00  482.00
summary(sinaloa)#Resumen sinaloa
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00    0.00   55.00   70.73  122.00  291.00

Gráfico de caja y bigote

boxplot(sonora)

boxplot(sinaloa)

### Medidas de dispersión

Varianza

var(sonora)
## [1] 13317.47
var(sinaloa)
## [1] 4742.007

Desviación estándar

sd(sonora)
## [1] 115.4013
sd(sinaloa)
## [1] 68.86223

Asignación:

Agregar un análisis de tabla de frecuencia (fdth) Agregar los polígonos e histogramas absolutos y de frecuencia para ambos estados *Hacer una explicación de los procedimientos y la interpretacion, añadir conclusión final.

##Tabla de frecuencia para sonora y sinaloa

#Frecuencia absoluta
distsonora = fdt (sonora, braks="Sturges")
distsonora 
##       Class limits   f   rf rf(%)  cf  cf(%)
##        [0,54.0911) 126 0.51 51.43 126  51.43
##  [54.0911,108.182)  30 0.12 12.24 156  63.67
##  [108.182,162.273)  31 0.13 12.65 187  76.33
##  [162.273,216.364)  19 0.08  7.76 206  84.08
##  [216.364,270.456)  13 0.05  5.31 219  89.39
##  [270.456,324.547)   9 0.04  3.67 228  93.06
##  [324.547,378.638)  10 0.04  4.08 238  97.14
##  [378.638,432.729)   5 0.02  2.04 243  99.18
##   [432.729,486.82)   2 0.01  0.82 245 100.00
#Frecuencia acumulada
distasonora = fdt (asonora, braks="Sturges")
distasonora 
##         Class limits   f   rf rf(%)  cf  cf(%)
##         [0,2599.067) 134 0.55 54.69 134  54.69
##  [2599.067,5198.133)  11 0.04  4.49 145  59.18
##    [5198.133,7797.2)  11 0.04  4.49 156  63.67
##    [7797.2,10396.27)   9 0.04  3.67 165  67.35
##  [10396.27,12995.33)   8 0.03  3.27 173  70.61
##   [12995.33,15594.4)   7 0.03  2.86 180  73.47
##   [15594.4,18193.47)  14 0.06  5.71 194  79.18
##  [18193.47,20792.53)  20 0.08  8.16 214  87.35
##   [20792.53,23391.6)  31 0.13 12.65 245 100.00
#Frecuencia absoluta
distsinaloa = fdt (sinaloa, braks="Sturges")
distsinaloa 
##       Class limits  f   rf rf(%)  cf  cf(%)
##        [0,32.6567) 98 0.40 40.00  98  40.00
##  [32.6567,65.3133) 34 0.14 13.88 132  53.88
##    [65.3133,97.97) 28 0.11 11.43 160  65.31
##    [97.97,130.627) 32 0.13 13.06 192  78.37
##  [130.627,163.283) 23 0.09  9.39 215  87.76
##   [163.283,195.94) 18 0.07  7.35 233  95.10
##   [195.94,228.597)  9 0.04  3.67 242  98.78
##  [228.597,261.253)  2 0.01  0.82 244  99.59
##   [261.253,293.91)  1 0.00  0.41 245 100.00
#Frecuenncia acumulada
distasinaloa = fdt (asinaloa, braks="Sturges")
distasinaloa 
##         Class limits   f   rf rf(%)  cf  cf(%)
##         [0,1944.811) 122 0.50 49.80 122  49.80
##  [1944.811,3889.622)  16 0.07  6.53 138  56.33
##  [3889.622,5834.433)  11 0.04  4.49 149  60.82
##  [5834.433,7779.244)  11 0.04  4.49 160  65.31
##  [7779.244,9724.056)  12 0.05  4.90 172  70.20
##  [9724.056,11668.87)  14 0.06  5.71 186  75.92
##  [11668.87,13613.68)  17 0.07  6.94 203  82.86
##  [13613.68,15558.49)  19 0.08  7.76 222  90.61
##   [15558.49,17503.3)  23 0.09  9.39 245 100.00

##Histogramas de sonora y sinaloa

hist(sonora, main="Histograma confirmados COVID-19 SONORA(Absoluto)", breaks = "Sturges")

hist(asonora, main="Histograma confirmados COVID-19 SONORA(Acumulados)", breaks = "Sturges")

hist(sinaloa,main="Histograma confirmados COVID-19 SINALOA (Absoluto)", breaks = "Sturges")

hist(asinaloa, main="Histograma confirmados COVID-19 SINALOA(Acumulados)", breaks = "Sturges")

plot(distsonora,xlab="CASOS", ylab="Frecuencia confirmados COVID-19 Sonora(Absoluto)",type="cfh")

plot(distasonora,xlab="CASOS", ylab="Frecuencia confirmados COVID-19 Sonora(Acumulado)",type="cfh")

plot(distsinaloa,xlab="CASOS", ylab="Frecuencia confirmados COVID-19 Sinaloa(Absoluto)",type="cfh")

plot(distasinaloa,xlab="CASOS", ylab="Frecuencia confirmados COVID-19 Sinaloa(Acumulado)",type="cfh")

plot(distsonora, type="cfp")

plot(distasonora, type="cfp")

plot(distsinaloa, type="cfp")

plot(distasinaloa, type="cfp")

##En conclusión, podemos observar de qué maneras se pueden interpretar la información con distintos métodos muy visuales para todo tipo de público que puedan tener ciertas preferencias visuales a la hora de interpretar información detallada.