setwd("~/3er Semestre/ProbYEst ")

Importar

Importar paquetes

library(pacman)
p_load("base64enc","htmltools","mime", "xfun","prettydoc","readr", "knitr","DT","scales","tidyverse", "gridExtra", "modeest", "fdth")

Importar datos

datos <- read.csv("Casos_Diarios_Estado_Nacional_Confirmados_20200913.csv")

Transformar y Filtrar

sonora <- t(datos[datos$nombre == "SONORA" ,])
sonora <- as.vector(sonora)
sonora <- sonora[4:248]
sonora <- as.numeric(sonora)
sonora <- as.vector(sonora)
asonora <- cumsum(sonora)

sinaloa <- t(datos[datos$nombre == "SINALOA" ,])
sinaloa <- as.vector(sinaloa)
sinaloa <- sinaloa[4:248]
sinaloa <- as.numeric(sinaloa)
sinaloa <- as.vector(sinaloa)
asinaloa <- cumsum(sinaloa)

plot(sinaloa)

plot(sonora)

jalisco <- t(datos[datos$nombre == "JALISCO" ,])
jalisco <- as.vector(jalisco)
jalisco <- jalisco[4:248]
jalisco <- as.numeric(jalisco)
jalisco <- as.vector(jalisco)
ajalisco <- cumsum(jalisco)

yucatan <- t(datos[datos$nombre == "YUCATAN" ,])
yucatan <- as.vector(yucatan)
yucatan <- yucatan[4:248]
yucatan <- as.numeric(yucatan)
yucatan <- as.vector(yucatan)
ayucatan <- cumsum(yucatan)

plot(jalisco)

plot(yucatan)

# Estructura de los datos en un marco de datos( Data frame)

Fecha <- seq(from= as.Date("2020-01-12"), to = as.Date("2020-09-12"), by =
"day" ) # Vector de fechas desde el 12 de enero al 12 de septiembre de 2020

#Data frame de datos absolutos
sonsin <- data.frame(Fecha,sonora,sinaloa,jalisco,yucatan)
#Data frame de datos acumulados
asonsin <- data.frame(Fecha,asonora,asinaloa,ajalisco,ayucatan)

TABLA

# tabla de datos absolutos
datatable(sonsin)
# Tabla de datos acumulados
datatable(asonsin)

## Gráficas

Gráficas utilizando GGplot

#Datos absolutos

ggplot(data=sonsin)+geom_line(aes(Fecha, yucatan, colour="Yucatan"))+geom_line(aes(Fecha, jalisco,                             colour="Jalisco"))+xlab("Mes del año 2020") + ylab("Casos diarios")+ ggtitle("Casos diarios confirmados de COVID-19 en Yucatan y Jalisco")

#Datos acumulados

ggplot(data=asonsin)+geom_line(aes(Fecha, yucatan, colour="Yucatan"))+geom_line(aes(Fecha, jalisco,                               colour="Jalisco"))+xlab("Mes del año 2020") + ylab("Casos diarios acumulados")+ ggtitle("Casos diarios confirmados acumulados de COVID-19 en Yucatan y Jalisco") + scale_y_continuous(labels= comma)

Grafica combinada de datos acumulados y absolutos

Grafica para Yucatan

yucatan1 <- data.frame(Fecha, yucatan, ayucatan)

g2 <- ggplot(data=yucatan1)+geom_col(aes(Fecha, ayucatan))+xlab("Mes del año 2020")+ ylab("Casos acumulados")+ ggtitle("A) Casos diarios acumulados de COVID-19 en Yucatan")

g3 <- ggplot(data=yucatan1)+geom_line(aes(Fecha, yucatan))+xlab("Mes del año 2020")+ylab("Casos diarios")+ggtitle("B) Casos diarios de COVID-19 en Yucatan")

grid.arrange(g2,g3)

#### Grafica para Jalisco

jalisco1 <- data.frame(Fecha, jalisco, ajalisco)

g2 <- ggplot(data=jalisco1)+geom_col(aes(Fecha, ajalisco))+ xlab("Mes del año 2020")+ ylab("Casos acumulados")+ ggtitle("A) Casos diarios acumulados de COVID-19 en Jalisco")

g3 <- ggplot(data = jalisco1)+ geom_line(aes(Fecha, jalisco))+ xlab("Mes del año 2020")+ ylab("Casos diarios")+ ggtitle("B) Casos diarios de COVID-19 en Jalisco")

grid.arrange(g2, g3)

## Medidas de posición central

Cálculo individual de las medidas principales de valores de casos confirmados para Yucatan y Jalisco (MMM)

Media

mean(yucatan) #Media para Yucatan
## [1] 68.02041
mean(jalisco) #Media para Jalisco
## [1] 94.77959

Mediana

median(yucatan) #Mediana para yucatan
## [1] 37
median(jalisco) #Mediana para jalisco
## [1] 32

Moda

mfv(yucatan)#Moda para Yucatan
## [1] 0
mfv(jalisco) #moda pra Jalisco
## [1] 0

Resumen de posición central

summary(yucatan) #Resumen Yucatan
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00    0.00   37.00   68.02  118.00  369.00
summary(jalisco) #Resumen Jalisco
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00    2.00   32.00   94.78  208.00  333.00

Gráfico de caja y bigote

boxplot(yucatan) #

boxplot(jalisco) #

Varianza

var(yucatan)
## [1] 6149.332
var(jalisco)
## [1] 10874.49

Desviación estándar

sd(yucatan)
## [1] 78.41767
sd(jalisco)
## [1] 104.2808

Histogramas

Histograma Absoluto

dist<- fdt(yucatan, breaks="Sturges")
#Se crea esta variable para obtener la distribución de frecuencia de Yucatan, aplicando el reglamento de Sturges.

dist
##     Class limits   f   rf rf(%)  cf  cf(%)
##        [0,41.41) 125 0.51 51.02 125  51.02
##    [41.41,82.82)  38 0.16 15.51 163  66.53
##   [82.82,124.23)  23 0.09  9.39 186  75.92
##  [124.23,165.64)  18 0.07  7.35 204  83.27
##  [165.64,207.05)  27 0.11 11.02 231  94.29
##  [207.05,248.46)   8 0.03  3.27 239  97.55
##  [248.46,289.87)   3 0.01  1.22 242  98.78
##  [289.87,331.28)   2 0.01  0.82 244  99.59
##  [331.28,372.69)   1 0.00  0.41 245 100.00
dist1 <-fdt(jalisco, breaks= "Sturges") #Se crea esta variable para obtener la distribución de frecuencia de Jalisco, aplicando el reglamento de Sturges.

dist1
##     Class limits   f   rf rf(%)  cf  cf(%)
##        [0,37.37) 123 0.50 50.20 123  50.20
##    [37.37,74.74)  11 0.04  4.49 134  54.69
##   [74.74,112.11)  20 0.08  8.16 154  62.86
##  [112.11,149.48)  15 0.06  6.12 169  68.98
##  [149.48,186.85)   6 0.02  2.45 175  71.43
##  [186.85,224.22)  22 0.09  8.98 197  80.41
##  [224.22,261.59)  31 0.13 12.65 228  93.06
##  [261.59,298.96)  10 0.04  4.08 238  97.14
##  [298.96,336.33)   7 0.03  2.86 245 100.00
dist2 <- fdt(ayucatan, breaks="Sturges")
dist3 <-fdt(ajalisco, breaks= "Sturges")
# hist <- c(dist, type="fh") 
#Histograma de frecuencia absoluta de Yucatan
hist(yucatan, breaks="Sturges")

hist(ayucatan, breaks="Sturges")

#hist <- c(dist1, type="fh") 
#Histograma de frecuencia absoluta de Jalisco
hist(jalisco, breaks="Sturges")

hist(ajalisco, breaks="Sturges")

#hist <- c(dist, type="cfh") 
#Histograma de frecuencua acumuladas de Yucatan
plot(dist2, type="cfh")

#hist <- c(dist1, type="cfh") 
#Histograma de frecuencua acumuladas de Jalisco
plot(dist3, type="cfh")

plot(dist2, type="cfp") #Poligono de frecuencia absoluto de Yucatan

plot(dist3, type="cfp") #Poligono de frecuencia absoluto de Jalisco

plot(dist2, type="cfp") #Poligono de frecuencia acumulada de Yucatan

plot(dist3, type="cfp") #Poligono de frecuencia acumulada de Jalisco

Se observa como jalisco tiene mas casos confirmados que yucatan, esta grafica muestra como se ha ido creciendo los casos confirmados, no ha ido decreciendo en ningun momento, pero en la grafica de yucatan donde en el momento 200 hubo una creciente y despues se hizo constante.