setwd("~/3er Semestre/ProbYEst ")
library(pacman)
p_load("base64enc","htmltools","mime", "xfun","prettydoc","readr", "knitr","DT","scales","tidyverse", "gridExtra", "modeest", "fdth")
datos <- read.csv("Casos_Diarios_Estado_Nacional_Confirmados_20200913.csv")
sonora <- t(datos[datos$nombre == "SONORA" ,])
sonora <- as.vector(sonora)
sonora <- sonora[4:248]
sonora <- as.numeric(sonora)
sonora <- as.vector(sonora)
asonora <- cumsum(sonora)
sinaloa <- t(datos[datos$nombre == "SINALOA" ,])
sinaloa <- as.vector(sinaloa)
sinaloa <- sinaloa[4:248]
sinaloa <- as.numeric(sinaloa)
sinaloa <- as.vector(sinaloa)
asinaloa <- cumsum(sinaloa)
plot(sinaloa)
plot(sonora)
jalisco <- t(datos[datos$nombre == "JALISCO" ,])
jalisco <- as.vector(jalisco)
jalisco <- jalisco[4:248]
jalisco <- as.numeric(jalisco)
jalisco <- as.vector(jalisco)
ajalisco <- cumsum(jalisco)
yucatan <- t(datos[datos$nombre == "YUCATAN" ,])
yucatan <- as.vector(yucatan)
yucatan <- yucatan[4:248]
yucatan <- as.numeric(yucatan)
yucatan <- as.vector(yucatan)
ayucatan <- cumsum(yucatan)
plot(jalisco)
plot(yucatan)
# Estructura de los datos en un marco de datos( Data frame)
Fecha <- seq(from= as.Date("2020-01-12"), to = as.Date("2020-09-12"), by =
"day" ) # Vector de fechas desde el 12 de enero al 12 de septiembre de 2020
#Data frame de datos absolutos
sonsin <- data.frame(Fecha,sonora,sinaloa,jalisco,yucatan)
#Data frame de datos acumulados
asonsin <- data.frame(Fecha,asonora,asinaloa,ajalisco,ayucatan)
# tabla de datos absolutos
datatable(sonsin)
# Tabla de datos acumulados
datatable(asonsin)
## Gráficas
Gráficas utilizando GGplot
#Datos absolutos
ggplot(data=sonsin)+geom_line(aes(Fecha, yucatan, colour="Yucatan"))+geom_line(aes(Fecha, jalisco, colour="Jalisco"))+xlab("Mes del año 2020") + ylab("Casos diarios")+ ggtitle("Casos diarios confirmados de COVID-19 en Yucatan y Jalisco")
#Datos acumulados
ggplot(data=asonsin)+geom_line(aes(Fecha, yucatan, colour="Yucatan"))+geom_line(aes(Fecha, jalisco, colour="Jalisco"))+xlab("Mes del año 2020") + ylab("Casos diarios acumulados")+ ggtitle("Casos diarios confirmados acumulados de COVID-19 en Yucatan y Jalisco") + scale_y_continuous(labels= comma)
yucatan1 <- data.frame(Fecha, yucatan, ayucatan)
g2 <- ggplot(data=yucatan1)+geom_col(aes(Fecha, ayucatan))+xlab("Mes del año 2020")+ ylab("Casos acumulados")+ ggtitle("A) Casos diarios acumulados de COVID-19 en Yucatan")
g3 <- ggplot(data=yucatan1)+geom_line(aes(Fecha, yucatan))+xlab("Mes del año 2020")+ylab("Casos diarios")+ggtitle("B) Casos diarios de COVID-19 en Yucatan")
grid.arrange(g2,g3)
#### Grafica para Jalisco
jalisco1 <- data.frame(Fecha, jalisco, ajalisco)
g2 <- ggplot(data=jalisco1)+geom_col(aes(Fecha, ajalisco))+ xlab("Mes del año 2020")+ ylab("Casos acumulados")+ ggtitle("A) Casos diarios acumulados de COVID-19 en Jalisco")
g3 <- ggplot(data = jalisco1)+ geom_line(aes(Fecha, jalisco))+ xlab("Mes del año 2020")+ ylab("Casos diarios")+ ggtitle("B) Casos diarios de COVID-19 en Jalisco")
grid.arrange(g2, g3)
## Medidas de posición central
mean(yucatan) #Media para Yucatan
## [1] 68.02041
mean(jalisco) #Media para Jalisco
## [1] 94.77959
median(yucatan) #Mediana para yucatan
## [1] 37
median(jalisco) #Mediana para jalisco
## [1] 32
mfv(yucatan)#Moda para Yucatan
## [1] 0
mfv(jalisco) #moda pra Jalisco
## [1] 0
summary(yucatan) #Resumen Yucatan
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 0.00 37.00 68.02 118.00 369.00
summary(jalisco) #Resumen Jalisco
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 2.00 32.00 94.78 208.00 333.00
boxplot(yucatan) #
boxplot(jalisco) #
var(yucatan)
## [1] 6149.332
var(jalisco)
## [1] 10874.49
sd(yucatan)
## [1] 78.41767
sd(jalisco)
## [1] 104.2808
dist<- fdt(yucatan, breaks="Sturges")
#Se crea esta variable para obtener la distribución de frecuencia de Yucatan, aplicando el reglamento de Sturges.
dist
## Class limits f rf rf(%) cf cf(%)
## [0,41.41) 125 0.51 51.02 125 51.02
## [41.41,82.82) 38 0.16 15.51 163 66.53
## [82.82,124.23) 23 0.09 9.39 186 75.92
## [124.23,165.64) 18 0.07 7.35 204 83.27
## [165.64,207.05) 27 0.11 11.02 231 94.29
## [207.05,248.46) 8 0.03 3.27 239 97.55
## [248.46,289.87) 3 0.01 1.22 242 98.78
## [289.87,331.28) 2 0.01 0.82 244 99.59
## [331.28,372.69) 1 0.00 0.41 245 100.00
dist1 <-fdt(jalisco, breaks= "Sturges") #Se crea esta variable para obtener la distribución de frecuencia de Jalisco, aplicando el reglamento de Sturges.
dist1
## Class limits f rf rf(%) cf cf(%)
## [0,37.37) 123 0.50 50.20 123 50.20
## [37.37,74.74) 11 0.04 4.49 134 54.69
## [74.74,112.11) 20 0.08 8.16 154 62.86
## [112.11,149.48) 15 0.06 6.12 169 68.98
## [149.48,186.85) 6 0.02 2.45 175 71.43
## [186.85,224.22) 22 0.09 8.98 197 80.41
## [224.22,261.59) 31 0.13 12.65 228 93.06
## [261.59,298.96) 10 0.04 4.08 238 97.14
## [298.96,336.33) 7 0.03 2.86 245 100.00
dist2 <- fdt(ayucatan, breaks="Sturges")
dist3 <-fdt(ajalisco, breaks= "Sturges")
# hist <- c(dist, type="fh")
#Histograma de frecuencia absoluta de Yucatan
hist(yucatan, breaks="Sturges")
hist(ayucatan, breaks="Sturges")
#hist <- c(dist1, type="fh")
#Histograma de frecuencia absoluta de Jalisco
hist(jalisco, breaks="Sturges")
hist(ajalisco, breaks="Sturges")
#hist <- c(dist, type="cfh")
#Histograma de frecuencua acumuladas de Yucatan
plot(dist2, type="cfh")
#hist <- c(dist1, type="cfh")
#Histograma de frecuencua acumuladas de Jalisco
plot(dist3, type="cfh")
plot(dist2, type="cfp") #Poligono de frecuencia absoluto de Yucatan
plot(dist3, type="cfp") #Poligono de frecuencia absoluto de Jalisco
plot(dist2, type="cfp") #Poligono de frecuencia acumulada de Yucatan
plot(dist3, type="cfp") #Poligono de frecuencia acumulada de Jalisco