Análisis comparativo de casos confirmados de COVID-19 en Sonora y Sinaloa
- Establecer carpeta de trabajo
IMPORTAR DATOS
TRANSFOMAR Y FILTRAR
yucatan <- t(datos[datos$nombre == "YUCATAN" ,])
yucatan <- as.vector(yucatan)
yucatan <- yucatan[4:248]
yucatan <- as.numeric(yucatan)
yucatan <- as.vector(yucatan)
ayucatan <- cumsum(yucatan)
# Aquí se crea una variable llamada Yucatán, se filtra los datos para que solo tome los valores de Yucatán, después se guarda como si fuera un vector, después se toman los valores a partir del 4 valor hasta el final, después nuevamente se convierte a numérico y después a vector.
#Se crea una variable para guardar los datos totales acumulados de Yucatán
quintanaroo <- t(datos[datos$nombre == "QUINTANA ROO" ,])
quintanaroo <- as.vector(quintanaroo)
quintanaroo <- quintanaroo[4:248]
quintanaroo <- as.numeric(quintanaroo)
quintanaroo <- as.vector(quintanaroo)
aquintanaroo <- cumsum(quintanaroo)
# Aquí se crea una variable llamada Quintana Roo, se filtra los datos para que solo tome los valores de Quintana Roo, después se guarda como si fuera un vector, después se toman los valores a partir del 4 valor hasta el final, después nuevamente se convierte a numérico y después a vector.
#Se crea una variable para guardar los datos totales acumulados de Quintana Roo.
plot(yucatan)# Aquí se hace una gráfica de puntos de los datos de Yucatán y Quintana Roo
# Estructuración de los datos en un marco de datos (Data frame)
Fecha <- seq(from = as.Date("2020-01-12"), to = as.Date("2020-09-12"), by = "day")
# Aquí se crea un formato de fecha mas digerible para nosotros los mexicanos
yucqui <- data.frame(Fecha,yucatan,quintanaroo)
# Marco de datos de Yucatán y Quintana Roo
ayucqui <- data.frame(Fecha,ayucatan,aquintanaroo)
# Marco de datos acumulados de Yucatán y Quintana RooEn las gráficas se puede apreciar que en las gráficas en Yucatán han habido mas casos en Quintana Roo
VISUALIZAR
TABLA
GrÁFICAS
Gráficas utilizando ggplot
#Datos absolutos
ggplot(data = yucqui) +
geom_line(aes(Fecha,yucatan,colour="yucatan"))+
geom_line(aes(Fecha,quintanaroo,colour="quintanaroo"))+
xlab("Mes del año 2020")+
ylab("Casos diarios")+
ggtitle("Casos diarios confirmados de COVID-19 en Yucatán y Quintana Roo")#Datos acumulados
ggplot(data = ayucqui) +
geom_line(aes(Fecha,ayucatan,colour="yucatan"))+
geom_line(aes(Fecha,aquintanaroo,colour="quintanaroo"))+
xlab("Mes del año 2020")+
ylab("Casos diarios")+
ggtitle("Casos diarios confirmados acumulados de COVID-19 en Yucatán y Quintana Roo") +
scale_y_continuous(labels = comma) En esta gráfica es visiblemente notable que los datos en Yucatán son muchos mas altos, se puede asumir que hay mas ciudadanos en Yucatán
Gráfica combianda de datos acumulados y absoulutos
Gráfica para Yucatán
# Marco de datos con los datos y datos acumulados de Yucatán
yucatan1 <- data.frame(Fecha, yucatan, ayucatan)
# Gráfica de Yucatán
g2 <- ggplot(data = yucatan1) +
geom_col(aes(Fecha,yucatan))+
xlab("Mes del año 2020")+
ylab("Casos diarios")+
ggtitle("A) Casos diarios confirmados de COVID-19 en Yucatan ")
# Gráfica de Quintana Roo
g3 <- ggplot(data = yucatan1) +
geom_col(aes(Fecha,ayucatan))+
xlab("Mes del año 2020")+
ylab("Casos diarios")+
ggtitle("B) Casos diarios confirmados acumulados de COVID-19 en Yucatan ")
# Comparativa de las dos graficas
grid.arrange(g2,g3) En estas gráficas se puede apreciar que a mediados de julio los casos se dispararon en Yucatán, ademas los casos acumulados se puede ver que la curva en este caso no se logra aplanar.
# Creación de marco de datos, en este marco hay datos normales y datos acumulados de Quintana Roo
quintanaroo1 <- data.frame(Fecha, quintanaroo, aquintanaroo)
# Gráfica de datos diarios de Quintana Roo
g2 <- ggplot(data = quintanaroo1) +
geom_col(aes(Fecha,quintanaroo))+
xlab("Mes del año 2020")+
ylab("Casos diarios")+
ggtitle("A) Casos diarios confirmados de COVID-19 en Quintana Roo ")
# Gráfica de datos acumulados de Quintana Roo
g3 <- ggplot(data = quintanaroo1) +
geom_col(aes(Fecha,aquintanaroo))+
xlab("Mes del año 2020")+
ylab("Casos diarios")+
ggtitle("B) Casos diarios confirmados acumulados de COVID-19 en Quintana Roo ")
# Comparación de las dos tablas de datos
grid.arrange(g2,g3) En estas gráficas se puede apreciar que los contagios se disparan a finales de abril hasta mediados de julio, ademas los datos son un poco atipicos, con bajas y altas muy variables durante el mes de julio y finales de abril.
Medidas de prosición central
Cálculo individual de las medidas principales de valores de casos confirmados para soora (MMM)
Media
## [1] 68.02041
## [1] 45.37959
En la media de los 2 estados se puede ver que la media de contagios diarios de Yucatán son algo mas grandes en comparación a Quintana Roo
Mediana
## [1] 37
## [1] 32
En la mediana de los 2 estados se puede ver que la mediana de Yucatán evidente mente también es mayor a la mediana de Quintana Roo
Moda
## [1] 0
## [1] 0
Debido a que en los primeros días de infectados en la ciudad de México, los datos se empezaron a tomar desde entonces, existen muchos días sin infecciones, por eso la moda de infecciones en 0 en ambos países.
Resumen de posición central
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 0.00 37.00 68.02 118.00 369.00
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 0.00 32.00 45.38 66.00 196.00
En este resumen se puede apreciar y confirmar que la media, mediana y la máxima son mayores en Yucatán que en Quintana Roo
Gráfico de caja y bigote
En las dos tablas de caja y bigotes se pueden ver que los valores máximos en son mas grandes en Yucatán, sin embargo en Quintana Roo hay valores que se salen fuera de la media, significa que tiene días donde las infecciones son atipicas, o sea que se salen de los parametros normales.
Medidas de dispersión
## [1] 6149.332
## [1] 2401.163
En estos datos se puede ver que los contagios estan mas dispersos en Yucatán comparandolos con Quintana Roo
Varianza
## [1] 78.41767
## [1] 49.00166
Evidentemente si se le saca la raíz cuadrada a la varianza, los datos de Yucatán serán mayores que los datos de Quintana Roo, ya que la varianza es mayor en Yucatán
Asignación:
Agregar un análisis de tabla de frecuencia (fdth)Agregar los polígonos e histogramas absolutos, acumulados y de frecuencia para ambos estadosHacer una explicación de los procedimientos y la interpretación, añadir conclusión final
Tabla de frecuencia de Yucatan y Quintana Roo
# Frecuencia de contagios diarios de Yucatán
dist <- fdt(yucatan,breaks = "Sturges") # Se calcula la distribución de frecuencia utilizando la regla de sturges
# Aquí se crea una tabla de frecuencia de contagios diarios de Yucatán
plot(dist,type="fp") #Poligono de frecuencias absoluto# Frecuencia de contagios diarios de Quintana Roo
dist <- fdt(quintanaroo,breaks = "Sturges") # Se calcula la distribución de frecuencia utilizando la regla de sturges
# Aquí se crea una tabla de frecuencia de contagios diarios de Quintanas Roo
plot(dist,type="fp") #Poligono de frecuencias absolutoTabla de frecuencia de Yucatan y Quintana Roo
# Frecuencia de contagios diarios acumulados de Yucatán
dist <- fdt(ayucatan,breaks = "Sturges") # Se calcula la distribución de frecuencia utilizando la regla de sturges
# Aquí se crea una tabla de frecuencia de contagios diarios de Yucatán
plot(dist,type="fp") #Poligono de frecuencias absoluto# Frecuencia de contagios diarios acumulados de Quintana Roo
dist <- fdt(aquintanaroo,breaks = "Sturges") # Se calcula la distribución de frecuencia utilizando la regla de sturges
# Aquí se crea una tabla de frecuencia de contagios diarios de Quintanas Roo
plot(dist,type="fp") #Poligono de frecuencias absolutoComo se puede apreciar en ambas tablas se puede ver que los contagios son mucho mas frecuentes en Yucatán, se puede asumir dos cosas, 1 en Yucatán probablemente hay mas personas en Quintana Roo, y 2 probablemente en Yucatán las personas se cuidan menos