Análisis comparativo de casos confirmados de COVID-19 en Sonora y Sinaloa
- Establecer folder de trabajo
IMPORTAR
IMPORTAR PAQUETES
TRANSFORMAR Y FILTRAR
sonora <- t(datos[datos$nombre == "SONORA" ,])
sonora <- as.vector(sonora)
sonora <- sonora[4:248]
sonora <- as.numeric(sonora)
sonora <- as.vector(sonora)
asonora <- cumsum(sonora)
sinaloa <- t(datos[datos$nombre == "SINALOA" ,])
sinaloa <- as.vector(sinaloa )
sinaloa <- sinaloa[4:248]
sinaloa <- as.numeric(sinaloa )
sinaloa <- as.vector(sinaloa )
asinaloa <- cumsum(sinaloa )
plot(sinaloa)
# Estructuración de los datos en un marco de datos ( Data frame)
Fecha <- seq(from= as.Date("2020-01-12"), to = as.Date("2020-09-12"), by = "day" ) #Vector de fechas desde el 12 de enero al 12 de septiembre de 2020
#Data frame de datos absolutos
sonsin <- data.frame(Fecha,sonora,sinaloa)
#Data frame de datos acumulados
asonsin <- data.frame(Fecha,asonora,asinaloa)
Graficas
#Datos absolutos
ggplot(data= sonsin) +
geom_line(aes(Fecha,sonora,colour="sonora"))+
geom_line(aes(Fecha,sinaloa,colour="sinaloa"))+
xlab("Mes del año 2020")+
ylab("Casos diarios")+
ggtitle("Casos diarios confirmados de COVID-19 en Sonora y sinaloa")+scale_y_continuous(labels = comma)
#datos acumulados
ggplot(data= asonsin) +
geom_line(aes(Fecha,asonora,colour="sonora"))+
geom_line(aes(Fecha,asinaloa,colour="sinaloa"))+
xlab("Mes del año 2020")+
ylab("Casos diarios acumulados")+
ggtitle("Casos diarios confirmados de COVID-19 en Sonora y sinaloa")+scale_y_continuous(labels = comma)
Grafica combinada de datos acumulados y absolutos
sonora1 <- data.frame(Fecha, sonora, asonora)
g2 <- ggplot(data=sonora1) +
geom_col(aes(Fecha,asonora)) +
xlab("Mes del año 2020") +
ylab("Casos acumulados") +
ggtitle("A) Casos diarios acumulados de COVID-19 en Sonora")
g3 <- ggplot(data=sonora1) +
geom_line(aes(Fecha,sonora)) +
xlab("Mes del año 2020") +
ylab("Casos diarios") +
ggtitle("B) Casos diarios de COVID-19 en Sonora")
grid.arrange(g2,g3)
### Grafica para sinaloa
sinaloa1 <- data.frame(Fecha, sinaloa, asinaloa)
g4 <- ggplot(data=sinaloa1) +
geom_col(aes(Fecha,asinaloa)) +
xlab("Mes del año 2020") +
ylab("Casos acumulados") +
ggtitle("A) Casos diarios acumulados de COVID-19 en Sinaloa")
g5 <- ggplot(data=sinaloa1) +
geom_line(aes(Fecha,sinaloa)) +
xlab("Mes del año 2020") +
ylab("Casos diarios") +
ggtitle("B) Casos diarios de COVID-19 en Sinaloa")
grid.arrange(g4,g5)
##Temas nuevos ### Media
## [1] 94.53061
## [1] 70.73469
Resumen de posicion central
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 0.00 45.00 94.53 154.00 482.00
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.00 0.00 55.00 70.73 122.00 291.00
grafico de caja y bigote
###Varianza
## [1] 13317.47
## [1] 4742.007
COMPARATIVA NUEVO LEON VS DF
nuevoLeon <- t(datos[datos$nombre == "NUEVO LEON" ,])
nuevoLeon <- as.vector(nuevoLeon)
nuevoLeon <- nuevoLeon[4:248]
nuevoLeon <- as.numeric(nuevoLeon)
nuevoLeon <- as.vector(nuevoLeon)
anuevoLeon <- cumsum(nuevoLeon)
df <- t(datos[datos$nombre == "DISTRITO FEDERAL" ,])
df <- as.vector(df)
df <- df[4:248]
df <- as.numeric(df )
df <- as.vector(df )
adf <- cumsum(df )
plot(nuevoLeon)
Se pudo observar como los casos de monterrey tuvo su pico de infectados y hubo un declive de los confirmados gracias a las prevenciones hoy en día está bajando, ahora miramos como el distrito federal estuvo estable hasta un punto donde solo ha estado subiendo
Asignación:
- Agregar un análisis de tabla de frecuencia (fdth)
- Agregar los polígonos e histogramas absolutos, acumulados y de frecuencia para ambos estados *Hacer una explicación de los procedimientos y la interpretación, añadir conclusión final
Tabla de distribucion de frecuencia de los datos recopilados de Sonora
se puede observar como los cambios no son tan drasticos entre las cifras trabajadas, teniendo un minimo entre 97 y 99 por lo que su cambio es de 2, es un minimo muy bueno y tiene un maximo o maxmima diferecia entre datos la cual es de 156 a 187 por lo que es preocupante ese cambio de datos tan distantes que refleja los casos en Sonora los cambios entre datos representan los casos de covid-19 en Sonora
## Class limits f rf rf(%) cf cf(%)
## [0,54.0911) 126 0.51 51.43 126 51.43
## [54.0911,108.182) 30 0.12 12.24 156 63.67
## [108.182,162.273) 31 0.13 12.65 187 76.33
## [162.273,216.364) 19 0.08 7.76 206 84.08
## [216.364,270.456) 13 0.05 5.31 219 89.39
## [270.456,324.547) 9 0.04 3.67 228 93.06
## [324.547,378.638) 10 0.04 4.08 238 97.14
## [378.638,432.729) 5 0.02 2.04 243 99.18
## [432.729,486.82) 2 0.01 0.82 245 100.00
Tabla de distribucion de frecuencia de los datos recopilados de Sinaloa
Se puede observas como al inicio los datos fueron abrumadores y superando al maximo de sonora en su momento, con el pasar del tiempo los casos fueron bajando y se regularizo el estandar de infectados en sinaloa, esto se debe a que Sonora es mucho mas grande que sinaloa y por ende hay mas poblacion.
## Class limits f rf rf(%) cf cf(%)
## [0,32.6567) 98 0.40 40.00 98 40.00
## [32.6567,65.3133) 34 0.14 13.88 132 53.88
## [65.3133,97.97) 28 0.11 11.43 160 65.31
## [97.97,130.627) 32 0.13 13.06 192 78.37
## [130.627,163.283) 23 0.09 9.39 215 87.76
## [163.283,195.94) 18 0.07 7.35 233 95.10
## [195.94,228.597) 9 0.04 3.67 242 98.78
## [228.597,261.253) 2 0.01 0.82 244 99.59
## [261.253,293.91) 1 0.00 0.41 245 100.00
Histogramas y poligonos
Histograma de frecuancia absoluta
Se puede observar como Sinaloa llega a tener muchos menos contagiados que sonora y como los datos representados de forma grafica de sonora son mas variables que los se Sinaloa, esto se entiende por cantidad de cambios drasticos entre estos 2 estados
### poligono de frecuancia absoluta Se representa de manera grafica con valores Absolutos que Sinaloa tiene una pendiente mucho mas estable que sonora, esto se entiende como la media de cambios entre casos comfirmados de covid-19, siempre entra en clave el factor de la poblacion.
Poligono de frecuancia relativa
En el caso de los datos relativos siempre sinaloa esta en decremento de casos, siempre esta de forma decendente en cambio Sonora tiene cambios drasticos y hay momentos en los cuales esta en aumento y despues en decremento. esto se debe a la cantidad de problacion que existe en Sonora la cual es muy superior a la de Sinaloa.
Conclusión
Los datos se interpretan por si solos, comolos casos de contagiados de covid-19 en el estado de Sonora son superiores a los del estado de Sinaloa, hay varios factores que he podido investigar los cuales son, cantidad de habitantes y la informacion del virus, es evidente que la cantidad de habitantes es una factor determinante si no es que el mas, sonora supera con creces a la poblacion de Sinaloa, aunque en la actualidad no es tanta la diferencia, el otro factor clave es la informacion, en Sonora se genero un estudio que comprueba dos cosas:
1: los habitantes de Sonora son mas incredulos que los habitantes de Sinaloa, por lo que tiendes a respetar mucho menos las normas de proteccion.
2: los habitantes de Sinaloa estan mas informados que los de Sonora, 8 de cada 10 habitantes de Sinaloa saben e los peligros de la enfermedad mientras que en Sonora solo saben de la existencia de sicha enfermedad y solo 4 de cada 10 habitantes de Sonora saben realmente los peligros de dicha enfermedad.
Esto es mas que obvio, mas del doble de la poblacion de Sinaloa es conciente y contiene informacion de los peligros del covid y por eso la tendencia al decremento de infectados en sinaloa supera a Sonora.