U1A6

HéctorZapata

14/9/2020

Análisis comparativo de casos confirmados de COVID-19 en Sonora y Sinaloa

  • Establecer folder de trabajo
setwd("~/Probabilidad y Estadistica")

IMPORTAR

IMPORTAR PAQUETES

library(pacman)
p_load("base64enc", "htmltools", "mime", "xfun", "prettydoc", "readr", "knitr", "DT", "scales", "tidyverse", "gridExtra", "modeest", "fdth")

IMPORTAR DATOS

datos <- read.csv("Casos_Diarios_Estado_Nacional_Confirmados_20200913.csv")

TRANSFORMAR Y FILTRAR

sonora <- t(datos[datos$nombre == "SONORA" ,])
sonora <- as.vector(sonora)
sonora <- sonora[4:248]
sonora <- as.numeric(sonora)
sonora <- as.vector(sonora)
asonora <- cumsum(sonora)

sinaloa <- t(datos[datos$nombre == "SINALOA" ,])
sinaloa <- as.vector(sinaloa )
sinaloa  <- sinaloa[4:248]
sinaloa  <- as.numeric(sinaloa )
sinaloa  <- as.vector(sinaloa )
asinaloa  <- cumsum(sinaloa )

plot(sinaloa)

plot (sonora)

# Estructuración de los datos en un marco de datos ( Data frame)

Fecha <- seq(from= as.Date("2020-01-12"), to = as.Date("2020-09-12"), by = "day" ) #Vector de fechas desde el 12 de enero al 12 de septiembre de 2020

#Data frame de datos absolutos
sonsin <- data.frame(Fecha,sonora,sinaloa)
#Data frame de datos acumulados
asonsin <- data.frame(Fecha,asonora,asinaloa)

Visualizar

datatable(sonsin)
datatable(asonsin)

Graficas

#Datos absolutos
ggplot(data= sonsin) +
  geom_line(aes(Fecha,sonora,colour="sonora"))+
  geom_line(aes(Fecha,sinaloa,colour="sinaloa"))+
  xlab("Mes del año 2020")+
  ylab("Casos diarios")+
  ggtitle("Casos diarios confirmados de COVID-19 en Sonora y sinaloa")+scale_y_continuous(labels = comma)

#datos acumulados
ggplot(data= asonsin) +
  geom_line(aes(Fecha,asonora,colour="sonora"))+
  geom_line(aes(Fecha,asinaloa,colour="sinaloa"))+
  xlab("Mes del año 2020")+
  ylab("Casos diarios acumulados")+
  ggtitle("Casos diarios confirmados de COVID-19 en Sonora y sinaloa")+scale_y_continuous(labels = comma)

Grafica combinada de datos acumulados y absolutos

sonora1 <- data.frame(Fecha, sonora, asonora)

g2 <- ggplot(data=sonora1) +
  geom_col(aes(Fecha,asonora)) +
  xlab("Mes del año 2020") +
  ylab("Casos acumulados") +
  ggtitle("A) Casos diarios acumulados de COVID-19 en Sonora")

g3 <- ggplot(data=sonora1) +
  geom_line(aes(Fecha,sonora)) +
  xlab("Mes del año 2020") +
  ylab("Casos diarios") +
  ggtitle("B) Casos diarios de COVID-19 en Sonora")

grid.arrange(g2,g3)

### Grafica para sinaloa

sinaloa1 <- data.frame(Fecha, sinaloa, asinaloa)

g4 <- ggplot(data=sinaloa1) +
  geom_col(aes(Fecha,asinaloa)) +
  xlab("Mes del año 2020") +
  ylab("Casos acumulados") +
  ggtitle("A) Casos diarios acumulados de COVID-19 en Sinaloa")

g5 <- ggplot(data=sinaloa1) +
  geom_line(aes(Fecha,sinaloa)) +
  xlab("Mes del año 2020") +
  ylab("Casos diarios") +
  ggtitle("B) Casos diarios de COVID-19 en Sinaloa")

grid.arrange(g4,g5)

##Temas nuevos ### Media

mean(sonora)
## [1] 94.53061
mean(sinaloa)
## [1] 70.73469

Mediana

median(sonora)
## [1] 45
median(sinaloa)
## [1] 55

Moda

mfv(sonora)
## [1] 0
mfv(sinaloa)
## [1] 0

Resumen de posicion central

summary(sonora)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00    0.00   45.00   94.53  154.00  482.00
summary(sinaloa)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00    0.00   55.00   70.73  122.00  291.00

grafico de caja y bigote

boxplot(sonora)

boxplot(sinaloa)

###Varianza

var(sonora)
## [1] 13317.47
var(sinaloa)
## [1] 4742.007

Desviacion estandar

sd(sonora)
## [1] 115.4013
sd(sinaloa)
## [1] 68.86223

COMPARATIVA NUEVO LEON VS DF

nuevoLeon <- t(datos[datos$nombre == "NUEVO LEON" ,])
nuevoLeon <- as.vector(nuevoLeon)
nuevoLeon <- nuevoLeon[4:248]
nuevoLeon <- as.numeric(nuevoLeon)
nuevoLeon <- as.vector(nuevoLeon)
anuevoLeon <- cumsum(nuevoLeon)

df <- t(datos[datos$nombre == "DISTRITO FEDERAL" ,])
df <- as.vector(df)
df  <- df[4:248]
df  <- as.numeric(df )
df  <- as.vector(df )
adf  <- cumsum(df )

plot(nuevoLeon)

plot (df)

Se pudo observar como los casos de monterrey tuvo su pico de infectados y hubo un declive de los confirmados gracias a las prevenciones hoy en día está bajando, ahora miramos como el distrito federal estuvo estable hasta un punto donde solo ha estado subiendo

Asignación:

  • Agregar un análisis de tabla de frecuencia (fdth)
  • Agregar los polígonos e histogramas absolutos, acumulados y de frecuencia para ambos estados *Hacer una explicación de los procedimientos y la interpretación, añadir conclusión final

Tabla de distribucion de frecuencia de los datos recopilados de Sonora

se puede observar como los cambios no son tan drasticos entre las cifras trabajadas, teniendo un minimo entre 97 y 99 por lo que su cambio es de 2, es un minimo muy bueno y tiene un maximo o maxmima diferecia entre datos la cual es de 156 a 187 por lo que es preocupante ese cambio de datos tan distantes que refleja los casos en Sonora los cambios entre datos representan los casos de covid-19 en Sonora

sonoraDist <- fdt(sonora, breaks="Sturges")
sonoraDist
##       Class limits   f   rf rf(%)  cf  cf(%)
##        [0,54.0911) 126 0.51 51.43 126  51.43
##  [54.0911,108.182)  30 0.12 12.24 156  63.67
##  [108.182,162.273)  31 0.13 12.65 187  76.33
##  [162.273,216.364)  19 0.08  7.76 206  84.08
##  [216.364,270.456)  13 0.05  5.31 219  89.39
##  [270.456,324.547)   9 0.04  3.67 228  93.06
##  [324.547,378.638)  10 0.04  4.08 238  97.14
##  [378.638,432.729)   5 0.02  2.04 243  99.18
##   [432.729,486.82)   2 0.01  0.82 245 100.00

Tabla de distribucion de frecuencia de los datos recopilados de Sinaloa

Se puede observas como al inicio los datos fueron abrumadores y superando al maximo de sonora en su momento, con el pasar del tiempo los casos fueron bajando y se regularizo el estandar de infectados en sinaloa, esto se debe a que Sonora es mucho mas grande que sinaloa y por ende hay mas poblacion.

sinaloaDist <- fdt(sinaloa, breaks = "Sturges")
sinaloaDist
##       Class limits  f   rf rf(%)  cf  cf(%)
##        [0,32.6567) 98 0.40 40.00  98  40.00
##  [32.6567,65.3133) 34 0.14 13.88 132  53.88
##    [65.3133,97.97) 28 0.11 11.43 160  65.31
##    [97.97,130.627) 32 0.13 13.06 192  78.37
##  [130.627,163.283) 23 0.09  9.39 215  87.76
##   [163.283,195.94) 18 0.07  7.35 233  95.10
##   [195.94,228.597)  9 0.04  3.67 242  98.78
##  [228.597,261.253)  2 0.01  0.82 244  99.59
##   [261.253,293.91)  1 0.00  0.41 245 100.00

Histogramas y poligonos

Histograma de frecuancia absoluta

Se puede observar como Sinaloa llega a tener muchos menos contagiados que sonora y como los datos representados de forma grafica de sonora son mas variables que los se Sinaloa, esto se entiende por cantidad de cambios drasticos entre estos 2 estados

plot (sonoraDist, type = 'fh', col="blue")

plot (sinaloaDist, type = 'fh', col="red")

### poligono de frecuancia absoluta Se representa de manera grafica con valores Absolutos que Sinaloa tiene una pendiente mucho mas estable que sonora, esto se entiende como la media de cambios entre casos comfirmados de covid-19, siempre entra en clave el factor de la poblacion.

plot (sonoraDist, type = 'fp',col="blue")

plot (sinaloaDist, type = 'fp',col="red")

Poligono de frecuancia relativa

En el caso de los datos relativos siempre sinaloa esta en decremento de casos, siempre esta de forma decendente en cambio Sonora tiene cambios drasticos y hay momentos en los cuales esta en aumento y despues en decremento. esto se debe a la cantidad de problacion que existe en Sonora la cual es muy superior a la de Sinaloa.

plot (sonoraDist, type = 'rfh',col="blue")

plot (sinaloaDist, type = 'rfh',col="red")

Conclusión

Los datos se interpretan por si solos, comolos casos de contagiados de covid-19 en el estado de Sonora son superiores a los del estado de Sinaloa, hay varios factores que he podido investigar los cuales son, cantidad de habitantes y la informacion del virus, es evidente que la cantidad de habitantes es una factor determinante si no es que el mas, sonora supera con creces a la poblacion de Sinaloa, aunque en la actualidad no es tanta la diferencia, el otro factor clave es la informacion, en Sonora se genero un estudio que comprueba dos cosas:

1: los habitantes de Sonora son mas incredulos que los habitantes de Sinaloa, por lo que tiendes a respetar mucho menos las normas de proteccion.

2: los habitantes de Sinaloa estan mas informados que los de Sonora, 8 de cada 10 habitantes de Sinaloa saben e los peligros de la enfermedad mientras que en Sonora solo saben de la existencia de sicha enfermedad y solo 4 de cada 10 habitantes de Sonora saben realmente los peligros de dicha enfermedad.

Esto es mas que obvio, mas del doble de la poblacion de Sinaloa es conciente y contiene informacion de los peligros del covid y por eso la tendencia al decremento de infectados en sinaloa supera a Sonora.