Analisis de datos diarios de COVID-19 y salud para MORELOS Y NAYARIT

IMPORTAR

  • Importar paquetes
library(pacman)
p_load("base64enc", "htmltools", "mime", "xfun", "prettydoc", "readr", "knitr", "DT", "tidyverse", "scales", "gridExtra", "modeest", "fdth")
#Leer datos del archivo local descargado
datos <- read.csv("Casos_Diarios_Estado_Nacional_Confirmados_20200913.csv")

TRANSFORMAR

#Datos confirmados para morelos (absolutos y acumulados)
morelos <- t(datos[datos$nombre == "MORELOS" ,])
morelos <- as.vector(morelos)
morelos <- morelos[4:248]
morelos <- as.numeric(morelos)
morelos <- as.vector(morelos)
amorelos <- cumsum(morelos)

#Datos confirmados para nayarit (absolutos y acumulados)
nayarit <- t(datos[datos$nombre == "NAYARIT" ,])
nayarit <- as.vector(nayarit)
nayarit <- nayarit[4:248]
nayarit <- as.numeric(nayarit)
nayarit <- as.vector(nayarit)
anayarit <- cumsum(nayarit)

#Vector de Fecha

Fecha <- seq(from = as.Date("2020-01-12"), to = as.Date("2020-09-12"), by = "day" )

#Estructura de datos en un data frame 

mornay <- data.frame(Fecha, morelos, nayarit) #datos diarios absolutos
amornay <- data.frame(Fecha, amorelos, anayarit) #datos acumulados 

Visualizar

Visualizacion en Tablas

Para esto se usara una tabla interactiva

#Tabla de datos absolutos
datatable(mornay)
#Tabla de datos acumulados
datatable(amornay)

Visualizacion en graficas

Utilizando ggplot2

#Datos absolutos
ggplot(data=mornay) + 
  geom_line(aes(Fecha, morelos, colour="morelos")) +
  geom_line(aes(Fecha, nayarit, colour="nayarit")) +
  xlab("Mes del año 2020") +
  ylab ("Casos diarios Confirmados") +
  ggtitle("Casos de COVID-19 en Morelos y Nayarit") +
  scale_y_continuous(labels = comma)

#Datos acumulados
ggplot(data=amornay) + 
  geom_line(aes(Fecha, amorelos, colour="morelos")) +
  geom_line(aes(Fecha, anayarit, colour="nayarit")) +
  xlab("Mes del año 2020") +
  ylab ("Casos diarios acumulados") +
  ggtitle("Casos de COVID-19 en morelos y nayarit") +
  scale_y_continuous(labels = comma)

Medidas de tendencia central

Media

mean(morelos)
## [1] 22.58367
mean(nayarit)
## [1] 22.39184

Mediana

median(morelos)
## [1] 18
median(nayarit)
## [1] 15

Moda

mfv(morelos)
## [1] 0
mfv(nayarit)
## [1] 0

Resumen de tendencia central

summary(morelos)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00    0.00   18.00   22.58   41.00   88.00
summary(nayarit)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00    0.00   15.00   22.39   42.00   85.00

Grafico de caja y bigote

boxplot(morelos)

boxplot(nayarit)

Medidas de dispersion

Amplitud

Varianza

var(morelos)
## [1] 470.5965
var(nayarit)
## [1] 594.3212

Desviacion estandar

sd(morelos)
## [1] 21.69324
sd(nayarit)
## [1] 24.3787

Grafico de dispersion

plot(nayarit)

Tarea: Completar este analisis comparativo para Morelos y Nayarit, incluyendo:

  • Distribucion de frecuencia en tabla
dist <- fdt(morelos, breaks = "Sturges")
dist1 <- fdt(nayarit, breaks = "Sturges")
dist
##     Class limits   f   rf rf(%)  cf  cf(%)
##       [0,9.8756) 102 0.42 41.63 102  41.63
##  [9.8756,19.751)  23 0.09  9.39 125  51.02
##  [19.751,29.627)  22 0.09  8.98 147  60.00
##  [29.627,39.502)  32 0.13 13.06 179  73.06
##  [39.502,49.378)  31 0.13 12.65 210  85.71
##  [49.378,59.253)  25 0.10 10.20 235  95.92
##  [59.253,69.129)   8 0.03  3.27 243  99.18
##  [69.129,79.004)   1 0.00  0.41 244  99.59
##   [79.004,88.88)   1 0.00  0.41 245 100.00
dist1
##     Class limits   f   rf rf(%)  cf  cf(%)
##       [0,9.5389) 115 0.47 46.94 115  46.94
##  [9.5389,19.078)  21 0.09  8.57 136  55.51
##  [19.078,28.617)  16 0.07  6.53 152  62.04
##  [28.617,38.156)  25 0.10 10.20 177  72.24
##  [38.156,47.694)  18 0.07  7.35 195  79.59
##  [47.694,57.233)  23 0.09  9.39 218  88.98
##  [57.233,66.772)  12 0.05  4.90 230  93.88
##  [66.772,76.311)   8 0.03  3.27 238  97.14
##   [76.311,85.85)   7 0.03  2.86 245 100.00

Histogramas y poligonos para Morelos

# Histograma
hist(morelos)

# Histograma de frecuancias absolutas
plot(dist, type = "fh")

# Polígono de frecuencias absolutas
plot(dist, type = "fp")

# Histograma de frecuencias relativas
plot(dist, type = "rfh")

# Polígono de frecuencias relativas
plot(dist, type = "rfp")

# Histograma de frecuencias acumulado
plot(dist, type = "cfh")

# Polígono de frecuencias acumulado
plot(dist, type = "cfp")

Histogramas y poligonos para Nayarit

# Histograma
hist(nayarit)

# Histograma de frecuancias absolutas
plot(dist1, type = "fh")

# Polígono de frecuencias absolutas
plot(dist1, type = "fp")

# Histograma de frecuencias relativas
plot(dist1, type = "rfh")

# Polígono de frecuencias relativas
plot(dist1, type = "rfp")

# Histograma de frecuencias acumulado
plot(dist1, type = "cfh")

# Polígono de frecuencias acumulado
plot(dist1, type = "cfp")

  • conclusion: Con la relizacion de esta asignacion se pudo comparar los casos presentes de COVID-19 para los estados de Morelos y Nayarit, con la posibilidad de transformar y visualizar los datos de una manera mas sencilla para que sea de mejor compresion para las personas. Con el apoyo de tablas y graficas vemos que el estado de morelos presenta muchos mas casos en comparacion con el estado de Nayarit