U1A6

Bernardo Valenzuela

26/9/2020

Análisis de datos diarios de COVID-19 de salud para tlaxcala y nayarit

Probabilidad

IMPORTAR

  • Importar paquetes
library(pacman)
p_load("base64enc", "htmltools", "mime", "xfun", "prettydoc", "readr", "knitr", "DT", "tidyverse", "scales", "gridExtra", "modeest", "fdth")
#Leer datos del archivo local descargado
datos <- read.csv("Casos_Diarios_Estado_Nacional_Confirmados_20200913.csv")

TRANSFORMAR

#Datos confirmados para tlaxcala (absolutos y acumulados)
tlaxcala<- t(datos[datos$nombre == "TLAXCALA" ,])
tlaxcala <- as.vector(tlaxcala)
tlaxcala <- tlaxcala[4:248]
tlaxcala <- as.numeric(tlaxcala)
tlaxcala <- as.vector(tlaxcala)
atlaxcala <- cumsum(tlaxcala)

#Datos confirmados para nayarit (absolutos y acumulados)
nayarit <- t(datos[datos$nombre == "NAYARIT" ,])
nayarit<- as.vector(nayarit)
nayarit<- nayarit[4:248]
nayarit<- as.numeric(nayarit)
nayarit<- as.vector(nayarit)
anayarit<- cumsum(nayarit)

#Vector de Fecha

Fecha <- seq(from = as.Date("2020-01-12"), to = as.Date("2020-09-12"), by = "day" )

#Estructura de datos en un data frame 

tlanay <- data.frame(Fecha, tlaxcala, nayarit) #datos diarios absolutos
atlanay <- data.frame(Fecha, atlaxcala, anayarit) #datos acumulados 

Visualizar

Visualización en Tablas

Para esto se usará una tabla interactiva

#Tabla de datos absolutos
datatable(tlanay)
#Tabla de datos acumulados
datatable(atlanay)

Visualización en gráficas

Utilizando ggplot2

#Datos absolutos
ggplot(data=tlanay) + 
  geom_line(aes(Fecha, tlaxcala, colour="tlaxcala")) +
  geom_line(aes(Fecha, nayarit, colour="nayarit")) +
  xlab("Mes del año 2020") +
  ylab ("Casos diarios Confirmados") +
  ggtitle("Casos de COVID-19 en Tlaxcala y Nayarit") +
  scale_y_continuous(labels = comma)

#Datos acumulados
ggplot(data=atlanay) + 
  geom_line(aes(Fecha, atlaxcala, colour="tlaxcala")) +
  geom_line(aes(Fecha, anayarit, colour="nayarit")) +
  xlab("Mes del año 2020") +
  ylab ("Casos diarios acumulados") +
  ggtitle("Casos de COVID-19 en Tlaxcala y Nayarit") +
  scale_y_continuous(labels = comma)

Medidas de tendencia central

Media

mean(tlaxcala)
## [1] 28.19592
mean(nayarit)
## [1] 22.39184

Mediana

median(tlaxcala)
## [1] 16
median(nayarit)
## [1] 15

Moda

mfv(tlaxcala)
## [1] 0
mfv(nayarit)
## [1] 0

Resumen de tendencia central

summary(tlaxcala)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##     0.0     0.0    16.0    28.2    51.0   103.0
summary(nayarit)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00    0.00   15.00   22.39   42.00   85.00

Gráfico de caja y bigote

boxplot(tlaxcala)

boxplot(nayarit)

Medidas de dispersión

Amplitud

Varianza

var(tlaxcala)
## [1] 902.3631
var(nayarit)
## [1] 594.3212

Desviación estándar

sd(tlaxcala)
## [1] 30.03936
sd(nayarit)
## [1] 24.3787

Gráfico de dispersión

plot(tlaxcala)

Tarea: Completar este análisis comparativo para tlaxcala y nayarit, incluyendo:

  • Distribución de frecuencia en tabla
  • Histogramas y polígonos para tlaxcala y nayarit
dist <- fdt(tlaxcala, breaks = "Sturges")
dist1 <- fdt(nayarit, breaks = "Sturges")
dist
##       Class limits   f   rf rf(%)  cf  cf(%)
##        [0,11.5589) 107 0.44 43.67 107  43.67
##  [11.5589,23.1178)  26 0.11 10.61 133  54.29
##  [23.1178,34.6767)  21 0.09  8.57 154  62.86
##  [34.6767,46.2356)  21 0.09  8.57 175  71.43
##  [46.2356,57.7944)  22 0.09  8.98 197  80.41
##  [57.7944,69.3533)  14 0.06  5.71 211  86.12
##  [69.3533,80.9122)  14 0.06  5.71 225  91.84
##  [80.9122,92.4711)  15 0.06  6.12 240  97.96
##   [92.4711,104.03)   5 0.02  2.04 245 100.00
dist1
##     Class limits   f   rf rf(%)  cf  cf(%)
##       [0,9.5389) 115 0.47 46.94 115  46.94
##  [9.5389,19.078)  21 0.09  8.57 136  55.51
##  [19.078,28.617)  16 0.07  6.53 152  62.04
##  [28.617,38.156)  25 0.10 10.20 177  72.24
##  [38.156,47.694)  18 0.07  7.35 195  79.59
##  [47.694,57.233)  23 0.09  9.39 218  88.98
##  [57.233,66.772)  12 0.05  4.90 230  93.88
##  [66.772,76.311)   8 0.03  3.27 238  97.14
##   [76.311,85.85)   7 0.03  2.86 245 100.00

Histogramas y poligonos para tlaxcala

# Histograma
hist(tlaxcala)

# Histograma de frecuancias absolutas
plot(dist, type = "fh")

# Polígono de frecuencias absolutas
plot(dist, type = "fp")

# Histograma de frecuencias relativas
plot(dist, type = "rfh")

# Polígono de frecuencias relativas
plot(dist, type = "rfp")

# Histograma de frecuencias acumulado
plot(dist, type = "cfh")

# Polígono de frecuencias acumulado
plot(dist, type = "cfp")

Histogramas y poligonos para nayarit

# Histograma
hist(nayarit)

# Histograma de frecuancias absolutas
plot(dist1, type = "fh")

# Polígono de frecuencias absolutas
plot(dist1, type = "fp")

# Histograma de frecuencias relativas
plot(dist1, type = "rfh")

# Polígono de frecuencias relativas
plot(dist1, type = "rfp")

# Histograma de frecuencias acumulado
plot(dist1, type = "cfh")

# Polígono de frecuencias acumulado
plot(dist1, type = "cfp")

Conclusión

Con el uso de distintos graficos y medidas de tendencia, pudimos hacer una comparacion entre los estados de tlaxcala y nayarit. Dos estados que si bien detacan por ser poco conocidos dentro de la republica Mexicana, son estados perfectos para hacer un analisis de como funciona el coronavirus en estados con poca afluencia de poblacion en las calles. R nos permitio tranformar datos obtenidos de bases de informacion proporcionadas por el gobierno, y poder tranformarlas en tablas y graficas entendibles para cualquier persona.