U1A6

Miguel Sanez

14/9/2020

Establecer folder de trabajo

setwd("~/PyE1213")

##IMPORTAR

IMPORTAR PAQUETES

library(pacman)
p_load("base64enc","htmltools","mime", "xfun","prettydoc","readr", "knitr","DT","scales","tidyverse", "gridExtra", "modeest", "fdth")

IMPORTAR DATOS

datos <- read.csv("Casos_Diarios_Estado_Nacional_Confirmados_20200913.csv")

TRANSFORMAR Y FILTRAR

Se agarran los datos del archivo y se almacenan en un vector para los absolutos y otro para para los acumulados. También se pone una fecha de parámetros en una variable de Fecha y se usa para representar en los data frame

sonora <- t(datos[datos$nombre=="SONORA" ,])
sonora <- as.vector(sonora)
sonora <- sonora[4:248]
sonora <- as.numeric(sonora)
sonora <- as.vector(sonora)
asonora <- cumsum(sonora)

sinaloa <- t(datos[datos$nombre=="SINALOA" ,])
sinaloa <- as.vector(sinaloa)
sinaloa <- sinaloa[4:248]
sinaloa <- as.numeric(sinaloa)
sinaloa <- as.vector(sinaloa)
asinaloa <- cumsum(sinaloa)

oaxaca <- t(datos[datos$nombre=="OAXACA" ,])
oaxaca <- as.vector(oaxaca)
oaxaca <- oaxaca[4:248]
oaxaca <- as.numeric(oaxaca)
oaxaca <- as.vector(oaxaca)
aoaxaca <- cumsum(oaxaca)

veracruz <- t(datos[datos$nombre=="VERACRUZ" ,])
veracruz <- as.vector(veracruz)
veracruz <- veracruz[4:248]
veracruz <- as.numeric(veracruz)
veracruz <- as.vector(veracruz)
averacruz <- cumsum(veracruz)

# Estructuración de los datos en un marco de datos (Data frame)

Fecha <- seq(from=as.Date("2020-01-12"), to= as.Date("2020-09-12"), by="day") #Vector de fechas desde el 12 de enero al 12 de septiembre de 2020

#Data frame de datos absolutos
sonsin <- data.frame(Fecha,sonora, sinaloa)
#Data frame de datos acumulados
asonsin <- data.frame(Fecha,asonora, asinaloa)

#Data frame de datos absolutos
oaxver<- data.frame(Fecha,oaxaca, veracruz)
#Data frame de datos acumulados
aoaxver <- data.frame(Fecha,aoaxaca, averacruz)

plot(sonora)

plot(asonora)

plot(oaxaca)

plot(aoaxaca)

plot(veracruz)

plot(averacruz)

##VISUALIZAR

##TABLA Se utilizan las anteriores variables para crear tablas interactivas

#Tabla interactica de datos diarios absolutos
datatable(sonsin)
#Tabla interactica de datos diarios acumulados
datatable(asonsin)
#Tabla interactica de datos diarios absolutos
datatable(oaxver)
#Tabla interactica de datos diarios acumulados
datatable(aoaxver)

##GRÁFICAS Se crean gráficas con los datos anteriores y se representan.

#Datos absolutos
ggplot(data=sonsin) +
  geom_line(aes(Fecha, sonora, colour="sonora")) +
  geom_line(aes(Fecha, sinaloa, colour="sinaloa")) +
  xlab("Mes del año 2020") + 
  ylab("Casos diarios") + 
  ggtitle("Casos diarios confirmados de COVID-19 en Sonora y Sinaloa")

#Datos acumulados
ggplot(data=asonsin) +
  geom_line(aes(Fecha, asonora, colour="sonora")) +
  geom_line(aes(Fecha, asinaloa, colour="sinaloa")) +
  xlab("Mes del año 2020") + 
  ylab("Casos acumulados") + 
  ggtitle("Casos diarios acumulados de COVID-19 en Sonora y Sinaloa") + 
  scale_y_continuous(labels=comma)

#Datos absolutos
ggplot(data=oaxver) +
  geom_line(aes(Fecha, oaxaca, colour="oaxaca")) +
  geom_line(aes(Fecha, veracruz, colour="veracruz")) +
  xlab("Mes del año 2020") + 
  ylab("Casos diarios") + 
  ggtitle("Casos diarios confirmados de COVID-19 en Oaxaca y Veracruz")

#Datos acumulados
ggplot(data=aoaxver) +
  geom_line(aes(Fecha, aoaxaca, colour="oaxaca")) +
  geom_line(aes(Fecha, averacruz, colour="veracruz")) +
  xlab("Mes del año 2020") + 
  ylab("Casos acumulados") + 
  ggtitle("Casos diarios acumulados de COVID-19 en Oaxaca y Veracruz") + 
  scale_y_continuous(labels=comma)

Gráfica para Sonora de datos acumulados y absolutos

Se crean gráficas para mostrar las comparaciones de los datos acumulados y absolutos.

sonora1 <- data.frame(Fecha, sonora, asonora)

g2 <- ggplot(data=sonora1) +
  geom_col(aes(Fecha, asonora)) +
  xlab("Mes del año 2020") + 
  ylab("Casos acumulados") + 
  ggtitle("A) Casos diarios aculumados de COVID-19 en Sonora")

g3 <- ggplot(data=sonora1) +
  geom_line(aes(Fecha, sonora)) +
  xlab("Mes del año 2020") + 
  ylab("Casos diarios") + 
  ggtitle("B) Casos diarios confirmados de COVID-19 en Sonora")

grid.arrange(g2,g3)

Gráfica para Sinaloa de datos acumulados y absolutos

Se crean gráficas para mostrar las comparaciones de los datos acumulados y absolutos

sinaloa1 <- data.frame(Fecha, sinaloa, asinaloa)

g2 <- ggplot(data=sinaloa1) +
  geom_col(aes(Fecha, asinaloa)) +
  xlab("Mes del año 2020") + 
  ylab("Casos acumulados") + 
  ggtitle("A) Casos diarios acumulados de COVID-19 en Sinaloa")

g3 <- ggplot(data=sinaloa1) +
  geom_line(aes(Fecha, sinaloa)) +
  xlab("Mes del año 2020") + 
  ylab("Casos diarios") + 
  ggtitle("B) Casos diarios confirmados de COVID-19 en Sinaloa")

grid.arrange(g2,g3)

### Gráfica para Oaxaca de datos acumulados y absolutos Se crean gráficas para mostrar las comparaciones de los datos acumulados y absolutos

oaxaca1 <- data.frame(Fecha, oaxaca, aoaxaca)

g2 <- ggplot(data=oaxaca1) +
  geom_col(aes(Fecha, aoaxaca)) +
  xlab("Mes del año 2020") + 
  ylab("Casos acumulados") + 
  ggtitle("A) Casos diarios acumulados de COVID-19 en Oaxaca")

g3 <- ggplot(data=oaxaca1) +
  geom_line(aes(Fecha, oaxaca)) +
  xlab("Mes del año 2020") + 
  ylab("Casos diarios") + 
  ggtitle("B) Casos diarios confirmados de COVID-19 en Oaxaca")

grid.arrange(g2,g3)

Gráfica para Veracruz de datos acumulados y absolutos

Se crean gráficas para mostrar las comparaciones de los datos acumulados y absolutos

veracruz1 <- data.frame(Fecha, veracruz, averacruz)

g2 <- ggplot(data=veracruz1) +
  geom_col(aes(Fecha, averacruz)) +
  xlab("Mes del año 2020") + 
  ylab("Casos acumulados") + 
  ggtitle("A) Casos diarios acumulados de COVID-19 en Veracruz")

g3 <- ggplot(data=veracruz1) +
  geom_line(aes(Fecha, veracruz)) +
  xlab("Mes del año 2020") + 
  ylab("Casos diarios") + 
  ggtitle("B) Casos diarios confirmados de COVID-19 en Veracruz")

grid.arrange(g2,g3)

Media de posición central

Sonora

Cálculo individual de las medidas principales de valores de casos confirmados para Sonora (MMM)

Media

Se calcula la media de los datos de cada estado

mean(sonora) #Media para Sonora
## [1] 94.53061
mean(sinaloa) #Media para Sinaloa
## [1] 70.73469
mean(oaxaca) #Media para Oaxaca
## [1] 60.82857
mean(veracruz) #Media para Veracruz
## [1] 125.9878

Mediana

Se calcula la mediana de los datos de cada estado

median(sonora) #Mediana para Sonora
## [1] 45
median(sinaloa) #Mediana para Sinaloa
## [1] 55
median(oaxaca) #Mediana para Oaxaca
## [1] 24
median(veracruz) #Mediana para Veracruz
## [1] 94

Moda

Se calcula la moda de los datos de cada estado

mfv(sonora) #Moda para Sonora
## [1] 0
mfv(sinaloa) #Moda para Sinaloa
## [1] 0
mfv(oaxaca) #Moda para Oaxaca
## [1] 0
mfv(veracruz) #Moda para Veracruz
## [1] 0

Resumen de posición central

Se hace un resumen de la media, mediana y moda, junto con su máximo y mínimo.

summary(sinaloa) #Resumen Sinaloa
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00    0.00   55.00   70.73  122.00  291.00
summary(sonora) #Resumen Sonora
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00    0.00   45.00   94.53  154.00  482.00
summary(oaxaca) #Resumen Oaxaca
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00    0.00   24.00   60.83  114.00  263.00
summary(veracruz) #Resumen Veracruz
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##       0       0      94     126     212     523

Gráfico de caja y bigote

Se hace una gráfica de caja y bigote representando los datos.

boxplot(sonora)

boxplot(sinaloa)

boxplot(oaxaca)

boxplot(veracruz)

Medidas de dispersión

###Varianza Se calcula la varianza de los datos

var(sonora)
## [1] 13317.47
var(sinaloa)
## [1] 4742.007
var(oaxaca)
## [1] 4709.708
var(veracruz)
## [1] 18816.49

Desviación estándar

Se calcula la desviación de cada estado

sd(sonora)
## [1] 115.4013
sd(sinaloa)
## [1] 68.86223
sd(oaxaca)
## [1] 68.62731
sd(veracruz)
## [1] 137.1732

##Asignación

  • Agregar un análisis de la tabla de frecuencia
distoaxaca <- fdt(oaxaca, breaks="Sturges")
distoaxaca
##       Class limits   f   rf rf(%)  cf  cf(%)
##        [0,29.5144) 128 0.52 52.24 128  52.24
##  [29.5144,59.0289)  10 0.04  4.08 138  56.33
##  [59.0289,88.5433)  27 0.11 11.02 165  67.35
##  [88.5433,118.058)  22 0.09  8.98 187  76.33
##  [118.058,147.572)  17 0.07  6.94 204  83.27
##  [147.572,177.087)  24 0.10  9.80 228  93.06
##  [177.087,206.601)  11 0.04  4.49 239  97.55
##  [206.601,236.116)   5 0.02  2.04 244  99.59
##   [236.116,265.63)   1 0.00  0.41 245 100.00
distaoaxaca <- fdt(aoaxaca, breaks="Sturges")
distaoaxaca
##           Class limits   f   rf rf(%)  cf  cf(%)
##          [0,1672.4478) 136 0.56 55.51 136  55.51
##  [1672.4478,3344.8956)  13 0.05  5.31 149  60.82
##  [3344.8956,5017.3433)  10 0.04  4.08 159  64.90
##  [5017.3433,6689.7911)  11 0.04  4.49 170  69.39
##  [6689.7911,8362.2389)   9 0.04  3.67 179  73.06
##  [8362.2389,10034.687)  12 0.05  4.90 191  77.96
##  [10034.687,11707.134)  14 0.06  5.71 205  83.67
##  [11707.134,13379.582)  18 0.07  7.35 223  91.02
##   [13379.582,15052.03)  22 0.09  8.98 245 100.00
distveracruz <- fdt(veracruz, breaks="Sturges")
distveracruz
##       Class limits   f   rf rf(%)  cf  cf(%)
##        [0,58.6922) 110 0.45 44.90 110  44.90
##  [58.6922,117.384)  28 0.11 11.43 138  56.33
##  [117.384,176.077)  27 0.11 11.02 165  67.35
##  [176.077,234.769)  27 0.11 11.02 192  78.37
##  [234.769,293.461)  18 0.07  7.35 210  85.71
##  [293.461,352.153)  12 0.05  4.90 222  90.61
##  [352.153,410.846)  13 0.05  5.31 235  95.92
##  [410.846,469.538)   7 0.03  2.86 242  98.78
##   [469.538,528.23)   3 0.01  1.22 245 100.00
distaveracruz <- fdt(averacruz, breaks="Sturges")
distaveracruz
##           Class limits   f   rf rf(%)  cf  cf(%)
##          [0,3463.9633) 131 0.53 53.47 131  53.47
##  [3463.9633,6927.9267)  19 0.08  7.76 150  61.22
##   [6927.9267,10391.89)  15 0.06  6.12 165  67.35
##   [10391.89,13855.853)  11 0.04  4.49 176  71.84
##  [13855.853,17319.817)   9 0.04  3.67 185  75.51
##   [17319.817,20783.78)   9 0.04  3.67 194  79.18
##   [20783.78,24247.743)  11 0.04  4.49 205  83.67
##  [24247.743,27711.707)  17 0.07  6.94 222  90.61
##   [27711.707,31175.67)  23 0.09  9.39 245 100.00
  • Agregar los polígonos e histogramas absolutos, acumulados y de frecuencia para ambos estados
#Histograma de datos diarios de Oaxaca
hist(oaxaca, breaks = "Sturges")

#Histograma de datos acumulados de Oaxaca
hist(aoaxaca, breaks = "Sturges")

#Histograma de datos diarios de Veracruz
hist(veracruz, breaks = "Sturges")

#Histograma de datos acumulados de Veracruz
hist(averacruz, breaks = "Sturges")

#Histograma de frecuencia de Oaxaca
plot(distoaxaca, type = "cfh")

#Histograma de frecuencia acumulada de Oaxaca
plot(distaoaxaca, type = "cfh")

#Histograma de frecuencia de Veracruz
plot(distveracruz, type = "cfh")

#Histograma de frecuencia acumulada de Veracruz
plot(distaveracruz, type = "cfh")

#Poligono de frecuencias de Oaxaca
plot(distoaxaca, type = "cfp")

#Poligono de frecuencias acumuladas de Oaxaca
plot(distaoaxaca, type = "cfp")

#Poligono de frecuencia de Veracruz
plot(distveracruz, type = "cfp")

#Poligono de frecuencia acumulada de Veracruz
plot(distaveracruz, type = "cfp")

  • Hacer una explicación de los procedimientos

Conclusión

En las gráficas, se puede observar cómo los contagios confirmados de COVID-19 en el estado de Oaxaca son más leves e iniciaron más lentamente a comparación con el estado de Veracruz, el cual, tuvo una subida de contagios más elevado y tiene mayor número de contagiados en todo este tiempo.