title: “U1A6” author: “Francisco Esquer” date: “14/9/2020” output: prettydoc::html_pretty: theme: architect highlight: github toc: yes

Análisis comparativo de casos confirmados de COVID-19 en estado de Mexico y Nuevo Leon

setwd("~/PYE1213")

IMPORTAR

IMPORTAR PAQUETES

library(pacman)
p_load("base64enc", "htmltools", "mime", "xfun", "prettydoc", "readr", "knitr", "DT", "scales", "tidyverse","gridExtra", "modeest", "fdth")

IMPORTAR DATOS

datos <- read.csv("Casos_Diarios_Estado_Nacional_Confirmados_20200913.csv")

TRANSFORMAR Y FILTRAR

mexico <- t(datos[datos$nombre == "MEXICO" ,])
mexico <- as.vector(mexico)
mexico <- mexico[4:248]
mexico <- as.numeric(mexico)
mexico <- as.vector(mexico)
amexico <- cumsum(mexico)

nuevoleon <- t(datos[datos$nombre == "NUEVO LEON" ,])
nuevoleon<- as.vector(nuevoleon )
nuevoleon<- nuevoleon[4:248]
nuevoleon<- as.numeric(nuevoleon )
nuevoleon<- as.vector(nuevoleon )
anuevoleon <- cumsum(nuevoleon )


# Estructuración de los datos en un marco de datos ( Data frame)

Fecha <- seq(from= as.Date("2020-01-12"), to = as.Date("2020-09-12"), by = "day" ) #Vector de fechas desde el 12 de enero al 12 de septiembre de 2020

#Data frame de datos absolutos
mexnu <- data.frame(Fecha,mexico,nuevoleon)
#Data frame de datos acumulados
amexnu <- data.frame(Fecha,amexico,anuevoleon)

aqui podemmos ver como tanto el estado de mexico y nuevo leon estan tenien como especie de segunda oleada de infesctados por covid 19 en el estado de nuevo leon es un poco menos grave que en estado de mexico pero esto se debe que en estado de mexico tiene mas habitante,

Podemos concluir que la gente se esta volviendo a confiar que la pandemia se esta terminando o que no habia que preocuparse pero no los casos estan volviendo a subir.

VISUALIZAR

TABLA

#Tabla interactiva de datos diarios absolutos
datatable(mexnu)
#Tabla interativa de datos diarios acumulados
datatable(amexnu)

GRÁFICAS

Gráficas utilizando ggplot

#Datos absolutos
ggplot(data=mexnu) +
  geom_line(aes(Fecha,mexico, colour="mexico")) +
  geom_line(aes(Fecha,nuevoleon, colour="nuevo leon")) +
  xlab("Mes del año 2020") +
  ylab("Casos diarios") +
  ggtitle("Casos diarios confirmados de COVID-19 en Mexico y Nuevo Leon")

#Datos acumulados
ggplot(data=amexnu) +
  geom_line(aes(Fecha,amexico, colour="mexico")) +
  geom_line(aes(Fecha,anuevoleon, colour="nuevo leon")) +
  xlab("Mes del año 2020") +
  ylab("Casos diarios acumulados") +
  ggtitle("Casos diarios confirmados acumulados de COVID-19 en Mexico y Nuevo Leon ") +
  scale_y_continuous(labels = comma)

Gráfica combinada de datos acumulados y absolutos

Gráfica para mexico

mexico1 <- data.frame(Fecha, mexico, amexico)

g2 <- ggplot(data=mexico1) +
  geom_col(aes(Fecha,amexico)) +
  xlab("Mes del año 2020") +
  ylab("Casos acumulados") +
  ggtitle("A) Casos diarios acumulados de COVID-19 en mexico")

g3 <- ggplot(data=mexico1) +
  geom_line(aes(Fecha,mexico)) +
  xlab("Mes del año 2020") +
  ylab("Casos diarios") +
  ggtitle("B) Casos diarios de COVID-19 en mexico")

grid.arrange(g2,g3)

Gráfica para nuevo leon

nuevoleon1 <- data.frame(Fecha, nuevoleon, anuevoleon)

g2 <- ggplot(data=nuevoleon1) +
  geom_col(aes(Fecha,anuevoleon)) +
  xlab("Mes del año 2020") +
  ylab("Casos acumulados") +
  ggtitle("A) Casos diarios acumulados de COVID-19 en Nuevo leon")

g3 <- ggplot(data=nuevoleon1) +
  geom_line(aes(Fecha,nuevoleon)) +
  xlab("Mes del año 2020") +
  ylab("Casos diarios") +
  ggtitle("B) Casos diarios de COVID-19 en Nuevo leon")

grid.arrange(g2,g3)

#Aqui podemos ver como los casos diarios y los casos darios acumulados en mexico son superiones que en nuevo leon.

Medidas de posición central

Cálculo individual de las medidas principales de valores de casos confirmados para mexico y nuevo leon (MMM)

Media

mean(mexico) #Media para mexico
## [1] 302.3143
mean(nuevoleon) #Media para nuevo leon
## [1] 138.4735

Mediana

median(mexico) #Mediana para mexico
## [1] 252
median(nuevoleon) #Mediana para nuevo leon
## [1] 30

Moda

mfv(mexico) #Moda para mexico
## [1] 0
mfv(nuevoleon) #Moda para nuevo leon
## [1] 0

En la media, meadiana y moda a exepcion por la moda en mexico es superios siempre tienen una gran cantidad de casos y promedios de casos diarios.

Resumen de posición central

summary(mexico) #Resumen mexico
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##     0.0     3.0   252.0   302.3   545.0  1061.0
summary(nuevoleon) #Resumen nuevo leon
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##     0.0     0.0    30.0   138.5   244.0   603.0
# En resumen aqui se puede observar la supremacia en los movimientos que tiene mexico en casos de covid19 

Gráfico de caja y bigote

boxplot(mexico)

boxplot(nuevoleon)

# A simple vista en la caja de bigote en mexico se puede ver su mmm es superio a la nuevo leon ya que su linea esta mas arriba, contendran los mismos datos pero con diferentes valores a los nuevo leon.

Medidas de dispersión

Varianza

var(mexico)
## [1] 82951.35
var(nuevoleon)
## [1] 31265.5

Desviación estándar

sd(mexico)
## [1] 288.0128
sd(nuevoleon)
## [1] 176.8205

Asignación:

  • Agregar un análisis de tabla de frecuencia (fdth)

Mexico

dist <- fdt(mexico, breaks="Sturges")

dist
##         Class limits  f   rf rf(%)  cf  cf(%)
##         [0,119.0678) 96 0.39 39.18  96  39.18
##  [119.0678,238.1356) 24 0.10  9.80 120  48.98
##  [238.1356,357.2033) 29 0.12 11.84 149  60.82
##  [357.2033,476.2711) 18 0.07  7.35 167  68.16
##  [476.2711,595.3389) 28 0.11 11.43 195  79.59
##  [595.3389,714.4067) 27 0.11 11.02 222  90.61
##  [714.4067,833.4744) 15 0.06  6.12 237  96.73
##  [833.4744,952.5422)  7 0.03  2.86 244  99.59
##   [952.5422,1071.61)  1 0.00  0.41 245 100.00
sort(mexico)
##   [1]    0    0    0    0    0    0    0    0    0    0    0    0    0    0    0
##  [16]    0    0    0    0    0    0    0    0    0    0    0    0    0    0    0
##  [31]    0    0    0    0    0    0    0    0    0    0    0    0    0    0    0
##  [46]    0    0    0    0    0    0    0    0    1    1    1    1    2    2    2
##  [61]    2    3    4    5    5    6    6    7   10   10   12   13   15   18   23
##  [76]   26   27   27   27   34   34   41   43   50   50   51   55   62   73   78
##  [91]   84   84   87   88   94  119  129  146  155  158  159  161  161  179  184
## [106]  185  191  192  194  194  197  197  209  209  214  224  225  232  234  235
## [121]  244  252  252  252  255  258  262  262  264  264  270  272  274  274  280
## [136]  280  284  303  312  321  323  323  331  338  347  348  349  352  357  366
## [151]  366  375  375  377  398  406  410  420  434  441  442  443  445  446  456
## [166]  459  476  477  489  497  499  512  515  516  516  523  525  528  529  537
## [181]  541  541  545  545  546  547  576  577  581  584  586  586  589  589  591
## [196]  610  611  615  618  624  634  642  645  649  651  656  663  665  671  683
## [211]  687  687  688  691  697  698  699  702  702  703  709  710  731  747  749
## [226]  749  754  764  769  774  775  789  799  805  806  816  829  840  853  864
## [241]  882  893  899  937 1061
hist(mexico, breaks = "Sturges") #histograma utilizando el numero de clases según Sturge

plot(dist, type="cfh")   #histograma de frecuencias acumulada

plot(dist, type="cfp")   #poligono de frecuencias acumulado

plot(dist, type="rfh")# histograma de frecuencias relativas

Nuevo leon

dist <- fdt(nuevoleon, breaks="Sturges")

dist
##     Class limits   f   rf rf(%)  cf  cf(%)
##        [0,67.67) 137 0.56 55.92 137  55.92
##   [67.67,135.34)  19 0.08  7.76 156  63.67
##  [135.34,203.01)  17 0.07  6.94 173  70.61
##  [203.01,270.68)  13 0.05  5.31 186  75.92
##  [270.68,338.35)  10 0.04  4.08 196  80.00
##  [338.35,406.02)  22 0.09  8.98 218  88.98
##  [406.02,473.69)  10 0.04  4.08 228  93.06
##  [473.69,541.36)   9 0.04  3.67 237  96.73
##  [541.36,609.03)   8 0.03  3.27 245 100.00
sort(nuevoleon)
##   [1]   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
##  [19]   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
##  [37]   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
##  [55]   0   0   0   0   0   0   0   0   1   1   1   1   2   2   2   2   3   3
##  [73]   4   4   4   4   4   5   5   5   6   6   6   6   6   6   6   6   6   7
##  [91]   8   8   8   8   9   9   9   9  10  11  12  12  12  15  17  17  18  20
## [109]  20  21  21  22  22  22  24  26  26  27  27  27  28  30  30  35  35  36
## [127]  38  39  40  42  42  43  46  50  61  63  63  68  68  69  75  76  77  81
## [145]  84  94 103 104 106 108 118 121 123 131 131 133 142 142 147 147 154 154
## [163] 165 173 175 179 189 190 193 195 199 202 203 209 210 212 213 214 215 221
## [181] 229 230 239 244 245 269 276 294 295 305 310 315 317 319 326 329 342 342
## [199] 346 348 357 357 360 361 363 365 368 370 373 379 383 385 393 394 395 396
## [217] 398 405 417 424 424 431 434 449 454 457 460 462 474 491 495 502 514 516
## [235] 523 526 532 542 560 565 572 576 577 579 603
hist(nuevoleon, breaks = "Sturges") #histograma utilizando el numero de clases según Sturge

plot(dist, type="cfh")   #histograma de frecuencias acumulada

plot(dist, type="cfp")   #poligono de frecuencias acumulado

plot(dist, type="rfh")# histograma de frecuencias relativas

#Como podemos ver aqui a las frecuencias absolutas y acumumuladas son superiones las de mexico, esto puede ser porque mexico es un estado pequeño pero es el estado con mas habitantes que tiene el pais y con mas movimientos hablando de comercios y etc.

# Mencionamos mucho a mexico pero es la verdad mexico es superior en casos acumulados y absolutos que nuevo leon hay n de razones lo cual esto se debe pero resumiendo es porque es capital del mexico, pero nuevo leon no se quedo atras nuevo leon es sin dudad el segundo estado mas importante en mexico y los casos tambien estuviero casi a la par con mexico hasta habia ocaiones en la que nuevo leon casi le ganaba a mexico pero mexico era mas exponenciales sus casos.