setwd("~/PyE_206145")
#Analizar series de tiempo acumuladas de datos
#de COVID-19 en Japon utilizando el repositorio de JHU
#bibliotecas #Descargamos las bibliotecas necesariaas para usarlas como herramientas
library(readr)
library(tidyverse)
## -- Attaching packages ------------------------------------- tidyverse 1.3.0 --
## v ggplot2 3.3.1 v dplyr 1.0.0
## v tibble 3.0.1 v stringr 1.4.0
## v tidyr 1.1.0 v forcats 0.5.0
## v purrr 0.3.4
## -- Conflicts ---------------------------------------- tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
library(plotly)
##
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
##
## last_plot
## The following object is masked from 'package:stats':
##
## filter
## The following object is masked from 'package:graphics':
##
## layout
library(gganimate)
library(gifski)
#declaracion de variables #Fijamos las variables mediante las siguientes bases de datos
url_conf <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv"
url_decesos <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_deaths_global.csv"
url_recuperados <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_recovered_global.csv"
#Leer los archivos CSV de las URL #usamos estos comandos para poder interpretar los datos de las urls
datos_conf <- read.csv(url_conf)
datos_decesos <-read.csv(url_decesos)
datos_recuperados <- read.csv(url_recuperados)
#filtrar datos para Japon #Separamos solo los datos para Japon
conf_jap <- t(datos_conf[datos_conf$Country.Region=="Japan" ,])
dec_jap <- t(datos_decesos [datos_decesos$Country.Region=="Japan" ,])
rec_jap <- t(datos_recuperados [datos_recuperados$Country.Region=="Japan" ,])
#Primer figura acumulada #Creamos el grafico representativo de los datos anteriores
plot(conf_jap)
## Warning in xy.coords(x, y, xlabel, ylabel, log): NAs introducidos por coerción

#Para crear un vector de fecha con formato : Dia-Mes-Año
Fecha <- seq(from = as.Date("2020-01-22"), to = as.Date("2020-06-08"), by="day")
#Obtuvimos los datos dentro de las fechas fijadas, debido a que
#son los datos con los que cuenta la base
#Formatear datos confirmados
vec1 <- as.vector(conf_jap) #transformar de formato matriz a vector de caracteres
vec2 <- vec1[5:143] #filtrar datos en un rango
num1 <- as.numeric(vec2) # transformar a numericos
Confirmados <- as.vector(num1) #vector numerico
Confirmados
## [1] 2 2 2 2 4 4 7 7 11 15 20 20
## [13] 20 22 22 22 25 25 26 26 26 28 28 29
## [25] 43 59 66 74 84 94 105 122 147 159 170 189
## [37] 214 228 241 256 274 293 331 360 420 461 502 511
## [49] 581 639 639 701 773 839 839 878 889 924 963 1007
## [61] 1101 1128 1193 1307 1387 1468 1693 1866 1866 1953 2178 2495
## [73] 2617 3139 3139 3654 3906 4257 4667 5530 6005 6748 7370 7645
## [85] 8100 8626 9787 10296 10797 10797 11135 11512 12368 12829 13231 13441
## [97] 14153 13736 13895 14088 14305 14571 14877 15078 15253 15253 15477 15575
## [109] 15663 15777 15847 15968 16049 16120 16203 16237 16285 16305 16367 16367
## [121] 16424 16513 16536 16550 16581 16623 16651 16598 16673 16716 16751 16787
## [133] 16837 16867 16911 16958 17000 17039 17060
#Hasta el momento van alrededor de 17060 casos confirmados
#Formatear datos de decesos
vec1 <- as.vector(dec_jap) #transformar de formato matriz a vector de caracteres
vec2 <- vec1[5:143] #filtrar datos en un rango
num1 <- as.numeric(vec2) # transformar a numericos
Decesos <- as.vector(num1) #vector numerico
Decesos
## [1] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## [19] 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 2
## [37] 4 4 5 6 6 6 6 6 6 6 6 10 10 15 16 19 22 22
## [55] 27 29 29 29 33 35 41 42 43 45 47 49 52 54 54 56 57 62
## [73] 63 77 77 85 92 93 94 99 99 108 123 143 146 178 190 222 236 236
## [91] 263 281 328 345 360 372 385 394 413 430 455 474 487 536 556 556 577 590
## [109] 607 624 633 657 678 697 713 725 744 749 768 768 777 796 808 820 830 846
## [127] 858 881 887 894 898 899 902 905 911 916 915 917 920
#Hasta el momeno van alrededor de 920 decesos
#Formatear datos de recuperados
vec1 <- as.vector(rec_jap) #transformar de formato matriz a vector de caracteres
vec2 <- vec1[5:143] #filtrar datos en un rango
num1 <- as.numeric(vec2) # transformar a numéricos
Recuperados <- as.vector(num1) #vector numérico
Recuperados
## [1] 0 0 0 0 1 1 1 1 1 1 1 1
## [13] 1 1 1 1 1 1 1 4 9 9 9 9
## [25] 12 12 12 13 18 18 22 22 22 22 22 22
## [37] 22 22 32 32 32 43 43 43 46 76 76 76
## [49] 101 118 118 118 118 118 144 144 144 150 191 232
## [61] 235 235 285 310 359 372 404 424 424 424 472 472
## [73] 514 514 514 575 592 622 632 685 762 762 784 799
## [85] 853 901 935 1069 1159 1159 1239 1356 1494 1530 1656 1809
## [97] 1899 1899 2368 2460 2975 3205 3981 4156 4496 4496 4918 5146
## [109] 5906 8127 8293 8531 8920 9868 10338 10338 11153 11564 11564 11564
## [121] 12672 13005 13244 13413 13612 13810 13973 14096 14213 14267 14342 14463
## [133] 14585 14702 14785 14925 14927 14990 15043
#Hasta el momento van al rededor de 15043 recuperados
#Para construir un marco de datos
datos1 <- data.frame(Fecha, Confirmados, Decesos, Recuperados)
#Figura 2 de casos confirmados en méxico
#utilizando ggplot
ggplot (data=datos1) +
geom_line(mapping = aes(x=Fecha, y=Confirmados))

#Figura 3 de Decesos
ggplot (data=datos1) +
geom_line(mapping = aes(x=Fecha, y=Decesos))

#Figura 4 de Recuperados
ggplot (data=datos1) +
geom_line(mapping = aes(x=Fecha, y=Recuperados))

#Animacionn simple
ggplot(data=datos1) +
ggtitle("Casos confirmados acumulados COVID-19 en Japon") +
geom_line(mapping = aes(x=Fecha, y=Confirmados)) +
transition_reveal(Fecha)
#Figura 5 multi ejes
#animacion multiejes
ggplot(data=datos1) +
geom_line(aes(x=Fecha,y=Confirmados),color='red') +
geom_line(aes(x=Fecha,y=Decesos),color='blue') +
geom_line(aes(x=Fecha,y=Recuperados),color='green')+
ylab('COVID-19 Japon') + xlab('Fecha') +
transition_reveal(Fecha)

#Grafica interactiva
gcov <- ggplot(data=datos1) +
geom_line(aes(x=Fecha,y=Confirmados),color='red') +
geom_line(aes(x=Fecha,y=Decesos),color='blue') +
geom_line(aes(x=Fecha,y=Recuperados),color='green')+
ylab('COVID-19 Japon') + xlab('Fecha')
ggplotly(gcov)
#Conclusiones
#(1) Como se puede notar en el gráfico:
#Japon fue uno de los paises que contrajeron el virus mas rapidamente
#esto tendria que ver bastante conque esta muy cercano a china
#y desde febrero comenzaron a surgir los primeros casos confirmados
#(2) a pesar de que la curva de confirmados crecio bastante
#entre marzo hasta finales de abril, la curva se empezo a estabilizar un poco
#en mayo y lo que va de junio
#(3) Tomando en cuenta que la densidad de poblacion de japon es elevada:
#se llega a la conclusion de que en realidad sus contagios no fueron
#elevados, y mirando la curva de los recuperados,
#podemos notar que sus confirmados y recuperados van muy a la par
#y los decesos fueron muy pocos
#(de nuevo tomando en cuenta su poblacion y su densidad)
#lo que nos lleva a la pregunta ¿Por que si Mexico y Japon
#tienen una poblacion bastante parecida, y japon mayor densidad de poblacion
#la incidencia en Mexico ha sido mas fatal?
#(4) De acuerdo al historial de las instituciones de salud de estos dos paises
#y tambien al del comportamiento de sus pobladores, se llega a la conclusion
#de que por ser Japon evidentemente un pais con mas educacion y mejor en lo que respecta
#a las investigaciones del sector salud (datos que son muy bien conocidos)
#estos factores fueron los que probablemnte hicieron que en japon se estabilizara
#en mucho mayor medida las fatalidades y numero de casos