setwd("~/PyE_206145")
#Analizar series de tiempo acumuladas de datos
#de COVID-19 en Japon utilizando el repositorio de JHU

#bibliotecas #Descargamos las bibliotecas necesariaas para usarlas como herramientas
library(readr)
library(tidyverse)
## -- Attaching packages ------------------------------------- tidyverse 1.3.0 --
## v ggplot2 3.3.1     v dplyr   1.0.0
## v tibble  3.0.1     v stringr 1.4.0
## v tidyr   1.1.0     v forcats 0.5.0
## v purrr   0.3.4
## -- Conflicts ---------------------------------------- tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
library(plotly)
## 
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
## 
##     last_plot
## The following object is masked from 'package:stats':
## 
##     filter
## The following object is masked from 'package:graphics':
## 
##     layout
library(gganimate)
library(gifski)

#declaracion de variables  #Fijamos las variables mediante las siguientes bases de datos

url_conf <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv"
url_decesos <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_deaths_global.csv"
url_recuperados <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_recovered_global.csv"

#Leer los archivos CSV de las URL #usamos estos comandos para poder interpretar los datos de las urls
datos_conf <- read.csv(url_conf)
datos_decesos <-read.csv(url_decesos)
datos_recuperados <- read.csv(url_recuperados)

#filtrar datos para Japon #Separamos solo los datos para Japon
conf_jap <- t(datos_conf[datos_conf$Country.Region=="Japan" ,])
dec_jap <- t(datos_decesos [datos_decesos$Country.Region=="Japan" ,])
rec_jap <- t(datos_recuperados [datos_recuperados$Country.Region=="Japan" ,])

#Primer figura acumulada #Creamos el grafico representativo de los datos anteriores
plot(conf_jap)
## Warning in xy.coords(x, y, xlabel, ylabel, log): NAs introducidos por coerción

#Para crear un vector de fecha con formato : Dia-Mes-Año 


Fecha <- seq(from = as.Date("2020-01-22"), to = as.Date("2020-06-08"), by="day")
#Obtuvimos los datos dentro de las fechas fijadas, debido a que 
#son los datos con los que cuenta la base

#Formatear datos confirmados 
vec1 <- as.vector(conf_jap)  #transformar de formato matriz a vector de caracteres
vec2 <- vec1[5:143] #filtrar datos en un rango
num1 <- as.numeric(vec2) # transformar a numericos
Confirmados <- as.vector(num1) #vector numerico
Confirmados
##   [1]     2     2     2     2     4     4     7     7    11    15    20    20
##  [13]    20    22    22    22    25    25    26    26    26    28    28    29
##  [25]    43    59    66    74    84    94   105   122   147   159   170   189
##  [37]   214   228   241   256   274   293   331   360   420   461   502   511
##  [49]   581   639   639   701   773   839   839   878   889   924   963  1007
##  [61]  1101  1128  1193  1307  1387  1468  1693  1866  1866  1953  2178  2495
##  [73]  2617  3139  3139  3654  3906  4257  4667  5530  6005  6748  7370  7645
##  [85]  8100  8626  9787 10296 10797 10797 11135 11512 12368 12829 13231 13441
##  [97] 14153 13736 13895 14088 14305 14571 14877 15078 15253 15253 15477 15575
## [109] 15663 15777 15847 15968 16049 16120 16203 16237 16285 16305 16367 16367
## [121] 16424 16513 16536 16550 16581 16623 16651 16598 16673 16716 16751 16787
## [133] 16837 16867 16911 16958 17000 17039 17060
#Hasta el momento van alrededor de 17060 casos confirmados

#Formatear datos de decesos
vec1 <- as.vector(dec_jap)  #transformar de formato matriz a vector de caracteres
vec2 <- vec1[5:143] #filtrar datos en un rango
num1 <- as.numeric(vec2) # transformar a numericos
Decesos <- as.vector(num1) #vector numerico
Decesos
##   [1]   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0   0
##  [19]   0   0   0   0   1   1   1   1   1   1   1   1   1   1   1   1   1   2
##  [37]   4   4   5   6   6   6   6   6   6   6   6  10  10  15  16  19  22  22
##  [55]  27  29  29  29  33  35  41  42  43  45  47  49  52  54  54  56  57  62
##  [73]  63  77  77  85  92  93  94  99  99 108 123 143 146 178 190 222 236 236
##  [91] 263 281 328 345 360 372 385 394 413 430 455 474 487 536 556 556 577 590
## [109] 607 624 633 657 678 697 713 725 744 749 768 768 777 796 808 820 830 846
## [127] 858 881 887 894 898 899 902 905 911 916 915 917 920
#Hasta el momeno van alrededor de 920 decesos

#Formatear datos de recuperados
vec1 <- as.vector(rec_jap)  #transformar de formato matriz a vector de caracteres
vec2 <- vec1[5:143] #filtrar datos en un rango
num1 <- as.numeric(vec2) # transformar a numéricos
Recuperados <- as.vector(num1) #vector numérico
Recuperados
##   [1]     0     0     0     0     1     1     1     1     1     1     1     1
##  [13]     1     1     1     1     1     1     1     4     9     9     9     9
##  [25]    12    12    12    13    18    18    22    22    22    22    22    22
##  [37]    22    22    32    32    32    43    43    43    46    76    76    76
##  [49]   101   118   118   118   118   118   144   144   144   150   191   232
##  [61]   235   235   285   310   359   372   404   424   424   424   472   472
##  [73]   514   514   514   575   592   622   632   685   762   762   784   799
##  [85]   853   901   935  1069  1159  1159  1239  1356  1494  1530  1656  1809
##  [97]  1899  1899  2368  2460  2975  3205  3981  4156  4496  4496  4918  5146
## [109]  5906  8127  8293  8531  8920  9868 10338 10338 11153 11564 11564 11564
## [121] 12672 13005 13244 13413 13612 13810 13973 14096 14213 14267 14342 14463
## [133] 14585 14702 14785 14925 14927 14990 15043
#Hasta el momento van al rededor de 15043 recuperados

#Para construir un marco de datos 
datos1 <- data.frame(Fecha, Confirmados, Decesos, Recuperados)

#Figura 2 de casos confirmados en méxico
#utilizando ggplot
ggplot (data=datos1) +
  geom_line(mapping = aes(x=Fecha, y=Confirmados))

#Figura 3 de Decesos 
ggplot (data=datos1) +
  geom_line(mapping = aes(x=Fecha, y=Decesos))

#Figura 4 de Recuperados
ggplot (data=datos1) +
  geom_line(mapping = aes(x=Fecha, y=Recuperados))

#Animacionn simple 

ggplot(data=datos1) +
  ggtitle("Casos confirmados acumulados COVID-19 en Japon") +
  geom_line(mapping = aes(x=Fecha, y=Confirmados)) +
  transition_reveal(Fecha)

#Figura 5 multi ejes 


#animacion multiejes
ggplot(data=datos1) +
  geom_line(aes(x=Fecha,y=Confirmados),color='red') + 
  geom_line(aes(x=Fecha,y=Decesos),color='blue') + 
  geom_line(aes(x=Fecha,y=Recuperados),color='green')+
  ylab('COVID-19 Japon') + xlab('Fecha') +
  transition_reveal(Fecha)

#Grafica interactiva

gcov <- ggplot(data=datos1) +
  geom_line(aes(x=Fecha,y=Confirmados),color='red') + 
  geom_line(aes(x=Fecha,y=Decesos),color='blue') + 
  geom_line(aes(x=Fecha,y=Recuperados),color='green')+
  ylab('COVID-19 Japon') + xlab('Fecha')

ggplotly(gcov)
#Conclusiones
#(1) Como se puede notar en el gráfico:
#Japon fue uno de los paises que contrajeron el virus mas rapidamente
#esto tendria que ver bastante conque esta muy cercano a china
#y desde febrero comenzaron a surgir los primeros casos confirmados
#(2) a pesar de que la curva de confirmados crecio bastante
#entre marzo hasta finales de abril, la curva se empezo a estabilizar un poco
#en mayo y lo que va de junio
#(3) Tomando en cuenta que la densidad de poblacion de japon es elevada:
#se llega a la conclusion de que en realidad sus contagios no fueron 
#elevados, y mirando la curva de los recuperados, 
#podemos notar que sus confirmados y recuperados van muy a la par
#y los decesos fueron muy pocos
#(de nuevo tomando en cuenta su poblacion y su densidad)
#lo que nos lleva a la pregunta ¿Por que si Mexico y Japon 
#tienen una poblacion bastante parecida, y japon mayor densidad de poblacion
#la incidencia en Mexico ha sido mas fatal?
#(4) De acuerdo al historial de las instituciones de salud de estos dos paises
#y tambien al del comportamiento de sus pobladores, se llega a la conclusion
#de que por ser Japon evidentemente un pais con mas educacion y mejor en lo que respecta
#a las investigaciones del sector salud (datos que son muy bien conocidos)
#estos factores fueron los que probablemnte hicieron que en japon se estabilizara
#en mucho mayor medida las fatalidades y numero de casos