Tercer ejercicio de estadística aplicada

Análisis de datos abiertos de covid 19

El objetivo de este ejercicio es analizar el crecimiento de los contagiados, recuperados, fallecidos por COVID-19 en Japón

Importar

  • Importar biblotecas
library(readr)
library(tidyverse)
## -- Attaching packages -------------------
## v ggplot2 3.3.2     v dplyr   1.0.2
## v tibble  3.0.3     v stringr 1.4.0
## v tidyr   1.1.1     v forcats 0.5.0
## v purrr   0.3.4
## -- Conflicts --- tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
library(plotly)
## 
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
## 
##     last_plot
## The following object is masked from 'package:stats':
## 
##     filter
## The following object is masked from 'package:graphics':
## 
##     layout
library(gifski)
library(gganimate)
  • Importar datos
url_conf <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv"
url_decesos <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_deaths_global.csv"
url_recuperados <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_recovered_global.csv"
  • Leer el archivo .csv de las URL

este comando descargará los archivos a la computadora a archivos separados por comas

datos_conf <- read.csv(url_conf)
datos_decesos <-read.csv(url_decesos)
datos_recuperados <- read.csv(url_recuperados)
  • Extraer los datos para México
conf_Jap <- t(datos_conf [datos_conf$Country.Region=="Japan" ,])
dec_Jap <- t(datos_decesos [datos_decesos$Country.Region=="Japan" ,])
rec_Jap <- t(datos_recuperados [datos_recuperados$Country.Region=="Japan" ,])

Ordenar los datos

  • visuzalización de reconocimiento Esto con una gráfica sencilla para conocer cómo se comportan los datos para ordenarlos
plot(conf_Jap)
## Warning in xy.coords(x, y, xlabel, ylabel, log): NAs introducidos por coerción

plot(rec_Jap)
## Warning in xy.coords(x, y, xlabel, ylabel, log): NAs introducidos por coerción

plot(dec_Jap)
## Warning in xy.coords(x, y, xlabel, ylabel, log): NAs introducidos por coerción

  • ordenar y transformar los datos
#Vector de Fecha
Fecha = seq(from = as.Date("2020-01-22"), to = as.Date("2020-09-06"), by = 'day')

#Casos confirmados
vec1 <- as.vector(conf_Jap)
vec2 <-vec1[5:233]
num1 <- as.numeric(vec2)
Confirmados <- as.vector(num1)

#decesos 
vec1 <- as.vector(dec_Jap)
vec2 <-vec1[5:233]
num1 <- as.numeric(vec2)
Decesos <- as.vector(num1)

#recuperados
vec1 <- as.vector(rec_Jap)
vec2 <-vec1[5:233]
num1 <- as.numeric(vec2)
Recuperados <- as.vector(num1)

#construir data frame (marco de datos)

datos1 <- data.frame(Fecha, Confirmados, Decesos, Recuperados)

Visualizar

  • A continuación se presentan 3 gráficas simples elaboradas con ggplot para Confirmados, Recuperados, decesos e COVID-19 en México, al día 06/09/20
#Figura 2 Confirmados ggplot
ggplot(data = datos1) +
  geom_line(mapping = aes(x = Fecha, y = Confirmados)) +
  ggtitle("Casos acumulados confirmados de COVID-19 en Japón, al día 06/09/20")

#Figura 3 Recuperados ggplot
ggplot(data = datos1) +
  geom_line(mapping = aes(x = Fecha, y = Recuperados)) +
  ggtitle("Casos acumulados de recuperados de COVID-19 en Japón, al día 06/09/20")

#Figura 4 Decesos ggplot
ggplot(data = datos1) +
  geom_line(mapping = aes(x = Fecha, y = Decesos)) +
  ggtitle("Casos acumulados de Decesos de COVID-19 en Japón, al día 06/09/20")

  • Gráfico animado

El objetivo de realizar animacione de transición temporal es ilustrar la manera en la que han crecido los casos confirmados de COVID-19.

ggplot(data = datos1) +
  geom_line(mapping = aes(x = Fecha, y = Confirmados)) +
  ggtitle("Casos acumulados confirmados de COVID-19 en Japón, al día 06/09/20") +
  transition_reveal(Fecha)

  • Gráfico interactivo en conjunto
#Gráfica multiejes 
gcov <- ggplot(data=datos1) +
  geom_line(aes(x=Fecha, y=Confirmados), colour="red") +
  geom_line(aes(x=Fecha, y=Decesos), colour="green") +
  geom_line(aes(x=Fecha, y=Recuperados), colour="blue") +
  ggtitle("Casos acumulados de COVID-19 en Japón, al día 06/09/20") +
  ylab("COVID-19 en Japón") + xlab("Mes")+
  transition_reveal(Fecha)
  
gcov

  • Gráfico interactivo con plotly
ggplotly(gcov)

                    REDACCIÓN

en este problemas buscamos datos libres de coivd del gobierno de Japón para hacer graficas de los casos acumulados confirmados ,deseos,recuperados dia con dia del COVID-19 en Japón ya que este es un tema muy hablado en todo el mundo, ya que nos ha afectado de una gran manera, tanto que afecto nuestra realidad, las primeras graficas son de decesos,recuperados y casos confirmados en las ultimas podemos a las tres juntas, podemos observar japon tiene bajos deseos, pero los confirmados intentaron aplanarce ente el mes de abril a junio pero estos siguieron subiendo y los recuperados son muchos ya que hay pocos decesos, usamos muchas librerias ya que hicimos graficas simples,graficas gif y una grafica interactiva, en lo personal me parecio muy interesante la manea de realizacion de estas graficas, ya que descargamos los datos, nos concentramos en una region, hicimos litas de cada uno(confirmados, decesos,recuperados), pusimos nuestro tipo de fecha, los filtramos y despues graficamos.