Tercer ejercicio de estadística aplicada
Análisis de datos abiertos de covid 19
El objetivo de este ejercicio es analizar el crecimiento de los contagiados, recuperados, fallecidos por COVID-19 en España
Importar
- Importar biblotecas
## -- Attaching packages ------------------------------------------------------------ tidyverse 1.3.0 --
## v ggplot2 3.3.2 v dplyr 1.0.2
## v tibble 3.0.3 v stringr 1.4.0
## v tidyr 1.1.1 v forcats 0.5.0
## v purrr 0.3.4
## -- Conflicts --------------------------------------------------------------- tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
##
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
##
## last_plot
## The following object is masked from 'package:stats':
##
## filter
## The following object is masked from 'package:graphics':
##
## layout
- Importar datos
url_conf <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv"
url_decesos <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_deaths_global.csv"
url_recuperados <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_recovered_global.csv"- Leer el archivo .csv de las URL
este comando descargará los archivos a la computadora a archivos separados por comas
datos_conf <- read.csv(url_conf)
datos_decesos <-read.csv(url_decesos)
datos_recuperados <- read.csv(url_recuperados)- Extraer los datos para España
Ordenar los datos
- Visuzalización de reconocimiento
Esto con unas gráficas sencillas para conocer cómo se comportan los datos para ordenarlos
## Warning in xy.coords(x, y, xlabel, ylabel, log): NAs introducidos por coerción
## Warning in xy.coords(x, y, xlabel, ylabel, log): NAs introducidos por coerción
## Warning in xy.coords(x, y, xlabel, ylabel, log): NAs introducidos por coerción
*Ordenar y transformar los datos
#Vector de Fecha
Fecha = seq(from = as.Date("2020-01-22"), to = as.Date("2020-09-03"), by = 'day')
#Tranformamos todos los datos a vectores y de ahí a datos numéricos.
#Casos confirmados
vec1 <- as.vector(conf_españa)
vec2 <-vec1[5:230]
num1 <- as.numeric(vec2)
Confirmados <- as.vector(num1)
#decesos
vec1 <- as.vector(dec_españa)
vec2 <-vec1[5:230]
num1 <- as.numeric(vec2)
Decesos <- as.vector(num1)
#recuperados
vec1 <- as.vector(rec_españa)
vec2 <-vec1[5:230]
num1 <- as.numeric(vec2)
Recuperados <- as.vector(num1)
#Construir data frame (marco de datos) para poder visualisarlos ordenadamente
#en una tabla.
datos1 <- data.frame(Fecha, Confirmados, Decesos, Recuperados)