R Markdown

This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see http://rmarkdown.rstudio.com.

When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:

summary(cars)
##      speed           dist       
##  Min.   : 4.0   Min.   :  2.00  
##  1st Qu.:12.0   1st Qu.: 26.00  
##  Median :15.0   Median : 36.00  
##  Mean   :15.4   Mean   : 42.98  
##  3rd Qu.:19.0   3rd Qu.: 56.00  
##  Max.   :25.0   Max.   :120.00

Including Plots

You can also embed plots, for example:

Note that the echo = FALSE parameter was added to the code chunk to prevent printing of the R code that generated the plot.

Tercer ejercicio de estadística aplicada

Analisis de datos abiertos de covid 19

importar

*Importar bibliotecas

library(readr)
library(tidyverse)
## -- Attaching packages ---------------------------------------- tidyverse 1.3.0 --
## v ggplot2 3.3.2     v dplyr   1.0.2
## v tibble  3.0.3     v stringr 1.4.0
## v tidyr   1.1.1     v forcats 0.5.0
## v purrr   0.3.4
## -- Conflicts ------------------------------------------- tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag()    masks stats::lag()
library(plotly)
## 
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
## 
##     last_plot
## The following object is masked from 'package:stats':
## 
##     filter
## The following object is masked from 'package:graphics':
## 
##     layout
library(gifski)
library(gganimate)

*Importar datos

url_conf <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv"
url_decesos <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_deaths_global.csv"
url_recuperados <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_recovered_global.csv"
  • Leer el archivo .csv de las URL

**Da en negritas el texto *a da cursivas el texto

datos_conf <- read.csv(url_conf)
datos_decesos <-read.csv(url_decesos)
datos_recuperados <- read.csv(url_recuperados)
  • Extraer los datos para México
conf_mex <- t(datos_conf [datos_conf$Country.Region=="Mexico" ,])
dec_mex <- t(datos_decesos [datos_decesos$Country.Region=="Mexico" ,])
rec_mex <- t(datos_recuperados [datos_recuperados$Country.Region=="Mexico" ,])

Ordenar los datos

  • Visualización de reconocimiento Esto con una grafica sencilla para conocer como se comportan los datos
plot(conf_mex)
## Warning in xy.coords(x, y, xlabel, ylabel, log): NAs introducidos por coerción

plot(rec_mex)
## Warning in xy.coords(x, y, xlabel, ylabel, log): NAs introducidos por coerción

plot(dec_mex)
## Warning in xy.coords(x, y, xlabel, ylabel, log): NAs introducidos por coerción

  • Ordenar y trnasformar los datos
#Vector de Fecha
Fecha = seq(from = as.Date("2020-01-22"), to = as.Date("2020-09-06"), by = 'day')

#Casos confirmados
vec1 <- as.vector(conf_mex)
vec2 <-vec1[5:233]
num1 <- as.numeric(vec2)
Confirmados <- as.vector(num1)

#decesos 
vec1 <- as.vector(dec_mex)
vec2 <-vec1[5:233]
num1 <- as.numeric(vec2)
Decesos <- as.vector(num1)

#recuperados
vec1 <- as.vector(rec_mex)
vec2 <-vec1[5:233]
num1 <- as.numeric(vec2)
Recuperados <- as.vector(num1)

#Construir data frame (marco de datos) 
datos1 <- data.frame(Fecha, Confirmados, Decesos, Recuperados)

Visualizar

  • A continuaión se presentan 3 gráficas simples elaboradas por ggplot para confirmados, recuperados y decesos.
#Figura 2 Confirmados ggplot
ggplot(data = datos1) +
  geom_line(mapping = aes(x = Fecha, y = Confirmados)) +
  ggtitle("Casos acumulados confirmados de covid-19 en México al día 6 de Septiembre")

  • Gráfico animado objetivo, realizar animaciones de trancision temporal
#Figura 2 Confirmados ggplot
ggplot(data = datos1) +
  geom_line(mapping = aes(x = Fecha, y = Confirmados)) +
  ggtitle("Casos acumulados confirmados de covid-19 en México al día 6 de Septiembre") +
  transition_reveal(Fecha)

  • Gráfico interactivo en conjunto
gcov <- ggplot(data=datos1) +
  geom_line(aes(x=Fecha, y=Confirmados), colour="red") +
  geom_line(aes(x=Fecha, y=Decesos), colour="green") +
  geom_line(aes(x=Fecha, y=Recuperados), colour="blue") +
  ggtitle("Casos acumulados confirmados de covid-19 en México al día 6 de Septiembre") +
  ylab("México") + xlab("Mes")
gcov

  • Gráfico interactivo con plotly
ggplotly(gcov)

Trabajo en base a la infrmación de covid recopilada en websites.

Se importó la información de los URL`s que el maestro nos paso por la reunión, para así obtener los datos que despues se usarian para seguir *con la enseñanza de esta sesión.

Para darle uso a la informacion que se importo, se usaron las lineas de códgo que hacen alucion a datos para poder saber los confirmados, *decesos y recuperados de personas con covid 19, en México.

Depués de haber obtenido los datos los que se hizo fue ordenar los mismos para poder visualizarlos más facilmente y el orden se dio por fechas, *inicios de este año hasta el 3 de Septiembre.

Por último se hizo un marco de datos con toda la data de confirmados, decesos y recuperados, y una grafica muy simple para visualizar esto.