En esta actividad se modelarán y analizaran los datos de “JOHNS HOPKINS university of medicine” acerca de los casos de infección, recuperación y muertes ocasionadas por COVID-19
Debido a que esta es una actividad de uso libre, se deja a disposición de quien guste usar este código.
xfun::embed_file("U1A5.Rmd")En esta actividad se harán recolecciones de datos libres y modelación de los mismos de:
setwd("~/Documents/EA9") # Este es mi directorio de trabajo, en caso de replicar el código se deberá de cambiar el propio.
# pacman ayuda a importar paquetes de manera mas fácil, en caso de que no se cuente con esta librería utilizar el código install.packages('pacman')
library(pacman) # Se importa pacman
p_load('htmltools','mime','prettydoc','xfun','readr','DT','dplyr','ggplot2','plotly','gganimate','gifski','scales') # Esta función instala e importa paquetes con ayuda de pacmanDatos obtenidos de la universidad de JOHNS HOPKINS
url_confimados <- 'https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv'
url_decesos <- 'https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_deaths_global.csv'
url_recuperados <- 'https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_recovered_global.csv'confirmados <- read.csv(url_confimados) # Datos de personas confirmadas de covid-19
decesos <- read.csv(url_decesos) # Datos de personas fallecidas de covid-19
recuperados <- read.csv(url_recuperados) # Datos de personas recuperadas de covid-19confirmadosMX <- t(confirmados[confirmados$Country.Region=='Mexico' ,])
decesosMX <- t(decesos[decesos$Country.Region=='Mexico' ,])
recuperadosMX <- t(recuperados[recuperados$Country.Region=='Mexico' ,])# Formato: YYYY/MM/DD
Fecha <- seq(from = as.Date('2020/01/22'), to = as.Date('2021/02/13'), by = 'day')# Confirmados
confirmadosMX <- as.vector(confirmadosMX)
confirmadosMX <- confirmadosMX[5:393]
confirmadosMX <- as.numeric(confirmadosMX)
# Recuperados
recuperadosMX <- as.vector(recuperadosMX)
recuperadosMX <- recuperadosMX[5:393]
recuperadosMX <- as.numeric(recuperadosMX)
# Decesos
decesosMX <- as.vector(decesosMX)
decesosMX <- decesosMX[5:393]
decesosMX <- as.numeric(decesosMX)# Es esta apartado se crea un data frame, de esta manera se trabajará de una manera mas organizada, ademas de la facilidad de manipulas y visualizar los datos, ya que están dentro de una misma "matriz"
covid <- data.frame(Fecha,confirmadosMX,recuperadosMX,decesosMX)El data frame creado anteriormente contienes todos los datos en una tabla, a continuación se podrán visualizar los datos en una tabla, esto es solamente ilustrativo.
datatable(covid)graficaCovid <- ggplot(data = covid)+
geom_line(aes(x = Fecha, y = confirmadosMX, colour="Confirmados"))+
geom_line(aes(x = Fecha, y = decesosMX, colour="Decesos"))+
geom_line(aes(x = Fecha, y = recuperadosMX, colour="Recuperados"))+
labs(title="Casos de COVID-19 en México", subtitle="Fuente: JHU CSSE", x="Fecha",y="COVID-19 en México",colour="Casos")+
scale_y_continuous(labels=comma)
graficaCovidggplotly(graficaCovid)La gráfica interactiva es muy interesante porque permite ver números especificos con solo poner el cursor sobre la linea
La gráfica animada sirve para poder observar como los casos van en aumento basándose en el aumento de la fecha
graficaCovid + transition_reveal(Fecha)Como se puede apreciar la gráfica animada muestra en base a la fecha como han ido aumentado los casos de confirmados, recuperados y fallecidos debido al COVID-19
En caso de no encontrar los datos o que no permita la descarga, se pueden descargar de aquí
xfun::embed_file("Diagnosticos18.csv")enfermedades <- read.csv("Diagnosticos18.csv", encoding = "UTF-8")datatable(enfermedades) # El archivo es demasiado grande es complicado para R poder cargarlo todo para visualizarlo, por ende en este caso se usará la sentencia head para poder ver el tipo de datos de los encabezado## Warning in instance$preRenderHook(instance): It seems your data is too big
## for client-side DataTables. You may consider server-side processing: https://
## rstudio.github.io/DT/server.html
head(enfermedades)## Estado Jurisdiccion Uneme CLUES Cve.Persona Genero
## 1 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN5910 Mujer
## 2 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN5953 Mujer
## 3 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN6045 Mujer
## 4 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN6091 Mujer
## 5 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN6138 Mujer
## 6 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN5706 Hombre
## Cve.Diagnostico Diagnostico Fecha.Diagnotico
## 1 E78.2 Dislipidemias 02/01/2018
## 2 E78.2 Dislipidemias 02/01/2018
## 3 E78.2 Dislipidemias 02/01/2018
## 4 E78.2 Dislipidemias 02/01/2018
## 5 E78.2 Dislipidemias 02/01/2018
## 6 E78.2 Dislipidemias 02/01/2018
enfermedadesS <- t(enfermedades[enfermedades$Estado == "Sonora", ])
enfermedadesS <- (enfermedades[enfermedades$Estado == "Sonora", ])enfermedadesG <- ggplot(enfermedadesS, aes(fill=Jurisdiccion, y=Diagnostico))+
geom_bar(position = "dodge", stat="count")+
labs(title="Enfermedades cronicas en Sonora, 2018",subtitle = "Fuente: CENAPRECE",x="Número de casos",y="Diagnostico")
enfermedadesGggplotly(enfermedadesG)datatable(enfermedadesS)## Warning in instance$preRenderHook(instance): It seems your data is too big
## for client-side DataTables. You may consider server-side processing: https://
## rstudio.github.io/DT/server.html