En esta actividad se modelarĆ”n y analizaran los datos de āJOHNS HOPKINS university of medicineā acerca de los casos de infección, recuperación y muertes ocasionadas por COVID-19
Para descargar este código
Debido a que esta es una actividad de uso libre, se deja a disposición de quien guste usar este código.
Download U1A5.RmdEn esta actividad se harÔn recolecciones de datos libres y modelación de los mismos de:
Importación de librerias
setwd("~/EA9") # Este es mi directorio de trabajo, en caso de replicar el código se deberÔ de cambiar el propio.
# pacman ayuda a importar paquetes de manera mas fĆ”cil, en caso de que no se cuente con esta librerĆa utilizar el código install.packages('pacman')
library(pacman) # Se importa pacman
p_load('htmltools','mime','prettydoc','xfun','readr','DT','dplyr','ggplot2','plotly','gganimate','gifski','scales') # Esta función instala e importa paquetes con ayuda de pacmanRecolección y Modelación de datos de COVID-19 JOHNS HOPKINS university of medicine para México
Datos obtenidos de la universidad de JOHNS HOPKINS
Importación de datos de JHONS HOPKINS
Ligas para acceder a los datos
Importación y filtrado de los datos en R
Se guardan los datos crudos en varaibles para su posterior manipulación
url_confimados <- 'https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv'
url_decesos <- 'https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_deaths_global.csv'
url_recuperados <- 'https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_recovered_global.csv'Leer los datos de las urls
Declaración de variables para México
Declaración de una fecha personalizada mas adecuada al formato utilizado en México
Filtrado y formateo de datos
# Confirmados
confirmadosMX <- as.vector(confirmadosMX)
confirmadosMX <- confirmadosMX[5:393]
confirmadosMX <- as.numeric(confirmadosMX)
# Recuperados
recuperadosMX <- as.vector(recuperadosMX)
recuperadosMX <- recuperadosMX[5:393]
recuperadosMX <- as.numeric(recuperadosMX)
# Decesos
decesosMX <- as.vector(decesosMX)
decesosMX <- decesosMX[5:393]
decesosMX <- as.numeric(decesosMX)Visualización de datos en una tabla
El data frame creado anteriormente contienes todos los datos en una tabla, a continuación se podrÔn visualizar los datos en una tabla, esto es solamente ilustrativo.
GrƔfica estatica
graficaCovid <- ggplot(data = covid)+
geom_line(aes(x = Fecha, y = confirmadosMX, colour="Confirmados"))+
geom_line(aes(x = Fecha, y = decesosMX, colour="Decesos"))+
geom_line(aes(x = Fecha, y = recuperadosMX, colour="Recuperados"))+
labs(title="Casos de COVID-19 en MƩxico", subtitle="Fuente: JHU CSSE", x="Fecha",y="COVID-19 en MƩxico",colour="Casos")+
scale_y_continuous(labels=comma)
graficaCovidGrƔfica interactiva sobre los datos de covid-19 en MƩxico
La grÔfica interactiva es muy interesante porque permite ver números especificos con solo poner el cursor sobre la linea
GrƔfica animada
La grƔfica animada sirve para poder observar como los casos van en aumento basƔndose en el aumento de la fecha
Como se puede apreciar la grƔfica animada muestra en base a la fecha como han ido aumentado los casos de confirmados, recuperados y fallecidos debido al COVID-19
Recolección y Modelación de datos de enfermedades crónicas en Sonora.
Importanción de datos del Gobierno federal sobre Enfermedades cronicas para el estado de Sonora
Visualización de datos en una tabla
datatable(enfermedades) # El archivo es demasiado grande es complicado para R poder cargarlo todo para visualizarlo, por ende en este caso se usarĆ” la sentencia head para poder ver el tipo de datos de los encabezado## Warning in instance$preRenderHook(instance): It seems your data is too big
## for client-side DataTables. You may consider server-side processing: https://
## rstudio.github.io/DT/server.html
## Estado Jurisdiccion Uneme CLUES Cve.Persona Genero
## 1 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN5910 Mujer
## 2 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN5953 Mujer
## 3 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN6045 Mujer
## 4 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN6091 Mujer
## 5 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN6138 Mujer
## 6 Guanajuato IRAPUATO UNEME EC IRAPUATO GTSSA017250 GuIRUN5706 Hombre
## Cve.Diagnostico Diagnostico Fecha.Diagnotico
## 1 E78.2 Dislipidemias 02/01/2018
## 2 E78.2 Dislipidemias 02/01/2018
## 3 E78.2 Dislipidemias 02/01/2018
## 4 E78.2 Dislipidemias 02/01/2018
## 5 E78.2 Dislipidemias 02/01/2018
## 6 E78.2 Dislipidemias 02/01/2018
Formateo de datos
GrÔficación de los datos de las enfermedades en sonora
Conclusión
Me parece que R es una herramienta capaz de generar trabajos muy profesionales con la capacidad de transmitir mensajes a traves de los datos como lo vimos con este caso de estudio.