REPORTE COVID-19 - 001
Acerca de este documento
Este es un documento que explica de manera demostrativa una forma de procesar datos abiertos oficiales de Colombia y convertirlos en análisis y visualizaciones que puedan ser útiles para los ciudadanos ante la pandemia por COVID-19
El análisis fue realizado con el objetivo de difundir y democratizar el uso y análisis de datos en México para de esta forma crear una masa crítica que nos permita tomar mejores decisiones en lo colectivo con mejores herramientas y métodos.
El código aquí usado está escrito en el lenguaje de programación abierto R y puede ser descargado y así como también sus datos en los hipervínculos que se encuentran abajo.
Este reporte nos va a mostrar diferentes métricas de la evolución y modelación de la pandemia de COVID-19 usando datos oficiales.
- Datos globales de Johns Hopkins University para Colombia
- Datos coronavirus.gob.mx para …
- Datos de enfermedades crónicas en …
Importación de paquetes
## Warning: package 'pacman' was built under R version 4.0.3
Descarga de este codigo
Para fines de reproducibilidad se incluye todo el código para su descarga
Download RTALLERSALUD.RmdDatos globales de Johns Hopkins University para Colombia
De lo general a lo particular
Datos obtenidos de:
“Coronavirus COVID-19 Global Cases by the Center for Systems Science and Engineering (CSSE) at Johns Hopkings University (JHU)” https://coronavirus.jhu.edu/map.html
Importar datos de JHU
#Variables
url_conf <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv"
url_muer <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_deaths_global.csv"
url_recu <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_recovered_global.csv"
#Carga
datos_conf <- read.csv(url_conf)
datos_muer <- read.csv(url_muer)
datos_recu <- read.csv(url_recu)
#Variables 2
conf_col <- t(datos_conf[datos_conf$Country.Region=="Colombia" ,])
muer_col <- t(datos_muer[datos_muer$Country.Region=="Colombia" ,])
recu_col <- t(datos_recu[datos_recu$Country.Region=="Colombia" ,])###Formatear datos * Eliminar campos no utilizables * Formatear fechas * Crear un marco de datos (“data frame”)
#Vector Fecha
Fecha <- seq(from= as.Date("2020-01-22"), to = as.Date("2020-12-27"), by = "day")
#Casos Confirmados
vec1 <- as.vector(conf_col)
vec2 <- vec1[5:345]
num1 <- as.numeric(vec2)
conf <- as.vector(num1)
#Casos Muertes
vec1 <- as.vector(muer_col)
vec2 <- vec1[5:345]
num1 <- as.numeric(vec2)
muer <- as.vector(num1)
#Casos Recuperados
vec1 <- as.vector(recu_col)
vec2 <- vec1[5:345]
num1 <- as.numeric(vec2)
recu <- as.vector(num1)
#Generacion de Data Frame
datos1 <- data.frame(Fecha, conf, muer, recu)###Graficación de Datos
#Grafica Estatica
gcov <- ggplot(data = datos1) +
geom_line(aes(Fecha, conf, colour="confirmados")) +
geom_line(aes(Fecha, muer, colour="muertes")) +
geom_line(aes(Fecha, recu, colour="recuperados")) +
xlab("Fecha") +
ylab("COVID-19") +
labs(colour="Casos") +
ggtitle("Casos de COVID-19 en Colombia (Fuente: JHU CSSE)") +
scale_y_continuous(labels = comma)
gcov#Grafica animada
ggplot(data = datos1) +
geom_line(aes(Fecha, conf, colour="confirmados")) +
geom_line(aes(Fecha, muer, colour="muertes")) +
geom_line(aes(Fecha, recu, colour="recuperados")) +
xlab("Fecha") +
ylab("COVID-19") +
labs(colour="Casos") +
ggtitle("Casos de COVID-19 en Colombia (Fuente: JHU CSSE)") +
scale_y_continuous(labels = comma) +
transition_reveal(Fecha)#EJERCICIO 3
###Importar datos locales
# encoding = UTF-8 o latin1
Datos2 <- read.csv("Casos_positivos_de_COVID-19_en_Colombiav0.csv", encoding = "UTF-8")
class(Datos2)## [1] "data.frame"
## fecha.reporte.web ID.de.caso Fecha.de.notificación
## 1 6/3/2020 0:00:00 1 2/3/2020 0:00:00
## 2 9/3/2020 0:00:00 2 6/3/2020 0:00:00
## 3 9/3/2020 0:00:00 3 7/3/2020 0:00:00
## 4 11/3/2020 0:00:00 4 9/3/2020 0:00:00
## 5 11/3/2020 0:00:00 5 9/3/2020 0:00:00
## 6 11/3/2020 0:00:00 6 10/3/2020 0:00:00
## Código.DIVIPOLA.departamento Nombre.departamento Código.DIVIPOLA.municipio
## 1 11 BOGOTA 11001
## 2 76 VALLE 76111
## 3 5 ANTIOQUIA 5001
## 4 5 ANTIOQUIA 5001
## 5 5 ANTIOQUIA 5001
## 6 5 ANTIOQUIA 5360
## Nombre.municipio Edad Unidad.de.medida.de.edad Sexo Tipo.de.contagio
## 1 BOGOTA 19 1 F Importado
## 2 BUGA 34 1 M Importado
## 3 MEDELLIN 50 1 F Importado
## 4 MEDELLIN 55 1 M Relacionado
## 5 MEDELLIN 25 1 M Relacionado
## 6 ITAGUI 27 1 F Relacionado
## Ubicación.del.caso Estado Código.ISO.del.país Nombre.del.país Recuperado
## 1 Casa Leve 380 ITALIA Recuperado
## 2 Casa Leve 724 ESPAÑA Recuperado
## 3 Casa Leve 724 ESPAÑA Recuperado
## 4 Casa Leve NA Recuperado
## 5 Casa Leve NA Recuperado
## 6 Casa Leve NA Recuperado
## Fecha.de.inicio.de.síntomas Fecha.de.muerte Fecha.de.diagnóstico
## 1 27/2/2020 0:00:00 6/3/2020 0:00:00
## 2 4/3/2020 0:00:00 9/3/2020 0:00:00
## 3 29/2/2020 0:00:00 9/3/2020 0:00:00
## 4 6/3/2020 0:00:00 11/3/2020 0:00:00
## 5 8/3/2020 0:00:00 11/3/2020 0:00:00
## 6 6/3/2020 0:00:00 11/3/2020 0:00:00
## Fecha.de.recuperación Tipo.de.recuperación Pertenencia.étnica
## 1 13/3/2020 0:00:00 PCR 6
## 2 19/3/2020 0:00:00 PCR 5
## 3 15/3/2020 0:00:00 PCR 6
## 4 26/3/2020 0:00:00 PCR 6
## 5 23/3/2020 0:00:00 PCR 6
## 6 26/3/2020 0:00:00 PCR 6
## Nombre.del.grupo.étnico
## 1
## 2
## 3
## 4
## 5
## 6
###Formateo de datos
Cajica <- t(Datos2[Datos2$Nombre.municipio =="CAJICA", ])
Cajica <- (Datos2[Datos2$Nombre.municipio =="CAJICA", ])###GRaficacion
#Grafico agrupado
ggplot(Cajica, aes(fill=Sexo, y=Tipo.de.contagio)) +
geom_bar(position = "dodge", stat = "count") +
xlab("Numero de Casos") +
ylab("Tipo de Contagio") +
ggtitle("Estadistica por tipo de contagio, Fuente: INS")###Tabla interactiva de datos