RTALLERSALUD

RAULSC

12/27/2020

REPORTE COVID-19 - 001

Acerca de este documento

  • Este es un documento que explica de manera demostrativa una forma de procesar datos abiertos oficiales de Colombia y convertirlos en análisis y visualizaciones que puedan ser útiles para los ciudadanos ante la pandemia por COVID-19

  • El análisis fue realizado con el objetivo de difundir y democratizar el uso y análisis de datos en México para de esta forma crear una masa crítica que nos permita tomar mejores decisiones en lo colectivo con mejores herramientas y métodos.

  • El código aquí usado está escrito en el lenguaje de programación abierto R y puede ser descargado y así como también sus datos en los hipervínculos que se encuentran abajo.

Este reporte nos va a mostrar diferentes métricas de la evolución y modelación de la pandemia de COVID-19 usando datos oficiales.

  • Datos globales de Johns Hopkins University para Colombia
  • Datos coronavirus.gob.mx para …
  • Datos de enfermedades crónicas en …

Importación de paquetes

setwd("~/GitHub/RTALLERSALUD")
library(pacman)
## Warning: package 'pacman' was built under R version 4.0.3
p_load("base64enc", "htmltools", "mime", "xfun", "prettydoc","readr", "knitr","DT","dplyr", "ggplot2","plotly", "gganimate","gifski","scales")

Descarga de este codigo

Para fines de reproducibilidad se incluye todo el código para su descarga

xfun::embed_file("RTALLERSALUD.Rmd")
Download RTALLERSALUD.Rmd

Datos globales de Johns Hopkins University para Colombia

De lo general a lo particular

Datos obtenidos de:

“Coronavirus COVID-19 Global Cases by the Center for Systems Science and Engineering (CSSE) at Johns Hopkings University (JHU)” https://coronavirus.jhu.edu/map.html

Importar datos de JHU

#Variables
url_conf <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv"
url_muer <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_deaths_global.csv"
url_recu <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_recovered_global.csv"

#Carga
datos_conf <- read.csv(url_conf)
datos_muer <- read.csv(url_muer)
datos_recu <- read.csv(url_recu)

#Variables 2
conf_col <- t(datos_conf[datos_conf$Country.Region=="Colombia" ,])
muer_col <- t(datos_muer[datos_muer$Country.Region=="Colombia" ,])
recu_col <- t(datos_recu[datos_recu$Country.Region=="Colombia" ,])

###Formatear datos * Eliminar campos no utilizables * Formatear fechas * Crear un marco de datos (“data frame”)

#Vector Fecha
Fecha <- seq(from= as.Date("2020-01-22"), to = as.Date("2020-12-27"), by = "day")

#Casos Confirmados
vec1 <- as.vector(conf_col)
vec2 <- vec1[5:345]
num1 <- as.numeric(vec2)
conf <- as.vector(num1)

#Casos Muertes
vec1 <- as.vector(muer_col)
vec2 <- vec1[5:345]
num1 <- as.numeric(vec2)
muer <- as.vector(num1)

#Casos Recuperados
vec1 <- as.vector(recu_col)
vec2 <- vec1[5:345]
num1 <- as.numeric(vec2)
recu <- as.vector(num1)

#Generacion de Data Frame

datos1 <- data.frame(Fecha, conf, muer, recu)

###Graficación de Datos

#Grafica Estatica
gcov <- ggplot(data = datos1) + 
  geom_line(aes(Fecha, conf, colour="confirmados")) +
  geom_line(aes(Fecha, muer, colour="muertes")) +
  geom_line(aes(Fecha, recu, colour="recuperados")) +
  xlab("Fecha") +
  ylab("COVID-19") +
  labs(colour="Casos") +
  ggtitle("Casos de COVID-19 en Colombia (Fuente: JHU CSSE)") +
  scale_y_continuous(labels = comma)
gcov

#Grafica Interactiva
ggplotly(gcov)
#Grafica animada
ggplot(data = datos1) + 
  geom_line(aes(Fecha, conf, colour="confirmados")) +
  geom_line(aes(Fecha, muer, colour="muertes")) +
  geom_line(aes(Fecha, recu, colour="recuperados")) +
  xlab("Fecha") +
  ylab("COVID-19") +
  labs(colour="Casos") +
  ggtitle("Casos de COVID-19 en Colombia (Fuente: JHU CSSE)") +
  scale_y_continuous(labels = comma) +
  transition_reveal(Fecha)

#EJERCICIO 3

###Importar datos locales

# encoding = UTF-8 o latin1
Datos2 <- read.csv("Casos_positivos_de_COVID-19_en_Colombiav0.csv", encoding = "UTF-8")
class(Datos2)
## [1] "data.frame"
head(Datos2)
##   fecha.reporte.web ID.de.caso Fecha.de.notificación
## 1  6/3/2020 0:00:00          1      2/3/2020 0:00:00
## 2  9/3/2020 0:00:00          2      6/3/2020 0:00:00
## 3  9/3/2020 0:00:00          3      7/3/2020 0:00:00
## 4 11/3/2020 0:00:00          4      9/3/2020 0:00:00
## 5 11/3/2020 0:00:00          5      9/3/2020 0:00:00
## 6 11/3/2020 0:00:00          6     10/3/2020 0:00:00
##   Código.DIVIPOLA.departamento Nombre.departamento Código.DIVIPOLA.municipio
## 1                           11              BOGOTA                     11001
## 2                           76               VALLE                     76111
## 3                            5           ANTIOQUIA                      5001
## 4                            5           ANTIOQUIA                      5001
## 5                            5           ANTIOQUIA                      5001
## 6                            5           ANTIOQUIA                      5360
##   Nombre.municipio Edad Unidad.de.medida.de.edad Sexo Tipo.de.contagio
## 1           BOGOTA   19                        1    F        Importado
## 2             BUGA   34                        1    M        Importado
## 3         MEDELLIN   50                        1    F        Importado
## 4         MEDELLIN   55                        1    M      Relacionado
## 5         MEDELLIN   25                        1    M      Relacionado
## 6           ITAGUI   27                        1    F      Relacionado
##   Ubicación.del.caso Estado Código.ISO.del.país Nombre.del.país Recuperado
## 1               Casa   Leve                 380          ITALIA Recuperado
## 2               Casa   Leve                 724          ESPAÑA Recuperado
## 3               Casa   Leve                 724          ESPAÑA Recuperado
## 4               Casa   Leve                  NA                 Recuperado
## 5               Casa   Leve                  NA                 Recuperado
## 6               Casa   Leve                  NA                 Recuperado
##   Fecha.de.inicio.de.síntomas Fecha.de.muerte Fecha.de.diagnóstico
## 1           27/2/2020 0:00:00                     6/3/2020 0:00:00
## 2            4/3/2020 0:00:00                     9/3/2020 0:00:00
## 3           29/2/2020 0:00:00                     9/3/2020 0:00:00
## 4            6/3/2020 0:00:00                    11/3/2020 0:00:00
## 5            8/3/2020 0:00:00                    11/3/2020 0:00:00
## 6            6/3/2020 0:00:00                    11/3/2020 0:00:00
##   Fecha.de.recuperación Tipo.de.recuperación Pertenencia.étnica
## 1     13/3/2020 0:00:00                  PCR                  6
## 2     19/3/2020 0:00:00                  PCR                  5
## 3     15/3/2020 0:00:00                  PCR                  6
## 4     26/3/2020 0:00:00                  PCR                  6
## 5     23/3/2020 0:00:00                  PCR                  6
## 6     26/3/2020 0:00:00                  PCR                  6
##   Nombre.del.grupo.étnico
## 1                        
## 2                        
## 3                        
## 4                        
## 5                        
## 6

###Formateo de datos

Cajica <- t(Datos2[Datos2$Nombre.municipio =="CAJICA", ])
Cajica <- (Datos2[Datos2$Nombre.municipio =="CAJICA", ])

###GRaficacion

#Grafico agrupado
ggplot(Cajica, aes(fill=Sexo, y=Tipo.de.contagio)) +
  geom_bar(position = "dodge", stat = "count") +
  xlab("Numero de Casos") +
  ylab("Tipo de Contagio") +
  ggtitle("Estadistica por tipo de contagio, Fuente: INS")

###Tabla interactiva de datos

datatable(Cajica)