El siguiente informe tiene resultados comparativos de los casos de covid en colombia repotados diariamente por el instituto Departamental de salud INS.
### IMPORTAR LIBRERIAS Y DATOS
require(ggplot2)
require(RSocrata)
require(lubridate)
require(plotly)
token <- "ew2rEMuESuzWPqMkyPfOSGJgE"
casos_ins <- read.socrata("https://www.datos.gov.co/resource/gt2j-8ykr.json", app_token = token)
head(casos_ins,5)
## id_de_caso fecha_de_notificaci_n codigo_divipola ciudad_de_ubicaci_n
## 1 1 2020-03-02T00:00:00.000 11001 Bogotá D.C.
## 2 2 2020-03-06T00:00:00.000 76111 Guadalajara de Buga
## 3 3 2020-03-07T00:00:00.000 5001 Medellín
## 4 4 2020-03-09T00:00:00.000 5001 Medellín
## 5 5 2020-03-09T00:00:00.000 5001 Medellín
## departamento atenci_n edad sexo tipo estado pa_s_de_procedencia
## 1 Bogotá D.C. Recuperado 19 F Importado Leve Italia
## 2 Valle del Cauca Recuperado 34 M Importado Leve España
## 3 Antioquia Recuperado 50 F Importado Leve España
## 4 Antioquia Recuperado 55 M Relacionado Leve Colombia
## 5 Antioquia Recuperado 25 M Relacionado Leve Colombia
## fis fecha_diagnostico fecha_recuperado
## 1 2020-02-27T00:00:00.000 2020-03-06T00:00:00.000 2020-03-13T00:00:00.000
## 2 2020-03-04T00:00:00.000 2020-03-09T00:00:00.000 2020-03-19T00:00:00.000
## 3 2020-02-29T00:00:00.000 2020-03-09T00:00:00.000 2020-03-15T00:00:00.000
## 4 2020-03-06T00:00:00.000 2020-03-11T00:00:00.000 2020-03-26T00:00:00.000
## 5 2020-03-08T00:00:00.000 2020-03-11T00:00:00.000 2020-03-23T00:00:00.000
## fecha_reporte_web tipo_recuperaci_n fecha_de_muerte
## 1 2020-03-06T00:00:00.000 PCR <NA>
## 2 2020-03-09T00:00:00.000 PCR <NA>
## 3 2020-03-09T00:00:00.000 PCR <NA>
## 4 2020-03-11T00:00:00.000 PCR <NA>
## 5 2020-03-11T00:00:00.000 PCR <NA>
Como se puede observar en la anterior tabla esta contiene 36635 registros de casos positivos de covid 19 para Colombia a la fecha 6 de junio de 2020 cada caso tiene un total de 16 varables medidas dentro de las cuales se encuentran caracteristicas de la persona (edad, sexo….) el estado y el lugar actual donde se recupera entre otros.
### Explorando la Curva Epidemica
casos_ins$fecha_reporte=as.Date(casos_ins$fecha_de_notificaci_n)
g1=ggplot(casos_ins,aes(x=fecha_reporte))+geom_bar()+ theme_bw()
ggplotly(g1)
Se observa en la figura que el comportamiento de los casos positivos en la ultimas semanas es decreciente.
###Crear Variable Estado (muerto o vivo)
casos_ins$muerto=casos_ins$fecha_de_muerte!="NA"
tabla1=table(casos_ins$muerto)/36635*100
tabla1
##
## TRUE
## 3.218234
## Crear Curva Epidemica con muertos
g2=ggplot(casos_ins,aes(x=fecha_reporte,fill=muerto))+geom_bar()+theme_bw()
ggplotly(g2)
Se observa que para la Colombia a la fecha la mortalidad por Covid 19 es de 3.2182339.
tabla2=sort(table(casos_ins$departamento),decreasing = TRUE)[1:10]
tabla2
##
## Bogotá D.C. Cartagena D.T. y C. Valle del Cauca Barranquilla D.E.
## 12185 3610 3526 2978
## Atlántico Amazonas Nariño Antioquia
## 2830 1954 1431 1360
## Cundinamarca Meta
## 1141 987
Se observa que los Departamentos con mayores casos de covid 19 en colombia hasta la fecha son Bogotá DC, Cartagena D.T, Valle del Cauca, Barranquilla D.E.
require(lubridate)
fecha_sintomas=as.Date(casos_ins$fis)
fecha_notifica=as.Date(casos_ins$fecha_de_notificaci_n)
casos_ins$demora=difftime(fecha_notifica,fecha_sintomas,units = "days") ##resta de fechas
casos_ins$semana=as.factor(lubridate::week(fecha_sintomas))
g3=ggplot(casos_ins,aes(x=semana,y=demora,fill=semana))+geom_boxplot()+theme_bw()
ggplotly(g3)
Se observa que los tiempos o demoras enla entrega de los resultados son mejores a medida que pasan las semanas, iniciamos con la medida de 32 días y a la fecha se evidencia hasta 1 día. En conclusión a medida que ha pasado el tiempo la entrega de pruebas a mejorado.