vamos a realizar una exploracion de datos…

Exploratorio Univariado

## # A tibble: 5 × 5
##   fecha_reporte_web   id_de_caso fecha_de_notificaci_n departamento departamen…¹
##   <dttm>                   <dbl> <dttm>                       <dbl> <chr>       
## 1 2020-09-08 00:00:00     675920 2020-08-27 00:00:00             76 VALLE       
## 2 2020-09-08 00:00:00     675924 2020-08-27 00:00:00             76 VALLE       
## 3 2020-09-08 00:00:00     675925 2020-08-27 00:00:00             76 VALLE       
## 4 2021-03-04 00:00:00    2265227 2021-02-27 00:00:00             76 VALLE       
## 5 2021-03-04 00:00:00    2265228 2021-02-26 00:00:00             76 VALLE       
## # … with abbreviated variable name ¹​departamento_nom

se observa en la base de datos depurada que continene un total de 1125 registros y 25 variables, sobre la que se va aexplorar la informacion

## tabla de indicadores 
require(table1)
## Loading required package: table1
## 
## Attaching package: 'table1'
## The following objects are masked from 'package:base':
## 
##     units, units<-
require(ggplot2)
## Loading required package: ggplot2
#selecciona la fecha mas frec y hace una tabla
tabla=sort(table(datos$fis),decreasing = TRUE)[1:5]
res=data.frame(tabla)
names(res)=c("Fecha","Frecuencia")
res
## # A tibble: 5 × 2
##   Fecha      Frecuencia
##   <fct>           <int>
## 1 2021-01-07         83
## 2 2021-01-06         81
## 3 2021-01-08         53
## 4 2021-01-05         48
## 5 2021-01-23         45
table(datos_filtro$fuente_tipo_contagio)
## 
## Comunitaria Relacionado 
##         725         400
table1(~edad+sexo+fuente_tipo_contagio|Estado,data=datos_filtro,overall=F,extra.col=list(`P-value`=pvalue))
Confirmado
(N=1100)
Fallecido
(N=25)
P-value
edad
Mean (SD) 37.5 (17.1) 72.2 (14.0) <0.001
Median [Min, Max] 35.0 [1.00, 87.0] 72.0 [32.0, 97.0]
sexo
F 657 (59.7%) 8 (32.0%) 0.0098
M 443 (40.3%) 17 (68.0%)
fuente_tipo_contagio
Comunitaria 704 (64.0%) 21 (84.0%) 0.0637
Relacionado 396 (36.0%) 4 (16.0%)