vamos a realizar una exploracion de datos…
## # A tibble: 5 × 5
## fecha_reporte_web id_de_caso fecha_de_notificaci_n departamento departamen…¹
## <dttm> <dbl> <dttm> <dbl> <chr>
## 1 2020-09-08 00:00:00 675920 2020-08-27 00:00:00 76 VALLE
## 2 2020-09-08 00:00:00 675924 2020-08-27 00:00:00 76 VALLE
## 3 2020-09-08 00:00:00 675925 2020-08-27 00:00:00 76 VALLE
## 4 2021-03-04 00:00:00 2265227 2021-02-27 00:00:00 76 VALLE
## 5 2021-03-04 00:00:00 2265228 2021-02-26 00:00:00 76 VALLE
## # … with abbreviated variable name ¹departamento_nom
se observa en la base de datos depurada que continene un total de 1125 registros y 25 variables, sobre la que se va aexplorar la informacion
## tabla de indicadores
require(table1)
## Loading required package: table1
##
## Attaching package: 'table1'
## The following objects are masked from 'package:base':
##
## units, units<-
require(ggplot2)
## Loading required package: ggplot2
#selecciona la fecha mas frec y hace una tabla
tabla=sort(table(datos$fis),decreasing = TRUE)[1:5]
res=data.frame(tabla)
names(res)=c("Fecha","Frecuencia")
res
## # A tibble: 5 × 2
## Fecha Frecuencia
## <fct> <int>
## 1 2021-01-07 83
## 2 2021-01-06 81
## 3 2021-01-08 53
## 4 2021-01-05 48
## 5 2021-01-23 45
table(datos_filtro$fuente_tipo_contagio)
##
## Comunitaria Relacionado
## 725 400
table1(~edad+sexo+fuente_tipo_contagio|Estado,data=datos_filtro,overall=F,extra.col=list(`P-value`=pvalue))
| Confirmado (N=1100) |
Fallecido (N=25) |
P-value | |
|---|---|---|---|
| edad | |||
| Mean (SD) | 37.5 (17.1) | 72.2 (14.0) | <0.001 |
| Median [Min, Max] | 35.0 [1.00, 87.0] | 72.0 [32.0, 97.0] | |
| sexo | |||
| F | 657 (59.7%) | 8 (32.0%) | 0.0098 |
| M | 443 (40.3%) | 17 (68.0%) | |
| fuente_tipo_contagio | |||
| Comunitaria | 704 (64.0%) | 21 (84.0%) | 0.0637 |
| Relacionado | 396 (36.0%) | 4 (16.0%) |