INTRODUCCION

En los últimos años el dengue en el departamento del Cauca ha presentado una tendencia de aumento, actualmente en situación de alerta con 192 casos reportados en el transcurso del 2022; cabe resaltar que, durante los años 2020 y 2021, este departamento también estuvo en situación de alerta, ya que su comportamiento epidemiológico superó el límite esperado.

El conjunto de datos a analizar tiene como fin priorizar los barrios en los municipios de Piamonte, Patía y Miranda donde el riesgo por dengue se ha incrementado en el periodo de tiempo (2015-2021) para ello contamos con los siguientes dataset 1) casos de dengue georreferenciados por centroide o geocodificados por la dirección de procedencia del caso con variables como la edad, el sexo, ocupación y pertenencia étnica, 2) muestreo entomológico de adultos realizado en el intradomicilio por primera vez en los municipios de estudio y 3) datos meteorológicos de dos tipos: uno proveniente de estaciones meteorológicas in situ y otro con la información a nivel de cada municipio en formato MSWX.

El objetivo del trabajo será encontrar los barrios(conglomerados) en cada municipio(estrato) haciendo uso de herramientas estadísticas de muestreo, para realizar estimaciones en cuanto a las variables de interes consideradas como la edad, sexo y el nivel de riesgo que tienen los barrios en cada municipio que son considerados como conglomerados de riesgo epidemiológico y entomológico. Un estudio posterior a este sería la elaboración de modelos de predicción para el dengue a escala de barrio y encontrar patrones de comportamientos semejantes a localidades de nuestro país para poder ajustar el modelo a nuestras propias condiciones.

METODOLOGIA

Paquetes y funciones de R

library(pacman)
p_load(TeachingSampling, dplyr, ggplot2, tidyverse)

Lectura de datos

datos_dengue <- read.csv('cases_clean.csv')

Lista de variables

summary(datos_dengue)

##     OBJECTID        Loc_name            Longitud         Latitud      
##  Min.   :  0.00   Length:573         Min.   :-77.16   Min.   :0.9841  
##  1st Qu.: 38.00   Class :character   1st Qu.:-76.98   1st Qu.:1.1194  
##  Median : 86.00   Mode  :character   Median :-76.33   Median :2.1127  
##  Mean   : 86.69                      Mean   :-76.54   Mean   :2.1292  
##  3rd Qu.:133.00                      3rd Qu.:-76.23   3rd Qu.:3.2489  
##  Max.   :189.00                      Max.   :-76.13   Max.   :3.2701  
##    Proceso           Match_addr         Barrio_OSM            Sexo          
##  Length:573         Length:573         Length:573         Length:573        
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##       Edad         Ocupación    Pertenencia.etnica fec_consulta      
##  Min.   : 1.00   Min.   : 110   Min.   :1.000      Length:573        
##  1st Qu.:11.00   1st Qu.:9996   1st Qu.:6.000      Class :character  
##  Median :19.00   Median :9997   Median :6.000      Mode  :character  
##  Mean   :24.81   Mean   :9053   Mean   :5.716                        
##  3rd Qu.:34.00   3rd Qu.:9997   3rd Qu.:6.000                        
##  Max.   :89.00   Max.   :9999   Max.   :6.000                        
##  ini_sintomas        locationID           county         
##  Length:573         Length:573         Length:573        
##  Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character  
##                                                          
##                                                          
##

datos_dengue$county |> unique()

## [1] "Piamonte" "Patía"    "Miranda"

LIMPIEZA

sapply(datos_dengue, function(x) sum(is.na(x)))

##           OBJECTID           Loc_name           Longitud            Latitud 
##                  0                  0                  0                  0 
##            Proceso         Match_addr         Barrio_OSM               Sexo 
##                  0                  0                  0                  0 
##               Edad          Ocupación Pertenencia.etnica       fec_consulta 
##                  0                  0                  0                  0 
##       ini_sintomas         locationID             county 
##                  0                  0                  0

#No existe valores perdidos en la data

PREPROCESAMIENTO

#Transformando a Factor
county_num <- factor(datos_dengue$county,
                     levels=c("Piamonte","Patía","Miranda"),
                     labels=c("1","2","3"))

#Transformando a numérico
county_num <- as.integer(county_num)

#Agregando columna
datos_dengue<-cbind(datos_dengue,county_num)

ANALISIS EXPLORATORIO

#Agrupando los casos por barrios
Nueva_tabla <- datos_dengue %>% group_by(Barrio_OSM) %>% 
  summarize(casos = n() , ciudad = round(mean(county_num),0) )

#Pasando a mayúscula todas las columnas
Nueva_tabla <- mutate_if(Nueva_tabla, is.character, toupper)

#Agrupando los barrios con mismo nombre
Nueva_tabla <- Nueva_tabla %>% group_by(Barrio_OSM) %>% 
  summarize(casos = sum(casos) , ciudad = round(mean(ciudad),0) )

#Eliminando la variable de la primera fila que falto agregar nombre del barrio
Nueva_tabla <- Nueva_tabla[-1,]

#Pasando todos los datos caracteres a mayúsculas para normalizarlos
datos_dengue_ <- mutate_if(datos_dengue, is.character, toupper)

#Transformando barrio de nominal a ordinal
levels <- as.vector(Nueva_tabla$Barrio_OSM)
datos_dengue_ <- datos_dengue_ |>
  mutate(Barrio_OSM_num = match(Barrio_OSM, levels))
#Con match() obtenemos el índice del vector levels del valor que se corresponde con cada valor de Barrio_OSM_num.

RESULTADOS LIMPIEZA/PREPROCESAMIENTO

#Tabla de frecuencia de numero de casos por barrio
Nueva_tabla

## # A tibble: 92 × 3
##    Barrio_OSM        casos ciudad
##    <chr>             <int>  <dbl>
##  1 " LA CASTELLANA"      2      3
##  2 " LA FONDA"           2      2
##  3 "ALTILLO"             4      2
##  4 "ÁNGULO"              1      2
##  5 "ARUBA Y CURAZAO"     3      2
##  6 "BALBOITA"            7      2
##  7 "BARRIO HOSPITAL"     3      2
##  8 "BETANIA"             1      2
##  9 "BR EL ROSARIO"      11      3
## 10 "BRASILIA"            2      1
## # … with 82 more rows
## # ℹ Use `print(n = ...)` to see more rows

#Tabla de data set preprocesado: datos_dengue_

Agregando columna nivel de riesgo de los barrios segun la cantidad de casos

#BRE: Bajo Riesgo Entomologico (De 0 hasta Q1 casos)
Q1 <- quantile(Nueva_tabla$casos, c(0.25), type = 6); Q1

## 25% 
##   1

Nueva_tabla_Q1 <- Nueva_tabla |> filter(casos<=Q1)  |> select(Barrio_OSM) 
levels_Q1 <- as.vector(Nueva_tabla_Q1$Barrio_OSM)

datos_dengue_BRE <- datos_dengue_[datos_dengue_$Barrio_OSM %in% levels_Q1, ] 
datos_dengue_BRE <- datos_dengue_BRE |> mutate(nivel_riesgo = 1) #Bajo = 1

nrow(datos_dengue_BRE)

## [1] 33

#ARE: Alto Riesgo Entomologico (De Q3 a mas casos)
Q3 <- quantile(Nueva_tabla$casos, c(0.75), type = 6); Q3

## 75% 
##   6

Nueva_tabla_Q3 <- Nueva_tabla |> filter(casos>Q3)  |> select(Barrio_OSM) 
levels_Q3 <- as.vector(Nueva_tabla_Q3$Barrio_OSM)

datos_dengue_ARE <- datos_dengue_[datos_dengue_$Barrio_OSM %in% levels_Q3, ] 
datos_dengue_ARE <- datos_dengue_ARE |> mutate(nivel_riesgo = 3) #Bajo = 3

nrow(datos_dengue_ARE)

## [1] 403

#MRE: Riesgo Medio Entomologico (Q1 hasta Q3 casos)

Nueva_tabla_Q1_Q3 <- Nueva_tabla |> filter(casos>Q1 & casos<=Q3)  |> select(Barrio_OSM) 
levels_Q1_Q3 <- as.vector(Nueva_tabla_Q1_Q3$Barrio_OSM)

datos_dengue_MRE <- datos_dengue_[datos_dengue_$Barrio_OSM %in% levels_Q1_Q3, ]
datos_dengue_MRE <- datos_dengue_MRE |> mutate(nivel_riesgo = 2) #Medio = 2

nrow(datos_dengue_MRE)

## [1] 136

#cantidad de Barrios con bajo riesgo entomologico
datos_dengue_BRE|> filter(county_num==1) |> select(Barrio_OSM_num) |> unique()|> nrow()

## [1] 8

datos_dengue_BRE|> filter(county_num==2) |> select(Barrio_OSM_num) |> unique()|> nrow()

## [1] 22

datos_dengue_BRE|> filter(county_num==3) |> select(Barrio_OSM_num) |> unique()|> nrow()

## [1] 3

#cantidad de Barrios con medio riesgo entomologico
datos_dengue_MRE|> filter(county_num==1) |> select(Barrio_OSM_num) |> unique()|> nrow()

## [1] 6

datos_dengue_MRE|> filter(county_num==2) |> select(Barrio_OSM_num) |> unique()|> nrow()

## [1] 23

datos_dengue_MRE|> filter(county_num==3) |> select(Barrio_OSM_num) |> unique()|> nrow()

## [1] 8

#cantidad de Barrios con alto riesgo entomologico
datos_dengue_ARE|> filter(county_num==1) |> select(Barrio_OSM_num) |> unique()|> nrow()

## [1] 4

datos_dengue_ARE|> filter(county_num==2) |> select(Barrio_OSM_num) |> unique()|> nrow()

## [1] 10

datos_dengue_ARE|> filter(county_num==3) |> select(Barrio_OSM_num) |> unique()|> nrow()

## [1] 12

#Tabla final con el campo nivel de riesgo

datos_dengue_final <- rbind(datos_dengue_BRE,datos_dengue_MRE,datos_dengue_ARE)

library(openxlsx)

write.xlsx(datos_dengue_final, "datos_dengue_final.xlsx")

SELECCION DE MUESTRA

Tamaño de muestra

#Población de los municipios departamento de Cauca
# Piamonte = 7379
# Patia = 36544
# Miranda = 40455
N_ = 7379 + 36544 + 40455
# proporción de éxito de casos dengue 
x= 572
p=x/N_
q = 1-p
Z = qnorm(0.975)
e=0.01 
nI = N_*Z**2*p*q/(e**2*(N_-1)+Z**2*p*q)
nI = round(nI,0)
#nI

#Población objetivo de casos dengue georeferenciados en cada municipio:
N1 = 190 #Piamonte
N2 = 207 #Paita
N3 = 175 #Miramda

# Tamaño de muestra para cada estrato Afijacion proporcional

n1 = round(nI*N1/(N1+N2+N3),0)
n2 = round(nI*N2/(N1+N2+N3),0)
n3 = round(nI*N3/(N1+N2+N3),0)

c(n1, n2, n3)

## [1] 86 93 79

Eleccion muestra estrato 1: MAS

UI=1:190
set.seed(22)
sam=S.SI(N1,n1) 
muestra_1=UI[sam]
datos_dengue_1 <- datos_dengue_final |> filter(county_num==1)
datos_dengue_1 <- datos_dengue_1[muestra_1,]

Eleccion muestra estrato 2: MAS

UI=1:207
set.seed(23)
sam=S.SI(N2,n2) 
muestra_2=UI[sam]
datos_dengue_2 <- datos_dengue_final |> filter(county_num==2)
datos_dengue_2 <- datos_dengue_2[muestra_2,]

Eleccion muestra estrato 3: MAS

UI=1:175
set.seed(24)
sam=S.SI(N3,n3) 
muestra_3=UI[sam]
datos_dengue_3 <- datos_dengue_final |> filter(county_num==3)
datos_dengue_3 <- datos_dengue_3[muestra_3,]

Tamaño de muestra de conglomerados de cada estrato

datos_dengue_1$Barrio_OSM |> unique() |> length() #11 Conglomerados (Barrios)

## [1] 11

datos_dengue_2$Barrio_OSM |> unique() |> length() #37 Conglomerados (Barrios)

## [1] 37

datos_dengue_3$Barrio_OSM |> unique() |> length() #22 Conglomerados (Barrios)

## [1] 22

ESTIMACIONES

Conglomeradados dentro del Municipio 1: PIAMONTE

library(TeachingSampling)
UI= as.vector(datos_dengue_1$Barrio_OSM_num|> unique())

NI=11 # Conglomerados total del estrato

nI=10 # muestra de conglomerados

N=nrow(datos_dengue_1) # Muestra del estrato
N

## [1] 86

Mi=table(datos_dengue_1$Barrio_OSM_num);Mi

## 
## 10 13 25 34 49 50 57 67 82 86 89 
##  1 16  2 23  7  2  3  2  1  1 28

M =sum(Mi)/NI;M #En promedio hay 8 casos dengue por barrio(conglomerado)

## [1] 7.818182

#Muestreo aleatorio simple sin reemplazo, elección conglomerados
set.seed(22)
sam=S.SI(NI,nI) 
muestra=UI[sam];muestra #Elección

##  [1] 86 67 25 82 57 10 49 89 13 34

Dengue_1=datos_dengue_1[which(datos_dengue_1$Barrio_OSM_num==muestra[1]),]
Dengue_2=datos_dengue_1[which(datos_dengue_1$Barrio_OSM_num==muestra[2]),]
Dengue_3=datos_dengue_1[which(datos_dengue_1$Barrio_OSM_num==muestra[3]),]
Dengue_4=datos_dengue_1[which(datos_dengue_1$Barrio_OSM_num==muestra[4]),]
Dengue_5=datos_dengue_1[which(datos_dengue_1$Barrio_OSM_num==muestra[5]),]
Dengue_6=datos_dengue_1[which(datos_dengue_1$Barrio_OSM_num==muestra[6]),]
Dengue_7=datos_dengue_1[which(datos_dengue_1$Barrio_OSM_num==muestra[7]),]
Dengue_8=datos_dengue_1[which(datos_dengue_1$Barrio_OSM_num==muestra[8]),]
Dengue_9=datos_dengue_1[which(datos_dengue_1$Barrio_OSM_num==muestra[9]),]
Dengue_10=datos_dengue_1[which(datos_dengue_1$Barrio_OSM_num==muestra[10]),]

#total de datos de los conglomerados seleccionados
Dengue_muestra_1=rbind(Dengue_1,Dengue_2,Dengue_3,Dengue_4,Dengue_5,Dengue_6,
                       Dengue_7,Dengue_8,Dengue_9,Dengue_10)

head(Dengue_muestra_1)

##    OBJECTID                Loc_name  Longitud  Latitud          Proceso
## 1       114        VEREDA TROJAYACO -76.27317 0.984080 GEORREFERENCIADO
## 9       188 CENTRO POBLADO PIAMONTE -76.32567 1.117098 GEORREFERENCIADO
## 20      189 CENTRO POBLADO PIAMONTE -76.32567 1.117098 GEORREFERENCIADO
## 15      108         VEREDA EL MORRO -76.27202 1.057713 GEORREFERENCIADO
## 21      109         VEREDA EL MORRO -76.27202 1.057713 GEORREFERENCIADO
## 16      103       VEREDA SAN ISIDRO -76.38227 1.123567 GEORREFERENCIADO
##                   Match_addr Barrio_OSM Sexo Edad Ocupación Pertenencia.etnica
## 1  NOMBRE DEL CENTRO POBLADO  TROJAYACO    M   40      6112                  1
## 9          NOMBRE DEL BARRIO   PIAMONTE    F   16      9999                  6
## 20         NOMBRE DEL BARRIO   PIAMONTE    F   54      9996                  6
## 15 NOMBRE DEL CENTRO POBLADO   EL MORRO    F   46      9999                  6
## 21 NOMBRE DEL CENTRO POBLADO   EL MORRO    M   13      9997                  6
## 16 NOMBRE DEL CENTRO POBLADO SAN ISIDRO    M   14      9997                  6
##           fec_consulta        ini_sintomas locationID   county county_num
## 1  2016-01-10 00:00:00 2016-01-07 00:00:00   CO:19533 PIAMONTE          1
## 9  2018-02-21 00:00:00 2018-02-19 00:00:00   CO:19533 PIAMONTE          1
## 20 2019-11-12 00:00:00 2019-11-06 00:00:00   CO:19533 PIAMONTE          1
## 15 2018-04-04 00:00:00 2018-04-02 00:00:00   CO:19533 PIAMONTE          1
## 21 2019-11-26 00:00:00 2019-11-25 00:00:00   CO:19533 PIAMONTE          1
## 16 2018-04-12 00:00:00 2018-04-09 00:00:00   CO:19533 PIAMONTE          1
##    Barrio_OSM_num nivel_riesgo
## 1              86            1
## 9              67            2
## 20             67            2
## 15             25            2
## 21             25            2
## 16             82            2

ESTIMACION: MUNICIPIO PIAMONTE

library(openxlsx)

write.xlsx(Dengue_muestra_1, "Dengue_muestra_1.xlsx")

#Estimación del promedio edad 
#----------------------------
barrio=as.factor(as.integer(Dengue_muestra_1$Barrio_OSM_num))

#muestreo por conglomerado barrios
y =T.SIC(Dengue_muestra_1$Edad,barrio);
#y 
res1=E.SI(NI,nI,y)
res1 <-res1/N
#res1 

LI =res1[1,3]-qnorm(1-0.05/2)*res1[2,3]
LS =res1[1,3]+qnorm(1-0.05/2)*res1[2,3]
c(LI,LS)

## [1] 20.23710 31.56522

#Estimación de la edad de las personas sexo masculino
#-----------------------------------------------------
Dominios<-Domains(Dengue_muestra_1$Sexo)
masculino<-Dominios[,2]*Dengue_muestra_1$Edad 

y1<-T.SIC(masculino, barrio) 
res_1<-E.SI(NI,nI,y1)/sum(Dominios[,2])

LI1 =res_1[1,3]-qnorm(1-0.05/2)*res_1[2,3]
LS1 =res_1[1,3]+qnorm(1-0.05/2)*res_1[2,3]
c(LI1,LS1)

## [1] 20.36819 33.02640

#Estimación de la edad de las personas sexo femenino
#-----------------------------------------------------
Dominios<-Domains(Dengue_muestra_1$Sexo)
femenino<-Dominios[,1]*Dengue_muestra_1$Edad 

y1<-T.SIC(femenino, barrio) 
res_1<-E.SI(NI,nI,y1)/sum(Dominios[,1])

LI1 =res_1[1,3]-qnorm(1-0.05/2)*res_1[2,3]
LS1 =res_1[1,3]+qnorm(1-0.05/2)*res_1[2,3]
c(LI1,LS1)

## [1] 20.63120 32.12199

#Estimación de la edad de las personas con riesgo alto
#-----------------------------------------------------
Dominios<-Domains(Dengue_muestra_1$nivel_riesgo)
nivel_alto<-Dominios[,3]*Dengue_muestra_1$Edad

y1<-T.SIC(nivel_alto, barrio) 
res_1<-E.SI(NI,nI,y1)/N

LI1 =res_1[1,3]-qnorm(1-0.05/2)*res_1[2,3]
LS1 =res_1[1,3]+qnorm(1-0.05/2)*res_1[2,3]
c(LI1,LS1)

## [1] 15.98690 28.32008

anva=anova(lm(Dengue_muestra_1$Edad~as.factor(Dengue_muestra_1$Barrio_OSM_num)))
res2=anva
rho= 1-(M/(M-1))*(res2[2,2]/(res2[1,2]+res2[2,2]))
rho

## [1] -0.08051136

eff =1+(M-1)*rho
eff

## [1] 0.4510589

Conglomeradados dentro del Municipio 2: Patia

library(TeachingSampling)
UI= as.vector(datos_dengue_2$Barrio_OSM_num|> unique())

NI=37 # Conglomerados total del estrato

nI=10 # muestra de conglomerados

N=nrow(datos_dengue_2) # Muestra del estrato
N

## [1] 93

Mi=table(datos_dengue_2$Barrio_OSM_num);Mi

## 
##  3  5  6  7 11 12 13 15 17 18 20 21 23 26 32 33 34 35 36 38 39 45 51 55 56 59 
##  1  2  1  1  2  4  7  1  1  1  7  1  3  2  1  2  3  1  1  2  1  2  2  8  2  1 
## 61 63 64 65 68 72 75 76 78 88 91 
##  1 11  3  2  3  2  4  1  2  2  2

#Promedio de los Mi #
M =sum(Mi)/NI;M #En promedio hay 3 casos dengue por barrio(conglomerado)

## [1] 2.513514

#Muestreo aleatorio simple sin reemplazo, elección conglomerados
set.seed(23)
sam=S.SI(NI,nI) 
muestra=UI[sam];muestra #Elección

##  [1] 32 64 11 38  3 63 68  6 13 75

Dengue_1=datos_dengue_2[which(datos_dengue_2$Barrio_OSM_num==muestra[1]),]
Dengue_2=datos_dengue_2[which(datos_dengue_2$Barrio_OSM_num==muestra[2]),]
Dengue_3=datos_dengue_2[which(datos_dengue_2$Barrio_OSM_num==muestra[3]),]
Dengue_4=datos_dengue_2[which(datos_dengue_2$Barrio_OSM_num==muestra[4]),]
Dengue_5=datos_dengue_2[which(datos_dengue_2$Barrio_OSM_num==muestra[5]),]
Dengue_6=datos_dengue_2[which(datos_dengue_2$Barrio_OSM_num==muestra[6]),]
Dengue_7=datos_dengue_2[which(datos_dengue_2$Barrio_OSM_num==muestra[7]),]
Dengue_8=datos_dengue_2[which(datos_dengue_2$Barrio_OSM_num==muestra[8]),]
Dengue_9=datos_dengue_2[which(datos_dengue_2$Barrio_OSM_num==muestra[9]),]
Dengue_10=datos_dengue_2[which(datos_dengue_2$Barrio_OSM_num==muestra[10]),]

#total de datos de los conglomerados seleccionados
Dengue_muestra_2=rbind(Dengue_1,Dengue_2,Dengue_3,Dengue_4,Dengue_5,Dengue_6,
                       Dengue_7,Dengue_8,Dengue_9,Dengue_10)

head(Dengue_muestra_2)

##    OBJECTID              Loc_name  Longitud  Latitud          Proceso
## 3        70        VEREDA EL TUNO -77.04886 2.020125 GEORREFERENCIADO
## 35       64              PABLO VI -76.98885 2.112244 GEORREFERENCIADO
## 61       65              PABLO VI -76.98885 2.112244 GEORREFERENCIADO
## 82       62              PABLO VI -76.98885 2.112244 GEORREFERENCIADO
## 43      110 CENTRO POBLADO BRISAS -77.06070 2.280627 GEORREFERENCIADO
## 62      109 CENTRO POBLADO BRISAS -77.06070 2.280627 GEORREFERENCIADO
##                   Match_addr Barrio_OSM Sexo Edad Ocupación Pertenencia.etnica
## 3  NOMBRE DEL CENTRO POBLADO    EL TUNO    F    7      9997                  6
## 35         NOMBRE DEL BARRIO   PABLO VI    F   22      9996                  5
## 61         NOMBRE DEL BARRIO   PABLO VI    M   16      9997                  5
## 82         NOMBRE DEL BARRIO   PABLO VI    F    8      9997                  6
## 43 NOMBRE DEL CENTRO POBLADO     BRISAS    M   30      6111                  6
## 62 NOMBRE DEL CENTRO POBLADO     BRISAS    M   24      9999                  6
##           fec_consulta        ini_sintomas locationID county county_num
## 3  2016-02-01 00:00:00 2016-01-28 00:00:00   CO:19532  PATÍA          2
## 35 2016-02-19 00:00:00 2016-02-16 00:00:00   CO:19532  PATÍA          2
## 61 2016-02-19 00:00:00 2016-02-16 00:00:00   CO:19532  PATÍA          2
## 82 2015-12-07 00:00:00 2015-12-06 00:00:00   CO:19532  PATÍA          2
## 43 2019-01-21 00:00:00 2019-01-16 00:00:00   CO:19532  PATÍA          2
## 62 2017-05-16 00:00:00 2017-05-16 00:00:00   CO:19532  PATÍA          2
##    Barrio_OSM_num nivel_riesgo
## 3              32            1
## 35             64            2
## 61             64            2
## 82             64            2
## 43             11            2
## 62             11            2

ESTIMACION: MUNICIPIO PATIA

#Estimación del promedio edad 
#----------------------------
barrio=as.factor(as.integer(Dengue_muestra_2$Barrio_OSM_num))
#muestreo por conglomerado barrio
y =T.SIC(Dengue_muestra_2$Edad,barrio);
#y 
res1=E.SI(NI,nI,y)
res1 <-res1/N
#res1 

LI =res1[1,3]-qnorm(1-0.05/2)*res1[2,3]
LS =res1[1,3]+qnorm(1-0.05/2)*res1[2,3]
c(LI,LS)

## [1] 13.40404 37.99811

#Estimación de la edad de las personas sexo masculino
#-----------------------------------------------------
Dominios<-Domains(Dengue_muestra_2$Sexo)
masculino<-Dominios[,2]*Dengue_muestra_2$Edad 

y1<-T.SIC(masculino, barrio) 
res_1<-E.SI(NI,nI,y1)/N

LI1 =res_1[1,3]-qnorm(1-0.05/2)*res_1[2,3]
LS1 =res_1[1,3]+qnorm(1-0.05/2)*res_1[2,3]
c(LI1,LS1)

## [1]  8.07063 25.90571

#Estimación de la edad de las personas sexo femenino
#-----------------------------------------------------
Dominios<-Domains(Dengue_muestra_2$Sexo)
femenino<-Dominios[,1]*Dengue_muestra_2$Edad 

y1<-T.SIC(femenino, barrio) 
res_1<-E.SI(NI,nI,y1)/N

LI1 =res_1[1,3]-qnorm(1-0.05/2)*res_1[2,3]
LS1 =res_1[1,3]+qnorm(1-0.05/2)*res_1[2,3]
c(LI1,LS1)

## [1]  3.96893 13.45688

#Estimación de la edad de las personas con riesgo alto
#------------------------------------------------------
Dominios<-Domains(Dengue_muestra_2$nivel_riesgo)
nivel_alto<-Dominios[,3]*Dengue_muestra_2$Edad 

y1<-T.SIC(nivel_alto, barrio) 
res_1<-E.SI(NI,nI,y1)/N

LI1 =res_1[1,3]-qnorm(1-0.05/2)*res_1[2,3]
LS1 =res_1[1,3]+qnorm(1-0.05/2)*res_1[2,3]
c(LI1,LS1)

## [1]  5.100143 33.889104

# Correlación y Efecto diseño
anva=anova(lm(Dengue_muestra_2$Edad~as.factor(Dengue_muestra_2$Barrio_OSM_num)))
res2=anva
rho= 1-(M/(M-1))*(res2[2,2]/(res2[1,2]+res2[2,2]))
rho

## [1] -0.1713238

eff =1+(M-1)*rho
eff

## [1] 0.7406991

Conglomeradados dentro del Municipio 3: MIRANDA

library(TeachingSampling)
UI= as.vector(datos_dengue_3$Barrio_OSM_num|> unique())

NI=22 # Conglomerados totales del estrato

nI=10 # muestra de conglomerados

N=nrow(datos_dengue_3) #Muestra del estrato
N

## [1] 79

Mi=table(datos_dengue_3$Barrio_OSM_num);Mi

## 
##  1  9 13 16 19 27 30 31 40 41 42 43 44 54 60 69 73 74 80 81 84 87 
##  1  4  8  4  2  3  6  2  5  2  8  1  5  5  1  2  2  1  1 10  2  4

#Promedio de los Mi #
M =sum(Mi)/NI;M #En promedio hay 4 casos dengue por barrio(conglomerado)

## [1] 3.590909

#Muestreo aleatorio simple sin reemplazo, elección conglomerados
set.seed(25)
sam=S.SI(NI,nI) 
muestra=UI[sam];muestra #Elección

##  [1] 74 31 19 60 73 84 13 54 16 27

Dengue_1=datos_dengue_3[which(datos_dengue_3$Barrio_OSM_num==muestra[1]),]
Dengue_2=datos_dengue_3[which(datos_dengue_3$Barrio_OSM_num==muestra[2]),]
Dengue_3=datos_dengue_3[which(datos_dengue_3$Barrio_OSM_num==muestra[3]),]
Dengue_4=datos_dengue_3[which(datos_dengue_3$Barrio_OSM_num==muestra[4]),]
Dengue_5=datos_dengue_3[which(datos_dengue_3$Barrio_OSM_num==muestra[5]),]
Dengue_6=datos_dengue_3[which(datos_dengue_3$Barrio_OSM_num==muestra[6]),]
Dengue_7=datos_dengue_3[which(datos_dengue_3$Barrio_OSM_num==muestra[7]),]
Dengue_8=datos_dengue_3[which(datos_dengue_3$Barrio_OSM_num==muestra[8]),]
Dengue_9=datos_dengue_3[which(datos_dengue_3$Barrio_OSM_num==muestra[9]),]
Dengue_10=datos_dengue_3[which(datos_dengue_3$Barrio_OSM_num==muestra[10]),]

#total de datos de los conglomerados seleccionados
Dengue_muestra_3=rbind(Dengue_1,Dengue_2,Dengue_3,Dengue_4,Dengue_5,Dengue_6,
                       Dengue_7,Dengue_8,Dengue_9,Dengue_10)

head(Dengue_muestra_3)

##    OBJECTID                                 Loc_name  Longitud  Latitud
## 1       174                             CRA 11 11-22 -76.23261 3.254571
## 7       148                               CRA 9 4-25 -76.23158 3.249390
## 12      169 CALLE 5 KRA 8A ESQUINA BARRIO EL TRIUNFO -76.23098 3.250101
## 15       62             C 19  # 6 - 73, EL ESPEJUELO -76.22493 3.266030
## 18      117            CARRERA 5 NUM 19-70 ESPEJUELO -76.22459 3.265994
## 21       47                   CRA 4 # 1-18 MIRALINDO -76.22841 3.246279
##             Proceso        Match_addr   Barrio_OSM Sexo Edad Ocupación
## 1   GEOCODIFICACIÓN NOMBRE DEL BARRIO     PORVENIR    F    2      9999
## 7   GEOCODIFICACIÓN NOMBRE DEL BARRIO   EL TRIUNFO    M    6      9997
## 12  GEOCODIFICACIÓN NOMBRE DEL BARRIO   EL TRIUNFO    M    7      9997
## 15  GEOCODIFICACIÓN NOMBRE DEL BARRIO EL ESPEJUELO    F   16      9997
## 18 GEORREFERENCIADO NOMBRE DEL BARRIO EL ESPEJUELO    M   10      9997
## 21  GEOCODIFICACIÓN NOMBRE DEL BARRIO    MIRALINDO    F   18      9999
##    Pertenencia.etnica        fec_consulta        ini_sintomas locationID
## 1                   6 2020-06-17 00:00:00 2020-06-14 00:00:00   CO:19455
## 7                   6 2020-06-10 00:00:00 2020-06-06 00:00:00   CO:19455
## 12                  6 2020-11-23 00:00:00 2020-11-23 00:00:00   CO:19455
## 15                  5 2016-05-09 00:00:00 2016-05-07 00:00:00   CO:19455
## 18                  6 2019-08-22 00:00:00 2019-08-16 00:00:00   CO:19455
## 21                  6 2016-04-30 00:00:00 2016-04-25 00:00:00   CO:19455
##     county county_num Barrio_OSM_num nivel_riesgo
## 1  MIRANDA          3             74            1
## 7  MIRANDA          3             31            2
## 12 MIRANDA          3             31            2
## 15 MIRANDA          3             19            2
## 18 MIRANDA          3             19            2
## 21 MIRANDA          3             60            2

ESTIMACION: MUNICIPIO MIRANDA

#Estimación del promedio edad 
#----------------------------
barrio=as.factor(as.integer(Dengue_muestra_3$Barrio_OSM_num))
#muestreo por conglomerado barrio
y =T.SIC(Dengue_muestra_3$Edad,barrio);
#y 
res1=E.SI(NI,nI,y)
res1 <-res1/N
#res1 

LI =res1[1,3]-qnorm(1-0.05/2)*res1[2,3]
LS =res1[1,3]+qnorm(1-0.05/2)*res1[2,3]
c(LI,LS)

## [1]  9.209498 27.438604

#Estimación de la edad de las personas sexo masculino
#-----------------------------------------------------
Dominios<-Domains(Dengue_muestra_3$Sexo)
masculino<-Dominios[,2]*Dengue_muestra_3$Edad 

y1<-T.SIC(masculino, barrio) 
res_1<-E.SI(NI,nI,y1)/N

LI1 =res_1[1,3]-qnorm(1-0.05/2)*res_1[2,3]
LS1 =res_1[1,3]+qnorm(1-0.05/2)*res_1[2,3]
c(LI1,LS1)

## [1]  3.616509 11.365769

#Estimación de la edad de las personas sexo Femenino
#---------------------------------------------------
Dominios<-Domains(Dengue_muestra_3$Sexo)
femenino<-Dominios[,1]*Dengue_muestra_3$Edad 

y1<-T.SIC(femenino, barrio) 
res_1<-E.SI(NI,nI,y1)/N

LI1 =res_1[1,3]-qnorm(1-0.05/2)*res_1[2,3]
LS1 =res_1[1,3]+qnorm(1-0.05/2)*res_1[2,3]
c(LI1,LS1)

## [1]  3.459338 18.206485

#Estimación de la edad de las personas con riesgo alto
#-----------------------------------------------------
Dominios<-Domains(Dengue_muestra_3$nivel_riesgo)
nivel_alto<-Dominios[,3]*Dengue_muestra_3$Edad 

y1<-T.SIC(nivel_alto, barrio) 
res_1<-E.SI(NI,nI,y1)/N

LI1 =res_1[1,3]-qnorm(1-0.05/2)*res_1[2,3]
LS1 =res_1[1,3]+qnorm(1-0.05/2)*res_1[2,3]
c(LI1,LS1)

## [1]  3.119865 23.391527

# Correlación y Efecto diseño
anva=anova(lm(Dengue_muestra_3$Edad~as.factor(Dengue_muestra_3$Barrio_OSM_num)))
res2=anva
rho= 1-(M/(M-1))*(res2[2,2]/(res2[1,2]+res2[2,2]))
rho

## [1] 0.2141739

eff =1+(M-1)*rho
eff

## [1] 1.554905

Tabla Resumen Final

CONCLUSIONES

Para la inclusión de la variable nivel de riesgo en nuestro estudio solo nos basamos en el número de casos presentes en la estratificación que venía con el dataset, y no analizamos variables demográficas, socioeconómicas, climatológicas y entomológicas, que se entiende son determinantes del aumento o disminución de las tasas de incidencia en los barrios del municipio. Para analizar la carga de dengue que presentan los municipios de alto, medio o bajo riesgo nos basamos en un estudio entomológico sobre la malaria el cual dividían la población basadas en los cuantiles Q1 y Q3 para dividir la cantidad total de casos en 3 segmentos, ya que sus tratamiento son semejantes a nivel entomológico.
De los resultados de la última tabla se tiene que existe una mayor cantidad de barrios en Miranda (12) con ARE seguido por Patía (10) y con una menor cantidad en Piamonte (4). A pesar que existe una mayor cantidad de barrios con ARE en Miranda (12) estos tienen un menor número de casos concentrados en barrios (143/12 ≈12) en comparación con Piamonte (4) que una menor cantidad barrios, pero con una mayor cantidad de casos (160/4 ≈ 40), esto es traducible a que tienen un mayor foco infeccioso de 40 casos en sus barrios de ARE y deberían priorizar el apoyo a Piamonte. Seguido debería ser prioridad Patía ya que su tasa es de (100/3 ≈ 33) aproximadamente 33 casos por barrio de ARE y por último Miranda con 12 como se mencionó al inicio. La misma analogía es interpretable para los barrios de BRE y MRE, pero en nuestro análisis nos enfocamos en los barrios de prioridad con categoría ARE para sus medidas posteriores.
De las estimaciones intervalares se puede observar a grandes rasgos que en el municipio de Miranda hay mayor presencia de casos de menores de edad debido a su LIC al 95%, seguido de Patía y no se observa tanta presencia de menores en Piamonte, con esto es posible segmentar mayor apoyo médico pediátrico a estos 2 municipios con presencia de casos dengue en Menores. Revisando el dominio con nivel ARE se puede observar que las edades guardan el mismo patrón antes mencionado, es decir población de riesgo alto con minoría de edad en Miranda luego un intervalo en la edad de mayor margen en Patía y uno de menor margen en Piamonte. A nivel de la correlación intraconglomerados analizados en cada municipio se observa que en Piamonte y Patía resultó más preciso realizar el muestreo de conglomerados mientras que en Miranda es más preciso utilizar MAS.
Algunas recomendaciones finales, es importante el saneamiento básico o la calidad de agua; el empleo de mapas en salud ya que proporciona una imagen más precisa de la distribución espacial de las enfermedades, mediante su uso es posible conocer el patrón de distribución geográfica de un suceso y dar posibles explicaciones sobre la expansión del Dengue en el departamento de Cauca. Para diseñar mejores herramientas de control es necesario profundizar en la dinámica de la enfermedad del dengue y su relación con variables espaciales y otros determinantes de la salud que contribuyan a la comprensión del fenómeno y faciliten la planeación de estrategias para la vigilancia y el control de la enfermedad.

BIBLIOGRAFIA

➢ Aguilera, Q. J. A. (s. f.). Diferentes enfoques para la estratificación epidemiológica del dengue. Scielo. Recuperado 14 de agosto de 2022, de http://scielo.sld.cu/scielo.php?script=sci_arttext&pid=S1025-02552012000100014

➢ Gutiérrez Rojas, H. A. (2016). Estrategias de Muestreo - Diseño de encuestas y estimación de parámetros. Ediciones de la U - Carrera.

➢ L. Lohr, S. (2000). Muestreo: Diseño y análisis. International Thomson Editores.

➢ Manual de estratificación según el riesgo de malaria y eliminación de focos de transmisión. (2019, 1 mayo). Región de las Américas. Recuperado 14 de agosto de 2022, de https://www3.paho.org/hq/index.php?option=com_docman&view=download&slug=malaria-technical-advisory-group-session-8-2019-only-in-spanish&Itemid=270&lang=en

➢ Pérez López, C. (2005). Muestreo estadístico: conceptos y problemas resueltos. Pearson Education.

➢ S. (2022, 26 julio). Alerta en el Valle del Cauca ante el aumento de casos de dengue. Noticias de Colombia y el Mundo. Recuperado 14 de agosto de 2022, de https://www.semana.com/nacion/articulo/alerta-en-el-valle-del-cauca-ante-el-aumento-de-casos-de-dengue/202249/

➢ Stratification of Dengue in Cauca - Colombia. (2022, 31 julio). Kaggle. Recuperado 14 de agosto de 2022, de https://www.kaggle.com/datasets/davidrestrepo/stratification-of-dengue-in-cauca-colombia

➢ Técnicas de limpieza y calidad de datos. (2021, 8 mayo). RPubs. Recuperado 14 de agosto de 2022, de https://www.rpubs.com/KarenPCalva/TecnicasLimpiezaCalidadDatosSEE#:%7E:text=R%20como%20herramienta%20para%20limpiar,de%20aprender%20y%20bien%20documentado.

Trabajo_Final_Grupo5

Flores Taco, Alex Jesus

Salsavilca Cayetano, Luis Alfonso

Vargas Estela, Kopeycor

Última edición: 14 08 2022