En los últimos años el dengue en el departamento del Cauca ha presentado una tendencia de aumento, actualmente en situación de alerta con 192 casos reportados en el transcurso del 2022; cabe resaltar que, durante los años 2020 y 2021, este departamento también estuvo en situación de alerta, ya que su comportamiento epidemiológico superó el límite esperado.
El conjunto de datos a analizar tiene como fin priorizar los barrios en los municipios de Piamonte, Patía y Miranda donde el riesgo por dengue se ha incrementado en el periodo de tiempo (2015-2021) para ello contamos con los siguientes dataset 1) casos de dengue georreferenciados por centroide o geocodificados por la dirección de procedencia del caso con variables como la edad, el sexo, ocupación y pertenencia étnica, 2) muestreo entomológico de adultos realizado en el intradomicilio por primera vez en los municipios de estudio y 3) datos meteorológicos de dos tipos: uno proveniente de estaciones meteorológicas in situ y otro con la información a nivel de cada municipio en formato MSWX.
El objetivo del trabajo será encontrar los barrios(conglomerados) en cada municipio(estrato) haciendo uso de herramientas estadísticas de muestreo, para realizar estimaciones en cuanto a las variables de interes consideradas como la edad, sexo y el nivel de riesgo que tienen los barrios en cada municipio que son considerados como conglomerados de riesgo epidemiológico y entomológico. Un estudio posterior a este sería la elaboración de modelos de predicción para el dengue a escala de barrio y encontrar patrones de comportamientos semejantes a localidades de nuestro país para poder ajustar el modelo a nuestras propias condiciones.
library(pacman)
p_load(TeachingSampling, dplyr, ggplot2, tidyverse)datos_dengue <- read.csv('cases_clean.csv')summary(datos_dengue)## OBJECTID Loc_name Longitud Latitud
## Min. : 0.00 Length:573 Min. :-77.16 Min. :0.9841
## 1st Qu.: 38.00 Class :character 1st Qu.:-76.98 1st Qu.:1.1194
## Median : 86.00 Mode :character Median :-76.33 Median :2.1127
## Mean : 86.69 Mean :-76.54 Mean :2.1292
## 3rd Qu.:133.00 3rd Qu.:-76.23 3rd Qu.:3.2489
## Max. :189.00 Max. :-76.13 Max. :3.2701
## Proceso Match_addr Barrio_OSM Sexo
## Length:573 Length:573 Length:573 Length:573
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
## Edad Ocupación Pertenencia.etnica fec_consulta
## Min. : 1.00 Min. : 110 Min. :1.000 Length:573
## 1st Qu.:11.00 1st Qu.:9996 1st Qu.:6.000 Class :character
## Median :19.00 Median :9997 Median :6.000 Mode :character
## Mean :24.81 Mean :9053 Mean :5.716
## 3rd Qu.:34.00 3rd Qu.:9997 3rd Qu.:6.000
## Max. :89.00 Max. :9999 Max. :6.000
## ini_sintomas locationID county
## Length:573 Length:573 Length:573
## Class :character Class :character Class :character
## Mode :character Mode :character Mode :character
##
##
##
datos_dengue$county |> unique()## [1] "Piamonte" "Patía" "Miranda"
sapply(datos_dengue, function(x) sum(is.na(x)))## OBJECTID Loc_name Longitud Latitud
## 0 0 0 0
## Proceso Match_addr Barrio_OSM Sexo
## 0 0 0 0
## Edad Ocupación Pertenencia.etnica fec_consulta
## 0 0 0 0
## ini_sintomas locationID county
## 0 0 0
#No existe valores perdidos en la data#Transformando a Factor
county_num <- factor(datos_dengue$county,
levels=c("Piamonte","Patía","Miranda"),
labels=c("1","2","3"))
#Transformando a numérico
county_num <- as.integer(county_num)
#Agregando columna
datos_dengue<-cbind(datos_dengue,county_num) #Agrupando los casos por barrios
Nueva_tabla <- datos_dengue %>% group_by(Barrio_OSM) %>%
summarize(casos = n() , ciudad = round(mean(county_num),0) )#Pasando a mayúscula todas las columnas
Nueva_tabla <- mutate_if(Nueva_tabla, is.character, toupper)
#Agrupando los barrios con mismo nombre
Nueva_tabla <- Nueva_tabla %>% group_by(Barrio_OSM) %>%
summarize(casos = sum(casos) , ciudad = round(mean(ciudad),0) )
#Eliminando la variable de la primera fila que falto agregar nombre del barrio
Nueva_tabla <- Nueva_tabla[-1,]#Pasando todos los datos caracteres a mayúsculas para normalizarlos
datos_dengue_ <- mutate_if(datos_dengue, is.character, toupper)#Transformando barrio de nominal a ordinal
levels <- as.vector(Nueva_tabla$Barrio_OSM)
datos_dengue_ <- datos_dengue_ |>
mutate(Barrio_OSM_num = match(Barrio_OSM, levels))
#Con match() obtenemos el índice del vector levels del valor que se corresponde con cada valor de Barrio_OSM_num. #Tabla de frecuencia de numero de casos por barrio
Nueva_tabla## # A tibble: 92 × 3
## Barrio_OSM casos ciudad
## <chr> <int> <dbl>
## 1 " LA CASTELLANA" 2 3
## 2 " LA FONDA" 2 2
## 3 "ALTILLO" 4 2
## 4 "ÁNGULO" 1 2
## 5 "ARUBA Y CURAZAO" 3 2
## 6 "BALBOITA" 7 2
## 7 "BARRIO HOSPITAL" 3 2
## 8 "BETANIA" 1 2
## 9 "BR EL ROSARIO" 11 3
## 10 "BRASILIA" 2 1
## # … with 82 more rows
## # ℹ Use `print(n = ...)` to see more rows
#Tabla de data set preprocesado: datos_dengue_#BRE: Bajo Riesgo Entomologico (De 0 hasta Q1 casos)
Q1 <- quantile(Nueva_tabla$casos, c(0.25), type = 6); Q1## 25%
## 1
Nueva_tabla_Q1 <- Nueva_tabla |> filter(casos<=Q1) |> select(Barrio_OSM)
levels_Q1 <- as.vector(Nueva_tabla_Q1$Barrio_OSM)
datos_dengue_BRE <- datos_dengue_[datos_dengue_$Barrio_OSM %in% levels_Q1, ]
datos_dengue_BRE <- datos_dengue_BRE |> mutate(nivel_riesgo = 1) #Bajo = 1
nrow(datos_dengue_BRE)## [1] 33
#ARE: Alto Riesgo Entomologico (De Q3 a mas casos)
Q3 <- quantile(Nueva_tabla$casos, c(0.75), type = 6); Q3## 75%
## 6
Nueva_tabla_Q3 <- Nueva_tabla |> filter(casos>Q3) |> select(Barrio_OSM)
levels_Q3 <- as.vector(Nueva_tabla_Q3$Barrio_OSM)
datos_dengue_ARE <- datos_dengue_[datos_dengue_$Barrio_OSM %in% levels_Q3, ]
datos_dengue_ARE <- datos_dengue_ARE |> mutate(nivel_riesgo = 3) #Bajo = 3
nrow(datos_dengue_ARE)## [1] 403
#MRE: Riesgo Medio Entomologico (Q1 hasta Q3 casos)
Nueva_tabla_Q1_Q3 <- Nueva_tabla |> filter(casos>Q1 & casos<=Q3) |> select(Barrio_OSM)
levels_Q1_Q3 <- as.vector(Nueva_tabla_Q1_Q3$Barrio_OSM)
datos_dengue_MRE <- datos_dengue_[datos_dengue_$Barrio_OSM %in% levels_Q1_Q3, ]
datos_dengue_MRE <- datos_dengue_MRE |> mutate(nivel_riesgo = 2) #Medio = 2
nrow(datos_dengue_MRE)## [1] 136
#cantidad de Barrios con bajo riesgo entomologico
datos_dengue_BRE|> filter(county_num==1) |> select(Barrio_OSM_num) |> unique()|> nrow()## [1] 8
datos_dengue_BRE|> filter(county_num==2) |> select(Barrio_OSM_num) |> unique()|> nrow()## [1] 22
datos_dengue_BRE|> filter(county_num==3) |> select(Barrio_OSM_num) |> unique()|> nrow()## [1] 3
#cantidad de Barrios con medio riesgo entomologico
datos_dengue_MRE|> filter(county_num==1) |> select(Barrio_OSM_num) |> unique()|> nrow()## [1] 6
datos_dengue_MRE|> filter(county_num==2) |> select(Barrio_OSM_num) |> unique()|> nrow()## [1] 23
datos_dengue_MRE|> filter(county_num==3) |> select(Barrio_OSM_num) |> unique()|> nrow()## [1] 8
#cantidad de Barrios con alto riesgo entomologico
datos_dengue_ARE|> filter(county_num==1) |> select(Barrio_OSM_num) |> unique()|> nrow()## [1] 4
datos_dengue_ARE|> filter(county_num==2) |> select(Barrio_OSM_num) |> unique()|> nrow()## [1] 10
datos_dengue_ARE|> filter(county_num==3) |> select(Barrio_OSM_num) |> unique()|> nrow()## [1] 12
#Tabla final con el campo nivel de riesgo
datos_dengue_final <- rbind(datos_dengue_BRE,datos_dengue_MRE,datos_dengue_ARE)library(openxlsx)
write.xlsx(datos_dengue_final, "datos_dengue_final.xlsx")#Población de los municipios departamento de Cauca
# Piamonte = 7379
# Patia = 36544
# Miranda = 40455
N_ = 7379 + 36544 + 40455
# proporción de éxito de casos dengue
x= 572
p=x/N_
q = 1-p
Z = qnorm(0.975)
e=0.01
nI = N_*Z**2*p*q/(e**2*(N_-1)+Z**2*p*q)
nI = round(nI,0)
#nI
#Población objetivo de casos dengue georeferenciados en cada municipio:
N1 = 190 #Piamonte
N2 = 207 #Paita
N3 = 175 #Miramda
# Tamaño de muestra para cada estrato Afijacion proporcional
n1 = round(nI*N1/(N1+N2+N3),0)
n2 = round(nI*N2/(N1+N2+N3),0)
n3 = round(nI*N3/(N1+N2+N3),0)
c(n1, n2, n3)## [1] 86 93 79
UI=1:190
set.seed(22)
sam=S.SI(N1,n1)
muestra_1=UI[sam]
datos_dengue_1 <- datos_dengue_final |> filter(county_num==1)
datos_dengue_1 <- datos_dengue_1[muestra_1,]UI=1:207
set.seed(23)
sam=S.SI(N2,n2)
muestra_2=UI[sam]
datos_dengue_2 <- datos_dengue_final |> filter(county_num==2)
datos_dengue_2 <- datos_dengue_2[muestra_2,]UI=1:175
set.seed(24)
sam=S.SI(N3,n3)
muestra_3=UI[sam]
datos_dengue_3 <- datos_dengue_final |> filter(county_num==3)
datos_dengue_3 <- datos_dengue_3[muestra_3,]datos_dengue_1$Barrio_OSM |> unique() |> length() #11 Conglomerados (Barrios)## [1] 11
datos_dengue_2$Barrio_OSM |> unique() |> length() #37 Conglomerados (Barrios)## [1] 37
datos_dengue_3$Barrio_OSM |> unique() |> length() #22 Conglomerados (Barrios)## [1] 22
library(TeachingSampling)
UI= as.vector(datos_dengue_1$Barrio_OSM_num|> unique())
NI=11 # Conglomerados total del estrato
nI=10 # muestra de conglomerados
N=nrow(datos_dengue_1) # Muestra del estrato
N## [1] 86
Mi=table(datos_dengue_1$Barrio_OSM_num);Mi##
## 10 13 25 34 49 50 57 67 82 86 89
## 1 16 2 23 7 2 3 2 1 1 28
M =sum(Mi)/NI;M #En promedio hay 8 casos dengue por barrio(conglomerado)## [1] 7.818182
#Muestreo aleatorio simple sin reemplazo, elección conglomerados
set.seed(22)
sam=S.SI(NI,nI)
muestra=UI[sam];muestra #Elección## [1] 86 67 25 82 57 10 49 89 13 34
Dengue_1=datos_dengue_1[which(datos_dengue_1$Barrio_OSM_num==muestra[1]),]
Dengue_2=datos_dengue_1[which(datos_dengue_1$Barrio_OSM_num==muestra[2]),]
Dengue_3=datos_dengue_1[which(datos_dengue_1$Barrio_OSM_num==muestra[3]),]
Dengue_4=datos_dengue_1[which(datos_dengue_1$Barrio_OSM_num==muestra[4]),]
Dengue_5=datos_dengue_1[which(datos_dengue_1$Barrio_OSM_num==muestra[5]),]
Dengue_6=datos_dengue_1[which(datos_dengue_1$Barrio_OSM_num==muestra[6]),]
Dengue_7=datos_dengue_1[which(datos_dengue_1$Barrio_OSM_num==muestra[7]),]
Dengue_8=datos_dengue_1[which(datos_dengue_1$Barrio_OSM_num==muestra[8]),]
Dengue_9=datos_dengue_1[which(datos_dengue_1$Barrio_OSM_num==muestra[9]),]
Dengue_10=datos_dengue_1[which(datos_dengue_1$Barrio_OSM_num==muestra[10]),]
#total de datos de los conglomerados seleccionados
Dengue_muestra_1=rbind(Dengue_1,Dengue_2,Dengue_3,Dengue_4,Dengue_5,Dengue_6,
Dengue_7,Dengue_8,Dengue_9,Dengue_10)
head(Dengue_muestra_1)## OBJECTID Loc_name Longitud Latitud Proceso
## 1 114 VEREDA TROJAYACO -76.27317 0.984080 GEORREFERENCIADO
## 9 188 CENTRO POBLADO PIAMONTE -76.32567 1.117098 GEORREFERENCIADO
## 20 189 CENTRO POBLADO PIAMONTE -76.32567 1.117098 GEORREFERENCIADO
## 15 108 VEREDA EL MORRO -76.27202 1.057713 GEORREFERENCIADO
## 21 109 VEREDA EL MORRO -76.27202 1.057713 GEORREFERENCIADO
## 16 103 VEREDA SAN ISIDRO -76.38227 1.123567 GEORREFERENCIADO
## Match_addr Barrio_OSM Sexo Edad Ocupación Pertenencia.etnica
## 1 NOMBRE DEL CENTRO POBLADO TROJAYACO M 40 6112 1
## 9 NOMBRE DEL BARRIO PIAMONTE F 16 9999 6
## 20 NOMBRE DEL BARRIO PIAMONTE F 54 9996 6
## 15 NOMBRE DEL CENTRO POBLADO EL MORRO F 46 9999 6
## 21 NOMBRE DEL CENTRO POBLADO EL MORRO M 13 9997 6
## 16 NOMBRE DEL CENTRO POBLADO SAN ISIDRO M 14 9997 6
## fec_consulta ini_sintomas locationID county county_num
## 1 2016-01-10 00:00:00 2016-01-07 00:00:00 CO:19533 PIAMONTE 1
## 9 2018-02-21 00:00:00 2018-02-19 00:00:00 CO:19533 PIAMONTE 1
## 20 2019-11-12 00:00:00 2019-11-06 00:00:00 CO:19533 PIAMONTE 1
## 15 2018-04-04 00:00:00 2018-04-02 00:00:00 CO:19533 PIAMONTE 1
## 21 2019-11-26 00:00:00 2019-11-25 00:00:00 CO:19533 PIAMONTE 1
## 16 2018-04-12 00:00:00 2018-04-09 00:00:00 CO:19533 PIAMONTE 1
## Barrio_OSM_num nivel_riesgo
## 1 86 1
## 9 67 2
## 20 67 2
## 15 25 2
## 21 25 2
## 16 82 2
library(openxlsx)
write.xlsx(Dengue_muestra_1, "Dengue_muestra_1.xlsx")#Estimación del promedio edad
#----------------------------
barrio=as.factor(as.integer(Dengue_muestra_1$Barrio_OSM_num))
#muestreo por conglomerado barrios
y =T.SIC(Dengue_muestra_1$Edad,barrio);
#y
res1=E.SI(NI,nI,y)
res1 <-res1/N
#res1
LI =res1[1,3]-qnorm(1-0.05/2)*res1[2,3]
LS =res1[1,3]+qnorm(1-0.05/2)*res1[2,3]
c(LI,LS)## [1] 20.23710 31.56522
#Estimación de la edad de las personas sexo masculino
#-----------------------------------------------------
Dominios<-Domains(Dengue_muestra_1$Sexo)
masculino<-Dominios[,2]*Dengue_muestra_1$Edad
y1<-T.SIC(masculino, barrio)
res_1<-E.SI(NI,nI,y1)/sum(Dominios[,2])
LI1 =res_1[1,3]-qnorm(1-0.05/2)*res_1[2,3]
LS1 =res_1[1,3]+qnorm(1-0.05/2)*res_1[2,3]
c(LI1,LS1)## [1] 20.36819 33.02640
#Estimación de la edad de las personas sexo femenino
#-----------------------------------------------------
Dominios<-Domains(Dengue_muestra_1$Sexo)
femenino<-Dominios[,1]*Dengue_muestra_1$Edad
y1<-T.SIC(femenino, barrio)
res_1<-E.SI(NI,nI,y1)/sum(Dominios[,1])
LI1 =res_1[1,3]-qnorm(1-0.05/2)*res_1[2,3]
LS1 =res_1[1,3]+qnorm(1-0.05/2)*res_1[2,3]
c(LI1,LS1)## [1] 20.63120 32.12199
#Estimación de la edad de las personas con riesgo alto
#-----------------------------------------------------
Dominios<-Domains(Dengue_muestra_1$nivel_riesgo)
nivel_alto<-Dominios[,3]*Dengue_muestra_1$Edad
y1<-T.SIC(nivel_alto, barrio)
res_1<-E.SI(NI,nI,y1)/N
LI1 =res_1[1,3]-qnorm(1-0.05/2)*res_1[2,3]
LS1 =res_1[1,3]+qnorm(1-0.05/2)*res_1[2,3]
c(LI1,LS1)## [1] 15.98690 28.32008
anva=anova(lm(Dengue_muestra_1$Edad~as.factor(Dengue_muestra_1$Barrio_OSM_num)))
res2=anva
rho= 1-(M/(M-1))*(res2[2,2]/(res2[1,2]+res2[2,2]))
rho## [1] -0.08051136
eff =1+(M-1)*rho
eff## [1] 0.4510589
library(TeachingSampling)
UI= as.vector(datos_dengue_2$Barrio_OSM_num|> unique())
NI=37 # Conglomerados total del estrato
nI=10 # muestra de conglomerados
N=nrow(datos_dengue_2) # Muestra del estrato
N## [1] 93
Mi=table(datos_dengue_2$Barrio_OSM_num);Mi##
## 3 5 6 7 11 12 13 15 17 18 20 21 23 26 32 33 34 35 36 38 39 45 51 55 56 59
## 1 2 1 1 2 4 7 1 1 1 7 1 3 2 1 2 3 1 1 2 1 2 2 8 2 1
## 61 63 64 65 68 72 75 76 78 88 91
## 1 11 3 2 3 2 4 1 2 2 2
#Promedio de los Mi #
M =sum(Mi)/NI;M #En promedio hay 3 casos dengue por barrio(conglomerado)## [1] 2.513514
#Muestreo aleatorio simple sin reemplazo, elección conglomerados
set.seed(23)
sam=S.SI(NI,nI)
muestra=UI[sam];muestra #Elección## [1] 32 64 11 38 3 63 68 6 13 75
Dengue_1=datos_dengue_2[which(datos_dengue_2$Barrio_OSM_num==muestra[1]),]
Dengue_2=datos_dengue_2[which(datos_dengue_2$Barrio_OSM_num==muestra[2]),]
Dengue_3=datos_dengue_2[which(datos_dengue_2$Barrio_OSM_num==muestra[3]),]
Dengue_4=datos_dengue_2[which(datos_dengue_2$Barrio_OSM_num==muestra[4]),]
Dengue_5=datos_dengue_2[which(datos_dengue_2$Barrio_OSM_num==muestra[5]),]
Dengue_6=datos_dengue_2[which(datos_dengue_2$Barrio_OSM_num==muestra[6]),]
Dengue_7=datos_dengue_2[which(datos_dengue_2$Barrio_OSM_num==muestra[7]),]
Dengue_8=datos_dengue_2[which(datos_dengue_2$Barrio_OSM_num==muestra[8]),]
Dengue_9=datos_dengue_2[which(datos_dengue_2$Barrio_OSM_num==muestra[9]),]
Dengue_10=datos_dengue_2[which(datos_dengue_2$Barrio_OSM_num==muestra[10]),]
#total de datos de los conglomerados seleccionados
Dengue_muestra_2=rbind(Dengue_1,Dengue_2,Dengue_3,Dengue_4,Dengue_5,Dengue_6,
Dengue_7,Dengue_8,Dengue_9,Dengue_10)
head(Dengue_muestra_2)## OBJECTID Loc_name Longitud Latitud Proceso
## 3 70 VEREDA EL TUNO -77.04886 2.020125 GEORREFERENCIADO
## 35 64 PABLO VI -76.98885 2.112244 GEORREFERENCIADO
## 61 65 PABLO VI -76.98885 2.112244 GEORREFERENCIADO
## 82 62 PABLO VI -76.98885 2.112244 GEORREFERENCIADO
## 43 110 CENTRO POBLADO BRISAS -77.06070 2.280627 GEORREFERENCIADO
## 62 109 CENTRO POBLADO BRISAS -77.06070 2.280627 GEORREFERENCIADO
## Match_addr Barrio_OSM Sexo Edad Ocupación Pertenencia.etnica
## 3 NOMBRE DEL CENTRO POBLADO EL TUNO F 7 9997 6
## 35 NOMBRE DEL BARRIO PABLO VI F 22 9996 5
## 61 NOMBRE DEL BARRIO PABLO VI M 16 9997 5
## 82 NOMBRE DEL BARRIO PABLO VI F 8 9997 6
## 43 NOMBRE DEL CENTRO POBLADO BRISAS M 30 6111 6
## 62 NOMBRE DEL CENTRO POBLADO BRISAS M 24 9999 6
## fec_consulta ini_sintomas locationID county county_num
## 3 2016-02-01 00:00:00 2016-01-28 00:00:00 CO:19532 PATÍA 2
## 35 2016-02-19 00:00:00 2016-02-16 00:00:00 CO:19532 PATÍA 2
## 61 2016-02-19 00:00:00 2016-02-16 00:00:00 CO:19532 PATÍA 2
## 82 2015-12-07 00:00:00 2015-12-06 00:00:00 CO:19532 PATÍA 2
## 43 2019-01-21 00:00:00 2019-01-16 00:00:00 CO:19532 PATÍA 2
## 62 2017-05-16 00:00:00 2017-05-16 00:00:00 CO:19532 PATÍA 2
## Barrio_OSM_num nivel_riesgo
## 3 32 1
## 35 64 2
## 61 64 2
## 82 64 2
## 43 11 2
## 62 11 2
#Estimación del promedio edad
#----------------------------
barrio=as.factor(as.integer(Dengue_muestra_2$Barrio_OSM_num))
#muestreo por conglomerado barrio
y =T.SIC(Dengue_muestra_2$Edad,barrio);
#y
res1=E.SI(NI,nI,y)
res1 <-res1/N
#res1
LI =res1[1,3]-qnorm(1-0.05/2)*res1[2,3]
LS =res1[1,3]+qnorm(1-0.05/2)*res1[2,3]
c(LI,LS)## [1] 13.40404 37.99811
#Estimación de la edad de las personas sexo masculino
#-----------------------------------------------------
Dominios<-Domains(Dengue_muestra_2$Sexo)
masculino<-Dominios[,2]*Dengue_muestra_2$Edad
y1<-T.SIC(masculino, barrio)
res_1<-E.SI(NI,nI,y1)/N
LI1 =res_1[1,3]-qnorm(1-0.05/2)*res_1[2,3]
LS1 =res_1[1,3]+qnorm(1-0.05/2)*res_1[2,3]
c(LI1,LS1)## [1] 8.07063 25.90571
#Estimación de la edad de las personas sexo femenino
#-----------------------------------------------------
Dominios<-Domains(Dengue_muestra_2$Sexo)
femenino<-Dominios[,1]*Dengue_muestra_2$Edad
y1<-T.SIC(femenino, barrio)
res_1<-E.SI(NI,nI,y1)/N
LI1 =res_1[1,3]-qnorm(1-0.05/2)*res_1[2,3]
LS1 =res_1[1,3]+qnorm(1-0.05/2)*res_1[2,3]
c(LI1,LS1)## [1] 3.96893 13.45688
#Estimación de la edad de las personas con riesgo alto
#------------------------------------------------------
Dominios<-Domains(Dengue_muestra_2$nivel_riesgo)
nivel_alto<-Dominios[,3]*Dengue_muestra_2$Edad
y1<-T.SIC(nivel_alto, barrio)
res_1<-E.SI(NI,nI,y1)/N
LI1 =res_1[1,3]-qnorm(1-0.05/2)*res_1[2,3]
LS1 =res_1[1,3]+qnorm(1-0.05/2)*res_1[2,3]
c(LI1,LS1)## [1] 5.100143 33.889104
# Correlación y Efecto diseño
anva=anova(lm(Dengue_muestra_2$Edad~as.factor(Dengue_muestra_2$Barrio_OSM_num)))
res2=anva
rho= 1-(M/(M-1))*(res2[2,2]/(res2[1,2]+res2[2,2]))
rho## [1] -0.1713238
eff =1+(M-1)*rho
eff## [1] 0.7406991
library(TeachingSampling)
UI= as.vector(datos_dengue_3$Barrio_OSM_num|> unique())
NI=22 # Conglomerados totales del estrato
nI=10 # muestra de conglomerados
N=nrow(datos_dengue_3) #Muestra del estrato
N## [1] 79
Mi=table(datos_dengue_3$Barrio_OSM_num);Mi##
## 1 9 13 16 19 27 30 31 40 41 42 43 44 54 60 69 73 74 80 81 84 87
## 1 4 8 4 2 3 6 2 5 2 8 1 5 5 1 2 2 1 1 10 2 4
#Promedio de los Mi #
M =sum(Mi)/NI;M #En promedio hay 4 casos dengue por barrio(conglomerado)## [1] 3.590909
#Muestreo aleatorio simple sin reemplazo, elección conglomerados
set.seed(25)
sam=S.SI(NI,nI)
muestra=UI[sam];muestra #Elección## [1] 74 31 19 60 73 84 13 54 16 27
Dengue_1=datos_dengue_3[which(datos_dengue_3$Barrio_OSM_num==muestra[1]),]
Dengue_2=datos_dengue_3[which(datos_dengue_3$Barrio_OSM_num==muestra[2]),]
Dengue_3=datos_dengue_3[which(datos_dengue_3$Barrio_OSM_num==muestra[3]),]
Dengue_4=datos_dengue_3[which(datos_dengue_3$Barrio_OSM_num==muestra[4]),]
Dengue_5=datos_dengue_3[which(datos_dengue_3$Barrio_OSM_num==muestra[5]),]
Dengue_6=datos_dengue_3[which(datos_dengue_3$Barrio_OSM_num==muestra[6]),]
Dengue_7=datos_dengue_3[which(datos_dengue_3$Barrio_OSM_num==muestra[7]),]
Dengue_8=datos_dengue_3[which(datos_dengue_3$Barrio_OSM_num==muestra[8]),]
Dengue_9=datos_dengue_3[which(datos_dengue_3$Barrio_OSM_num==muestra[9]),]
Dengue_10=datos_dengue_3[which(datos_dengue_3$Barrio_OSM_num==muestra[10]),]
#total de datos de los conglomerados seleccionados
Dengue_muestra_3=rbind(Dengue_1,Dengue_2,Dengue_3,Dengue_4,Dengue_5,Dengue_6,
Dengue_7,Dengue_8,Dengue_9,Dengue_10)
head(Dengue_muestra_3)## OBJECTID Loc_name Longitud Latitud
## 1 174 CRA 11 11-22 -76.23261 3.254571
## 7 148 CRA 9 4-25 -76.23158 3.249390
## 12 169 CALLE 5 KRA 8A ESQUINA BARRIO EL TRIUNFO -76.23098 3.250101
## 15 62 C 19 # 6 - 73, EL ESPEJUELO -76.22493 3.266030
## 18 117 CARRERA 5 NUM 19-70 ESPEJUELO -76.22459 3.265994
## 21 47 CRA 4 # 1-18 MIRALINDO -76.22841 3.246279
## Proceso Match_addr Barrio_OSM Sexo Edad Ocupación
## 1 GEOCODIFICACIÓN NOMBRE DEL BARRIO PORVENIR F 2 9999
## 7 GEOCODIFICACIÓN NOMBRE DEL BARRIO EL TRIUNFO M 6 9997
## 12 GEOCODIFICACIÓN NOMBRE DEL BARRIO EL TRIUNFO M 7 9997
## 15 GEOCODIFICACIÓN NOMBRE DEL BARRIO EL ESPEJUELO F 16 9997
## 18 GEORREFERENCIADO NOMBRE DEL BARRIO EL ESPEJUELO M 10 9997
## 21 GEOCODIFICACIÓN NOMBRE DEL BARRIO MIRALINDO F 18 9999
## Pertenencia.etnica fec_consulta ini_sintomas locationID
## 1 6 2020-06-17 00:00:00 2020-06-14 00:00:00 CO:19455
## 7 6 2020-06-10 00:00:00 2020-06-06 00:00:00 CO:19455
## 12 6 2020-11-23 00:00:00 2020-11-23 00:00:00 CO:19455
## 15 5 2016-05-09 00:00:00 2016-05-07 00:00:00 CO:19455
## 18 6 2019-08-22 00:00:00 2019-08-16 00:00:00 CO:19455
## 21 6 2016-04-30 00:00:00 2016-04-25 00:00:00 CO:19455
## county county_num Barrio_OSM_num nivel_riesgo
## 1 MIRANDA 3 74 1
## 7 MIRANDA 3 31 2
## 12 MIRANDA 3 31 2
## 15 MIRANDA 3 19 2
## 18 MIRANDA 3 19 2
## 21 MIRANDA 3 60 2
#Estimación del promedio edad
#----------------------------
barrio=as.factor(as.integer(Dengue_muestra_3$Barrio_OSM_num))
#muestreo por conglomerado barrio
y =T.SIC(Dengue_muestra_3$Edad,barrio);
#y
res1=E.SI(NI,nI,y)
res1 <-res1/N
#res1
LI =res1[1,3]-qnorm(1-0.05/2)*res1[2,3]
LS =res1[1,3]+qnorm(1-0.05/2)*res1[2,3]
c(LI,LS)## [1] 9.209498 27.438604
#Estimación de la edad de las personas sexo masculino
#-----------------------------------------------------
Dominios<-Domains(Dengue_muestra_3$Sexo)
masculino<-Dominios[,2]*Dengue_muestra_3$Edad
y1<-T.SIC(masculino, barrio)
res_1<-E.SI(NI,nI,y1)/N
LI1 =res_1[1,3]-qnorm(1-0.05/2)*res_1[2,3]
LS1 =res_1[1,3]+qnorm(1-0.05/2)*res_1[2,3]
c(LI1,LS1)## [1] 3.616509 11.365769
#Estimación de la edad de las personas sexo Femenino
#---------------------------------------------------
Dominios<-Domains(Dengue_muestra_3$Sexo)
femenino<-Dominios[,1]*Dengue_muestra_3$Edad
y1<-T.SIC(femenino, barrio)
res_1<-E.SI(NI,nI,y1)/N
LI1 =res_1[1,3]-qnorm(1-0.05/2)*res_1[2,3]
LS1 =res_1[1,3]+qnorm(1-0.05/2)*res_1[2,3]
c(LI1,LS1)## [1] 3.459338 18.206485
#Estimación de la edad de las personas con riesgo alto
#-----------------------------------------------------
Dominios<-Domains(Dengue_muestra_3$nivel_riesgo)
nivel_alto<-Dominios[,3]*Dengue_muestra_3$Edad
y1<-T.SIC(nivel_alto, barrio)
res_1<-E.SI(NI,nI,y1)/N
LI1 =res_1[1,3]-qnorm(1-0.05/2)*res_1[2,3]
LS1 =res_1[1,3]+qnorm(1-0.05/2)*res_1[2,3]
c(LI1,LS1)## [1] 3.119865 23.391527
# Correlación y Efecto diseño
anva=anova(lm(Dengue_muestra_3$Edad~as.factor(Dengue_muestra_3$Barrio_OSM_num)))
res2=anva
rho= 1-(M/(M-1))*(res2[2,2]/(res2[1,2]+res2[2,2]))
rho## [1] 0.2141739
eff =1+(M-1)*rho
eff## [1] 1.554905
➢ Aguilera, Q. J. A. (s. f.). Diferentes enfoques para la estratificación epidemiológica del dengue. Scielo. Recuperado 14 de agosto de 2022, de http://scielo.sld.cu/scielo.php?script=sci_arttext&pid=S1025-02552012000100014
➢ Gutiérrez Rojas, H. A. (2016). Estrategias de Muestreo - Diseño de encuestas y estimación de parámetros. Ediciones de la U - Carrera.
➢ L. Lohr, S. (2000). Muestreo: Diseño y análisis. International Thomson Editores.
➢ Manual de estratificación según el riesgo de malaria y eliminación de focos de transmisión. (2019, 1 mayo). Región de las Américas. Recuperado 14 de agosto de 2022, de https://www3.paho.org/hq/index.php?option=com_docman&view=download&slug=malaria-technical-advisory-group-session-8-2019-only-in-spanish&Itemid=270&lang=en
➢ Pérez López, C. (2005). Muestreo estadístico: conceptos y problemas resueltos. Pearson Education.
➢ S. (2022, 26 julio). Alerta en el Valle del Cauca ante el aumento de casos de dengue. Noticias de Colombia y el Mundo. Recuperado 14 de agosto de 2022, de https://www.semana.com/nacion/articulo/alerta-en-el-valle-del-cauca-ante-el-aumento-de-casos-de-dengue/202249/
➢ Stratification of Dengue in Cauca - Colombia. (2022, 31 julio). Kaggle. Recuperado 14 de agosto de 2022, de https://www.kaggle.com/datasets/davidrestrepo/stratification-of-dengue-in-cauca-colombia
➢ Técnicas de limpieza y calidad de datos. (2021, 8 mayo). RPubs. Recuperado 14 de agosto de 2022, de https://www.rpubs.com/KarenPCalva/TecnicasLimpiezaCalidadDatosSEE#:%7E:text=R%20como%20herramienta%20para%20limpiar,de%20aprender%20y%20bien%20documentado.