La consulta va relacionada con conocer el error asociado al tamaño muestral de cada estrato, cuando se ha llevado a cabo un muestreo estratificado, donde la afijación proporcional replica los tamaños relativos de los estratos en la población. En términos simples se seleccionó una muestra a través de un universo de estudiantes de matrícula 2021 que corresponde a 5733. Considerando los siguientes parámetros - Z = 1,96 - E = 0,05 - P = 0,5 (máxima verosimilitud) - N = 5733 - Tamaño muestra = 360
Lo que no da un tamaño de muestra de 360.034. Ahora bien, a través de la librería library(sampling) y en particular del comando strata se seleccionó la muestra, donde cada uno de los estratos posee el tamaño relativo poblacional. Los estratos hacen alusión a las sedes de la institución.
La pregunta es la siguiente ¿cómo podemos indicar el error que posee cada uno de los estratos? Si una muestra de 360 garantiza un 5% de error, ¿ese error se distribuye en la misma proporción de los estratos?
| NOMBRE_SEDE | n |
|---|---|
| Concepción | 614 |
| Rancagua | 831 |
| Santiago | 2516 |
| Sede Virtual | 685 |
| Temuco | 654 |
| Viña del Mar | 712 |
###tamaño de la muestra
z<-1.96
e<-0.05
p<-0.5
N<-UNIVERSO
numerador<-(z^2*p*(1-p))/(e^2)
denominador<-1+((z^2*p*(1-p)))/(e^2*N)
n <-numerador/denominador
n
## [1] 360.0346
estratos <- strata(tabla_2, stratanames = "NOMBRE_SEDE",
size = c(round(concepcion/N*n,0),
round(rancagua/N*n,0),
round(santiago/N*n,0),
round(virtual/N*n,0),
round(temuco/N*n,0),
round(viña/N*n)), method = "srswr")
kable(estratos %>%
group_by(NOMBRE_SEDE) %>% summarise(n = length((ID_unit))),
align = "c",
booktabs=TRUE,
linesep="",
caption = "Tamaño Muestra por estrato")%>%
kable_styling(font_size = 12,
full_width = FALSE,
latex_options = c("basic", "cambria"))
| NOMBRE_SEDE | n |
|---|---|
| Concepción | 37 |
| Rancagua | 50 |
| Santiago | 152 |
| Sede Virtual | 41 |
| Temuco | 38 |
| Viña del Mar | 41 |