Se desea estimar el número promedio de trabajadores por empresa en un determinado sector de la producción. a. Obtenga el tamaño de muestra para un 95% de confianza y un error de muestreo de e = 5.
Para calcular el tamaño de muestra necesario en cada estrato, podemos utilizar la siguiente fórmula general para el muestreo estratificado:
ni = (wi / sum(wj)) * N * (zi / ei)^2 * (Sj / Nj)^2
Donde:
ni es el tamaño de muestra necesario en el i-ésimo estrato.
wi es el peso relativo del i-ésimo estrato en la población.
N es el tamaño de la población total.
zi es el valor crítico de la distribución normal para un nivel de confianza dado.
ei es el margen de error deseado.
Sj es la desviación estándar del i-ésimo estrato.
Nj es el tamaño de la población del i-ésimo estrato.
Podemos usar los siguientes valores para resolver el problema:
Estrato pequeña:
Nh = 275
S = 144
Ch = 16
nh = 20
Estrato mediana:
Nh = 75
S = 400
Ch = 9
nh = 10
Y los siguientes valores generales:
Confianza: 0.95
Error: 5
Podemos entonces calcular el tamaño de muestra en R utilizando la siguiente función:
# Función para calcular el tamaño de muestra estratificado
nMuestraEstratificado <- function(N, Nh, S, Ch, nh, confianza, error) {
wi <- Nh / sum(Nh)
zi <- qnorm(1 - (1 - confianza) / 2)
ei <- error
ni <- (wi / sum(wi)) * N * (zi / ei)^2 * (S / Ch)^2
# Ajustar tamaño de muestra a número entero
ni <- ceiling(ni)
# Limitar tamaño de muestra al tamaño de la población del estrato
ni <- min(ni, nh)
return(ni)
}
# Valores para el cálculo
N <- 350
Nh <- c(275, 75)
S <- c(144, 400)
Ch <- c(16, 9)
nh <- c(20, 10)
confianza <- 0.95
error <- 5
# Calcular tamaño de muestra en cada estrato
ni <- sapply(1:2, function(i) nMuestraEstratificado(N, Nh[i], S[i], Ch[i], nh[i], confianza, error))
# Tamaño de muestra total
n <- sum(ni)
# Resultados
cat("Tamaño de muestra en el estrato pequeña: ", ni[1], "\n")
## Tamaño de muestra en el estrato pequeña: 20
cat("Tamaño de muestra en el estrato mediana: ", ni[2], "\n")
## Tamaño de muestra en el estrato mediana: 10
cat("Tamaño de muestra total: ", n, "\n")
## Tamaño de muestra total: 30
b. Afijar el tamaño de muestra usando los diferentes criterios de afijacion
# Datos del problema
Nh_peq <- 275
Nh_med <- 75
sd_peq <- 144
sd_med <- 400
Ch_peq <- 16
Ch_med <- 9
nh_peq <- 20
nh_med <- 10
conf_level <- 0.95
e <- 5
# Función para cálculo del tamaño de muestra estratificado
nMuestreoEstratificado <- function(Nh, sd, Ch, nh, e, conf_level, afijacion = "proporcional"){
za <- qnorm(1 - (1-conf_level)/2)
p <- nh/Nh
w <- switch(afijacion, "uniforme" = rep(1/length(nh), length(nh)),
"proporcional" = p,
"optima" = p/sum(p))
n <- (za^2 * sd^2 * sum(Nh * w) * sum(w * p * (1-p))) / ((e^2 * sum(Nh * w) - za^2 * sd^2 * sum(w * p * (1-p))) + (za^2 * sd^2 * sum(w^2 * p * (1-p))))
ni <- ceiling(n * w)
return(ni)
}
# Tamaño de muestra estratificado con afijación uniforme para la estrato pequeño
ni_unif_peq <- nMuestreoEstratificado(Nh_peq, sd_peq, Ch_peq, nh_peq, e, conf_level, "uniforme")
cat("Tamaño de muestra para estrato pequeño con afijación uniforme:", sum(ni_unif_peq), "\n")
## Tamaño de muestra para estrato pequeño con afijación uniforme: 215
cat("Tamaño de muestra por subestrato con afijación uniforme:", ni_unif_peq, "\n")
## Tamaño de muestra por subestrato con afijación uniforme: 215
# Tamaño de muestra estratificado con afijación proporcional para la estrato pequeño
ni_prop_peq <- nMuestreoEstratificado(Nh_peq, sd_peq, Ch_peq, nh_peq, e, conf_level, "proporcional")
cat("Tamaño de muestra para estrato pequeño con afijación proporcional:", sum(ni_prop_peq), "\n")
## Tamaño de muestra para estrato pequeño con afijación proporcional: 5
cat("Tamaño de muestra por subestrato con afijación proporcional:", ni_prop_peq, "\n")
## Tamaño de muestra por subestrato con afijación proporcional: 5
# Tamaño de muestra estratificado con afijación óptima para la estrato pequeño
ni_opt_peq <- nMuestreoEstratificado(Nh_peq, sd_peq, Ch_peq, nh_peq, e, conf_level, "optima")
cat("Tamaño de muestra para estrato pequeño con afijación óptima:", sum(ni_opt_peq), "\n")
## Tamaño de muestra para estrato pequeño con afijación óptima: 215
cat("Tamaño de muestra por subestrato con afijación óptima:", ni_opt_peq, "\n")
## Tamaño de muestra por subestrato con afijación óptima: 215
# Tamaño de muestra estratificado con afijación uniforme para la estrato mediano
ni_unif_med <- nMuestreoEstratificado(Nh_med, sd_med, Ch_med, nh_med, e, conf_level, "uniforme")
cat("Tamaño de muestra para estrato mediano con afijación uniforme:", sum(ni_unif_med), "\n")
## Tamaño de muestra para estrato mediano con afijación uniforme: 2841
cat("Tamaño de muestra por subestrato con afijación uniforme:", ni_unif_med, "\n")
## Tamaño de muestra por subestrato con afijación uniforme: 2841
Se tiene la siguiente Información de 120 alumnos de la escuela de Ingenieria Ambiental de la UNASAM año 2019 según sus notas en el curso de Matemática .
notas <- c(11, 11, 14, 13, 13, 11, 12, 10, 9, 10, 8, 9, 11, 9, 14, 11, 11, 8, 10, 10, 11, 13, 7, 11, 6, 8, 10, 12, 10, 12, 12, 15, 11, 9, 13, 15, 13, 13, 13, 11, 11, 14, 11, 14, 10, 12, 11, 12, 13, 8, 10, 9, 11, 12, 13, 15, 12, 8, 7, 12, 12, 11, 12, 13, 6, 7, 12, 12, 11, 12, 8, 11, 8, 13, 9, 10, 13, 12, 12, 13, 11, 9, 11, 10, 11, 10, 12, 9, 12, 7, 14, 13, 9, 14, 10, 12, 11, 13, 10, 13, 11, 8, 13, 13, 10, 12, 14, 10, 11, 10, 12, 11, 12, 12, 11, 12, 12, 11, 9, 11)
## Dividir notas en tres estratos
estrato1 <- notas[notas >= 11 & notas <= 12]
estrato2 <- notas[notas > 12 & notas <= 13]
estrato3 <- notas[notas > 13]
# Obtener tamaño de cada estrato
n1 <- length(estrato1)
n2 <- length(estrato2)
n3 <- length(estrato3)
#Luego, podemos calcular el tamaño de muestra para cada estrato usando la fórmula:
nh <- c(n1, n2, n3) # Tamaño de cada estrato
Nh <- c(sum(nh[1]), sum(nh[1:2]), sum(nh)) # Acumulado de tamaño de estratos
prop <- nh/Nh # Proporciones de cada estrato en la población
# Calcular tamaño de muestra para cada estrato
n <- c(ceiling(Nh[1]*prop[1]), ceiling(Nh[2]*prop[2]), ceiling(Nh[3]*prop[3]))
# Fijar muestra usando afijación proporcional
#Finalmente, podemos fijar la muestra usando la afijación proporcional:
set.seed(123) # Establecer semilla para reproducibilidad
muestra <- c(sample(estrato1, n[1], replace=FALSE),
sample(estrato2, n[2], replace=FALSE),
sample(estrato3, n[3], replace=FALSE))
# Ver tamaño de la muestra
length(muestra)
## [1] 80
Afije la muestra usando la afijacion neyman
# Definir los estratos
notas <- c(11, 11, 14, 13, 13, 11, 12, 10, 9, 10, 8, 9, 11, 9, 14, 11, 11, 8, 10, 10, 11, 13, 7, 11, 6, 8, 10, 12, 10, 12, 12, 15, 11, 9, 13, 15, 13, 13, 13, 11, 11, 14, 11, 14, 10, 12, 11, 12, 13, 8, 10, 9, 11, 12, 13, 15, 12, 8, 7, 12, 12, 11, 12, 13, 6, 7, 12, 12, 11, 12, 8, 11, 8, 13, 9, 10, 13, 12, 12, 13, 11, 9, 11, 10, 11, 10, 12, 9, 12, 7, 14, 13, 9, 14, 10, 12, 11, 13, 10, 13, 11, 8, 13, 13, 10, 12, 14, 10, 11, 10, 12, 11, 12, 12, 11, 12, 12, 11, 9, 11)
n <- length(notas)
# Asignar estratos
estratos <- rep(0, n)
estratos[notas <= 8] <- 1
estratos[notas > 8 & notas <= 12] <- 2
estratos[notas > 12] <- 3
# Calcular tamaño de muestra para cada estrato
tamanos <- c(10, 30, 20)
# Seleccionar aleatoriamente los elementos de cada estrato
set.seed(123) # Para reproducibilidad
muestra <- c()
for (i in 1:3) {
elementos_estrato <- which(estratos == i)
muestra_estrato <- sample(elementos_estrato, size = tamanos[i], replace = FALSE)
muestra <- c(muestra, muestra_estrato)
}
# Mostrar la muestra
length(muestra)
## [1] 60Una escuela desea estimar la calificación promedio que puede ser obtenida en un examen de comprensión de lectura para estudiantes de sexto grado, los estudiantes de la escuela son agrupados en 3 estratos, los que aprenden rápido en el estrato I y los que aprenden lento en el estrato III. La escuela decide está estratificación porque de está manera se r educe la variabilidad en las calificaciones del examen. El sexto grado contiene 55 estudiantes en el estrato I, 80 en el estrato II y 65 en el estrato III. Una muestra aleatoria estratificada de 50 estudiantes es asignada. Proporcionalmente: n1 = 14, n2 = 20, n3 = 16 de los estratos I,II,III el examen se aplica ala muestra de estudiantes y se obtiene los resultados que se muestran a continuación. Para encontrar la asignación de Neyman para una muestra de tamaño 60, primero necesitamos calcular la varianza para cada estrato. Luego, podemos asignar un número de muestras proporcional a la inversa de la varianza para cada estrato. Aquí está el código en R para realizar esta tarea:
Estime la calificación promedio para este grado.
# Datos de los estratos
estrato1 <- c(90, 82, 68, 85, 61, 72, 87, 85, 90, 93, 90, 81, 62, 70)
estrato2 <- c(85, 82, 48, 75, 53, 73, 75, 78, 49, 69, 72, 81, 53, 60, 68, 52, 71, 60, 59, 40)
estrato3 <- c(42, 37, 36, 31, 60, 29, 43, 19, 53, 14, 51, 31, 42, 30, 49, 32)
# Cálculo de la media de cada estrato
media_estrato1 <- mean(estrato1)
media_estrato2 <- mean(estrato2)
media_estrato3 <- mean(estrato3)
# Cálculo de la media ponderada del grado
n1 <- 55
n2 <- 80
n3 <- 65
n <- n1 + n2 + n3
media_grado <- (n1/n) * media_estrato1 + (n2/n) * media_estrato2 + (n3/n) * media_estrato3
media_grado
## [1] 60.14862b. Suponga que la calificación promedio para el examen de la clase se va ha estimar de nuevo el final del año escolar. Los costos de nuestro son iguales en todos los estratos. Encuentre la asignación de Neyman para una muestra de tamaño 60.
n1<-14
n2<-20
n3<-16
# Promedios de cada estrato
prom1 <- mean(estrato1)
prom2 <- mean(estrato2)
prom3 <- mean(estrato3)
# Varianzas de cada estrato
var1 <- var(estrato1)
var2 <- var(estrato2)
var3 <- var(estrato3)
# Varianza total ponderada
var_total <- (n1-1)*var1 + (n2-1)*var2 + (n3-1)*var3
var_total <- var_total / (n1+n2+n3-3)
var_total
## [1] 149.7307
La varianza total ponderada es 149.7307
A continuación, podemos calcular el tamaño de muestra óptimo para cada estrato:
# Tamaño de muestra óptimo para cada estrato
n1_neyman <- n1 * var1 / var_total
n2_neyman <- n2 * var2 / var_total
n3_neyman <- n3 * var3 / var_total
n1_neyman
## [1] 11.25508
n2_neyman
## [1] 22.50039
n3_neyman
## [1] 16.18505
El tamaño de muestra óptimo para el estrato 1 es 11.25508, para el estrato 2 es 22.50039 y para el estrato 3 es 16.18505.
Dado que necesitamos una muestra total de tamaño 60, podemos asignar la muestra de la siguiente manera:
# Tamaño de muestra asignado a cada estrato
n1_asignado <- round(n1_neyman / (n1_neyman+n2_neyman+n3_neyman) * 60)
n2_asignado <- round(n2_neyman / (n1_neyman+n2_neyman+n3_neyman) * 60)
n3_asignado <- 60 - n1_asignado - n2_asignado
n1_asignado
## [1] 14
n2_asignado
## [1] 27
n3_asignado
## [1] 19
De esta manera, asignamos 14 estudiantes al estrato 1, 27 estudiantes al estrato 2 y 19 estudiantes al estrato 3.
c. Determine un tamaño de muestra para estimar la calificación promedio, con un error de 4 puntos al 99% de confianza para la afijación use: la proporción y Neyman.
# Calcular la desviación estándar de la muestra
s <- sqrt(var(estrato1) * (n1-1) / (n1+n2+n3-3) + var(estrato2) * (n2-1) / (n1+n2+n3-3) + var(estrato3) * (n3-1) / (n1+n2+n3-3))
# Definir los tamaños de los estratos y la población total
n1 <- 14
n2 <- 20
n3 <- 16
N <- 200
# Calcular las proporciones de cada estrato en la población total
p1 <- n1 / N
p2 <- n2 / N
p3 <- n3 / N
# Definir el nivel de confianza y el error máximo deseados
conf_level <- 0.99
e <- 4
# Calcular el tamaño de muestra necesario
z <- qnorm(1 - (1-conf_level)/2)
n <- (z^2 * s^2 * N * p1 * (1-p1)) / (e^2 * (N-1) + z^2 * s^2 * p1 * (1-p1)) +
(z^2 * s^2 * N * p2 * (1-p2)) / (e^2 * (N-1) + z^2 * s^2 * p2 * (1-p2)) +
(z^2 * s^2 * N * p3 * (1-p3)) / (e^2 * (N-1) + z^2 * s^2 * p3 * (1-p3))
n <- round(n)
#Mostrar el resultado
cat("El tamaño de muestra necesario es:", n)
## El tamaño de muestra necesario es: 14