PREGUNTA 3

Se desea estimar el número promedio de trabajadores por empresa en un determinado sector de la producción. a. Obtenga el tamaño de muestra para un 95% de confianza y un error de muestreo de e = 5.

Para calcular el tamaño de muestra necesario en cada estrato, podemos utilizar la siguiente fórmula general para el muestreo estratificado:

ni = (wi / sum(wj)) * N * (zi / ei)^2 * (Sj / Nj)^2

Donde:

Podemos usar los siguientes valores para resolver el problema:

Y los siguientes valores generales:

Podemos entonces calcular el tamaño de muestra en R utilizando la siguiente función:

# Función para calcular el tamaño de muestra estratificado
nMuestraEstratificado <- function(N, Nh, S, Ch, nh, confianza, error) {
  wi <- Nh / sum(Nh)
  zi <- qnorm(1 - (1 - confianza) / 2)
  ei <- error
  
  ni <- (wi / sum(wi)) * N * (zi / ei)^2 * (S / Ch)^2
  
  # Ajustar tamaño de muestra a número entero
  ni <- ceiling(ni)
  
  # Limitar tamaño de muestra al tamaño de la población del estrato
  ni <- min(ni, nh)
  
  return(ni)
}

# Valores para el cálculo
N <- 350
Nh <- c(275, 75)
S <- c(144, 400)
Ch <- c(16, 9)
nh <- c(20, 10)
confianza <- 0.95
error <- 5

# Calcular tamaño de muestra en cada estrato
ni <- sapply(1:2, function(i) nMuestraEstratificado(N, Nh[i], S[i], Ch[i], nh[i], confianza, error))

# Tamaño de muestra total
n <- sum(ni)

# Resultados
cat("Tamaño de muestra en el estrato pequeña: ", ni[1], "\n")
## Tamaño de muestra en el estrato pequeña:  20
cat("Tamaño de muestra en el estrato mediana: ", ni[2], "\n")
## Tamaño de muestra en el estrato mediana:  10
cat("Tamaño de muestra total: ", n, "\n")
## Tamaño de muestra total:  30

b. Afijar el tamaño de muestra usando los diferentes criterios de afijacion

# Datos del problema
Nh_peq <- 275
Nh_med <- 75
sd_peq <- 144
sd_med <- 400
Ch_peq <- 16
Ch_med <- 9
nh_peq <- 20
nh_med <- 10
conf_level <- 0.95
e <- 5

# Función para cálculo del tamaño de muestra estratificado
nMuestreoEstratificado <- function(Nh, sd, Ch, nh, e, conf_level, afijacion = "proporcional"){
  za <- qnorm(1 - (1-conf_level)/2)
  p <- nh/Nh
  w <- switch(afijacion, "uniforme" = rep(1/length(nh), length(nh)),
                    "proporcional" = p,
                    "optima" = p/sum(p))
  n <- (za^2 * sd^2 * sum(Nh * w) * sum(w * p * (1-p))) / ((e^2 * sum(Nh * w) - za^2 * sd^2 * sum(w * p * (1-p))) + (za^2 * sd^2 * sum(w^2 * p * (1-p))))
  ni <- ceiling(n * w)
  return(ni)
}

# Tamaño de muestra estratificado con afijación uniforme para la estrato pequeño
ni_unif_peq <- nMuestreoEstratificado(Nh_peq, sd_peq, Ch_peq, nh_peq, e, conf_level, "uniforme")
cat("Tamaño de muestra para estrato pequeño con afijación uniforme:", sum(ni_unif_peq), "\n")
## Tamaño de muestra para estrato pequeño con afijación uniforme: 215
cat("Tamaño de muestra por subestrato con afijación uniforme:", ni_unif_peq, "\n")
## Tamaño de muestra por subestrato con afijación uniforme: 215
# Tamaño de muestra estratificado con afijación proporcional para la estrato pequeño
ni_prop_peq <- nMuestreoEstratificado(Nh_peq, sd_peq, Ch_peq, nh_peq, e, conf_level, "proporcional")
cat("Tamaño de muestra para estrato pequeño con afijación proporcional:", sum(ni_prop_peq), "\n")
## Tamaño de muestra para estrato pequeño con afijación proporcional: 5
cat("Tamaño de muestra por subestrato con afijación proporcional:", ni_prop_peq, "\n")
## Tamaño de muestra por subestrato con afijación proporcional: 5
# Tamaño de muestra estratificado con afijación óptima para la estrato pequeño
ni_opt_peq <- nMuestreoEstratificado(Nh_peq, sd_peq, Ch_peq, nh_peq, e, conf_level, "optima")
cat("Tamaño de muestra para estrato pequeño con afijación óptima:", sum(ni_opt_peq), "\n")
## Tamaño de muestra para estrato pequeño con afijación óptima: 215
cat("Tamaño de muestra por subestrato con afijación óptima:", ni_opt_peq, "\n")
## Tamaño de muestra por subestrato con afijación óptima: 215
# Tamaño de muestra estratificado con afijación uniforme para la estrato mediano
ni_unif_med <- nMuestreoEstratificado(Nh_med, sd_med, Ch_med, nh_med, e, conf_level, "uniforme")
cat("Tamaño de muestra para estrato mediano con afijación uniforme:", sum(ni_unif_med), "\n")
## Tamaño de muestra para estrato mediano con afijación uniforme: 2841
cat("Tamaño de muestra por subestrato con afijación uniforme:", ni_unif_med, "\n")
## Tamaño de muestra por subestrato con afijación uniforme: 2841

PREGUNTA 4

Se tiene la siguiente Información de 120 alumnos de la escuela de Ingenieria Ambiental de la UNASAM año 2019 según sus notas en el curso de Matemática .

  1. Determine un tamaño de muestra usando muestreo estratificado con tres estratos b) Afije la muestra usando la afijacion proporcional y neyman
notas <- c(11, 11, 14, 13, 13, 11, 12, 10, 9, 10, 8, 9, 11, 9, 14, 11, 11, 8, 10, 10, 11, 13, 7, 11, 6, 8, 10, 12, 10, 12, 12, 15, 11, 9, 13, 15, 13, 13, 13, 11, 11, 14, 11, 14, 10, 12, 11, 12, 13, 8, 10, 9, 11, 12, 13, 15, 12, 8, 7, 12, 12, 11, 12, 13, 6, 7, 12, 12, 11, 12, 8, 11, 8, 13, 9, 10, 13, 12, 12, 13, 11, 9, 11, 10, 11, 10, 12, 9, 12, 7, 14, 13, 9, 14, 10, 12, 11, 13, 10, 13, 11, 8, 13, 13, 10, 12, 14, 10, 11, 10, 12, 11, 12, 12, 11, 12, 12, 11, 9, 11)
## Dividir notas en tres estratos
estrato1 <- notas[notas >= 11 & notas <= 12]
estrato2 <- notas[notas > 12 & notas <= 13]
estrato3 <- notas[notas > 13]

# Obtener tamaño de cada estrato
n1 <- length(estrato1)
n2 <- length(estrato2)
n3 <- length(estrato3)
#Luego, podemos calcular el tamaño de muestra para cada estrato usando la fórmula:


nh <- c(n1, n2, n3) # Tamaño de cada estrato
Nh <- c(sum(nh[1]), sum(nh[1:2]), sum(nh)) # Acumulado de tamaño de estratos
prop <- nh/Nh # Proporciones de cada estrato en la población

# Calcular tamaño de muestra para cada estrato
n <- c(ceiling(Nh[1]*prop[1]), ceiling(Nh[2]*prop[2]), ceiling(Nh[3]*prop[3]))
# Fijar muestra usando afijación proporcional
#Finalmente, podemos fijar la muestra usando la afijación proporcional:


set.seed(123) # Establecer semilla para reproducibilidad
muestra <- c(sample(estrato1, n[1], replace=FALSE), 
             sample(estrato2, n[2], replace=FALSE), 
             sample(estrato3, n[3], replace=FALSE))

# Ver tamaño de la muestra
length(muestra)
## [1] 80
  1. Afije la muestra usando la afijacion neyman

    # Definir los estratos
    notas <- c(11, 11, 14, 13, 13, 11, 12, 10, 9, 10, 8, 9, 11, 9, 14, 11, 11, 8, 10, 10, 11, 13, 7, 11, 6, 8, 10, 12, 10, 12, 12, 15, 11, 9, 13, 15, 13, 13, 13, 11, 11, 14, 11, 14, 10, 12, 11, 12, 13, 8, 10, 9, 11, 12, 13, 15, 12, 8, 7, 12, 12, 11, 12, 13, 6, 7, 12, 12, 11, 12, 8, 11, 8, 13, 9, 10, 13, 12, 12, 13, 11, 9, 11, 10, 11, 10, 12, 9, 12, 7, 14, 13, 9, 14, 10, 12, 11, 13, 10, 13, 11, 8, 13, 13, 10, 12, 14, 10, 11, 10, 12, 11, 12, 12, 11, 12, 12, 11, 9, 11)
    n <- length(notas)
    
    # Asignar estratos
    estratos <- rep(0, n)
    estratos[notas <= 8] <- 1
    estratos[notas > 8 & notas <= 12] <- 2
    estratos[notas > 12] <- 3
    
    # Calcular tamaño de muestra para cada estrato
    tamanos <- c(10, 30, 20)
    
    # Seleccionar aleatoriamente los elementos de cada estrato
    set.seed(123)  # Para reproducibilidad
    muestra <- c()
    for (i in 1:3) {
      elementos_estrato <- which(estratos == i)
      muestra_estrato <- sample(elementos_estrato, size = tamanos[i], replace = FALSE)
      muestra <- c(muestra, muestra_estrato)
    }
    
    # Mostrar la muestra
    
    length(muestra)
    ## [1] 60

Pregunta 5

Una escuela desea estimar la calificación promedio que puede ser obtenida en un examen de comprensión de lectura para estudiantes de sexto grado, los estudiantes de la escuela son agrupados en 3 estratos, los que aprenden rápido en el estrato I y los que aprenden lento en el estrato III. La escuela decide está estratificación porque de está manera se r educe la variabilidad en las calificaciones del examen. El sexto grado contiene 55 estudiantes en el estrato I, 80 en el estrato II y 65 en el estrato III. Una muestra aleatoria estratificada de 50 estudiantes es asignada. Proporcionalmente: n1 = 14, n2 = 20, n3 = 16 de los estratos I,II,III el examen se aplica ala muestra de estudiantes y se obtiene los resultados que se muestran a continuación. Para encontrar la asignación de Neyman para una muestra de tamaño 60, primero necesitamos calcular la varianza para cada estrato. Luego, podemos asignar un número de muestras proporcional a la inversa de la varianza para cada estrato. Aquí está el código en R para realizar esta tarea:

  1. Estime la calificación promedio para este grado.

    # Datos de los estratos
    estrato1 <- c(90, 82, 68, 85, 61, 72, 87, 85, 90, 93, 90, 81, 62, 70)
    estrato2 <- c(85, 82, 48, 75, 53, 73, 75, 78, 49, 69, 72, 81, 53, 60, 68, 52, 71, 60, 59, 40)
    estrato3 <- c(42, 37, 36, 31, 60, 29, 43, 19, 53, 14, 51, 31, 42, 30, 49, 32)
    
    # Cálculo de la media de cada estrato
    media_estrato1 <- mean(estrato1)
    media_estrato2 <- mean(estrato2)
    media_estrato3 <- mean(estrato3)
    
    # Cálculo de la media ponderada del grado
    n1 <- 55
    n2 <- 80
    n3 <- 65
    n <- n1 + n2 + n3
    
    media_grado <- (n1/n) * media_estrato1 + (n2/n) * media_estrato2 + (n3/n) * media_estrato3
    media_grado
    ## [1] 60.14862

b. Suponga que la calificación promedio para el examen de la clase se va ha estimar de nuevo el final del año escolar. Los costos de nuestro son iguales en todos los estratos. Encuentre la asignación de Neyman para una muestra de tamaño 60.

n1<-14
n2<-20
n3<-16

# Promedios de cada estrato
prom1 <- mean(estrato1)
prom2 <- mean(estrato2)
prom3 <- mean(estrato3)

# Varianzas de cada estrato
var1 <- var(estrato1)
var2 <- var(estrato2)
var3 <- var(estrato3)

# Varianza total ponderada
var_total <- (n1-1)*var1 + (n2-1)*var2 + (n3-1)*var3
var_total <- var_total / (n1+n2+n3-3)
var_total
## [1] 149.7307

La varianza total ponderada es 149.7307

A continuación, podemos calcular el tamaño de muestra óptimo para cada estrato:

# Tamaño de muestra óptimo para cada estrato
n1_neyman <- n1 * var1 / var_total
n2_neyman <- n2 * var2 / var_total
n3_neyman <- n3 * var3 / var_total
n1_neyman
## [1] 11.25508
n2_neyman
## [1] 22.50039
n3_neyman
## [1] 16.18505

El tamaño de muestra óptimo para el estrato 1 es 11.25508, para el estrato 2 es 22.50039 y para el estrato 3 es 16.18505.

Dado que necesitamos una muestra total de tamaño 60, podemos asignar la muestra de la siguiente manera:

# Tamaño de muestra asignado a cada estrato
n1_asignado <- round(n1_neyman / (n1_neyman+n2_neyman+n3_neyman) * 60)
n2_asignado <- round(n2_neyman / (n1_neyman+n2_neyman+n3_neyman) * 60)
n3_asignado <- 60 - n1_asignado - n2_asignado
n1_asignado
## [1] 14
n2_asignado
## [1] 27
n3_asignado
## [1] 19

De esta manera, asignamos 14 estudiantes al estrato 1, 27 estudiantes al estrato 2 y 19 estudiantes al estrato 3.

c. Determine un tamaño de muestra para estimar la calificación promedio, con un error de 4 puntos al 99% de confianza para la afijación use: la proporción y Neyman.

# Calcular la desviación estándar de la muestra
s <- sqrt(var(estrato1) * (n1-1) / (n1+n2+n3-3) + var(estrato2) * (n2-1) / (n1+n2+n3-3) + var(estrato3) * (n3-1) / (n1+n2+n3-3))

# Definir los tamaños de los estratos y la población total
n1 <- 14
n2 <- 20
n3 <- 16
N <- 200

# Calcular las proporciones de cada estrato en la población total
p1 <- n1 / N
p2 <- n2 / N
p3 <- n3 / N

# Definir el nivel de confianza y el error máximo deseados
conf_level <- 0.99
e <- 4

# Calcular el tamaño de muestra necesario
z <- qnorm(1 - (1-conf_level)/2)
n <- (z^2 * s^2 * N * p1 * (1-p1)) / (e^2 * (N-1) + z^2 * s^2 * p1 * (1-p1)) +
(z^2 * s^2 * N * p2 * (1-p2)) / (e^2 * (N-1) + z^2 * s^2 * p2 * (1-p2)) +
(z^2 * s^2 * N * p3 * (1-p3)) / (e^2 * (N-1) + z^2 * s^2 * p3 * (1-p3))
n <- round(n)

#Mostrar el resultado
cat("El tamaño de muestra necesario es:", n)
## El tamaño de muestra necesario es: 14