_________________________________________________________________________________________________________________________
Si tenemos una población conocida, la fórmula ajustada es:
\[ n = \frac{Z^2 \cdot \sigma^2 \cdot N}{(N - 1) \cdot E^2 + Z^2 \cdot \sigma^2} \]
Donde:
\(n\): tamaño muestral.
\(Z\): valor Z correspondiente a un nivel de confianza.
\(\sigma\): desviación estándar de la población.
\(N\): tamaño de la población.
\(E\): margen de error tolerado.
# 1. Definimos los Parámetros
Z <- 1.96 # Valor de Z para un nivel de confianza del 95%
sigma <- 3 # Desviación estándar de la población
N <- 250 # Tamaño de la población total
E <- 2 # Margen de error tolerado
# 2. Calculamos el tamaño muestral
n_med_pf <- (Z^2 * sigma^2 * N) / ((N - 1) * E^2 + Z^2 * sigma^2)
n_med_pf <- ceiling(n_med_pf) # Redondear hacia arriba
n_med_pf## [1] 9
Para una población infinita, el tamaño muestral se calcula usando:
\[ n = \left( \frac{Z \cdot S}{E} \right)^2 \]
Donde:
\(Z\): es el valor del estadístico Z para un determinado nivel de confianza (1 - \(\alpha\)).
\(S\): es la desviación estándar estimada de la población a través de la muestra piloto o bien de experiencias previas.
\(E\): es el margen de error tolerado, es decir, la máxima diferencia aceptable entre la media muestral y la media poblacional.
# 1. Definimos los parámetros
Z <- 1.96 # Valor de Z para un nivel de confianza del 95%
E <- 14 # Margen de error tolerado
S <- 105 # Se considera una estimación de la desviación estándar de 105
# 2. Calculamos el tamaño muestral
n_media_pinf <- (Z * S / E)^2
n_media_pinf <- ceiling(n_media_pinf) # Redondear hacia arriba para obtener valor entero.
n_media_pinf## [1] 217
El tamaño de muestra necesario para estimar una proporción en una población infinita se puede calcular usando la siguiente fórmula:
\[ n = \frac{Z^2 \cdot p \cdot (1 - p)}{E^2} \]
Donde:
\(n\): es el tamaño muestral.
\(Z\): es el valor Z correspondiente al nivel de confianza.
\(p\): es la proporción esperada.
\(E\): es el margen de error tolerado.
# 1. Definimos los parámetros
Z <- 1.96 # Valor de Z para un nivel de confianza del 95%
p <- 0.5 # Proporción esperada
E <- 0.05 # Margen de error
# 2. Calculamos el tamaño muestral
n_prop_inf <- (Z^2 * p * (1 - p)) / (E^2)
n_prop_inf <- ceiling(n_prop_inf) # Redondear hacia arriba
n_prop_inf## [1] 385
\[ n = \frac{Z^2 \cdot p \cdot (1 - p) \cdot N}{(N - 1) \cdot E^2 + Z^2 \cdot p \cdot (1 - p)} \]
Donde:
\(n\): es el tamaño muestral.
\(Z\): es el valor Z correspondiente al nivel de confianza.
\(p\): es la proporción esperada.
\(N\): es el tamaño de la población.
\(E\): es el margen de error tolerado.
# 1. Definimos los Parámetros
Z <- 1.96 # Para un nivel de confianza del 95%
p <- 0.5 # Proporción esperada
N <- 1000 # Tamaño de la población total
E <- 0.05 # Margen de error tolerado
# 2. Calculamos el tamaño muestral
n_prop_fin <- (Z^2 * p * (1 - p) * N) / ((N - 1) * E^2 + Z^2 * p * (1 - p))
n_prop_fin <- ceiling(n_prop_fin) # Redondear hacia arriba
n_prop_fin## [1] 278
RESUMEN <- MANDARINAS %>%
filter(VARIEDAD == "Clementina") %>%
group_by(GRUPO) %>%
summarise(MEDIA = mean(PESO),
SD = sd(PESO),
MIN_GRUPO= min(PESO),
MAX_GRUPO= max(PESO))
RESUMEN## # A tibble: 7 × 5
## GRUPO MEDIA SD MIN_GRUPO MAX_GRUPO
## <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 1 146. 34.6 37 231
## 2 2 160. 36.0 113 273
## 3 3 151. 32.5 86 212
## 4 4 142. 33.6 64 199
## 5 5 158. 40.3 90 257
## 6 6 144. 34.9 71 204
## 7 7 168. 32.3 116 227
RESUMEN_GRAL <-MANDARINAS %>%
filter(VARIEDAD == "Clementina") %>%
summarise(MEDIA_GRAL = mean(PESO),
SD_GRAL= sd(PESO),
MIN_GRAL= min(PESO),
MAX_GRAL= max(PESO))
RESUMEN_GRAL## # A tibble: 1 × 4
## MEDIA_GRAL SD_GRAL MIN_GRAL MAX_GRAL
## <dbl> <dbl> <dbl> <dbl>
## 1 153. 35.6 37 273
“Cuando no se conocen los valores poblacionales, se pueden sustituir por una estimación adecuada obtenida de estudios previos o de una prueba piloto (Ojeda et al., 2011, Metodología de diseño estadístico).”
Podemos asumir un error del 5% respecto al valor medio. Si tomamos por ejemplo la variable “Peso” de las mandarinas, se puedes calcular el error en función de las medias observadas.Así, para el Grupo 1, con una media de 146.47 g, un error del 5% sería:
𝐸= 0.05 × 146.47 = 7.32 g
Esto implica que se espera que la media poblacional esté dentro de 7.32 gramos por encima o por debajo de la media muetral.
# Calculamos el tamaño muestral de frutos para la variedad "Clementina".
# 1. Definimos los parámetros
M1 <- 146.4667 # Media muestral del Grupo 1.
Z <- 1.96 # Valor de Z para un nivel de confianza del 95%
E <- 0.05*M1 # Margen de error tolerado (5% de la media)
S1 <- 34.57100 # Se considera una estimación de la desviación estándar de 35.59
E## [1] 7.323335
# 2. Calculamos el tamaño muestral
n_cle_g1 <- (Z * S1 / E)^2
n_cle_g1 <- ceiling(n_cle_g1) # Redondear hacia arriba para obtener valor entero.
n_cle_g1## [1] 86
# Calculamos el tamaño muestral de frutos para la variedad "Clementina".
# 1. Definimos los parámetros
M2 <- 160.4333
Z <- 1.96 # Valor de Z para un nivel de confianza del 95%
E <- 0.05 * M2 # Margen de error tolerado (5% de la media)
S2 <- 36.01789 # Se considera una estimación de la desviación estándar de 35.59
E## [1] 8.021665
# 2. Calculamos el tamaño muestral
n_cle_g2 <- (Z * S2 / E)^2
n_cle_g2 <- ceiling(n_cle_g2) # Redondear hacia arriba para obtener valor entero.
n_cle_g2## [1] 78
# Calculamos el tamaño muestral de frutos para la variedad "Clementina".
# 1. Definimos los parámetros
Mgral <- 152.5694
Z <- 1.96 # Valor de Z para un nivel de confianza del 95%
E <- 0.09 * Mgral # Margen de error tolerado (5% de la media) +-7.63 gramos.
Sgral <- 35.59098 # Se considera una estimación de la desviación estándar de 35.59
# 2. Calculamos el tamaño muestral
n_cle_gral <- (Z * Sgral / E)^2
n_cle_gral <- ceiling(n_cle_gral) # Redondear hacia arriba para obtener valor entero.
n_cle_gral## [1] 26
Para resolver este caso, vamos a partir del supuesto que cada árbol tiene 500 frutos y que en el lote hay 250 plantas de la variedad Clementina.
N = 500 frutos/planta x 250 plantas = 125000 frutos
# 1. Definimos los Parámetros
Mgral <- 152.5694
Z <- 1.96 # Valor de Z para un nivel de confianza del 95%
sigma <- 35.59098 # Desviación estándar de la población
N <- 125000 # Tamaño de la población total
E <- 0.05 * Mgral # Margen de error tolerado
E## [1] 7.62847
# 2. Calculamos el tamaño muestral
n_cle_peso_pf <- (Z^2 * sigma^2 * N) / ((N - 1) * E^2 + Z^2 * sigma^2)
n_cle_peso_pf <- ceiling(n_cle_peso_pf) # Redondear hacia arriba
n_cle_peso_pf## [1] 84