Ejercicio 29

Encuentre una fórmula para el tamaño muestral que nos permita estimar la media poblacional \(\mu\).

Solución

La media poblacional se estima dependiendo de varios casos, por tanto, se hará el ejercicio para cada caso, pero primero se realizará la demostración detallada de la fórmula para luego buscar una fórmula para el tamaño muestral.

Caso 1: muestras grandes

Supongamos que se extrae una muestra aleatoria de una distribución con media desconocida y se cumplen las siguientes condiciones:

a. La población es normal con varianza conocida.
b. La población es normal con varianza desconocida y el tamaño de la muestra es grande.
c. La forma de la población es desconocida (o no normal), su varianza es conocida o desconocida y el tamaño de la muestra es grande.

Desarrollo

Se supone que las variables muestrales \(X_i \sim \mathcal{N}(\mu, \sigma^2)\) forman una muestra \(X\) de tamaño \(n\) para la variable de interés.

Se sabe que
\[ \hat{\mu} = \hat{\mu}(X) = \overline{X}_{(n)} \] es una estimación puntual razonable para \(\mu\).
Por lo tanto, se buscará un intervalo de confianza \[ I = (\overline{X}_{(n)} - D, \; \overline{X}_{(n)} + D) \] donde se debe determinar el estadístico \(D\) tal que:

\[ P(\mu \in I) = P(\overline{X}_{(n)} - D < \mu < \overline{X}_{(n)} + D) = 1 - \alpha, \] para un \(\alpha\) dado.

Se reescriben las desigualdades de manera equivalente:

\[ -\frac{D}{\sigma / \sqrt{n}} < \frac{\overline{X}_{(n)} - \mu}{\sigma / \sqrt{n}} < \frac{D}{\sigma / \sqrt{n}} \]

Además tenemos que:

\[ Z= \frac{\overline{X}_{(n)} - \mu}{\sigma / \sqrt{n}} \sim \mathcal{N}(0, 1) \]

Z no depende de parámetros porque sigue una distribución normal estandar, por tanto, se saben los valores de esta. Por consiguiente:

\[ P(-\frac{D}{\sigma / \sqrt{n}}< Z < \frac{D}{\sigma / \sqrt{n}} ) = 1 - \alpha, \]

Tomemos el caso en que \(\alpha=0.05\); en este caso, el área central bajo la curva de la distribución normal estándar corresponde a una probabilidad de \(1-\alpha=0.95\):

Notemos que el area restante es \(1-(1-\alpha)=\alpha\) y como existen dos colas, el área restante a la derecha e izquierda es \(\frac{\alpha}{2}\). Por tanto, las lineas verticales mostradas en la gráfica, nos representan la probabilidad \(-Z_{\alpha/2}\) y \(Z_{\alpha/2}\) respectivamente.
Ahora, notemos que según la probabilidad mencionada anteriormente, se puede plantear la siguiente igualdad para la cola derecha:

\[ \frac{D}{\alpha/\sqrt{n}}= Z_{\alpha/2} \Rightarrow D=Z_{\alpha/2}\frac{\sigma}{\sqrt{n}} \hspace{1cm} (*) \]

Análogamente se realiza con la cola para la izquierda.

De la forma anterior se puede seguir realizando la demostración para plantear las fórmulas del intervalo de confianza para la media poblacional. Sin embargo, lo que se desea es buscar una fórmula para el tamaño muestral que nos permita estimar la media poblacional \(\mu\). En este caso, se puede buscar gracias a la ecuación \((*)\), por tanto, se tiene lo siguiente:

\[ D=Z_{\alpha/2}\frac{\sigma}{\sqrt{n}} \Rightarrow \sqrt{n}=Z_{\alpha/2}\frac{\sigma}{D} \Rightarrow n= (Z_{\alpha/2}\frac{\sigma}{D})^2 \]

Conclusión caso 1

Una fórmula para el tamaño muestral que nos permita estimar la media poblaciona \(\mu\) para el caso de que la muestras sean grandes, es la siguiente:

\[ n= (Z_{\alpha/2}\frac{\sigma}{D})^2 \]

Caso 2: muestras pequeñas

Supongamos que se extrae una muestra aleatoria de una distribución con media desconocida y se cumple la siguiente condición:

La población es normal con varianza desconocida y el tamaño de la muestra pequeño (n<30).

Desarrollo

El desarrollo es análogo al caso anterior, el paso que cambia es el siguiente:

En lugar de que Z siga una distrbución normal estándar, ahora t hace las veces de Z y esta sigue una distribución t de student con \(v=n-1\) grados de libertad.
\[ t = \frac{\overline{X}_{(n)} - \mu}{S_{(n)} / \sqrt{n}} \sim \mathcal{T}(n - 1) \]

y \(\sigma^2\) se reemplaza por su estimación insesgada:

\[ S^2_{(n)} = \frac{\displaystyle\sum_{i=1}^{n} \left( X_i - \overline{X}_{(n)} \right)^2}{n - 1} \]

Por tanto, D es expresado de la siguiente forma y se puede despejar n:

\[ D = t_{\alpha/2} \frac{S_{(n)}}{\sqrt{n}} \;\Rightarrow\; \sqrt{n} = t_{\alpha/2} \frac{S_{(n)}}{D} \;\Rightarrow\; n = \left( t_{\alpha/2} \frac{S_{(n)}}{D} \right)^2 \]

Conclusión caso 2

Una fórmula para el tamaño muestral que nos permita estimar la media poblaciona \(\mu\) para el caso de que la muestra sea pequeña, es la siguiente:

\[ n= (t_{\alpha/2}\frac{S_{(n)}}{D})^2 \]

Ejercicio 30

Encuentre una fórmula para el tamaño muestral que nos permita estimar la proporción poblacional \(p\).

Solución

Al igual que con la media poblacional, se puede determinar una fórmula general para el tamaño muestral que permita estimar la proporción poblacional \(p\) con un margen de error máximo permitido \(D\) y un nivel de confianza \(1 - \alpha\).

Desarrollo

Supongamos que deseamos estimar la proporción \(p\) de individuos en una población que presentan cierta característica (éxito).
Sea \(\hat{p}\) la proporción muestral de éxitos obtenida de una muestra aleatoria simple de tamaño \(n\).

Sabemos que:

\[ E(\hat{p}) = p, \quad Var(\hat{p}) = \frac{p(1-p)}{n} \]

Por el Teorema Central del Límite, si \(n\) es grande, entonces la distribución de \(\hat{p}\) puede aproximarse por una distribución normal:

\[ \hat{p} \sim N\left(p, \frac{p(1-p)}{n}\right) \]

De esta forma, se buscará un intervalo de confianza para \(p\):

\[ I = (\hat{p} - D, \hat{p} + D) \]

Se reescriben las desigualdades de manera equivalente

\[ P\left( -\frac{D}{\sqrt{\frac{p(1-p)}{n}}} < \frac{\hat{p} - p}{\sqrt{\frac{p(1-p)}{n}}} < \frac{D}{\sqrt{\frac{p(1-p)}{n}}} \right) = 1 - \alpha \]

Sabemos que:

\[ Z = \frac{\hat{p} - p}{\sqrt{\frac{p(1-p)}{n}}} \sim N(0,1) \]

Por tanto, el analisis llevado a cabo en la gráfica para la estimación de media muestral para el caso de n grandes, es similar a lo planteado en la estimación de proporción y podemos plantear la siguiente relación:

\[ \frac{D}{\sqrt{\frac{p(1-p)}{n}}} = z_{\alpha/2} \Rightarrow D = z_{\alpha/2} \sqrt{\frac{p(1-p)}{n}} \]

Ahora se debe despejar n de la ecuación anterior:

\[ D = z_{\alpha/2} \sqrt{\frac{p(1-p)}{n}} \Rightarrow \sqrt{n} = z_{\alpha/2} \sqrt{\frac{p(1-p)}{D^2}} \Rightarrow n = \left( \frac{z_{\alpha/2}^2 \, p(1-p)}{D^2} \right) \]

Conclusión

Una fórmula general para el tamaño muestral que nos permita estimar la proporción poblacional \(p\) con un nivel de confianza \(1 - \alpha\) y un margen de error máximo \(D\) es:

\[ n = \left( \frac{z_{\alpha/2}^2 \, p(1-p)}{D^2} \right) \]

Nota adicional

Si no se conoce una proporción preliminar \(p\), se utiliza el valor más conservador \(p = 0.5\), que maximiza el producto \(p(1-p) = 0.25\), dando el tamaño muestral más grande posible:

\[ n = \frac{z_{\alpha/2}^2 (0.25)}{D^2} \]