Encuentre una fórmula para el tamaño muestral que nos permita estimar la media poblacional \(\mu\).
La media poblacional se estima dependiendo de varios casos, por tanto, se hará el ejercicio para cada caso, pero primero se realizará la demostración detallada de la fórmula para luego buscar una fórmula para el tamaño muestral.
Supongamos que se extrae una muestra aleatoria de una distribución con media desconocida y se cumplen las siguientes condiciones:
a. La población es normal con varianza
conocida.
b. La población es normal con varianza desconocida y el tamaño
de la muestra es grande.
c. La forma de la población es desconocida (o no normal), su
varianza es conocida o desconocida y el tamaño de la muestra es
grande.
Se supone que las variables muestrales \(X_i \sim \mathcal{N}(\mu, \sigma^2)\) forman una muestra \(X\) de tamaño \(n\) para la variable de interés.
Se sabe que
\[
\hat{\mu} = \hat{\mu}(X) = \overline{X}_{(n)}
\] es una estimación puntual razonable para \(\mu\).
Por lo tanto, se buscará un intervalo de confianza \[
I = (\overline{X}_{(n)} - D, \; \overline{X}_{(n)} + D)
\] donde se debe determinar el estadístico \(D\) tal que:
\[ P(\mu \in I) = P(\overline{X}_{(n)} - D < \mu < \overline{X}_{(n)} + D) = 1 - \alpha, \] para un \(\alpha\) dado.
Se reescriben las desigualdades de manera equivalente:
\[ -\frac{D}{\sigma / \sqrt{n}} < \frac{\overline{X}_{(n)} - \mu}{\sigma / \sqrt{n}} < \frac{D}{\sigma / \sqrt{n}} \]
Además tenemos que:
\[ Z= \frac{\overline{X}_{(n)} - \mu}{\sigma / \sqrt{n}} \sim \mathcal{N}(0, 1) \]
Z no depende de parámetros porque sigue una distribución normal estandar, por tanto, se saben los valores de esta. Por consiguiente:
\[ P(-\frac{D}{\sigma / \sqrt{n}}< Z < \frac{D}{\sigma / \sqrt{n}} ) = 1 - \alpha, \]
Tomemos el caso en que \(\alpha=0.05\); en este caso, el área central bajo la curva de la distribución normal estándar corresponde a una probabilidad de \(1-\alpha=0.95\):
Notemos que el area restante es \(1-(1-\alpha)=\alpha\) y como existen dos
colas, el área restante a la derecha e izquierda es \(\frac{\alpha}{2}\). Por tanto, las lineas
verticales mostradas en la gráfica, nos representan la probabilidad
\(-Z_{\alpha/2}\) y \(Z_{\alpha/2}\) respectivamente.
Ahora, notemos que según la probabilidad mencionada anteriormente, se
puede plantear la siguiente igualdad para la cola derecha:
\[ \frac{D}{\alpha/\sqrt{n}}= Z_{\alpha/2} \Rightarrow D=Z_{\alpha/2}\frac{\sigma}{\sqrt{n}} \hspace{1cm} (*) \]
Análogamente se realiza con la cola para la izquierda.
De la forma anterior se puede seguir realizando la demostración para plantear las fórmulas del intervalo de confianza para la media poblacional. Sin embargo, lo que se desea es buscar una fórmula para el tamaño muestral que nos permita estimar la media poblacional \(\mu\). En este caso, se puede buscar gracias a la ecuación \((*)\), por tanto, se tiene lo siguiente:
\[ D=Z_{\alpha/2}\frac{\sigma}{\sqrt{n}} \Rightarrow \sqrt{n}=Z_{\alpha/2}\frac{\sigma}{D} \Rightarrow n= (Z_{\alpha/2}\frac{\sigma}{D})^2 \]
Una fórmula para el tamaño muestral que nos permita estimar la media poblaciona \(\mu\) para el caso de que la muestras sean grandes, es la siguiente:
\[ n= (Z_{\alpha/2}\frac{\sigma}{D})^2 \]
Supongamos que se extrae una muestra aleatoria de una distribución con media desconocida y se cumple la siguiente condición:
La población es normal con varianza desconocida y el tamaño de la muestra pequeño (n<30).
El desarrollo es análogo al caso anterior, el paso que cambia es el siguiente:
En lugar de que Z siga una distrbución normal estándar, ahora t hace
las veces de Z y esta sigue una distribución t de student con \(v=n-1\) grados de libertad.
\[
t = \frac{\overline{X}_{(n)} - \mu}{S_{(n)} / \sqrt{n}} \sim
\mathcal{T}(n - 1)
\]
y \(\sigma^2\) se reemplaza por su estimación insesgada:
\[ S^2_{(n)} = \frac{\displaystyle\sum_{i=1}^{n} \left( X_i - \overline{X}_{(n)} \right)^2}{n - 1} \]
Por tanto, D es expresado de la siguiente forma y se puede despejar n:
\[ D = t_{\alpha/2} \frac{S_{(n)}}{\sqrt{n}} \;\Rightarrow\; \sqrt{n} = t_{\alpha/2} \frac{S_{(n)}}{D} \;\Rightarrow\; n = \left( t_{\alpha/2} \frac{S_{(n)}}{D} \right)^2 \]
Una fórmula para el tamaño muestral que nos permita estimar la media poblaciona \(\mu\) para el caso de que la muestra sea pequeña, es la siguiente:
\[ n= (t_{\alpha/2}\frac{S_{(n)}}{D})^2 \]
Encuentre una fórmula para el tamaño muestral que nos permita estimar la proporción poblacional \(p\).
Al igual que con la media poblacional, se puede determinar una fórmula general para el tamaño muestral que permita estimar la proporción poblacional \(p\) con un margen de error máximo permitido \(D\) y un nivel de confianza \(1 - \alpha\).
Supongamos que deseamos estimar la proporción \(p\) de individuos en una población que
presentan cierta característica (éxito).
Sea \(\hat{p}\) la proporción muestral
de éxitos obtenida de una muestra aleatoria simple de tamaño \(n\).
Sabemos que:
\[ E(\hat{p}) = p, \quad Var(\hat{p}) = \frac{p(1-p)}{n} \]
Por el Teorema Central del Límite, si \(n\) es grande, entonces la distribución de \(\hat{p}\) puede aproximarse por una distribución normal:
\[ \hat{p} \sim N\left(p, \frac{p(1-p)}{n}\right) \]
De esta forma, se buscará un intervalo de confianza para \(p\):
\[ I = (\hat{p} - D, \hat{p} + D) \]
Se reescriben las desigualdades de manera equivalente
\[ P\left( -\frac{D}{\sqrt{\frac{p(1-p)}{n}}} < \frac{\hat{p} - p}{\sqrt{\frac{p(1-p)}{n}}} < \frac{D}{\sqrt{\frac{p(1-p)}{n}}} \right) = 1 - \alpha \]
Sabemos que:
\[ Z = \frac{\hat{p} - p}{\sqrt{\frac{p(1-p)}{n}}} \sim N(0,1) \]
Por tanto, el analisis llevado a cabo en la gráfica para la estimación de media muestral para el caso de n grandes, es similar a lo planteado en la estimación de proporción y podemos plantear la siguiente relación:
\[ \frac{D}{\sqrt{\frac{p(1-p)}{n}}} = z_{\alpha/2} \Rightarrow D = z_{\alpha/2} \sqrt{\frac{p(1-p)}{n}} \]
Ahora se debe despejar n de la ecuación anterior:
\[ D = z_{\alpha/2} \sqrt{\frac{p(1-p)}{n}} \Rightarrow \sqrt{n} = z_{\alpha/2} \sqrt{\frac{p(1-p)}{D^2}} \Rightarrow n = \left( \frac{z_{\alpha/2}^2 \, p(1-p)}{D^2} \right) \]
Una fórmula general para el tamaño muestral que nos permita estimar la proporción poblacional \(p\) con un nivel de confianza \(1 - \alpha\) y un margen de error máximo \(D\) es:
\[ n = \left( \frac{z_{\alpha/2}^2 \, p(1-p)}{D^2} \right) \]
Si no se conoce una proporción preliminar \(p\), se utiliza el valor más conservador \(p = 0.5\), que maximiza el producto \(p(1-p) = 0.25\), dando el tamaño muestral más grande posible:
\[ n = \frac{z_{\alpha/2}^2 (0.25)}{D^2} \]