Como sabemos, si \(X\) es una v.a. que sigue una distribución normal \(N(\mu,\sigma)\), entonces \(Z=\dfrac{\overline{X}-\mu}{\frac{\sigma}{\sqrt{n}}}\sim N(0,1)\). Luego, podemos plantear por ejemplo, que la probabilidad de que \(Z\) quede entre dos valores simétricos sea \(1-\alpha\): \[ P\left(z_{\frac{\alpha}{2}}<Z<z_{1-\frac{\alpha}{2}}\right)=1-\alpha \] donde la probabilidad \(\alpha\) ha sido repartida de manera simétrica en ambas colas de la distribución \(N(0,1)\). Nótese además que no es necesario que la probabilidad \(\alpha\) se reparta de forma simétrica.
Ahora bien, como \(Z=\dfrac{\overline{X}-\mu}{\frac{\sigma}{\sqrt{n}}}\), podemos escribir: \[ P\left(z_{\frac{\alpha}{2}}<\dfrac{\overline{X}-\mu}{\frac{\sigma}{\sqrt{n}}}<z_{1-\frac{\alpha}{2}}\right)=1-\alpha \]
Operando algebraicamente dentro del paréntesis,
\[ \begin{aligned} P\left(z_{\frac{\alpha}{2}}<\dfrac{\overline{X}-\mu}{\frac{\sigma}{\sqrt{n}}}<z_{1-\frac{\alpha}{2}}\right)&=1-\alpha\\ P\left(z_{\frac{\alpha}{2}}\cdot \frac{\sigma}{\sqrt{n}}<\overline{X}-\mu<z_{1-\frac{\alpha}{2}}\cdot \frac{\sigma}{\sqrt{n}}\right)&=1-\alpha\\ P\left(-z_{1-\frac{\alpha}{2}}\cdot \frac{\sigma}{\sqrt{n}}<\mu-\overline{X}<-z_{\frac{\alpha}{2}}\cdot \frac{\sigma}{\sqrt{n}}\right)&=1-\alpha\\ P\left(\overline{X}-z_{1-\frac{\alpha}{2}}\cdot \frac{\sigma}{\sqrt{n}}<\mu<\overline{X}-z_{\frac{\alpha}{2}}\cdot \frac{\sigma}{\sqrt{n}}\right)&=1-\alpha\\ \end{aligned} \]
Aprovechando la simetría de la distribución normal, podemos concluir que \[z_{\frac{\alpha}{2}}=-z_{1-\frac{\alpha}{2}}\]
Con lo que finalmente podemos concluir que \[ \begin{aligned} P\left(\overline{X}-z_{1-\frac{\alpha}{2}}\cdot \frac{\sigma}{\sqrt{n}}<\mu<\overline{X}+z_{1-\frac{\alpha}{2}}\cdot \frac{\sigma}{\sqrt{n}}\right)&=1-\alpha\\ \end{aligned} \]
De esta forma, un intervalo de confianza del \(\left(1-\alpha\right)100\%\) para la media poblacional \(\mu\) viene dado por: \[ \left(\overline{x}-z_{1-\frac{\alpha}{2}}\cdot \frac{\sigma}{\sqrt{n}}\;\;,\;\;\overline{x}+z_{1-\frac{\alpha}{2}}\cdot \frac{\sigma}{\sqrt{n}}\right) \] siempre que \(X\sim N(\mu,\sigma)\).
Usando funciones de R podemos construir la función intervalo_media
que nos permite construir un intervalo de confianza para \(\mu\) cuando \(X\sim N(\mu,\sigma)\), siendo \(\sigma\) un valor conocido. A continuación se presenta el código de la función intervalo_media
:
intervalo_media=function(n,m_muestra,de,alpha)
{
p = 1-(alpha/100)/2
z = qnorm(p,mean=0,sd=1,lower.tail=TRUE)
e = z*(de/sqrt(n))
cat("Un intervalo de confianza para la media poblacional con un nivel de confianza del ", 100-alpha, "% es \n")
cat("(", m_muestra-e,",",m_muestra+e,")\n")
}
Supongamos que el consumo, en gramos, de un cierto producto sigue una distribución con varianza 225 \(g^2\). A partir de una muestra de tamaño 25 se ha obtenido una media muestral igual a 175 g. Usemos la función intervalo_media
para construir un intervalo de confianza del 95% para la media poblacional \(\mu\):
intervalo_media(n=25,m_muestra=175,de=sqrt(225),alpha=5)
## Un intervalo de confianza para la media poblacional con un nivel de confianza del 95 % es
## ( 169.1201 , 180.8799 )
En R implemente un intervalo de confianza para: