Una de las distribuciones continuas más comúnmente utilizadas es la distribución normal o Gaussiana,tanto porque es una buena representación de muchas variables aleatorias en la práctica, como porque es la base de una buena parte de la teoría inferencial.
En esta sección conoceremos algunas de sus características y propiedades.
Una v.a.c, tiene distribución normal,\(X \sim N(\mu,\sigma^2)\), si su función de densidad está dada por:
\[f_X(x; \mu,\sigma^2)=\frac{1}{ \sigma\sqrt{2\pi}}\exp\left\{-\frac{(x-\mu)^2}{2\sigma^2}\right\} \text{; para }-\infty<x<\infty.\] Con \(\mu=\textsf{E}[X]\) y \(\sigma^2=\textsf{V}[X]\).
Si \(X\) es una v.a. tal que \(X \sim N(\mu,\sigma^2)\), \(a\) y \(b\) constantes, entonces:
Se sabe que el nivel de llenado de una botella de gaseosa tiene distribución normal, con promedio 500 ml y desviación estándar 5 ml. Con base en lo anterior, calcule:
En primer lugar, la v.a.c X:“nivel de llenado de una botella de gasesosa (ml)”, tiene distribución \(N(500 \text{ ml}, 25\text{ ml}^2)\), adicionalmente, nos preguntan:
\(P(X<450)=F_X(450)=7.61\times 10^{-24}\)
# parámetros
mu <- 500
sigma <- 5
#P(X<450)
pnorm(q=450,mean=mu,sd=sigma)## [1] 7.619853e-24
\(P(490<X<510)=F_X(510)-F_X(490)=0.9545\) Es decir que el \(95.45\%\) de las botellas tienen un nivel de llenado óptimo.
# parámetros
mu <- 500
sigma <- 5
#P(490<X<510)
pnorm(q=510,mean=mu,sd=sigma)-pnorm(q=490,mean=mu,sd=sigma)## [1] 0.9544997
Es decir que en este caso nos están preguntado por el percentil 75 de la distribución:
\(\pi_{75}=503.37\)
Es decir que el 75% de las botellas contienen 503.37 ml o menos.
# parámetros
mu <- 500
sigma <- 5
#percentil 75
qnorm(p=0.75,mean=mu,sd=sigma)## [1] 503.3724
# parámetros
mu <- 500
sigma <- 5
par(mfrow=c(1,2))
curve(expr = dnorm(x,mean=mu,sd=sigma), from = 480, to = 520, xlab = "x", ylab = "f(x)", col = "blue", lwd = 2)
curve(expr = pnorm(x,mean=mu,sd=sigma), from = 480, to = 520, xlab = "x", ylab = "f(x)", col = "blue", lwd = 2)Un caso particular de la distribución normal se tiene cuando \(\mu=0\) y \(\sigma^2=1\), dicha distribución se llama distribución normalestándar y en general se nota como,\(Z \sim N(0,1)\). Su función de densidad está dada por:
\[f_Z(z)=\frac{1}{ \sqrt{2\pi}}\exp\left\{-\frac{z^2}{2}\right\} \text{; para }-\infty<z<\infty.\]
Si \(Z\) es una v.a. tal que \(Z \sim N(0,1)\), entonces:
Al igual que en el caso descriptivo, la estandarización se utiliza cuando se quieren comparar individuos bajo escenarios diferentes, permitiendo hacer comparaciones entre magnitudes no comparables.
Una variable estandarizada es una variable adimensional (no tiene unidades de medición).
Si \(X\) es una v.a. con media \(\mu\) y varianza \(\sigma^2\), su estandarización estaría dada por:
\[Z=\frac{X-\mu}{\sigma}\]
\[P(a<X<b)=P\left(\frac{a-\mu}{\sigma}<Z<\frac{b-\mu}{\sigma} \right)=\Phi\left(\frac{b-\mu}{\sigma}\right)-\Phi\left(\frac{a-\mu}{\sigma}\right)\] Donde \(\Phi(.)\) es la función de distribución de una normal estándar.
Conteste las preguntas del ejemplo anterior, haciendo uso de la estandarización.
Sabemos que \(N(500 \text{ ml}, 25\text{ ml}^2)\), por lo tanto \(Z=\frac{X-500}{5}\sim N(0,1)\), nos preguntan:
\(P(X<450)=P\left(Z<\frac{450-500}{5}\right)=\Phi(-10)=7.61\times 10^{-24}\)
# parámetros
mu <- 500
sigma <- 5
#P(X<450)
pnorm(q=(450-mu)/sigma)## [1] 7.619853e-24
\(P(490<X<510)=P\left(\frac{510-500}{5}<Z<\frac{490-500}{5} \right)=\Phi(2)-\Phi(-2)=0.9545\) Es decir que el \(95.45\%\) de las botellas tienen un nivel de llenado óptimo.
# parámetros
mu <- 500
sigma <- 5
#P(490<X<510)
pnorm(q=(510-mu)/sigma)-pnorm(q=(490-mu)/sigma)## [1] 0.9544997
Es decir que en este caso nos están preguntado por el percentil 75 de la distribución. Empezaremos encontrando el percentil 75 de la normal estándar (\(z_{0.75}\)):
\[z_{0.75}=0.6745=\frac{\pi_{0.75}-500}{5}\]
Así, \(\pi_{0.75}=z_{0.75}*5+500=503.37\)
Es decir que el 75% de las botellas contienen 503.37 ml o menos.
# parámetros
mu <- 500
sigma <- 5
#percentil 75 de la normal estándar
z75<-qnorm(p=0.75)
#percentil 75 del volumen de llenado
x75<-z75*sigma+mu
print(x75)## [1] 503.3724