1 Introducción

Una de las distribuciones continuas más comúnmente utilizadas es la distribución normal o Gaussiana,tanto porque es una buena representación de muchas variables aleatorias en la práctica, como porque es la base de una buena parte de la teoría inferencial.

En esta sección conoceremos algunas de sus características y propiedades.

2 Distribución Normal

Una v.a.c, tiene distribución normal,\(X \sim N(\mu,\sigma^2)\), si su función de densidad está dada por:

\[f_X(x; \mu,\sigma^2)=\frac{1}{ \sigma\sqrt{2\pi}}\exp\left\{-\frac{(x-\mu)^2}{2\sigma^2}\right\} \text{; para }-\infty<x<\infty.\] Con \(\mu=\textsf{E}[X]\) y \(\sigma^2=\textsf{V}[X]\).

2.1 Propiedades

Si \(X\) es una v.a. tal que \(X \sim N(\mu,\sigma^2)\), \(a\) y \(b\) constantes, entonces:

  • \(\textsf{E}[X] = \mu\).
  • \(\textsf{V}[X] = \sigma^2\).
  • Es simétrica alrededor de \(\mu\)
  • \(P(\mu-\sigma<X<\mu+\sigma)=0.6827\)
  • \(P(\mu-2\sigma<X<\mu+2\sigma)=0.9545\)
  • \(P(\mu-3\sigma<X<\mu+3\sigma)=0.9973\)
  • \(aX+b\sim N(a\mu+b,a^2\sigma^2)\)

2.2 Ejemplo

Se sabe que el nivel de llenado de una botella de gaseosa tiene distribución normal, con promedio 500 ml y desviación estándar 5 ml. Con base en lo anterior, calcule:

  1. El departamento de control de calidad estipula que toda botella que contenga menos de 450 ml no puede salir al mercado ¿Cuál es la probabilidad de que una botella seleccionada al azar no pueda salir al mercado?

En primer lugar, la v.a.c X:“nivel de llenado de una botella de gasesosa (ml)”, tiene distribución \(N(500 \text{ ml}, 25\text{ ml}^2)\), adicionalmente, nos preguntan:

\(P(X<450)=F_X(450)=7.61\times 10^{-24}\)

# parámetros
mu <- 500
sigma <- 5
#P(X<450)
pnorm(q=450,mean=mu,sd=sigma)
## [1] 7.619853e-24
  1. Se dice además que una botella tiene nivel de llenado óptimo si se encuentra entre 490 ml y 510 ml, ¿qué porcentaje de botellas tendrán un nivel de llenado óptimo?

\[P(490<X<510)=F_X(510)-F_X(490)=0.9545\]

Es decir que el \(95.45\%\) de las botellas tienen un nivel de llenado óptimo.

# parámetros
mu <- 500
sigma <- 5
#P(490<X<510)
pnorm(q=510,mean=mu,sd=sigma)-pnorm(q=490,mean=mu,sd=sigma)
## [1] 0.9544997
  1. ¿Cuál es el nivel de llenado máximo del 75% de las botellas?

Es decir que en este caso nos están preguntado por el percentil 75 de la distribución:

\(\pi_{75}=503.37\)

Es decir que el 75% de las botellas contienen 503.37 ml o menos.

# parámetros
mu <- 500
sigma <- 5
#percentil 75
qnorm(p=0.75,mean=mu,sd=sigma)
## [1] 503.3724
  1. Grafique las funciones de densidad y de distribución
# parámetros
mu <- 500
sigma <- 5
par(mfrow=c(1,2))
curve(expr = dnorm(x,mean=mu,sd=sigma), from = 480, to = 520, xlab = "x", ylab = "f(x)", col = "blue", lwd = 2)
curve(expr = pnorm(x,mean=mu,sd=sigma), from = 480, to = 520, xlab = "x", ylab = "f(x)", col = "blue", lwd = 2)

2.3 Distribución normal estándar

Un caso particular de la distribución normal se tiene cuando \(\mu=0\) y \(\sigma^2=1\), dicha distribución se llama distribución normalestándar y en general se nota como,\(Z \sim N(0,1)\). Su función de densidad está dada por:

\[f_Z(z)=\frac{1}{ \sqrt{2\pi}}\exp\left\{-\frac{z^2}{2}\right\} \text{; para }-\infty<z<\infty.\]

2.3.1 Propiedades

Si \(Z\) es una v.a. tal que \(Z \sim N(0,1)\), entonces:

  • \(\textsf{E}[Z] = 0\).
  • \(\textsf{V}[Z] = 1\).
  • Es simétrica alrededor de \(0\)
  • \(P(-1<Z<1)=0.6827\)
  • \(P(-2<Z<2)=0.9545\)
  • \(P(-3<Z<3)=0.9973\)

2.3.2 Estandarización

  • Al igual que en el caso descriptivo, la estandarización se utiliza cuando se quieren comparar individuos bajo escenarios diferentes, permitiendo hacer comparaciones entre magnitudes no comparables.

  • Una variable estandarizada es una variable adimensional (no tiene unidades de medición).

  • Si \(X\) es una v.a. con media \(\mu\) y varianza \(\sigma^2\), su estandarización estaría dada por:

\[Z=\frac{X-\mu}{\sigma}\]

  • En particular si \(X \sim N(\mu,\sigma^2)\), \(Z=\frac{X-\mu}{\sigma}\sim N(0,1)\). Además:

\[P(a<X<b)=P\left(\frac{a-\mu}{\sigma}<Z<\frac{b-\mu}{\sigma} \right)=\Phi\left(\frac{b-\mu}{\sigma}\right)-\Phi\left(\frac{a-\mu}{\sigma}\right)\] Donde \(\Phi(.)\) es la función de distribución de una normal estándar.

2.3.2.1 Ejemplo

Conteste las preguntas del ejemplo anterior, haciendo uso de la estandarización.

  1. El departamento de control de calidad estipula que toda botella que contenga menos de 450 ml no puede salir al mercado ¿Cuál es la probabilidad de que una botella seleccionada al azar no pueda salir al mercado?

Sabemos que \(N(500 \text{ ml}, 25\text{ ml}^2)\), por lo tanto \(Z=\frac{X-500}{5}\sim N(0,1)\), nos preguntan:

\(P(X<450)=P\left(Z<\frac{450-500}{5}\right)=\Phi(-10)=7.61\times 10^{-24}\)

# parámetros
mu <- 500
sigma <- 5
#P(X<450)
pnorm(q=(450-mu)/sigma)
## [1] 7.619853e-24
  1. Se dice además que una botella tiene nivel de llenado óptimo su se encuentra en 490 ml y 510 ml, ¿qué porcentaje de botellas tendrán un nivel de llenado óptimo?

\(P(490<X<510)=P\left(\frac{510-500}{5}<Z<\frac{490-500}{5} \right)=\Phi(2)-\Phi(-2)=0.9545\). Es decir que el \(95.45\%\) de las botellas tienen un nivel de llenado óptimo.

# parámetros
mu <- 500
sigma <- 5
# P(490<X<510)
pnorm(q = (510-mu)/sigma) - pnorm(q = (490-mu)/sigma)
## [1] 0.9544997
  1. ¿Cuál es el nivel de llenado máximo del 75% de las botellas?

Es decir que en este caso nos están preguntado por el percentil 75 de la distribución. Empezaremos encontrando el percentil 75 de la normal estándar (\(z_{0.75}\)):

\[z_{0.75}=0.6745=\frac{\pi_{0.75}-500}{5}\]

Así, \(\pi_{0.75}=z_{0.75}*5+500=503.37\)

Es decir que el 75% de las botellas contienen 503.37 ml o menos.

# parámetros
mu <- 500
sigma <- 5
# percentil 75 de la normal estándar
z75 <- qnorm(p = 0.75)
# percentil 75 del volumen de llenado
x75 <- z75*sigma + mu
print(x75)
## [1] 503.3724