1 Introducción

Una de las distribuciones continuas más comúnmente utilizadas es la distribución normal o Gaussiana,tanto porque es una buena representación de muchas variables aleatorias en la práctica, como porque es la base de una buena parte de la teoría inferencial.

En esta sección conoceremos algunas de sus características y propiedades.

2 Distribución Normal

Una v.a.c, tiene distribución normal,\(X \sim N(\mu,\sigma^2)\), si su función de densidad está dada por:

\[f_X(x; \mu,\sigma^2)=\frac{1}{ \sigma\sqrt{2\pi}}\exp\left\{-\frac{(x-\mu)^2}{2\sigma^2}\right\} \text{; para }-\infty<x<\infty.\] Con \(\mu=\textsf{E}[X]\) y \(\sigma^2=\textsf{V}[X]\).

2.1 Propiedades

Si \(X\) es una v.a. tal que \(X \sim N(\mu,\sigma^2)\), \(a\) y \(b\) constantes, entonces:

  • \(\textsf{E}[X] = \mu\).
  • \(\textsf{V}[X] = \sigma^2\).
  • Es simétrica alrededor de \(\mu\)
  • \(P(\mu-\sigma<X<\mu+\sigma)=0.6827\)
  • \(P(\mu-2\sigma<X<\mu+2\sigma)=0.9545\)
  • \(P(\mu-3\sigma<X<\mu+3\sigma)=0.9973\)
  • \(aX+b\sim N(a\mu+b,a^2\sigma^2)\)

2.2 Ejemplo

Entre los diabéticos, el nivel de glucosa en sangre en ayunas \(X\),puede suponerse que tiene distribución aproximadamente normal, con media 106 mg/100 ml y desviación estándar 8 mg/100 ml. Con base en lo anterior, calcule:

  1. Se dice que una persona está controlada si su niveles están por debajo de 100 mg/100 ml. ¿Cuál es la probabilidad de que un paciente diabético se encuentre controlado?

En primer lugar, la v.a.c X:“nivel de glucosa en sangre en ayunas (mg/100 ml)”, tiene distribución \(N(100, 64)\), adicionalmente, nos preguntan:

\(P(X<100)=F_X(100)=0.2266\)

# parámetros
mu <- 106
sigma <- 8
#P(X<100)
pnorm(q=100,mean=mu,sd=sigma)
## [1] 0.2266274
  1. ¿Qué porcentaje de diabéticos tienen niveles de glucosa comprendidos entre 95 mg/100 mly 125 mg/100 ml?

\(P(95<X<125)=F_X(125)-F_X(95)=0.9067\) Es decir que el \(90.67\%\) de los pacientes tienen un nivel de glucosa en ayunas entre 95 mg/100 mly 125 mg/100 ml.

# parámetros
mu <- 106
sigma <- 8
#P(95<X<125)
pnorm(q=125,mean=mu,sd=sigma)-pnorm(q=95,mean=mu,sd=sigma)
## [1] 0.9066598
  1. ¿Cuál es el nivel de glucosa máximo del 75% de los pacientes diabéticos?

En este caso nos están preguntado por el percentil 75 de la distribución \(\pi_{75}\):

\(\pi_{75}=111.3959\)

Es decir que el 75% de los pacientes tienen niveles de glucosa en ayunas de 111.3959 mg/100 ml o menos.

# parámetros
mu <- 106
sigma <- 8
#percentil 75
qnorm(p=0.75,mean=mu,sd=sigma)
## [1] 111.3959
  1. Grafique las funciones de densidad y de distribución
# parámetros
mu <- 106
sigma <- 8
par(mfrow=c(1,2))
curve(expr = dnorm(x,mean=mu,sd=sigma), from = 76, to = 136, xlab = "x", ylab = "f(x)", col = "blue", lwd = 2)
curve(expr = pnorm(x,mean=mu,sd=sigma), from = 76, to = 136, xlab = "x", ylab = "f(x)", col = "blue", lwd = 2)

2.3 Distribución normal estándar

Un caso particular de la distribución normal se tiene cuando \(\mu=0\) y \(\sigma^2=1\), dicha distribución se llama distribución normalestándar y en general se nota como,\(Z \sim N(0,1)\). Su función de densidad está dada por:

\[f_Z(z)=\frac{1}{ \sqrt{2\pi}}\exp\left\{-\frac{z^2}{2}\right\} \text{; para }-\infty<z<\infty.\]

2.3.1 Propiedades

Si \(Z\) es una v.a. tal que \(Z \sim N(0,1)\), entonces:

  • \(\textsf{E}[Z] = 0\).
  • \(\textsf{V}[Z] = 1\).
  • Es simétrica alrededor de \(0\)
  • \(P(-1<Z<1)=0.6827\)
  • \(P(-2<Z<2)=0.9545\)
  • \(P(-3<Z<3)=0.9973\)

2.3.2 Estandarización

  • Al igual que en el caso descriptivo, la estandarización se utiliza cuando se quieren comparar individuos bajo escenarios diferentes, permitiendo hacer comparaciones entre magnitudes no comparables.

  • Una variable estandarizada es una variable adimensional (no tiene unidades de medición).

  • Si \(X\) es una v.a. con media \(\mu\) y varianza \(\sigma^2\), su estandarización estaría dada por:

\[Z=\frac{X-\mu}{\sigma}\]

  • En particular si \(X \sim N(\mu,\sigma^2)\), \(Z=\frac{X-\mu}{\sigma}\sim N(0,1)\). Además:

\[P(a<X<b)=P\left(\frac{a-\mu}{\sigma}<Z<\frac{b-\mu}{\sigma} \right)=\Phi\left(\frac{b-\mu}{\sigma}\right)-\Phi\left(\frac{a-\mu}{\sigma}\right)\] Donde \(\Phi(.)\) es la función de distribución de una normal estándar.

2.3.2.1 Ejemplo

Conteste las preguntas del ejemplo anterior, haciendo uso de la estandarización.

  1. Se dice que una persona está controlada si su niveles están por debajo de 100 mg/100 ml. ¿Cuál es la probabilidad de que un paciente diabético se encuentre controlado?

Sabemos que \(N(106, 64)\), por lo tanto \(Z=\frac{X-106}{8}\sim N(0,1)\), nos preguntan:

\(P(X<100)=P\left(Z<\frac{100-106}{8}\right)=\Phi(-0.75)=0.2266\)

# parámetros
mu <- 106
sigma <- 8
#P(X<450)
pnorm(q=(100-mu)/sigma)
## [1] 0.2266274
  1. ¿Qué porcentaje de diabéticos tienen niveles de glucosa comprendidos entre 95 mg/100 mly 125 mg/100 ml?

\(P(95<X<125)=P\left(\frac{125-106}{8}<Z<\frac{95-106}{8} \right)=\Phi(2.375)-\Phi(-1.375)=0.9067\) Es decir que el \(90.67\%\) de los pacientes tienen un nivel de glucosa en ayunas entre 95 mg/100 mly 125 mg/100 ml.

# parámetros
mu <- 106
sigma <- 8
#P(95<X<125)
pnorm(q=(125-mu)/sigma)-pnorm(q=(95-mu)/sigma)
## [1] 0.9066598
  1. ¿Cuál es el nivel de glucosa máximo del 75% de los pacientes diabéticos?

Es decir que en este caso nos están preguntado por el percentil 75 de la distribución. Empezaremos encontrando el percentil 75 de la normal estándar (\(z_{0.75}\)):

\[z_{0.75}=0.6745=\frac{\pi_{0.75}-106}{8}\]

Así, \(\pi_{0.75}=z_{0.75}*8+106=111.3959\)

Es decir que el 75% de los pacientes tienen niveles de glucosa en ayunas de 111.3959 mg/100 ml o menos.

# parámetros
mu <- 106
sigma <- 8
#percentil 75 de la normal estándar
z75<-qnorm(p=0.75)
#percentil 75 del volumen de llenado
x75<-z75*sigma+mu
print(x75)
## [1] 111.3959