Una de las distribuciones continuas más comúnmente utilizadas es la distribución normal o Gaussiana,tanto porque es una buena representación de muchas variables aleatorias en la práctica, como porque es la base de una buena parte de la teoría inferencial.
En esta sección conoceremos algunas de sus características y propiedades.
Una v.a.c, tiene distribución normal,\(X \sim N(\mu,\sigma^2)\), si su función de densidad está dada por:
\[f_X(x; \mu,\sigma^2)=\frac{1}{ \sigma\sqrt{2\pi}}\exp\left\{-\frac{(x-\mu)^2}{2\sigma^2}\right\} \text{; para }-\infty<x<\infty.\] Con \(\mu=\textsf{E}[X]\) y \(\sigma^2=\textsf{V}[X]\).
Si \(X\) es una v.a. tal que \(X \sim N(\mu,\sigma^2)\), \(a\) y \(b\) constantes, entonces:
Entre los diabéticos, el nivel de glucosa en sangre en ayunas \(X\),puede suponerse que tiene distribución aproximadamente normal, con media 106 mg/100 ml y desviación estándar 8 mg/100 ml. Con base en lo anterior, calcule:
En primer lugar, la v.a.c X:“nivel de glucosa en sangre en ayunas (mg/100 ml)”, tiene distribución \(N(100, 64)\), adicionalmente, nos preguntan:
\(P(X<100)=F_X(100)=0.2266\)
# parámetros
106
mu <- 8
sigma <-#P(X<100)
pnorm(q=100,mean=mu,sd=sigma)
## [1] 0.2266274
\(P(95<X<125)=F_X(125)-F_X(95)=0.9067\) Es decir que el \(90.67\%\) de los pacientes tienen un nivel de glucosa en ayunas entre 95 mg/100 mly 125 mg/100 ml.
# parámetros
106
mu <- 8
sigma <-#P(95<X<125)
pnorm(q=125,mean=mu,sd=sigma)-pnorm(q=95,mean=mu,sd=sigma)
## [1] 0.9066598
En este caso nos están preguntado por el percentil 75 de la distribución \(\pi_{75}\):
\(\pi_{75}=111.3959\)
Es decir que el 75% de los pacientes tienen niveles de glucosa en ayunas de 111.3959 mg/100 ml o menos.
# parámetros
106
mu <- 8
sigma <-#percentil 75
qnorm(p=0.75,mean=mu,sd=sigma)
## [1] 111.3959
# parámetros
106
mu <- 8
sigma <-par(mfrow=c(1,2))
curve(expr = dnorm(x,mean=mu,sd=sigma), from = 76, to = 136, xlab = "x", ylab = "f(x)", col = "blue", lwd = 2)
curve(expr = pnorm(x,mean=mu,sd=sigma), from = 76, to = 136, xlab = "x", ylab = "f(x)", col = "blue", lwd = 2)
Un caso particular de la distribución normal se tiene cuando \(\mu=0\) y \(\sigma^2=1\), dicha distribución se llama distribución normalestándar y en general se nota como,\(Z \sim N(0,1)\). Su función de densidad está dada por:
\[f_Z(z)=\frac{1}{ \sqrt{2\pi}}\exp\left\{-\frac{z^2}{2}\right\} \text{; para }-\infty<z<\infty.\]
Si \(Z\) es una v.a. tal que \(Z \sim N(0,1)\), entonces:
Al igual que en el caso descriptivo, la estandarización se utiliza cuando se quieren comparar individuos bajo escenarios diferentes, permitiendo hacer comparaciones entre magnitudes no comparables.
Una variable estandarizada es una variable adimensional (no tiene unidades de medición).
Si \(X\) es una v.a. con media \(\mu\) y varianza \(\sigma^2\), su estandarización estaría dada por:
\[Z=\frac{X-\mu}{\sigma}\]
\[P(a<X<b)=P\left(\frac{a-\mu}{\sigma}<Z<\frac{b-\mu}{\sigma} \right)=\Phi\left(\frac{b-\mu}{\sigma}\right)-\Phi\left(\frac{a-\mu}{\sigma}\right)\] Donde \(\Phi(.)\) es la función de distribución de una normal estándar.
Conteste las preguntas del ejemplo anterior, haciendo uso de la estandarización.
Sabemos que \(N(106, 64)\), por lo tanto \(Z=\frac{X-106}{8}\sim N(0,1)\), nos preguntan:
\(P(X<100)=P\left(Z<\frac{100-106}{8}\right)=\Phi(-0.75)=0.2266\)
# parámetros
106
mu <- 8
sigma <-#P(X<450)
pnorm(q=(100-mu)/sigma)
## [1] 0.2266274
\(P(95<X<125)=P\left(\frac{125-106}{8}<Z<\frac{95-106}{8} \right)=\Phi(2.375)-\Phi(-1.375)=0.9067\) Es decir que el \(90.67\%\) de los pacientes tienen un nivel de glucosa en ayunas entre 95 mg/100 mly 125 mg/100 ml.
# parámetros
106
mu <- 8
sigma <-#P(95<X<125)
pnorm(q=(125-mu)/sigma)-pnorm(q=(95-mu)/sigma)
## [1] 0.9066598
Es decir que en este caso nos están preguntado por el percentil 75 de la distribución. Empezaremos encontrando el percentil 75 de la normal estándar (\(z_{0.75}\)):
\[z_{0.75}=0.6745=\frac{\pi_{0.75}-106}{8}\]
Así, \(\pi_{0.75}=z_{0.75}*8+106=111.3959\)
Es decir que el 75% de los pacientes tienen niveles de glucosa en ayunas de 111.3959 mg/100 ml o menos.
# parámetros
106
mu <- 8
sigma <-#percentil 75 de la normal estándar
qnorm(p=0.75)
z75<-#percentil 75 del volumen de llenado
*sigma+mu
x75<-z75print(x75)
## [1] 111.3959