Ya que si \(X\) es una v.a. que sigue una distribución normal \(N(\mu,\sigma)\), entonces \(Z=\dfrac{X-\mu}{\sigma}\sim N(0,1)\); podemos construir una función \(Z\) que dependa de los parámetros \(x\) (valor particular de la v.a. \(X\)), \(m\) (media de la v.a. \(X\)) y \(de\) (desviación estándar de la v.a. \(X\)) para resolver problemas de probabilidades asociados al uso de la distribución normal, por medio de la distribución normal estándar:
Z = function(x,m,de){pnorm(x,mean=m,sd=de, lower.tail = TRUE)}
Así, si \(X\sim N(\mu,\sigma)\), entonces \(Z(x,m,de)\) entrega la probabilidad acumulada hasta el valor \(x\) mediante una distribución normal estándar. A modo de ejemplo, si \(X\) es una v.a. normal con media 125 y desviación estándar 20, la probabilidad de que \(X\) sea menor que 135 es:
Z(135,125,20)
## [1] 0.6914625
Notemos que la función \(Z\) calcula probabilidades del tipo \(P(X\leq x)\). Si se desea obtener probabilidades del tipo \(P(X\geq x)\), basta usar complementos o su defecto usar la opción lower.tail=FALSE
en la definición de la función \(Z\).
La función plot_normal definida a continuación nos entrega la gráfica de la función de densidad de una v.a. normal con media \(m\) y desviación estándar \(de\).
plot_normal=function(m,de)
{
li = qnorm(0.00001, mean=m, sd=de, lower.tail=TRUE) # qué representa 0.00001?
ls = qnorm(0.99999, mean=m, sd=de, lower.tail=TRUE) # qué representa 0.99999?
curve(dnorm(x, mean=m, sd=de), from=li, to=ls,
ylab = "Probabilidad",
xlab = "Valores de X",
main = "Distribución Normal",
col="blue")
}
Por ejemplo, el siguiente código genera el gráfico de una distribución normal con media 100 y desviación estándar 10. Este gráfico es el generado por defecto en R.
plot_normal(100,10)
Es posible automatizar el proceso de lidiar con las distribuciones muestrales de los diferentes estadísticos. Para ello basta construir funciones que nos ayuden a realizar los cálculos de manera mas eficiente.
Recordemos que si \(X\) es una v.a. con distribución \(N(\mu,\sigma)\) y si \(x_1,x_2,\ldots,x_n\) es una m.a.s. de tamaño \(n\) extraída de esta población, entonces: \[\overline{X}\sim N\left(\mu, \frac{\sigma}{\sqrt{n}}\right)\]
con lo que
\[\frac{\overline{X}-\mu}{\frac{\sigma}{\sqrt{n}}}\sim N(0,1)\]
La función Distr_media definida mas abajo nos ahorra pasar por el proceso de estandarización y nos entrega como resultado la distribución de probabilidad que sigue \(\overline{X}\) y la probabilidades de que \(\overline{X}\) sea menor o mayor que un determinado valor.
Distr_media=function(m,de,n,x)
{
de_media=(de/sqrt(n))
z=(x-m)/de_media
p = pnorm(z,mean=0,sd=1,lower.tail=TRUE)
cat("La media muestral sigue una distrbución N(",m,",",de_media,")\n")
cat("Z","=",z,"\n")
cat("La probabilidad de que la media muestral sea menor que",x,"es",p,"\n")
cat("La probabilidad de que la media muestral sea mayor que",x,"es",1-p,"\n") }
Notemos que la función Distr_media necesita de los siguientes argumentos:
A modo de ejemplo, supongamos que queremos resolver un problema: La altura de los hombres chilenos se distribuye normalmente con media 171.8 cm y desviación estándar de 20 cm. ¿Cuál es la probabilidad de que la altura media en una muestra de 15 hombres chilenos sea mayor que 185 cm?
Distr_media(171.8,20,15,185)
## La media muestral sigue una distrbución N( 171.8 , 5.163978 )
## Z = 2.556169
## La probabilidad de que la media muestral sea menor que 185 es 0.9947084
## La probabilidad de que la media muestral sea mayor que 185 es 0.005291585
Con lo que se concluye que en 99.5 de cada 100 veces que seleccionamos muestras aleatorias de 15 hombres chilenos, la altura media de éstos será inferior a 185 cm. Razón por la cual resulta muy poco probable suponer que en una muestra de 15 hombres chilenos, la altura media supere los 185 cm.
En R, implemente lo siguiente: