Distribucion Normal

Juan Felipe Gonzalez

Probabilidad y Estadistica
Universidad Javeriana

Origen

Surge en el siglo XVIII en el contexto de los errores de medicion en astronomia y geodesia. Abraham de Moivre (1733) en su trabajo sobre la teoria de probabilidades, encontro que la distribución binomial podia aproximarse mediante una curva cuando el numero de ensayos era grande. Carl Friedrich Gauss (1809) utilizo la distribucion normal en el analisis de errores en mediciones astronomicas y geodesicas, lo que ocasiono que se le nombrara la campana de Gauss. Y Pierre-Simon Laplace desarollo el teorema central del limite, que explica porque muchas distribuciones de datos tienden a ser normales cuando se combinan multiples fuentes de variables independientes.

Caracteristicas principales

La funcion densidad de la distribucion normal esta dada por: \[ f(x) = \frac{1}{\sqrt{2\pi\sigma^2}} e^{-\frac{1}{2\sigma^2} (x - \mu)^2}, \quad -\infty \leq x \leq \infty \] La esperanza se define como: \[ E[X] = \mu \]

La varianza se define como: \[ V[X] = \sigma^2 \] Algunas propiedades de la distribucion normal:

-Aproximadamente el 68% de la poblacion se encuentra en el intervalo centrado: \[(\mu-\sigma;\mu+\sigma)\] -Aproximadamente el 95% de la poblacion se encuentra en el intervalo centrado: \[(\mu-2\sigma;\mu+2\sigma)\] -Aproximadamente el 99.7% de la poblacion se encuentra en el intervalo centrado: \[(\mu-3\sigma;\mu+3\sigma)\]

Distribucion normal estandar

Dentro del sin número de posibles curvas que se pueden obtener con los parámetros \(\mu\) y \(\sigma^2\), existe una muy especial. Normal estándar (\(N(0,1)\)) con \(\mu = 0\) y \(\sigma^2 = 1\). La gran mayoría de libros de Estadística poseen tablas de la función de distribución acumulada de la normal estándar.

Su función de distribución está dada por: \[ f(x) = \frac{1}{\sqrt{2\pi}} e^{-\frac{1}{2} x^2}, \quad -\infty \leq x \leq \infty \] Si \[X \sim N(\mu, \sigma^2), entonces ~ Z= \frac{X - \mu}{\sigma} \sim N(0,1)\] Este proceso se llama estandarizacion.

Propiedad empririca de la distribucion normal estandar \[P(\mu-\sigma \leq X\mu+\sigma)=0.68\] \[P(\mu-2\sigma \leq X\mu+2\sigma)=0.95\] \[P(\mu-3\sigma \leq X\mu+3\sigma)=0.99\]

Grafica

Ejemplos

La velocidad de transferencia de archivos desde un servidor en el campus de la universidad a un ordenador personal en casa de un estudiante en un día laborable, se distribuye normalmente con una media de 60 kilobits por segundo y una desviación estándar de 4 kilobits por segundo.

Se puede deducir algunas cosas de aqui: Primero podemos decir que al normalizarlo se va a hacer mas facil encontrar la probabilidad indicada.

\(\mu=60\) (Es la media debido a que se aclara que se distribuye normalmente a esa velocidad)

\(\sigma=4\) (Es la desviacion estandar)

Preguntas:

1.¿Cuál es la probabilidad de que el archivo se transfiera a una velocidad de 70 kilobits por segundo o más?

\(X = 70\) (Porque es el numero al cual se le esta calculando la probabilidad)

Para una variable \(X\) con distribucion \(N(60,16)\), debemos calcular la probabilidad \(P(X\geq70)\)

\[ P(X \geq 70) = P\left( \frac{X - \mu}{\sigma} \geq \frac{70 - 60}{4} \right) \]

\[ = P\left( Z \geq \frac{70 - 60}{4} \right) \]

\[ = P(Z \geq 2.5) = 1 - P(Z < 2.5) \]

\[ = 1 - 0.9938 = 0.0062 \] Codigo de R

pnorm(70, mean=60, sd=4, lower.tail=FALSE)

## [1] 0.006209665

¿Cual es la probabilidad de que se transfiera entre 50 y 60 kilobits por segundo?

\(20 \leq X \leq 50\) (Entre esos valores va a pertenecer X para ver su probabilidad)

\[ P(50 \leq X \leq 60) = P\left( \frac{50 - 60}{4} \leq \frac{X - \mu}{\sigma} \leq \frac{60 - 60}{4} \right) \] \[ = P\left( \frac{50 - 60}{4} \leq Z \leq \frac{60 - 60}{4} \right) \] \[ = P\left( -2.5 \leq Z \leq 0 \right) \] \[ P(Z \leq 0) - (Z \leq -2.5) = 0.5-0.0062 = 0.4938 \] Codigo de R

norm1 <- pnorm(60, mean=60, sd=4, lower.tail=FALSE)

norm2 <- pnorm(50, mean=60, sd=4, lower.tail=FALSE)

totnormal <- norm2 - norm1

## 0.4937903

¿Cual es el valor esperado y la varianza?

\(E(X)=\mu=60\)

\(V(X) = \sigma=4\)

Aplicaciones en campos (Ingenierias, ciencias, economia, etc.)

En campos de ingeniería se puede usar para control de calidad, como en el monitoreo de medidas de piezas manufacturadas, y poder comprobar que se cumplan las especificaciones. Además, también puede ser usado para poder determinar la vida útil de algunos materiales o piezas, para poder determinar el tiempo en el que se pueden producir fallos y prevenirlos.

También tiene aplicación en campos de ciencias, con ejemplos como los errores de medición y análisis de datos, los cuales fueron de los primeros aplicados y por eso se inició la distribución normal. Adicionalmente, se puede aplicar en estudio de biometría para definir valores en poblaciones.

Y, por último, algunas aplicaciones en economía y finanzas, incluyen el cálculo de probabilidades de pérdidas en inversiones, análisis de desigualdad económica con medidas de dispersión, y estimaciones de inflación con respecto a variaciones normales.

Relaciones entre distribuciones univariadas

La distribucion normal tiene varias relaciones con otras distribuciones presentadas, siendo esta una de las distribuciones centrales:

La estandar normal es uno de los casos en los que las transformaciones pueden ser invertidas, en este caso Si \(X \sim N(\mu, \sigma^2)\), entonces \(\frac{X-\mu}{\sigma}\sim N(0,1)\); siendo esta de la normal a la estandar, tambien puede ser lo opuesto si \(X \sim N(0,1)\) seria \(\mu + \sigma X \sim N(\mu, \sigma^2)\)
El algoritmo de cajas de Muller, convierte a \(U(0,1)\) a una exponencial, despues a una chi-cuadrada, a una estandar normal y por ultimo a una variable normal aleatoria.
Una normal y una variable aleatoria uniforme, son casos especiales de el error de una variable aleatoria. (Evans, Hastings, and Peacock 2000, p. 166)
El limite de una variable aleatoria von Misess es normal tal que \(k -> \infty\) (Evans, Hastings, and Peacock 2000, p. 191)
Las distribuciones half-normal, Rayleigh y Maxwell-Boltzmann son casos especiales de la distribución chi con \(n = 1\), \(n = 2\) y \(n = 3\) grados de libertad, respectivamente. (Johnson, Balakrishnan y Kotz, 1994, p. 417).
La distribucion t con grado n de libertad, es definida como distribucion de: \(\frac{Z}{\sqrt{\frac{\chi^2(n)}{n}}}\), donde \(Z\) es una normal estandar, y \(\chi^2(n)\) es una variable de chi-cuadrada con grado n de libertad, independiente de Z. (Evans, Hastings, and Peacock 2000, p. 180)
Log-normal \(((- \infty < \alpha < \infty))\):

\[ f(x) = \frac{1}{\sqrt{2\pi} \beta x} \exp \left[ -\frac{1}{2} \left( \frac{\log(x / \alpha)}{\beta} \right)^2 \right], \quad x > 0 \] # Referencias

Laplace, P.-S. (1812). Théorie analytique des probabilités. Courcier.
Guía: La distribución normal - Fisterra. (2025). www.fisterra.com/formacion/metodologia-investigacion/la-distribucion-normal/#:~:text=La%20distribución%20normal%20fue%20reconocida,la”campana%20de%20Gauss”.
Leemis, L. M., & McQueston, J. T. (2008). Univariate distribution relationships. The American Statistician, 62(1), 45-53. [PDF].