La distribución normal, también conocida como distribución Gaussiana o campana de Gauss, en honor al matemático Carl Friederich Gauss, se describe mediante la siguiente ecuación:
\[Y=\frac{1}{\sqrt { 2\pi \sigma }} { e }^{ { -{ \left( x-\mu \right) }^{ 2 } }/{ { 2\sigma }^{ 2 } } }\]
Donde, \(Y\) = La altura de la curva en el punto X
\(\mu\) = Media aritmética de la distribución
\(\sigma\) = Desviación estándar de la distribución
\(\pi\) = Constante con valor aproximado de 3.1416
\(e\) = Constante con valor aproximado de 2.7183
Una distribución normal cumple con las siguientes características:
La normalidad de una curva se contrasta mediante los coeficientes de asimetría y curtosis, estos se pueden obtener fácilmente en un resumen de la distribución mediante la función describe()
del paquete psych
. Esta función nos presenta también, entre otros datos, la media aritmética y la desviación estándar.
Se denomina asimetría(\(\gamma_1\)) a la falta de simetría en la distribución. Con base en su asimetría, una curva puede ser simétrica (\(\gamma_1=0\)) o tener asimetría positiva (\(\gamma_1>0\)) o negativa (\(\gamma_1<0\)).
La curtosis (\(\gamma_2\)) determina el grado en que se concentran los datos de la distribución en su región central. De acuerdo a esta concentración la distribución puede ser: 1) platicúrtica (\(\gamma<0\)); mesocúrtica (\(\gamma_2=0\)); o 3) leptocúrtica (\(\gamma_2>0\)).
Es casi imposible obtener un valor de cero para estos coeficientes por lo que se considera que una distribución es simétrica o mesocúrtica cuando el coeficiente indicado para cada caso adquiere valores entre \(\pm\) 0.5.
Como ejemplo obtengamos una distribución de 1000 números aleatorios con una distribución normal (\(X \sim N(0,1)\)). Con la función describe()
obtenemos los estadísticos de media arítmetica, desviación estándar, asímetría y curtosis y con la función shapiro.test()
calculamos la prueba de normalidad de Shapiro-Wilk.
set.seed(123)
x <- rnorm(1000, 0, 1)
psych::describe(x)
vars n mean sd median trimmed mad min max range skew kurtosis
1 1 1000 0.02 0.99 0.01 0.01 0.96 -2.81 3.24 6.05 0.07 -0.08
se
1 0.03
shapiro.test(x)
Shapiro-Wilk normality test
data: x
W = 0.99838, p-value = 0.4765
La media (0.016) es muy cercana a la media teórica de cero, lo mismo sucede con la desviación estándar (0.992) cercana a uno, y los coeficientes \(\gamma_1\) y \(\gamma_2\) se encuentran en el rango considerado para una distribución simétrica y mesocúrtica. De igual forma la prueba de Shapiro-Wilk indica que la distribución es normal (\(p>0.05\)).
En la siguiente gráfica se representa la densidad para esta distribución y se señalan los valores (redondeados) para la media, y cuatro desviaciones estándar (dos positivas y dos negativas).