Entendemos la normalidad como la condición de todo aquello que es normal, es decir, todo aquello que se ajusta a las normas o responde a las expectativas comunes, aquello que no es extraordinario en ninguna medida (ni positiva, ni negativa
Existen varios tipos de pruebas de normalidad, que son métodos estadísticos usados para determinar si un conjunto de datos sigue una distribución normal. Aquí te detallo algunas de las pruebas más comunes:
Prueba de Shapiro-Wilk: Es una de las pruebas más populares y efectivas para verificar la normalidad, especialmente para tamaños de muestra pequeños (generalmente menores de 50). El test calcula una estadística W que mide cuán cercano está el conjunto de datos a una distribución normal; un valor de \(p\) bajo (generalmente \(p < 0.05\)) indica que los datos no siguen una distribución normal.
Prueba de Kolmogorov-Smirnov (K-S): Compara la distribución acumulativa de los datos con la de una distribución normal teórica. Aunque se usa en ocasiones para probar la normalidad, es menos sensible que el Shapiro-Wilk para detectar desviaciones de la normalidad en muestras pequeñas. Es más adecuado para grandes muestras y se usa generalmente para probar otras distribuciones.
Prueba de Anderson-Darling: Es una variación del test K-S que da más peso a las colas de la distribución. Esto la hace más sensible para detectar desviaciones de la normalidad, ya que considera los valores extremos en los datos. Es útil cuando los datos tienen observaciones en las colas que pueden alejarse de la normalidad.
Prueba de Lilliefors: Es una adaptación del test de K-S para el caso en que la media y la desviación estándar de la población no son conocidas. Es una prueba más flexible, utilizada principalmente para distribuciones normales con parámetros desconocidos, siendo útil en muestras pequeñas y medianas.
Prueba de Jarque-Bera: Se basa en el coeficiente de asimetría (skewness) y la curtosis (kurtosis) de los datos. Es adecuada para muestras grandes y calcula si la asimetría y curtosis de los datos son similares a los de una distribución normal. Un valor bajo de \(p\) indica desviaciones en asimetría o curtosis, sugiriendo que los datos no son normales.
Prueba de D’Agostino-Pearson: Esta prueba también se basa en asimetría y curtosis. Primero evalúa estos aspectos por separado, y luego combina ambos en una estadística conjunta para evaluar la normalidad. Es útil para tamaños de muestra medianos y grandes.
Prueba de Chi-cuadrado: También puede usarse para probar la normalidad al comparar las frecuencias observadas con las frecuencias esperadas en una distribución normal. Sin embargo, es menos precisa en muestras pequeñas y se usa más en análisis exploratorio o con datos categóricos.
Además de estas pruebas, es común utilizar gráficos de apoyo, como:
Cada prueba tiene fortalezas y limitaciones, por lo que elegir una depende del tamaño de la muestra y de la sensibilidad que se necesite para detectar desviaciones de la normalidad.
samid=(c(55.57028808,51.20262167,55.90365427,40.34968506,41.29028448,42.09700628,70.92620572,55.90239916,55.45005288,42.76541213,43.74661139,49.69336978,60.19300408,43.97613147,49.99733201,44.20803443,45.34495738,48.14103513,53.1603454,56.92067853,63.51939001,45.16700565,64.27568942,47.74154868,51.86065928,42.52923454,43.96403519,45.92634277,36.57088009,56.29962097,46.08464942,51.9373024,60.97178621,52.3753969,67.02421879,44.4320066,50.43268893,44.56457455,48.56194928,53.94951395,64.33320586,54.95851647,55.85647878,50.69111276,53.57844921,50.76894731,44.19379175,56.25500116,55.2464443,49.15343006,46.71694833,56.94816346,48.80767656,47.27626938,45.56687409,44.08519808,70.94344974,44.13252818,63.3259041))
#Instalacion de paquetes
library(nortest)
#Prueba de normalidad Shapiro Wilks sugerida para menos de 50 datos
shapiro.test(samid)
##
## Shapiro-Wilk normality test
##
## data: samid
## W = 0.95297, p-value = 0.02318
#Prueba de normalidad Anderson Darling sugerida para muestras grandes
ad.test(samid)
##
## Anderson-Darling normality test
##
## data: samid
## A = 0.87549, p-value = 0.02336
#Prueba de normalidad Kolmogorov-Smirnov sugerida para muestras mayores a 50 datos
lillie.test(samid)
##
## Lilliefors (Kolmogorov-Smirnov) normality test
##
## data: samid
## D = 0.090038, p-value = 0.2748