Normalidad

Entendemos la normalidad como la condición de todo aquello que es normal, es decir, todo aquello que se ajusta a las normas o responde a las expectativas comunes, aquello que no es extraordinario en ninguna medida (ni positiva, ni negativa

pruebas pequeñas

Existen varios tipos de pruebas de normalidad, que son métodos estadísticos usados para determinar si un conjunto de datos sigue una distribución normal. Aquí te detallo algunas de las pruebas más comunes:

  1. Prueba de Shapiro-Wilk: Es una de las pruebas más populares y efectivas para verificar la normalidad, especialmente para tamaños de muestra pequeños (generalmente menores de 50). El test calcula una estadística W que mide cuán cercano está el conjunto de datos a una distribución normal; un valor de \(p\) bajo (generalmente \(p < 0.05\)) indica que los datos no siguen una distribución normal.

  2. Prueba de Kolmogorov-Smirnov (K-S): Compara la distribución acumulativa de los datos con la de una distribución normal teórica. Aunque se usa en ocasiones para probar la normalidad, es menos sensible que el Shapiro-Wilk para detectar desviaciones de la normalidad en muestras pequeñas. Es más adecuado para grandes muestras y se usa generalmente para probar otras distribuciones.

  3. Prueba de Anderson-Darling: Es una variación del test K-S que da más peso a las colas de la distribución. Esto la hace más sensible para detectar desviaciones de la normalidad, ya que considera los valores extremos en los datos. Es útil cuando los datos tienen observaciones en las colas que pueden alejarse de la normalidad.

  4. Prueba de Lilliefors: Es una adaptación del test de K-S para el caso en que la media y la desviación estándar de la población no son conocidas. Es una prueba más flexible, utilizada principalmente para distribuciones normales con parámetros desconocidos, siendo útil en muestras pequeñas y medianas.

  5. Prueba de Jarque-Bera: Se basa en el coeficiente de asimetría (skewness) y la curtosis (kurtosis) de los datos. Es adecuada para muestras grandes y calcula si la asimetría y curtosis de los datos son similares a los de una distribución normal. Un valor bajo de \(p\) indica desviaciones en asimetría o curtosis, sugiriendo que los datos no son normales.

  6. Prueba de D’Agostino-Pearson: Esta prueba también se basa en asimetría y curtosis. Primero evalúa estos aspectos por separado, y luego combina ambos en una estadística conjunta para evaluar la normalidad. Es útil para tamaños de muestra medianos y grandes.

  7. Prueba de Chi-cuadrado: También puede usarse para probar la normalidad al comparar las frecuencias observadas con las frecuencias esperadas en una distribución normal. Sin embargo, es menos precisa en muestras pequeñas y se usa más en análisis exploratorio o con datos categóricos.

Métodos gráficos de apoyo

Además de estas pruebas, es común utilizar gráficos de apoyo, como:

  • Histogramas: Para visualizar si la distribución de los datos es aproximadamente simétrica y en forma de campana.
  • Q-Q Plot (Gráfica Cuantiles vs. Cuantiles): Grafica los cuantiles de los datos observados contra los cuantiles teóricos de una distribución normal. Si los datos son normales, los puntos estarán alineados cerca de la línea diagonal.

Cada prueba tiene fortalezas y limitaciones, por lo que elegir una depende del tamaño de la muestra y de la sensibilidad que se necesite para detectar desviaciones de la normalidad.

pruebas de muestras mas pequeñas

samid=(c(55.57028808,51.20262167,55.90365427,40.34968506,41.29028448,42.09700628,70.92620572,55.90239916,55.45005288,42.76541213,43.74661139,49.69336978,60.19300408,43.97613147,49.99733201,44.20803443,45.34495738,48.14103513,53.1603454,56.92067853,63.51939001,45.16700565,64.27568942,47.74154868,51.86065928,42.52923454,43.96403519,45.92634277,36.57088009,56.29962097,46.08464942,51.9373024,60.97178621,52.3753969,67.02421879,44.4320066,50.43268893,44.56457455,48.56194928,53.94951395,64.33320586,54.95851647,55.85647878,50.69111276,53.57844921,50.76894731,44.19379175,56.25500116,55.2464443,49.15343006,46.71694833,56.94816346,48.80767656,47.27626938,45.56687409,44.08519808,70.94344974,44.13252818,63.3259041))
#Instalacion de paquetes
library(nortest)
#Prueba de normalidad Shapiro Wilks sugerida para menos de 50 datos
shapiro.test(samid)
## 
##  Shapiro-Wilk normality test
## 
## data:  samid
## W = 0.95297, p-value = 0.02318
#Prueba de normalidad Anderson Darling sugerida para muestras grandes
ad.test(samid)
## 
##  Anderson-Darling normality test
## 
## data:  samid
## A = 0.87549, p-value = 0.02336
#Prueba de normalidad Kolmogorov-Smirnov sugerida para muestras mayores a 50 datos
lillie.test(samid)
## 
##  Lilliefors (Kolmogorov-Smirnov) normality test
## 
## data:  samid
## D = 0.090038, p-value = 0.2748