Diseños no paramétricos

Un diseño no paramétrico de experimentos se refiere a un conjunto de técnicas y procedimientos utilizados para analizar datos experimentales que no cumplen con las suposiciones requeridas por los métodos paramétricos tradicionales, como la normalidad en la distribución de los datos o la homogeneidad de las varianzas.

Características principales: Flexibilidad respecto a la distribución:

No requiere que los datos sigan una distribución normal. Es adecuado para datos ordinales, categóricos o datos con outliers extremos. Pruebas basadas en rangos:

En lugar de trabajar con los valores originales, los métodos no paramétricos suelen transformar los datos en rangos para realizar las pruebas. Ejemplo: Prueba de Kruskal-Wallis, Prueba de Friedman. Menos supuestos:

Los métodos no paramétricos tienen menos requisitos sobre las características de los datos, lo que los hace útiles en situaciones donde las pruebas paramétricas no son apropiadas. Tamaño de muestra pequeño:

Son útiles cuando las muestras son pequeñas, ya que los métodos paramétricos pierden potencia en estos casos. Comparaciones:

Los métodos no paramétricos pueden aplicarse en diseños completamente aleatorizados, bloques completos aleatorizados, entre otros. Ejemplos comunes de diseños no paramétricos: Pruebas de hipótesis para una muestra: Prueba de signos. Prueba de Wilcoxon de rangos con signo. Comparación de dos muestras: Prueba de Mann-Whitney U. Prueba de Wilcoxon para muestras pareadas. Comparación de más de dos grupos: Prueba de Kruskal-Wallis. Prueba de Friedman para diseños con medidas repetidas. Aplicaciones: Investigaciones donde las suposiciones de normalidad no se cumplen. Análisis de datos ordinales o categóricos, como encuestas. Datos robustos frente a valores atípicos o cuando los datos presentan sesgos extremos.

El estadístico de Kruskal-Wallis se define como:

\[ H = \frac{12}{N(N+1)} \sum_{i=1}^k n_i \left( \bar{R}_i - \frac{N+1}{2} \right)^2 \]

Donde:

El promedio de rangos para el grupo \(i\) se calcula como:

\[ \bar{R}_i = \frac{1}{n_i} \sum_{j=1}^{n_i} R_{ij} \]

Donde:

Si existen empates en los datos (valores idénticos asignados al mismo rango), el estadístico \(H\) debe ajustarse:

\[ H = \frac{\sum_{i=1}^k n_i \left( \bar{R}_i - \frac{N+1}{2} \right)^2}{\frac{1}{N(N-1)} \left( \sum_{j=1}^N R_j^2 - \frac{N(N+1)^2}{4} \right)} \]

Donde:

El estadístico \(H\) sigue aproximadamente una distribución chi-cuadrado (\(\chi^2\)) con \(k - 1\) grados de libertad bajo la hipótesis nula:

\[ H \sim \chi^2_{k-1} \]

La hipótesis nula establece que las medianas de los grupos son iguales. Si \(H\) excede un valor crítico de la distribución \(\chi^2\), se rechaza la hipótesis nula.

# Crear los datos de los estanques
estanques <- data.frame(
  Estanque_1 = c(7.68, 7.69, 7.70, 7.70, 7.72, 7.73, 7.73, 7.76),
  Estanque_2 = c(7.71, 7.73, 7.74, 7.74, 7.78, 7.78, 7.80, 7.81),
  Estanque_3 = c(7.74, 7.75, 7.77, 7.78, 7.80, 7.81, 7.84, 7.85),
  Estanque_4 = c(7.71, 7.71, 7.74, 7.79, 7.81, 7.85, 7.87, 7.91)
)
# Transformar los datos en formato largo para el test de Kruskal-Wallis
library(tidyr)
datos_long <- gather(estanques, key = "Estanque", value = "pH")

# Realizar el test de Kruskal-Wallis
kruskal_test <- kruskal.test(pH ~ Estanque, data = datos_long)
print(kruskal_test)
## 
##  Kruskal-Wallis rank sum test
## 
## data:  pH by Estanque
## Kruskal-Wallis chi-squared = 12.697, df = 3, p-value = 0.005339

\[ H_0: \theta_1 = ... = \theta_k \]

\[ H_0: \theta_i \neq \theta_j \]

Se recha la hipótesis nula de igualdad de medianas.

# install.packages("FSA")
# Si el test de Kruskal-Wallis es significativo, realizar el test de Dunn
library(FSA)
## ## FSA v0.9.6. See citation('FSA') if used in publication.
## ## Run fishR() for related website and fishR('IFAR') for related book.
dunn_test <- dunnTest(pH ~ Estanque, data = datos_long, method = "bonferroni")
## Warning: Estanque was coerced to a factor.
print(dunn_test)
## Dunn (1964) Kruskal-Wallis multiple comparison
##   p-values adjusted with the Bonferroni method.
##                Comparison          Z     P.unadj       P.adj
## 1 Estanque_1 - Estanque_2 -2.0708929 0.038368803 0.230212819
## 2 Estanque_1 - Estanque_3 -3.1931833 0.001407136 0.008442816
## 3 Estanque_2 - Estanque_3 -1.1222904 0.261739003 1.000000000
## 4 Estanque_1 - Estanque_4 -2.9660531 0.003016484 0.018098904
## 5 Estanque_2 - Estanque_4 -0.8951602 0.370701473 1.000000000
## 6 Estanque_3 - Estanque_4  0.2271302 0.820322508 1.000000000