Para estudiar la confiabilidad de ciertos tableros electrónicos para carros, se someten a un envejecimiento acelerado durante 100 horas a determinada temperatura, y como variable de interés se mide la intensidad de corriente que circula entre dos puntos, cuyos valores aumentan con el deterioro. Se probaron 20 módulos repartidos de manera equitativamente en cinco temperaturas y los resultados obtenidos fueron los siguientes1:
| 20°C | 40°C | 60°C | 80°C | 100°C |
|---|---|---|---|---|
| 15 | 17 | 23 | 28 | 45 |
| 18 | 21 | 19 | 32 | 51 |
| 13 | 11 | 25 | 34 | 57 |
| 12 | 16 | 22 | 31 | 48 |
La hipotesis nula es la siguiente: \(H_0: \mu_1 = \mu_2 = \mu_3 = \mu_4 = \mu_5\) La temperatura no afecta la intensidad de corriente promedio.
La hipotesis alternativa es la siguiente: \(H_1: \mu_1 \neq \mu_2 \neq \mu_3 \neq \mu_4 \neq \mu_5\) La temperatura afecta la intensidad de corriente promedio.
El modelo estadístico es el siguiente: \(Y_{ij} = \mu + \tau_i + \epsilon_{ij}\) donde \(Y_{ij}\) es la intensidad de corriente promedio, \(\mu\) es el efecto promedio, \(\tau_i\) es el efecto de la temperatura y \(\epsilon_{ij}\) es el error aleatorio.
Para estudiar si la temperatura afecta la intensidad de corriente promedio, se realiza un análisis de varianza (ANOVA) para comparar las medias de los diferentes tratamientos. El análisis de varianza se realiza con la función aov() y se imprime el resumen con la función summary().
# Datos
temperatura <- c(20, 20,20,20, 40,40,40,40,60,60,60,60,80,80,80,80, 100, 100, 100, 100)
intensidad <- c(15, 18,13,12, 17,21,11,16, 23,19,25,22, 28,32,34,31, 45,51,57,48)
# Análisis de varianza
anova_temp<- aov(intensidad ~ factor(temperatura)) #En este caso se esta utilizando el factor() para que R entienda que la variable temperatura es una variable categórica con 5 niveles distintos (20, 40, 60, 80, 100) y no una variable continua, asi se evita que R haga un análisis de regresión lineal y solo realice un análisis de varianza.
summary(anova_temp)
## Df Sum Sq Mean Sq F value Pr(>F)
## factor(temperatura) 4 3412 853.0 68.06 1.96e-09 ***
## Residuals 15 188 12.5
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
# Test Tukey
TukeyHSD(anova_temp)
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = intensidad ~ factor(temperatura))
##
## $`factor(temperatura)`
## diff lwr upr p adj
## 40-20 1.75 -5.98009744 9.480097 0.9535481
## 60-20 7.75 0.01990256 15.480097 0.0492648
## 80-20 16.75 9.01990256 24.480097 0.0000612
## 100-20 35.75 28.01990256 43.480097 0.0000000
## 60-40 6.00 -1.73009744 13.730097 0.1696046
## 80-40 15.00 7.26990256 22.730097 0.0002059
## 100-40 34.00 26.26990256 41.730097 0.0000000
## 80-60 9.00 1.26990256 16.730097 0.0190664
## 100-60 28.00 20.26990256 35.730097 0.0000001
## 100-80 19.00 11.26990256 26.730097 0.0000141
El análisis de varianza nos da un p-valor de 1.96e-09 que es menor que 0.05, es decir, hay suficiente evidencia para rechazar la hipótesis nula. En otras palabras, la temperatura afecta la intensidad de corriente promedio.
El test de Tukey nos da los pares de temperaturas que son significativamente diferentes. Los pares de temperaturas que son significativamente diferentes son: (T20, T40), (T20, T60), (T20, T80), (T20, T100), (T40, T60), (T40, T80), (T40, T100), (T60, T80), (T60, T100), (T80, T100).
Para verificar si la temperatura afecta la variabilidad de las intensidades, se realiza una prueba de Levene para comparar las varianzas de los diferentes tratamientos. La prueba de Levene se realiza con la función leveneTest() del paquete car.
library(car)
## Warning: package 'car' was built under R version 4.2.2
## Loading required package: carData
## Warning: package 'carData' was built under R version 4.2.1
# Prueba de Levene
levene_test <- leveneTest(intensidad ~ factor(temperatura))
# Imprimir resultados
levene_test
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 4 0.6808 0.616
## 15
La prueba de levene nos da un p-valor de 0.616 que es mayor que 0.05, es decir, no hay suficiente evidencia para rechazar la hipótesis nula. En otras palabras, la temperatura no afecta la variabilidad de las intensidades.
Para visualizar los resultados del análisis de varianza, se realizan gráficos de cajas y bigotes para comparar las intensidades de corriente en las diferentes temperaturas.
# Gráfico de cajas y bigotes
boxplot(intensidad ~ factor(temperatura), xlab = "Temperatura", ylab = "Intensidad de corriente", main = "Intensidad de corriente por temperatura")
# Gráfico de medias
means <- tapply(intensidad, temperatura, mean)
barplot(means, xlab = "Temperatura", ylab = "Intensidad de corriente promedio", main = "Intensidad de corriente promedio por temperatura")
# Histograma
hist(intensidad, xlab = "Intensidad", main = "Histograma de residuos")
Los gráficos de cajas y bigotes muestran que las intensidades de corriente aumentan con la temperatura, lo que confirma los resultados del análisis de varianza. El gráfico de medias muestra claramente que la intensidad de corriente promedio aumenta con la temperatura.
Ejercicio extraido del libro Análisis y diseño de experimentos.
Gutiérrez Pulido, H., & Vara Salazar, R. d. l. (2012). Análisis y diseño de experimentos (3a. ed. --.). México D.F.: McGrawHill.↩︎