Um engenheiro está fazendo o design de uma bateria para uso em um instrumento que estará sujeito a fortes variações de temperatura. O único parâmetro de design que ele pode selecionar nesta fase é o material da lâmina da bateria, sendo que ele tem 3 opções de materiais. O engenheiro decide testar todos os 3 materiais em três níveis de temperatura. 4 baterias são testadas para cada combinação de lâminas e temperaturas e todos os 36 testes são executados em ordem aleatória.
bateria<-read.csv(file = "baterias.csv", header = TRUE)
str(bateria)
## 'data.frame': 36 obs. of 3 variables:
## $ material : int 1 1 1 1 2 2 2 2 3 3 ...
## $ temperatura: int 15 15 15 15 15 15 15 15 15 15 ...
## $ y : int 130 155 74 180 150 188 159 126 138 110 ...
#arquivo criado em .CSV (para treinar em outra forma de importação)
Hipótese nula \(H_0\) : Não há influência do tipo de material ou da temperatura na vida útil das baterias.
Hipótese Alternativa \(H_1\) : Há influência de pelo menos um dos fatores na vida útil das baterias.
bateria$temperatura <- factor(bateria$temperatura)
bateria$material <- factor(bateria$material)
ggplot(bateria, aes(x = temperatura, y = y, fill = material)) + geom_boxplot()
#### 1.2.1 Analisando os dados
str(bateria)
## 'data.frame': 36 obs. of 3 variables:
## $ material : Factor w/ 3 levels "1","2","3": 1 1 1 1 2 2 2 2 3 3 ...
## $ temperatura: Factor w/ 3 levels "15","70","125": 1 1 1 1 1 1 1 1 1 1 ...
## $ y : int 130 155 74 180 150 188 159 126 138 110 ...
modelo.anava.fat <- aov(y ~ temperatura*material, data = bateria)
cv.model(modelo.anava.fat)
## [1] 24.62372
summary(modelo.anava.fat)
## Df Sum Sq Mean Sq F value Pr(>F)
## temperatura 2 39119 19559 28.968 0.000000191 ***
## material 2 10684 5342 7.911 0.00198 **
## temperatura:material 4 9614 2403 3.560 0.01861 *
## Residuals 27 18231 675
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Como o valor de P ficou abaixo do valor do limite do intervalo de confiança, há forte evidencia de que devo rejeitar as hipóteses nulas. Ou seja, há indícios de que há pelo menos um dos fatores influênciando a durabilidade das baterias.
plot(modelo.anava.fat, 1)
plot(modelo.anava.fat, 2)
Aparentemente os residuos do modelo atendem ao pressuposto de ter distribuição normal com média zero, mas para confirmar vamos realizar o teste de Shapiro-wilks
shapiro.test(modelo.anava.fat$residuals)
##
## Shapiro-Wilk normality test
##
## data: modelo.anava.fat$residuals
## W = 0.97606, p-value = 0.6117
Como o teste de Shapiro-Wilks confirmou, os resíduos atendem a uma distribuição normal
Agora avaliando a variância para checar a hipótese nula de que a mesma tenha valor constante.
plot(modelo.anava.fat, 3)
Teste de variância de Fligner.
fligner.test(y ~ interaction(temperatura,material), data = bateria)
##
## Fligner-Killeen test of homogeneity of variances
##
## data: y by interaction(temperatura, material)
## Fligner-Killeen:med chi-squared = 5.667, df = 8, p-value = 0.6845
Como o teste de Fligner demonstrou um valor de P acima do nivel de significância, não rejeito a hipótese de que a variância dos residuos seja constante
TukeyHSD(modelo.anava.fat, "material", group = FALSE)
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = y ~ temperatura * material, data = bateria)
##
## $material
## diff lwr upr p adj
## 2-1 25.16667 -1.135677 51.46901 0.0627571
## 3-1 41.91667 15.614323 68.21901 0.0014162
## 3-2 16.75000 -9.552344 43.05234 0.2717815
TukeyHSD(modelo.anava.fat, "temperatura", group = FALSE)
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = y ~ temperatura * material, data = bateria)
##
## $temperatura
## diff lwr upr p adj
## 70-15 -37.25000 -63.55234 -10.94766 0.0043788
## 125-15 -80.66667 -106.96901 -54.36432 0.0000001
## 125-70 -43.41667 -69.71901 -17.11432 0.0009787
Ao observar a comparação das médias, observamos que existe diferença entre os materiais 1 e 3 (evidenciado pelo baixo valor de P) quando comparados os materiais 2-1 e 3-2 tem médias dentro do nivel de confiança, entrentanto, temos um valor P maior para a relação de materiais 3-2.
library(effects)
## Loading required package: carData
## lattice theme set by effectsTheme()
## See ?effectsTheme for details.
plot(allEffects(modelo.anava.fat), main = "Efeitos do Material e Temperatura sobre a durabilidade das baterias", ylab = "Durabilidade(Horas)",xlab = "Temperatura (ºF)")
_______________________________________________________________________________________________________________________________________
Quais os efeitos do tipo de material e da temperatura sobre a vida da bateria?
1. Quanto maior a temperatura, menor a durabilidade das baterias, e maior a diferença de desempenho observada entre materiais.
Há um tipo de material que produz uma vida uniformemente longa independentemente da temperatura?
2. O material três, tem melhor desempenho quando comparados aos demais em relação as temperaturas de 70ºF e 125ºF como evidenciado no gráfico de efeitos (topico 1.4.2).
2.1 Sob a temperatura de 15ºF os três materiais apresentam desempenho similar.
Poder do teste
library(pwr)
pwr.anova.test(k = 3, n = 12, f = 0.4, sig.level = .05)
##
## Balanced one-way analysis of variance power calculation
##
## k = 3
## n = 12
## f = 0.4
## sig.level = 0.05
## power = 0.5251548
##
## NOTE: n is number in each group
#dúvida aqui é se colocamos mesmo o n = 12 ou se passamos para n = 4 e k = 6, se fizer dessa forma o poder do teste é muito baixo!
o poder do teste para a configuração acima é razoável, mas cai enormemente se as observações quanto a N e K forem aceitas.