Um engenheiro está fazendo o design de uma bateria para uso em um instrumento que estará sujeito a fortes variações de temperatura. O único parâmetro de design que ele pode selecionar nesta fase é o material da lâmina da bateria, sendo que ele tem 3 opções de materiais. O engenheiro decide testar todos os 3 materiais em três níveis de temperatura. 4 baterias são testadas para cada combinação de lâminas e temperaturas e todos os 36 testes são executados em ordem aleatória.

1. Importando os dados

bateria<-read.csv(file = "baterias.csv", header = TRUE)
str(bateria)
## 'data.frame':    36 obs. of  3 variables:
##  $ material   : int  1 1 1 1 2 2 2 2 3 3 ...
##  $ temperatura: int  15 15 15 15 15 15 15 15 15 15 ...
##  $ y          : int  130 155 74 180 150 188 159 126 138 110 ...
#arquivo criado em .CSV (para treinar em outra forma de importação)

1.1. Formulação das Hipóteses

Hipótese nula \(H_0\) : Não há influência do tipo de material ou da temperatura na vida útil das baterias.
Hipótese Alternativa \(H_1\) : Há influência de pelo menos um dos fatores na vida útil das baterias.

1.2 Mudando as variáveis temperatura e material para “factor”

bateria$temperatura <- factor(bateria$temperatura)
bateria$material <- factor(bateria$material)
ggplot(bateria, aes(x = temperatura, y = y, fill = material)) + geom_boxplot()

#### 1.2.1 Analisando os dados

str(bateria)
## 'data.frame':    36 obs. of  3 variables:
##  $ material   : Factor w/ 3 levels "1","2","3": 1 1 1 1 2 2 2 2 3 3 ...
##  $ temperatura: Factor w/ 3 levels "15","70","125": 1 1 1 1 1 1 1 1 1 1 ...
##  $ y          : int  130 155 74 180 150 188 159 126 138 110 ...

1.3 Avaliando o modelo de interação da análise de variâncias fatorial

modelo.anava.fat <- aov(y ~ temperatura*material, data = bateria)
cv.model(modelo.anava.fat)
## [1] 24.62372
summary(modelo.anava.fat)
##                      Df Sum Sq Mean Sq F value      Pr(>F)    
## temperatura           2  39119   19559  28.968 0.000000191 ***
## material              2  10684    5342   7.911     0.00198 ** 
## temperatura:material  4   9614    2403   3.560     0.01861 *  
## Residuals            27  18231     675                        
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

 Como o valor de P ficou abaixo do valor do limite do intervalo de confiança, há forte evidencia de que devo rejeitar as hipóteses nulas. Ou seja, há indícios de que há pelo menos um dos fatores influênciando a durabilidade das baterias.

1.3.1 Análise gráfica do modelo

plot(modelo.anava.fat, 1)

plot(modelo.anava.fat, 2)


  Aparentemente os residuos do modelo atendem ao pressuposto de ter distribuição normal com média zero, mas para confirmar vamos realizar o teste de Shapiro-wilks

1.4 Testando o modelo

shapiro.test(modelo.anava.fat$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  modelo.anava.fat$residuals
## W = 0.97606, p-value = 0.6117

 Como o teste de Shapiro-Wilks confirmou, os resíduos atendem a uma distribuição normal
Agora avaliando a variância para checar a hipótese nula de que a mesma tenha valor constante.

plot(modelo.anava.fat, 3)


Teste de variância de Fligner.

fligner.test(y ~ interaction(temperatura,material),  data = bateria)
## 
##  Fligner-Killeen test of homogeneity of variances
## 
## data:  y by interaction(temperatura, material)
## Fligner-Killeen:med chi-squared = 5.667, df = 8, p-value = 0.6845


Como o teste de Fligner demonstrou um valor de P acima do nivel de significância, não rejeito a hipótese de que a variância dos residuos seja constante

1.4.1 Comparando as médias com o teste de tukey

TukeyHSD(modelo.anava.fat, "material", group = FALSE)
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = y ~ temperatura * material, data = bateria)
## 
## $material
##         diff       lwr      upr     p adj
## 2-1 25.16667 -1.135677 51.46901 0.0627571
## 3-1 41.91667 15.614323 68.21901 0.0014162
## 3-2 16.75000 -9.552344 43.05234 0.2717815
TukeyHSD(modelo.anava.fat, "temperatura", group = FALSE)
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = y ~ temperatura * material, data = bateria)
## 
## $temperatura
##             diff        lwr       upr     p adj
## 70-15  -37.25000  -63.55234 -10.94766 0.0043788
## 125-15 -80.66667 -106.96901 -54.36432 0.0000001
## 125-70 -43.41667  -69.71901 -17.11432 0.0009787


Ao observar a comparação das médias, observamos que existe diferença entre os materiais 1 e 3 (evidenciado pelo baixo valor de P) quando comparados os materiais 2-1 e 3-2 tem médias dentro do nivel de confiança, entrentanto, temos um valor P maior para a relação de materiais 3-2.

1.4.2 Gráfico dos efeitos

library(effects)
## Loading required package: carData
## lattice theme set by effectsTheme()
## See ?effectsTheme for details.
plot(allEffects(modelo.anava.fat), main = "Efeitos do Material e Temperatura sobre a durabilidade das baterias", ylab = "Durabilidade(Horas)",xlab = "Temperatura (ºF)")

_______________________________________________________________________________________________________________________________________

2. Respondendo aos questionamentos.

Quais os efeitos do tipo de material e da temperatura sobre a vida da bateria?
1. Quanto maior a temperatura, menor a durabilidade das baterias, e maior a diferença de desempenho observada entre materiais.

Há um tipo de material que produz uma vida uniformemente longa independentemente da temperatura?

2. O material três, tem melhor desempenho quando comparados aos demais em relação as temperaturas de 70ºF e 125ºF como evidenciado no gráfico de efeitos (topico 1.4.2).
2.1 Sob a temperatura de 15ºF os três materiais apresentam desempenho similar.

2.1 Complemento

Poder do teste

library(pwr)
pwr.anova.test(k = 3, n = 12, f = 0.4, sig.level = .05)
## 
##      Balanced one-way analysis of variance power calculation 
## 
##               k = 3
##               n = 12
##               f = 0.4
##       sig.level = 0.05
##           power = 0.5251548
## 
## NOTE: n is number in each group
#dúvida aqui é se colocamos mesmo o n = 12 ou se passamos para n = 4 e k = 6, se fizer dessa forma o poder do teste é muito baixo!

o poder do teste para a configuração acima é razoável, mas cai enormemente se as observações quanto a N e K forem aceitas.