O modelo (de efeitos) mede o tempo de resposta do tipo de calculadora eletronica no qual há hipótese de que as médias de tempos de resposta entre os tipos de calculadora eletrónica são iguais (H0), a hipótese alternativa mede que alguma das médias é diferente do grupo.
com \(e\sim N(0,\sigma^2)\) temos
\[y_{ij}=\mu+\tau_i+e_{ij}\sim N(\mu_i,\sigma^2);\mu_i=\mu+\tau_i\]
no qual é estimado por
\[\hat\tau_i=\hat\mu_i-\hat\mu = {\sum_{j=i}^ny_{ij}\over n }+ {\sum_{i=1}^a\sum_{j=1}^ny_{ij}\over an }\]
\[\hat\mu_i=\bar{y}_{i.} = {\sum_{j=i}^ny_{ij}\over n }\sim N(\mu_i,\sigma^2/n)\] e supondo variâncias iguais
\[\hat\sigma^2=QMRes=S^2_{comb}={\sum_{j=1}^n (y_{1j}-\bar{y}_1.)^2+...+\sum_{j=1}^n (y_{4j}-\bar{y}_4.)^2\over (n-1)+...+(n-1)}\]
A forma da estatística de teste segue a distribuição F, onde mede a razão do erro quadrático médio geral sob o erro quadrático médio de cada grupo.
para 3 tratamentos, \(\tau_1,...,\tau_3\), com \(n\) amostras.
\[\begin{aligned} y_{ij}&=\mu+\tau_i+e_{ij}\\ \text{ e }\\ SQTot&=SQtrat+SQres\\ \sum_{i=1}^a\sum_{j=1}^n (y_{ij}-\mu)^2 &=\sum_{i=1}^a (\bar{y}_{i.}-\bar{y}_{..})^2+\sum_{i=1}^a\sum_{j=1}^n (y_{ij}-\bar{y}_{i.})^2\\ \end{aligned}\]
No qual
\[E(QMTrat)=E({\sum_{i=1}^a (\bar{y}_{i.}-\bar{y}_{..})^2 \over a-1} )=\sigma^2+{n\sum_{i=1}^a\tau_i^2\over a-1}\]
\[E(QMRes)=E({\sum_{i=1}^a\sum_{j=1}^n (y_{ij}-\bar{y}_{i.})^2 \over an-a} )=\sigma^2\]
Assim como estatistica de teste sob hipótese de H0
\[F_0={QMTrat \over QMRes}\sim F(a-1,an-a)\]
valores <- c(19, 22, 20, 18, 25,
20, 21, 33, 27, 40,
16, 15, 18, 26, 17)
trat <- factor(rep(1:3, each=5))
modelo <- aov(valores~trat)
summary(modelo)
## Df Sum Sq Mean Sq F value Pr(>F)
## trat 2 260.9 130.47 4.006 0.0465 *
## Residuals 12 390.8 32.57
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Com base no valor (Pr(>F)), temos que rejeitamos a
hipótese de igualdade entre os grupos, ou seja, existe algum grupo que
as médias não sejam significamente iguais.
data <- matrix(valores, byrow = T, ncol = 5)
# Media geral (mu)
media <- mean(data)
media
## [1] 22.46667
# Media por grupo (mu_i)
medias <- apply(data, 1, mean)
medias
## [1] 20.8 28.2 18.4
# efeito de grupo (tau_i)
apply(data, 1, mean) - media
## [1] -1.666667 5.733333 -4.066667
# variância (sigma2) (QM dos residuos)
n=ncol(data); a = nrow(data);
graus <- (a*n-a)
QMres <- sum(
apply(data, 1, function(x) { sum((x-mean(x))^2)})
) / graus
QMres
## [1] 32.56667
modelo$residuals[1]
## 1
## -1.8
Para faze testes de comparações de médias, podemos utilizar o intervalo de confiança onde faz o intervalo para cada dupla. Ou seja, hipotese nula seria que a diferença das médias é igual a zero (as medias são iguais). A hipotese alternativa seria que as diferença das médias é diferente de zero (as medias não são iguais). Então se 0 estiver no intervalo, aceitamo H0, caso contrátio, rejeitamos.
distancias <- dist(medias)
distancias
## 1 2
## 2 7.4
## 3 2.4 9.8
Ou seja, com um nível de significância de 0.05, há evidência que apenas os grupos dos tipo 2 e 3, possui igualdade nas médias, ou seja, que a diferença entre elas é igual a zero. Com relação ao Tipo 1, há evidência de rejeitar H0, comparando com os tipos 2 e 3.
as.numeric(distancias) + qt(0.975, graus)*sqrt(2*QMres/n)
## [1] 15.26387 10.26387 17.66387
as.numeric(distancias) - qt(0.975, graus)*sqrt(2*QMres/n)
## [1] -0.4638745 -5.4638745 1.9361255
alternativamente temos, pelo teste de fisher:
# Utilizando o p_valor (teste de fisher)
# Mas acaba utilizando 0.05*3 para o nivel de significância
2*(1-pt(distancias/ sqrt(2*QMres/n), graus))
## 1 2
## 2 0.06283965
## 3 0.51865261 0.01877220
Teste de Tukey, mais conservador
# COMO é Y_barra_max - Y_bara_min, o nível de significativa fica 0.05 unilateral
qtukey(.95, nmeans = 3, df = graus) * sqrt(QMres/n)
## [1] 9.62898
# P-valor
1-ptukey(distancias/ sqrt(QMres/5), nmeans = 3, df=graus)
## 1 2
## 2 0.14258845
## 3 0.78763926 0.04599703
# Formato de teste
TukeyHSD(modelo)
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = valores ~ trat)
##
## $trat
## diff lwr upr p adj
## 2-1 7.4 -2.22898 17.0289799 0.1425885
## 3-1 -2.4 -12.02898 7.2289799 0.7876393
## 3-2 -9.8 -19.42898 -0.1710201 0.0459970
Outro teste é o do teste de contrastes ortogonais.
Em geral existe 3 teste para comparações pós teste da ANOVA. Fisher, Tukey, contrastes ortogonais e shefer (mais conservador no nível de significância).
Pegando a amostra que possui os menores valores de resposta, o Tipo 3, temos um intervalo de confiança de:
gama = 0.02
sup<-medias[3]+ qt(1-gama/2, graus)* sqrt( QMres/n)
inf<-medias[3]- qt(1-gama/2, graus)* sqrt( QMres/n)
Ou seja
\[IC(\mu_3;98\%)=]11.56 ; 25.24[\]