I

O modelo (de efeitos) mede o tempo de resposta do tipo de calculadora eletronica no qual há hipótese de que as médias de tempos de resposta entre os tipos de calculadora eletrónica são iguais (H₀), a hipótese alternativa mede que alguma das médias é diferente do grupo.

com \(e\sim N(0,\sigma^2)\) temos

\[y_{ij}=\mu+\tau_i+e_{ij}\sim N(\mu_i,\sigma^2);\mu_i=\mu+\tau_i\]

no qual é estimado por

\[\hat\tau_i=\hat\mu_i-\hat\mu = {\sum_{j=i}^ny_{ij}\over n }+ {\sum_{i=1}^a\sum_{j=1}^ny_{ij}\over an }\]

\[\hat\mu_i=\bar{y}_{i.} = {\sum_{j=i}^ny_{ij}\over n }\sim N(\mu_i,\sigma^2/n)\] e supondo variâncias iguais

\[\hat\sigma^2=QMRes=S^2_{comb}={\sum_{j=1}^n (y_{1j}-\bar{y}_1.)^2+...+\sum_{j=1}^n (y_{4j}-\bar{y}_4.)^2\over (n-1)+...+(n-1)}\]

II

A forma da estatística de teste segue a distribuição F, onde mede a razão do erro quadrático médio geral sob o erro quadrático médio de cada grupo.

para 3 tratamentos, \(\tau_1,...,\tau_3\), com \(n\) amostras.

\[\begin{aligned} y_{ij}&=\mu+\tau_i+e_{ij}\\ \text{ e }\\ SQTot&=SQtrat+SQres\\ \sum_{i=1}^a\sum_{j=1}^n (y_{ij}-\mu)^2 &=\sum_{i=1}^a (\bar{y}_{i.}-\bar{y}_{..})^2+\sum_{i=1}^a\sum_{j=1}^n (y_{ij}-\bar{y}_{i.})^2\\ \end{aligned}\]

No qual

\[E(QMTrat)=E({\sum_{i=1}^a (\bar{y}_{i.}-\bar{y}_{..})^2 \over a-1} )=\sigma^2+{n\sum_{i=1}^a\tau_i^2\over a-1}\]

\[E(QMRes)=E({\sum_{i=1}^a\sum_{j=1}^n (y_{ij}-\bar{y}_{i.})^2 \over an-a} )=\sigma^2\]

Assim como estatistica de teste sob hipótese de H₀

H₀: \(\tau_1=,...,=\tau_4\)

\[F_0={QMTrat \over QMRes}\sim F(a-1,an-a)\]

H₁: \(\tau_i\neq \tau_j\text{ para, }i\neq j, i=1,...,4\)

III

valores <- c(19, 22, 20, 18, 25,
             20, 21, 33, 27, 40,
             16, 15, 18, 26, 17)

trat <- factor(rep(1:3, each=5))

modelo <- aov(valores~trat)
summary(modelo)

##             Df Sum Sq Mean Sq F value Pr(>F)  
## trat         2  260.9  130.47   4.006 0.0465 *
## Residuals   12  390.8   32.57                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Com base no valor (Pr(>F)), temos que rejeitamos a hipótese de igualdade entre os grupos, ou seja, existe algum grupo que as médias não sejam significamente iguais.

IV

data <- matrix(valores, byrow = T, ncol = 5)

# Media geral (mu)
media <- mean(data)
media

## [1] 22.46667

# Media por grupo (mu_i)
medias <- apply(data, 1, mean)
medias

## [1] 20.8 28.2 18.4

# efeito de grupo (tau_i)
apply(data, 1, mean) - media

## [1] -1.666667  5.733333 -4.066667

# variância (sigma2) (QM dos residuos)
n=ncol(data); a = nrow(data);

graus <- (a*n-a)
QMres <- sum(
  apply(data, 1, function(x) { sum((x-mean(x))^2)})
  ) / graus

QMres

## [1] 32.56667

V

modelo$residuals[1]

##    1 
## -1.8

VI

Para faze testes de comparações de médias, podemos utilizar o intervalo de confiança onde faz o intervalo para cada dupla. Ou seja, hipotese nula seria que a diferença das médias é igual a zero (as medias são iguais). A hipotese alternativa seria que as diferença das médias é diferente de zero (as medias não são iguais). Então se 0 estiver no intervalo, aceitamo H₀, caso contrátio, rejeitamos.

distancias <- dist(medias)
distancias

##     1   2
## 2 7.4    
## 3 2.4 9.8

Ou seja, com um nível de significância de 0.05, há evidência que apenas os grupos dos tipo 2 e 3, possui igualdade nas médias, ou seja, que a diferença entre elas é igual a zero. Com relação ao Tipo 1, há evidência de rejeitar H₀, comparando com os tipos 2 e 3.

as.numeric(distancias) + qt(0.975, graus)*sqrt(2*QMres/n)

## [1] 15.26387 10.26387 17.66387

as.numeric(distancias) - qt(0.975, graus)*sqrt(2*QMres/n)

## [1] -0.4638745 -5.4638745  1.9361255

alternativamente temos, pelo teste de fisher:

# Utilizando o p_valor (teste de fisher)

# Mas acaba utilizando 0.05*3 para o nivel de significância

2*(1-pt(distancias/ sqrt(2*QMres/n), graus))

##            1          2
## 2 0.06283965           
## 3 0.51865261 0.01877220

Teste de Tukey, mais conservador

# COMO é Y_barra_max -  Y_bara_min, o nível de significativa fica 0.05 unilateral

qtukey(.95, nmeans = 3, df = graus) * sqrt(QMres/n)

## [1] 9.62898

# P-valor
1-ptukey(distancias/ sqrt(QMres/5), nmeans =  3, df=graus)

##            1          2
## 2 0.14258845           
## 3 0.78763926 0.04599703

# Formato de teste
TukeyHSD(modelo)

##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = valores ~ trat)
## 
## $trat
##     diff       lwr        upr     p adj
## 2-1  7.4  -2.22898 17.0289799 0.1425885
## 3-1 -2.4 -12.02898  7.2289799 0.7876393
## 3-2 -9.8 -19.42898 -0.1710201 0.0459970

Outro teste é o do teste de contrastes ortogonais.

Em geral existe 3 teste para comparações pós teste da ANOVA. Fisher, Tukey, contrastes ortogonais e shefer (mais conservador no nível de significância).

VII

Pegando a amostra que possui os menores valores de resposta, o Tipo 3, temos um intervalo de confiança de:

gama = 0.02
sup<-medias[3]+ qt(1-gama/2, graus)* sqrt( QMres/n)

inf<-medias[3]- qt(1-gama/2, graus)* sqrt( QMres/n)

Ou seja

\[IC(\mu_3;98\%)=]11.56 ; 25.24[\]

ANOVA Aplication

I

II

III

IV

V

VI

VII