1 Introdução

Em um experimento para estudar o efeito da quantidade de fermento em pó na massa sobre a altura de crescimento dos biscoitos, quatro níveis de fermento em pó foram testados e quatro biscoitos foram feitos com cada nível em uma ordem aleatória. Os resultados são mostrados na tabela abaixo.

0,25 0,50 0,75 1,00
11.4 27.8 47.6 61.6
11.0 29.2 47.0 62.4
11.3 26.8 47.3 63.0
9.5 26.0 45.5 63.9

Então temos neste experimento de DCC de um fator com 4 níveis de fermento e com 4 massas de biscoitos para cada nível. Logo, rt = 16 observações ao total.

2 Análise descritiva

É apresentada abaixo uma breve análise descritivas dos dados, onde é possível identificar que quanto maior a proporção de fermento na massa dos biscoitos, maior fica a altura deles. Ou seja, para o nível de fermento de \(0,25\), a altura média da massa dos biscoitos foi de \(10.8\) unidades de medida, bem como para o nível de fermento de \(1,00\), a altura registrada foi de \(62.725\) unidades de medida. Assim, queremos testar se a diferença entre os níveis de fermento é significativa para o crescimento das massas.

fermento mean
0,25 10.800
0,50 27.450
0,75 46.850
1,00 62.725

O box-plot confirma a ideia de que a medida que aumenta a quantidade de fermento na receita dos biscoitos, maior fica a massa deles. Além disso, parece não haver uma grande diferença na variabilidade dentro de cada um dos quatro tratamentos.

3 Análise de Variância (ANOVA)

## Analysis of Variance Table
## 
## Response: massa
##           Df Sum Sq Mean Sq F value    Pr(>F)    
## fermento   3 6145.7 2048.58  1822.6 3.231e-16 ***
## Residuals 12   13.5    1.12                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Através do modelo ajustado entre a altura observada da massa dos biscoitos e os diferentes níveis de fermento utilizados nas receitas, o teste F evidenciou que há diferença significativa entre pelo menos uma proporção de fermento utilizada (p-valor < 0,001). Ou seja, a altura da massa dos biscoitos é influenciada pela quantidade de fermento utilizada na receita. Agora precisamos descobrir em qual, ou quais níveis, se encontram estas diferenças. Para isso, antes precisamos verificar se os pressupostos do modelo ANOVA estão sendo atendidos.

4 Verificação dos pressupostos do modelo

Os gráficos de diagnósticos mostram a variação residual dos dados observados, onde cada um fornece uma informação espefífica sobre o ajuste do modelo.

No gráfico dos resíduos versus valores ajustados, a linha vermelha representa basicamente a média dos resíduos, que deve ser horizontal e centrada em zero. Além disso, os resíduos precisam ser completamente aleatórios, ou seja, independentes, sem qualquer tipo de formato. No primeiro gráfico não parece haver algum tipo de comportamento ou formado nos resíduos do modelo ajustado.

O gráfico Normal QQ mostra a relação entre os resíduos padronizados e os observados, onde espera-se que os pontos estejam preferencialmente dispostos sobre a diagonal do gráfico de forma linear (ou próxima disso), seguindo uma distribuição aproximadamente normal (simétrica). No segundo gráfico, fica evidente que há uma presença de assimetria, ou seja, sabemos que o pressuposto de normalidade não está sendo atendido, bem como a homocedasticidade. Mesmo sabendo que o teste F é levemente afetado por conta da heterocedasticidade, dado que o experimento é balanceado com efeitos fixos, podemos aceitar a homogeneidade de variância aproximada e considerar o resultado do teste como robusto.

O terceiro gráfico também nos dá uma ideia de homocedasticidade, apesar de não apresentar uma linha exatamente reta em torno de zero (visualmente influenciada pela escala do eixo y), sugerindo um resultado aceitável.

Por fim, o último gráfico mostra os pontos de alavanca ou outliers, onde podemos ver que o modelo não apresentou nenhum resíduo fora do intervalo considerado adequado entre [-2,2].

4.1 Homogeneidade de variâncias

Para garantir o atendimento da homogeneidade de variância do modelo, faremos um teste para avaliar se há diferença entre pelo menos duas variâncias. As hipóteses do teste são dadas por

\[ H_0: \sigma_1^2=\sigma_2^2= \dotsc = \sigma_t^2 \\ H_1: \mbox{pelo menos duas variâncias diferem} \] Tanto o teste de Levene (centrado na média) quanto o teste de Brow-Forsythe (centrado na mediana), não apresentaram resultados significativos (p-valores > 0,05), ou seja, a homogeneidade de variância do modelo está satisfeita.

## Levene's Test for Homogeneity of Variance (center = mean)
##       Df F value Pr(>F)
## group  3  0.4794 0.7026
##       12
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  3  0.4608 0.7148
##       12

4.2 Normalidade dos Resíduos

A análise gráfica para a normalidade dos resíduos pode ser feita através do histograma com a curva de normalidade sobreposta, ou pelo gráfico Normal QQ, que já vimos anteriormente.

Por outro lado, exitem inúmeros testes para normalidade dos resíduos, conforme segue.

## 
##  Lilliefors (Kolmogorov-Smirnov) normality test
## 
## data:  r
## D = 0.18785, p-value = 0.1372
## 
##  Cramer-von Mises normality test
## 
## data:  r
## W = 0.077113, p-value = 0.2102
## 
##  Shapiro-Francia normality test
## 
## data:  r
## W = 0.94746, p-value = 0.3815
## 
##  Anderson-Darling normality test
## 
## data:  r
## A = 0.45008, p-value = 0.24
## 
##  Shapiro-Wilk normality test
## 
## data:  r
## W = 0.93838, p-value = 0.3297
## 
##  One-sample Kolmogorov-Smirnov test
## 
## data:  r
## D = 0.18785, p-value = 0.5621
## alternative hypothesis: two-sided

Conforme os resultados dos seis testes acima, podemos concluir que não houveram evidências significativas para a rejeição da normalidade dos resíduos. Então, seu atendimento está satisfatório.

4.3 Aditividade

A presença de um ou mais outliers pode distorcer a análise de variância. Com a análise gráfica do box-plot dos resíduos fica claro que não há presença de valores extemos, assim como o gráfico com a dispersão dos resíduos padronizados, onde eles não ultrapassam o limite de até 3 desvios. Assim, a pressuposição de aditividade do modelo não está comprometida.

4.4 Independência dos erros

O último pressuposto a ser testado é a correlação entre os resíduos. Com o teste de Durbin-Watson pode-se verificar a presença ou não de correlação entre eles. As hipóteses do teste são dadas por

\[ H_0: \rho = 0\\ H_1: \rho > 0 \]

Conforme resultado do teste DW, não hoveram evidências significativas para a rejeição da hipótese de não correlação dos resíduos (p-valor > 0,05). Ou seja, podemos dizer que os resíduos são independentes. Complementarmente, quando a estatística DW do teste é sensivelmente inferior a 2, há um indicativo da presença de resíduos correlacionados. Como \(DW = 1,8508\) está muito próximo de 2, continuaremos considerando que não há correlação entre os erros.

5 Continuação da ANOVA

Como todos os pressupostos da análise de variância foram atendidos, podemos dar continuidade no modelo sem a necessidade de ajustes. Como já vimos, há diferença significativa entre os níveis de fermento para o crescimento da massa dos biscoitos, como o teste F evidencia abaixo.

## Analysis of Variance Table
## 
## Response: massa
##           Df Sum Sq Mean Sq F value    Pr(>F)    
## fermento   3 6145.7 2048.58  1822.6 3.231e-16 ***
## Residuals 12   13.5    1.12                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Além disso, quando ajustamos um modelo linear, o poder de explicação \(R^2\) para y é de 0.9978, ou seja, 99.78% da variação total do modelo é explicada pelos diferentes níveis de fermento para o crescimento da massa dos biscoitos.

O coeficiente de variação estimado para o modelo de análise de variância foi de 2.87%, que, apesar de parecer baixo, seria necessário ser comparado a resultados de outros experimentos similares para validar esta leve dispersão.

5.1 Complementação da ANOVA

Para complementar o modelo ajustado, será utilizado o teste de Bonferronni pois ele faz uma correção no nível de significânica para as multiplas comparações. Ou seja, este teste aplica uma correção, partindo do número de comparações duas a duas, no alfa da tabela t. Logo, a comparação das diferenças médias estimadas entre todas as seis comparações possíveis para os quatro níveis de fermento foram significativas, a um nível de \(\alpha = 0,01\), como podemos ver na útima tabela de resultados, bem como os ICs para cada média estimada.

## 
## Study: fit1 ~ "fermento"
## 
## LSD t Test for massa 
## P value adjustment method: bonferroni 
## 
## Mean Square Error:  1.123958 
## 
## fermento,  means and individual ( 95 %) CI
## 
##       massa       std r       LCL      UCL  Min  Max
## 0,25 10.800 0.8831761 4  9.645045 11.95495  9.5 11.4
## 0,50 27.450 1.3796135 4 26.295045 28.60495 26.0 29.2
## 0,75 46.850 0.9327379 4 45.695045 48.00495 45.5 47.6
## 1,00 62.725 0.9708244 4 61.570045 63.87995 61.6 63.9
## 
## Alpha: 0.05 ; DF Error: 12
## Critical Value of t: 3.152681 
## 
## Comparison between treatments means
## 
##             difference pvalue signif.       LCL       UCL
## 0,25 - 0,50    -16.650      0     *** -19.01342 -14.28658
## 0,25 - 0,75    -36.050      0     *** -38.41342 -33.68658
## 0,25 - 1,00    -51.925      0     *** -54.28842 -49.56158
## 0,50 - 0,75    -19.400      0     *** -21.76342 -17.03658
## 0,50 - 1,00    -35.275      0     *** -37.63842 -32.91158
## 0,75 - 1,00    -15.875      0     *** -18.23842 -13.51158

6 Conclusão

Após todas as análises realizadas podemos concluir que a quantidade de fermento utilizada nas receitas dos biscoitos influecia no crescimento da massa, e quanto maior for a proporção de fermento utilizada, maior será a altura do biscoito.