1 Introdução

Um pesquisador formula a hipótese de que a aceitabilidade de um alimento depende da sua forma de preparo. Quatro formulações de um produto estão sendo pesquisadas. As amostras são preparadas e designadas aos julgadores, os quais irão atribuir notas, dentro de uma escala. Serão utilizados 4 julgadores. Como existem diferenças entre os julgadores, estes serão tomados como blocos. Entretanto, cada julgador pode testar apenas três formulações. Então, deve-se usar um delineamento em Blocos Incompletos Balanceados. As notas dos julgadores são apresentadas no quadro abaixo.

julgador 1 7.3 (A) 7.3 (C) 7.5 (D)
julgador 2 7.4 (A) 7.5 (B) 7.5 (C)
julgador 3 7.6 (B) 6.8 (C) 7.2 (D)
julgador 4 7.1 (A) 7.2 (B) 7.5 (D)

1.1 Características (dimensões) do delineamento

Vamos assumir: t tratamentos, b blocos, k tratamentos (tamanho) por bloco, r repetições por tratamento, n=rt=bk observações e \(\lambda\) nº de vezes que cada par de tratamento ocorre junto no mesmo bloco. Então, aqui temos um BIB do Tipo III com as seguintes características:

  • Quatro formulações de um produto estão sendo pesquisadas (t=4).
  • São selecionados 4 julgadores (b=4).
  • Cada julgador pode testar apenas três formulações (k=3).
  • Serão feitas 3 repetições (r=3) de cada tratamento.

O número de vezes que cada par de tratamentos aparece junto no mesmo bloco é \(\lambda= \frac{r(k-1)}{t-1} = \frac{3(3-1)}{4-1}=2\). Assim, \(n=(r \cdot t)=(3 \cdot 4)=12\).

1.2 Modelo

Este ensaio de blocos incompletos balanceados é dado pelo seguinte modelo

\[y_{ij} = \mu + \tau_i + \beta_j + \epsilon_{ij}, \mbox{ }i = 1, \dotsc, 4, \mbox{ } j = 1, \dotsc, 4,\]

Onde \(y_{ij}\) é a observação do i-ésimo tratamento (formulação) no j-ésimo bloco, \(\mu\) representa a média geral, \(\tau_i\) é o efeito da i-ésima formulação (tratamento), \(\beta_j\) é o efeito do j-ésimo bloco (julgador) e \(\epsilon_{ij}\) representa o erro experimental.

As hipóteses a serem testadas são

\[ \begin{aligned} H_0&: \tau_A = \tau_B = \tau_C = \tau_D \\ H_1&: \mbox{ao menos dois pares de médias diferem entre si} \end{aligned} \]

1.3 Aleatorização

Setando as variáveis k = 4 e t = 3, o código abaixo mostra uma possível forma de organizar os blocos de tamanho 3 (b = 3) para este experimento BIB, utilizando a função find.BIB {crossdes}, que resultou na mesma aleatorização que é trazida no problema.

## [1] 3
## [1] 2
##   V1 V2 V3
## 1  1  2  3
## 2  1  2  4
## 3  1  3  4
## 4  2  3  4

2 Leitura dos dados

## 'data.frame':    12 obs. of  3 variables:
##  $ bloco: Factor w/ 4 levels "1","2","3","4": 1 1 1 2 2 2 3 3 3 4 ...
##  $ trat : Factor w/ 4 levels "A","B","C","D": 1 3 4 1 2 3 2 3 4 1 ...
##  $ y    : num  7.3 7.3 7.5 7.4 7.5 7.5 6.7 6.8 7.2 7.1 ...

Através do código baixo podemos confirmar quantas vezes cada par de tratamentos ocorre junto.

## .
## 1_2 1_3 1_4 2_3 2_4 3_4 
##   2   2   2   2   2   2

3 Análise descritiva

No quadro abaixo são apresentados os totais de cada tratmento (formulação), bem como a visualização gráfica da nota que cada julgador deu para as formulações, onde a linha preta representa a nota média de cada formulação.

trat soma
A 21.8
B 21.4
C 21.6
D 22.2

Apesar das notas de aceitabilidade das formulações parecerem similares, o box-plot abaixo mostra que a formulação B apresenta a maior variabilidade entre as demais, ao passo que a maior mediana é da formulação D.

4 Ajuste do modelo ANOVA

O modelo ajustado pelo método de mínimos quadrados ordinários da nota de aceitabilidade para cada julgador, entre as diferentes formulações, é apresentado a seguir.

## Analysis of Variance Table
## 
## Response: y
##           Df Sum Sq  Mean Sq F value   Pr(>F)   
## bloco      3 0.5500 0.183333  28.205 0.001468 **
## trat       3 0.2275 0.075833  11.667 0.010739 * 
## Residuals  5 0.0325 0.006500                    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Como aqui nosso foco é apenas na análise dos blocos, o teste F evidenciou que há diferença significativa entre as formulações (p-valor < 0,001). A próxima etapa é verificar se os pressupostos do modelo ANOVA estão sendo atendidos, para então descobrir em qual, ou quais níveis, se encontram estas diferenças.

5 Verificação dos pressupostos do modelo

5.1 Análise gráfica dos resíduos

Os gráficos de diagnósticos mostram a variação residual dos dados observados, onde cada um fornece uma informação espefífica sobre o ajuste do modelo.

No gráfico dos resíduos versus valores ajustados, não parece haver algum tipo de comportamento ou formado nos resíduos do modelo ajustado.

O gráfico Normal Q-Q mostra a relação entre os resíduos padronizados e os observados, evidenciando que os resíduos do modelo ajustado seguem uma distribuição aproximadamente Normal.

O terceiro gráfico também nos dá uma ideia de homocedasticidade, apesar de não apresentar uma linha exatamente reta em torno de zero (visualmente influenciada pela escala do eixo y), sugerindo um resultado aceitável.

Por fim, o último gráfico mostra três pontos de alavanca e nenhum outlier, onde podemos ver que o modelo não apresentou nenhum resíduo fora do intervalo considerado adequado entre [-2,2].

5.2 Homogeneidade de variâncias

Para garantir o atendimento da homogeneidade de variância do modelo, faremos um teste para avaliar se há diferença entre pelo menos duas variâncias. As hipóteses do teste são dadas por

\[\begin{align} H_0&: \sigma_1^2=\sigma_2^2= \dotsc = \sigma_t^2 \\ H_1&: \mbox{pelo menos duas variâncias diferem} \end{align}\]

O teste de Barlett não rejeita a hipótese \(H_0\) de homocedasticidade para os tratamentos (formulações) (p-valor > 0.05), ou seja, a homogeneidade de variância do modelo está satisfeita.

## 
##  Bartlett test of homogeneity of variances
## 
## data:  r by trat
## Bartlett's K-squared = 4.2189, df = 3, p-value = 0.2388

5.3 Normalidade dos Resíduos

A análise gráfica para a normalidade dos resíduos pode ser feita através do histograma com a curva de normalidade sobreposta, ou pelo gráfico Normal Q-Q, que já vimos anteriormente.

Conforme o resultado do testes de Shapiro-Wilk, podemos concluir que não houve evidência significativa para a rejeição da normalidade dos resíduos (p-valor = 0.905).

## 
##  Shapiro-Wilk normality test
## 
## data:  r
## W = 0.96945, p-value = 0.905

5.4 Aditividade

A presença de um ou mais outliers pode distorcer a análise de variância. Com a análise gráfica do box-plot dos resíduos fica claro que não há presença de valores extemos, assim como o gráfico com a dispersão dos resíduos padronizados, onde eles não ultrapassam o limite de até 3 desvios. Assim, a pressuposição de aditividade do modelo não está comprometida.

5.5 Independência dos erros

O último pressuposto a ser testado é a correlação entre os resíduos. Com o teste de Durbin-Watson pode-se verificar a presença ou não de correlação entre eles. As hipóteses do teste são dadas por

\[ H_0: \rho = 0\\ H_1: \rho > 0 \]

## 
##  Durbin-Watson test
## 
## data:  y ~ bloco + trat
## DW = 2.0192, p-value = 0.2298
## alternative hypothesis: true autocorrelation is greater than 0

Conforme resultado do teste DW, não hoveram evidências significativas para a rejeição da hipótese de não correlação dos resíduos (p-valor = 0.2298). Ou seja, podemos dizer que os resíduos são independentes. Complementarmente, quando a estatística DW do teste é sensivelmente inferior a 2, há um indicativo da presença de resíduos correlacionados. Como \(DW = 2.0192\), podemos considerar que não há correlação entre os erros.

Desta forma, uma vez que os pressupostos do modelo estão sendo atendidos, podemos dar continuidade da análise de variância do experimento.

6 Continuação da ANOVA

Como todos os pressupostos da análise de variância foram atendidos, podemos dar continuidade no modelo sem a necessidade de ajustes. Como já vimos, há diferença significativa entre as formulações para a nota de aceitabilidade do alimento, como o teste F evidencia abaixo.

## Analysis of Variance Table
## 
## Response: y
##           Df Sum Sq  Mean Sq F value   Pr(>F)   
## bloco      3 0.5500 0.183333  28.205 0.001468 **
## trat       3 0.2275 0.075833  11.667 0.010739 * 
## Residuals  5 0.0325 0.006500                    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Quando ajustamos um modelo linear, o poder de explicação \(R^2\) para y é de 0.144, ou seja, 14.4% da variação total do modelo é explicada pela variação entre formulações.

Além disso, o coeficiente de variação estimado para o modelo de análise de variância foi de 1.11%, indica a dispersão do experimento. Este coeficiente é interessante para a comparação com outros estudos com temas semelhantes.

6.1 Complementação da ANOVA

Para complementar o modelo ajustado, será utilizado o teste de Tukey.

##  trat emmean     SE df lower.CL upper.CL .group
##  A      7.14 0.0487  5     7.01     7.26  1    
##  B      7.16 0.0487  5     7.04     7.29  1    
##  C      7.20 0.0487  5     7.07     7.33  1    
##  D      7.50 0.0487  5     7.37     7.63   2   
## 
## Results are averaged over the levels of: bloco 
## Confidence level used: 0.95 
## P value adjustment: tukey method for comparing a family of 4 estimates 
## significance level used: alpha = 0.05

7 Conclusão

Após todas as análises realizadas podemos concluir que o tipo de formulação do alimento influencia na sua aceitabilidade. Além disso, ao compararmos as médias simples entre os tratamentos (formulações), vemos que o tratamento D se diferiencia dos outros três a um nível \(\alpha = 0.05\) - e eles não se diferenciam entre si, isto é, o modo de preparo D de um alimento tem maior aceitabilidade do que as outras formas de preparo.