1.Análise de Poder e Número de Repetições

Exercícios

Um experimento comparou os efeitos de 5 tratamentos em relação ao crescimento de mudas de Pinus oocarpa, 60 dias após a semeadura. Os tratamentos utilizados foram: 1 - T1 = Solo de cerrado  2 - T2 = Solo de cerrado + esterco  3 - T3 = Solo de cerrado + esterco + NPK  4 - T4 = Solo de cerrado + Vermiculita  5 - T5 = Solo de cerrado + Vermiculita + NPK

O delineamento foi uma ANOVA com 1-Fator (delineamento inteiramente casualizado), com 4 repetições. Os resultados obtidos para as alturas médias de Pinus oocarpa sob aqueles tratamentos, em cm, aos 60 dias após a semeadura são apresentados no Quadro 1: Alturas médias de Pinus oocarpa, aos 60 dias após semeadura, em cm.

A. Construa um arquivo de dados apropriado para um software estatístico.

R: O arquivo de dados com a tabela foi construída em um bloco de notas, formato “TXT” e nomeado como “pinus2”.

1.1 Determinação de n - diferença padronizada pequena

pwr.anova.test(k = 5, f = 0.1, sig.level = .05, power = .4)
## 
##      Balanced one-way analysis of variance power calculation 
## 
##               k = 5
##               n = 101.9644
##               f = 0.1
##       sig.level = 0.05
##           power = 0.4
## 
## NOTE: n is number in each group

1.2 Determinação de n - diferença padronizada média

pwr.anova.test(k = 5, f = 0.25, sig.level = .05, power = .4)
## 
##      Balanced one-way analysis of variance power calculation 
## 
##               k = 5
##               n = 17.13092
##               f = 0.25
##       sig.level = 0.05
##           power = 0.4
## 
## NOTE: n is number in each group

1.3 Determinação de n - diferença padronizada grande

pwr.anova.test(k = 5, f = 0.4, sig.level = .05, power = .4)
## 
##      Balanced one-way analysis of variance power calculation 
## 
##               k = 5
##               n = 7.310441
##               f = 0.4
##       sig.level = 0.05
##           power = 0.4
## 
## NOTE: n is number in each group

1.4 Estimativa do Poder do teste - diferença padronizada pequena

pwr.anova.test(k = 5, n = 4, f = 0.1, sig.level = .05)
## 
##      Balanced one-way analysis of variance power calculation 
## 
##               k = 5
##               n = 4
##               f = 0.1
##       sig.level = 0.05
##           power = 0.05750932
## 
## NOTE: n is number in each group

1.5 Estimativa do Poder do teste - diferença padronizada média

pwr.anova.test(k = 5, n = 4, f = 0.25, sig.level = .05)
## 
##      Balanced one-way analysis of variance power calculation 
## 
##               k = 5
##               n = 4
##               f = 0.25
##       sig.level = 0.05
##           power = 0.1015229
## 
## NOTE: n is number in each group

1.6 Estimativa do Poder do teste - diferença padronizada grande

pwr.anova.test(k = 5, n = 4, f = 0.4, sig.level = .05)
## 
##      Balanced one-way analysis of variance power calculation 
## 
##               k = 5
##               n = 4
##               f = 0.4
##       sig.level = 0.05
##           power = 0.1987084
## 
## NOTE: n is number in each group

Interpretando: diferença padronizada pequena: o poder de teste tem 6% de rejeitar corretamente H0. diferença padronizada média: o poder de teste tem 10% de rejeitar corretamente H0. diferença padronizada grande: o poder de teste tem 20% de rejeitar corretamente H0.

2. Análise exploratória dos dados

2.1 Importando e verificando os dados

pinus <- read.table("pinus2.txt", header = TRUE) 
str(pinus)
## 'data.frame':    20 obs. of  2 variables:
##  $ Tratamento: Factor w/ 5 levels "T1","T2","T3",..: 1 1 1 1 2 2 2 2 3 3 ...
##  $ altura    : num  4.6 5.1 5.8 5.5 6 7.1 7.2 6.8 5.8 7.2 ...

2.2 Boxplot R. Base

boxplot(altura ~ Tratamento, data = pinus, col = "lightgray")

2.3 Boxplot R. Base usando pacote ‘ggplot2’

library(ggplot2) 
ggplot(pinus, aes(x=Tratamento, y=altura, fill=Tratamento)) + geom_boxplot()

2.4 Estatísticas Descritivas

library(summarytools)
## Registered S3 method overwritten by 'pryr':
##   method      from
##   print.bytes Rcpp
descr(pinus$altura, style = 'rmarkdown')
## ### Descriptive Statistics  
## #### pinus$altura  
## **N:** 20  
## 
## |          &nbsp; | altura |
## |----------------:|-------:|
## |        **Mean** |   6.12 |
## |     **Std.Dev** |   0.78 |
## |         **Min** |   4.60 |
## |          **Q1** |   5.65 |
## |      **Median** |   5.95 |
## |          **Q3** |   6.80 |
## |         **Max** |   7.20 |
## |         **MAD** |   1.04 |
## |         **IQR** |   1.12 |
## |          **CV** |   0.13 |
## |    **Skewness** |  -0.22 |
## | **SE.Skewness** |   0.51 |
## |    **Kurtosis** |  -1.16 |
## |     **N.Valid** |  20.00 |
## |   **Pct.Valid** | 100.00 |

3. Estimação do Modelo

# aov: estima o modelo linear 
pinus.aov <- aov(altura ~ Tratamento, data = pinus)

# Exibe a Tabela da ANAVA 
summary(pinus.aov)
##             Df Sum Sq Mean Sq F value  Pr(>F)   
## Tratamento   4  7.597   1.899   7.277 0.00183 **
## Residuals   15  3.915   0.261                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

B. Quais são as hipóteses nula e alternativa para este experimento?

Interpretação: H0: não há influência entre as médias dos tratamentos no crescimento das mudas. H1: Há influência de pelo menos um dos tratamentos no crescimento das mudas.

C. Estime o modelo e construa a tabela da ANAVA. Teste a hipótese de que não há diferença entre as médias dos tratamentos sobre o crescimento das mudas após 60 dias de semeadura (α = 5%).

R: Quanto maior a caixa do boxplot, maior a variabilidade dos dados. Para a distribuição ser simétrica, a mediana tem que estar no meio da caixa. As médias obtidas em T2 e T3, mesmo obtendo semelhança, existe diferença entre os efeitos médios dos tratamentos sobre os crescimentos das mudas após 60 dias. Então rejeitamos H0 porque o valor P do teste de análise de variância = 0.00183 é menor que o nível de significância 5%. E H1: há pelo menos uma diferença.

D. Quais os efeitos principais dos tratamentos?

Estimastivas dos efeitos principais \(\hat[\tau]_i\)

coef(pinus.aov)
##  (Intercept) TratamentoT2 TratamentoT3 TratamentoT4 TratamentoT5 
##        5.250        1.525        1.400        0.275        1.150

R: O crescimento das mudas no T1 estará 5,25 cm, em média. As outras estimativas são diferenças entre cada efeito de tratamento e a altura, isto é, o nível de referência. Po exemplo, na T2 as mudas crescem 3,725 cm mais rapidamente ( ou seja, em média para T2 = 5,250 - 1,525 = 3,725 cm)

4. Diagnóstico do modelo

4.1 CV do experimento

library(agricolae)

cv.model(pinus.aov)
## [1] 8.347738

4.2 Análise dos Resíduos

erro = \(\epsilon_{ij}\) = erro da população

resíduo = \(\hat{\epsilon}_{ij}\) = estimativa do erro da população a partir da amostra

# o que está contido no objeto pinus.aov?
names(pinus.aov)
##  [1] "coefficients"  "residuals"     "effects"       "rank"         
##  [5] "fitted.values" "assign"        "qr"            "df.residual"  
##  [9] "contrasts"     "xlevels"       "call"          "terms"        
## [13] "model"
#resíduos
pinus.aov$residuals
##                         1                         2                         3 
## -0.6499999999999992450483 -0.1500000000000017430501  0.5500000000000004884981 
##                         4                         5                         6 
##  0.2499999999999997224442 -0.7750000000000004662937  0.3249999999999999555911 
##                         7                         8                         9 
##  0.4250000000000004884981  0.0250000000000001054712 -0.8500000000000000888178 
##                        10                        11                        12 
##  0.5500000000000002664535  0.2500000000000004440892  0.0500000000000001554312 
##                        13                        14                        15 
##  0.0749999999999995947686 -0.6249999999999997779554  0.3750000000000002775558 
##                        16                        17                        18 
##  0.1750000000000000999201 -0.6000000000000000888178  0.0000000000000005273559 
##                        19                        20 
##  0.1999999999999997890576  0.3999999999999999111822
#dados da amostra
pinus$altura
##  [1] 4.6 5.1 5.8 5.5 6.0 7.1 7.2 6.8 5.8 7.2 6.9 6.7 5.6 4.9 5.9 5.7 5.8 6.4 6.6
## [20] 6.8
#valores previstos pelo modelo
pinus.aov$fitted.values
##     1     2     3     4     5     6     7     8     9    10    11    12    13 
## 5.250 5.250 5.250 5.250 6.775 6.775 6.775 6.775 6.650 6.650 6.650 6.650 5.525 
##    14    15    16    17    18    19    20 
## 5.525 5.525 5.525 6.400 6.400 6.400 6.400

4.2.1 Diagnóstico: Gráficos dos resíduos versus valores previstos pelo modelo

plot(pinus.aov, 1)

plot(pinus.aov, 2)

4.2.2 Teste de Shapiro-Wilks

shapiro.test(pinus.aov$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  pinus.aov$residuals
## W = 0.87837, p-value = 0.01654

4.2.3 Teste de Barplet

bartlett.test(altura ~ Tratamento, data = pinus)
## 
##  Bartlett test of homogeneity of variances
## 
## data:  altura by Tratamento
## Bartlett's K-squared = 0.44235, df = 4, p-value = 0.9789

4.3 Testes de comparações múltiplas

4.3.1 Teste de Fisher

LSD.test(pinus.aov,"Tratamento", p.adj="bon", console=TRUE)
## 
## Study: pinus.aov ~ "Tratamento"
## 
## LSD t Test for altura 
## P value adjustment method: bonferroni 
## 
## Mean Square Error:  0.261 
## 
## Tratamento,  means and individual ( 95 %) CI
## 
##    altura       std r      LCL      UCL Min Max
## T1  5.250 0.5196152 4 4.705541 5.794459 4.6 5.8
## T2  6.775 0.5439056 4 6.230541 7.319459 6.0 7.2
## T3  6.650 0.6027714 4 6.105541 7.194459 5.8 7.2
## T4  5.525 0.4349329 4 4.980541 6.069459 4.9 5.9
## T5  6.400 0.4320494 4 5.855541 6.944459 5.8 6.8
## 
## Alpha: 0.05 ; DF Error: 15
## Critical Value of t: 3.286039 
## 
## Minimum Significant Difference: 1.187074 
## 
## Treatments with the same letter are not significantly different.
## 
##    altura groups
## T2  6.775      a
## T3  6.650     ab
## T5  6.400    abc
## T4  5.525     bc
## T1  5.250      c

4.3.2 Teste de Tukey

#função interna do R
TukeyHSD(pinus.aov)
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = altura ~ Tratamento, data = pinus)
## 
## $Tratamento
##         diff         lwr          upr     p adj
## T2-T1  1.525  0.40949396  2.640506042 0.0056636
## T3-T1  1.400  0.28449396  2.515506042 0.0110848
## T4-T1  0.275 -0.84050604  1.390506042 0.9378222
## T5-T1  1.150  0.03449396  2.265506042 0.0418184
## T3-T2 -0.125 -1.24050604  0.990506042 0.9965682
## T4-T2 -1.250 -2.36550604 -0.134493958 0.0247157
## T5-T2 -0.375 -1.49050604  0.740506042 0.8339632
## T4-T3 -1.125 -2.24050604 -0.009493958 0.0476084
## T5-T3 -0.250 -1.36550604  0.865506042 0.9551477
## T5-T4  0.875 -0.24050604  1.990506042 0.1626657
#Exibição via gráfico
plot(TukeyHSD(pinus.aov))

mod1 <- agricolae::HSD.test(pinus.aov,"Tratamento",
                              group=TRUE, console = TRUE)
## 
## Study: pinus.aov ~ "Tratamento"
## 
## HSD Test for altura 
## 
## Mean Square Error:  0.261 
## 
## Tratamento,  means
## 
##    altura       std r Min Max
## T1  5.250 0.5196152 4 4.6 5.8
## T2  6.775 0.5439056 4 6.0 7.2
## T3  6.650 0.6027714 4 5.8 7.2
## T4  5.525 0.4349329 4 4.9 5.9
## T5  6.400 0.4320494 4 5.8 6.8
## 
## Alpha: 0.05 ; DF Error: 15 
## Critical Value of Studentized Range: 4.366985 
## 
## Minimun Significant Difference: 1.115506 
## 
## Treatments with the same letter are not significantly different.
## 
##    altura groups
## T2  6.775      a
## T3  6.650      a
## T5  6.400     ab
## T4  5.525     bc
## T1  5.250      c
                              plot(mod1, main = "Teste de Tukey")

E. O modelo é adequado?

R: Sim, pois através da análise da variância os resultados rejeita-se a hipótese nula (H0 = crescimento igual para todos os tratamentos). Evidenciando que na maioria das médias encontradas os níveis estão significativamente diferenciados.

F. Quais tratamentos tiveram o melhor desempenho?

R: T2 (solo de cerrado + esterco) e T3 (solo de cerrado + esterco + NPK) tiveram melhor crescimento das mudas de Pinus oocarpa e apresentam médias semelhantes.