#PACOTES
require(ExpDes)
require(moments)
require(lmtest)

Exercício 04

tratamento bloco peso_medio
1 1 142.4
1 2 144.8
1 3 145.2
1 4 138.9
2 1 139.3
2 2 137.8
2 3 144.4
2 4 130.6
3 1 140.7
3 2 134.1
3 3 136.1
3 4 144.1
4 1 150.9
4 2 135.8
4 3 137.0
4 4 136.4
5 1 153.5
5 2 165.0
5 3 151.8
5 4 150.2
# Definindo o modelo linear
lm_dbc <- lm(peso_medio ~ bloco + tratamento, data = dados)

AJUSTADO UM MODELO DE REGRESSÃO, VAMOS VERIFICAR SE OS PRESSUPOSTOS SE CONFIRMAM ANTES DE REALIZARMOS UMA ANOVA.

A PARTIR DO GRÁFICO QQ, É POSSÍVEL NOTAR UM AJUSTE NÃO ADEQUADO DOS PONTOS COM RELAÇÃO À RETA, PODENDO SER UM INDÍCIO DE NÃO NORMALIDADE DOS RESÍDUOS. POSTO ISSO, REALIZOU-SE O TESTE DE SHAPIRO PARA VERIFICAR A PRESENÇA OU NÃO DE NORMALIDADE E O TESTE DE BREUSCH-PAGAN, PARA ANÁLISE DA HOMOCEDASTICIDADE DAS VARIÂNCIAS

shapiro.test(res_1) #TESTE DE SHAPIRO-WILK PARA NORMALIDADE: VALORES PEQUENOS DE DADOS
## 
##  Shapiro-Wilk normality test
## 
## data:  res_1
## W = 0.85127, p-value = 0.005599
bptest(lm_dbc) #Realizando o teste
## 
##  studentized Breusch-Pagan test
## 
## data:  lm_dbc
## BP = 3.2586, df = 7, p-value = 0.8601
  1. Teste de Shapiro-Wilk: VALOR-P = 0.005599, INDICANDO NÃO NORMALIDADE DOS RESÍDUOS
  2. Teste de Breusch-Pagan: VALOR-P = 0.8601, INDICANDO HOMOCEDASTICIDADE DAS VARIÂNCIAS, QUE TAMBÉM PODE SER IDENTIFICADA VISUALMENTE, CONSIDERANDO QUE OS PONTOS ESTÃO ENTRE (-2,2)

ANÁLISE: CONSIDERANDO QUE O PRESSUPOSTO DE NORMALIDADE DOS RESÍDUOS NÃO FOI ATENDIDO, OPTOU-SE POR UTILIZAR UM MODELO LINEAR GENERALIZADO DO TIPO NORMAL, COM FUNÇÃO DE LIGAÇÃO DO TIPO IDENTIDADE, HAJA VISTA A NATUREZA DA DISTRIBUIÇÃO DOS DADOS QUE, APARENTEMENTE, É NORMAL.

glm_dbc <- glm(peso_medio ~ bloco + tratamento, family=gaussian(link="identity"), data = dados)
par(mfrow=c(2,2))
plot(glm_dbc)

Realizando a ANOVA

anova(glm_dbc, test="Chisq")
## Analysis of Deviance Table
## 
## Model: gaussian, link: identity
## 
## Response: peso_medio
## 
## Terms added sequentially (first to last)
## 
## 
##            Df Deviance Resid. Df Resid. Dev  Pr(>Chi)    
## NULL                          19    1272.31              
## bloco       3    72.91        16    1199.40    0.5394    
## tratamento  4   794.79        12     404.61 9.732e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

ANÁLISE: A ANOVA, APLICADA SOBRE O MODELO LINEAR GENERALIZADO, IDENTIFICOU QUE NÃO EXISTEM DIFERENÇAS ENTRE OS BLOCOS (VALOR-P=0.53), MAS EXISTE DIFERENÇA EM PELO MENOS UM DOS EFEITOS DE TRATAMENTOS (VALOR-P= 9.732e-05 << 0.05)

Realizando o Teste Tukey para comparação entre as médias

rbd(treat = dados$tratamento,
    block = dados$bloco,
    resp = dados$peso_medio)
## ------------------------------------------------------------------------
## Analysis of Variance Table
## ------------------------------------------------------------------------
##            DF      SS      MS     Fc   Pr>Fc
## Treatament  4  794.79 198.697 5.8929 0.00733
## Block       3   72.91  24.302 0.7207 0.55862
## Residuals  12  404.61  33.718               
## Total      19 1272.31                       
## ------------------------------------------------------------------------
## CV = 4.06 %
## 
## ------------------------------------------------------------------------
## Shapiro-Wilk normality test
## p-value:  0.005598915 
## WARNING: at 5% of significance, residuals can not be considered normal!
## ------------------------------------------------------------------------
## 
## ------------------------------------------------------------------------
## Homogeneity of variances test
## p-value:  0.8482574 
## According to the test of oneillmathews at 5% of significance, the variances can be considered homocedastic.
## ------------------------------------------------------------------------
## 
## Tukey's test
## ------------------------------------------------------------------------
## Groups Treatments Means
## a     5   155.125 
## ab    1   142.825 
##  b    4   140.025 
##  b    3   138.75 
##  b    2   138.025 
## ------------------------------------------------------------------------

INTERPRETAÇÃO: AS MÉDIAS DOS TRATAMENTOS 1,4,3 e 2 FORAM CONSIDERADAS ESTATÍSTICAMENTE IGUAIS, ENQUANTO QUE A MÉDIA DO TRATAMENTO 05 (TESTEMUNHA) FORA SEMELHANTE AO DO TRATAMENTO 01 ( 12,5PPM DE APLICAÇÃO DO PROMALIN EM PLENA FLORAÇÃO). A INTERPRETAÇÃO SERIA QUE, NÍVEIS SUPERIORES A 12,5PPM DE PROMALIN APLICADOS NA ÁRVORE CAUSAM DIMINUIÇÃO NOS PESOS MÉDIOS DOS FRUTOS.

Exercício 13

tratamento2 provador nota
A1 1 8.2
A2 1 4.5
B1 1 4.2
B2 1 5.6
C1 1 9.3
C2 1 9.6
A1 2 7.8
A2 2 3.5
B1 2 4.4
B2 2 4.9
C1 2 8.7
C2 2 8.9
A1 3 6.0
A2 3 3.8
B1 3 5.3
B2 3 5.4
C1 3 6.5
C2 3 7.3
A1 4 8.0
A2 4 4.7
B1 4 6.8
B2 4 6.8
C1 4 7.9
C2 4 9.3

*AJUSTANDO UM MODELO LINEAR

# Definindo o modelo linear
lm2_dbc <- lm(nota ~ provador + tratamento2, data = dados2)

*VERIFICAÇÃO DOS PRESSUPOSTOS

OS RESÍDUOS, VISUALMENTE, APARENTAM TER DISTRIBUIÇÃO NORMAL, TANTO PELA CURVA DO HISTOGRAMA, QUANTO PELO AJUSTE DOS PONTOS NA RETA DE DISTRIBUIÇÃO.

TESTE DE NORMALIDADE DOS RESÍDUOS E DE HOMOCEDASTICIDADE DA VARIÂNCIA

shapiro.test(res_2)
## 
##  Shapiro-Wilk normality test
## 
## data:  res_2
## W = 0.94943, p-value = 0.2633
bptest(lm2_dbc)
## 
##  studentized Breusch-Pagan test
## 
## data:  lm2_dbc
## BP = 16.903, df = 8, p-value = 0.03114
  1. Teste de Shapiro-Wilk: VALOR-P = 0.26, INDICANDO NORMALIDADE DOS RESÍDUOS
  2. Teste de Breusch-Pagan: VALOR-P = 0.0314, INDICANDO QUE OS DADOS NÃO TEM VARIÂNCIAS HOMOGÊNEAS (HETEROCEDASTICIDADES)

ANÁLISE: CONSIDERANDO QUE O PRESSUPOSTO DE HOMOGENEIDADE DAS VARIÂNCIAS NÃO FOI ATENDIDO, INVIABILIZA APLICAR DE IMEDIATO UM MODELO DE REGRESSÃO LINEAR. CONSIDEROU-SE APLICAR UMA TRANSFORMAÇÃO LOGARÍTMICA NOS DADOS E VERIFICAR SE EXISTE MELHORA PRESSUPOSTO DE VARIÂNCIA E SE A NORMALIDADE DOS RESÍDUOS FORA MANTIDA.

dados2$nota<-log(dados2$nota)
lm2_dbc <- lm(nota ~ provador + tratamento2, data = dados2)
shapiro.test(res_2)
## 
##  Shapiro-Wilk normality test
## 
## data:  res_2
## W = 0.94943, p-value = 0.2633
bptest(lm2_dbc)
## 
##  studentized Breusch-Pagan test
## 
## data:  lm2_dbc
## BP = 15.057, df = 8, p-value = 0.05806

APOS A TRANSFORMAÇÃO, OBTEVE-SE UM VALOR-P DE 0.0506, QUE SIGNIFICA QUE AS VARIÂNCIAS AGORA SÃO HOMOCEDÁSTICAS;COM RELAÇÃO AOS RESÍDUOS, MANTEVE-SE NORMALIDADE.

*MODELO COM DADOS TRANSFORMADOS

par(mfrow=c(2,2))
plot(lm2_dbc)

Realizando a ANOVA (Análise de Variância

anova(lm2_dbc)
## Analysis of Variance Table
## 
## Response: nota
##             Df  Sum Sq Mean Sq F value    Pr(>F)    
## provador     3 0.19138 0.06379  3.8478   0.03171 *  
## tratamento2  5 1.74809 0.34962 21.0884 2.679e-06 ***
## Residuals   15 0.24868 0.01658                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

INTERPRETAÇÃO: PELO TESTE ANOVA COM A VARIÁVEL TRANSFORMADA, OBTEMOS VALORES-P MENORES QUE 0.05 TANTO PARA OS PROVADORES (OU BLOCOS), QUANTO PARA OS VINHOS (OU TRATAMENTOS), CARACTERIZANDO DIFERENÇA TANTO ENTRE OS PROVADORES, QUANTO NOS EFEITOS DE TRATAMENTO (VINHOS).

Realizando o Teste Tukey para comparação entre as médias

rbd(treat = dados2$tratamento2,
    block = dados2$provador,
    resp = dados2$nota)
## ------------------------------------------------------------------------
## Analysis of Variance Table
## ------------------------------------------------------------------------
##            DF      SS      MS      Fc    Pr>Fc
## Treatament  5 1.74809 0.34962 21.0884 0.000003
## Block       3 0.19138 0.06379  3.8478 0.031707
## Residuals  15 0.24868 0.01658                 
## Total      23 2.18815                         
## ------------------------------------------------------------------------
## CV = 7.01 %
## 
## ------------------------------------------------------------------------
## Shapiro-Wilk normality test
## p-value:  0.327357 
## According to Shapiro-Wilk normality test at 5% of significance, residuals can be considered normal.
## ------------------------------------------------------------------------
## 
## ------------------------------------------------------------------------
## Homogeneity of variances test
## p-value:  0.013881 
## WARNING: at 5% of significance, residuals can not be considered homocedastic!
## ------------------------------------------------------------------------
## 
## Tukey's test
## ------------------------------------------------------------------------
## Groups Treatments Means
## a     C2      2.166426 
## a     C1      2.083001 
## ab    A1      2.007365 
##  bc   B2      1.728831 
##   cd      B1      1.62533 
##    d      A2      1.409851 
## ------------------------------------------------------------------------

INTERPRETAÇÃO:

  1. IDENTIFICA-SE QUE AS MÉDIAS DO VINHO TIPO “C” FORAM ESTATISTICAMENTE IGUAIS, INDEPENDENTE SE SERVIDO GELADO OU EM TEMPERATURA AMBIENTE, SENDO QUE ESTE VINHO OBTIVERA AS MAIORES MÉDIAS. ALÉM DISSO, O VINHO “A”, SERVIDO GELADO, OBTEVE MÉDIA ESTATISTICAMENTE IGUAL AO VINHO C.

  2. As médias do vinho “B”, independente se servido gelado ou em temperatura ambiente, foram consideradas estatísticamente iguais.

  3. O teste Tukey verificou que a média do vinho “B”, servido gelado (B1), é estatísticamente igual ao do vinho “A” servido em temperatura ambiente (A2), com esses tendo as menores médias.

Exercício 18

tratamento3 produtor teor_acucar
A_E0_T7 1 1.29
A_E0_T7 2 1.36
A_E0_T7 3 1.29
A_E0_T14 1 1.43
A_E0_T14 2 1.45
A_E0_T14 3 1.46
A_E0_T21 1 1.40
A_E0_T21 2 1.44
A_E0_T21 3 1.44
A_E0_T28 1 1.34
A_E0_T28 2 1.36
A_E0_T28 3 1.40
A_E0_T35 1 1.35
A_E0_T35 2 1.14
A_E0_T35 3 1.24
A_E1_T7 1 1.29
A_E1_T7 2 1.36
A_E1_T7 3 1.36
A_E1_T14 1 1.21
A_E1_T14 2 1.38
A_E1_T14 3 1.41
A_E1_T21 1 1.40
A_E1_T21 2 1.40
A_E1_T21 3 1.40
A_E1_T28 1 1.32
A_E1_T28 2 1.32
A_E1_T28 3 1.40
A_E1_T35 1 1.29
A_E1_T35 2 1.29
A_E1_T35 3 1.25
A_E0_T7 1 1.36
A_E0_T7 2 1.44
A_E0_T7 3 1.44
A_E0_T14 1 1.46
A_E0_T14 2 1.44
A_E0_T14 3 1.47
A_E0_T21 1 1.47
A_E0_T21 2 1.53
A_E0_T21 3 1.50
A_E0_T28 1 1.54
A_E0_T28 2 1.55
A_E0_T28 3 1.52
A_E0_T35 1 1.56
A_E0_T35 2 1.44
A_E0_T35 3 1.46
A_E1_T7 1 1.48
A_E1_T7 2 1.44
A_E1_T7 3 1.44
A_E1_T14 1 1.44
A_E1_T14 2 1.48
A_E1_T14 3 1.44
A_E1_T21 1 1.47
A_E1_T21 2 1.52
A_E1_T21 3 1.44
A_E1_T28 1 1.66
A_E1_T28 2 1.55
A_E1_T28 3 1.55
A_E1_T35 1 1.74
A_E1_T35 2 1.78
A_E1_T35 3 1.47
B_E0_T7 1 1.29
B_E0_T7 2 1.36
B_E0_T7 3 1.29
B_E0_T14 1 1.43
B_E0_T14 2 1.45
B_E0_T14 3 1.46
B_E0_T21 1 1.40
B_E0_T21 2 1.44
B_E0_T21 3 1.44
B_E0_T28 1 1.34
B_E0_T28 2 1.36
B_E0_T28 3 1.40
B_E0_T35 1 1.35
B_E0_T35 2 1.14
B_E0_T35 3 1.24
B_E1_T7 1 1.29
B_E1_T7 2 1.36
B_E1_T7 3 1.36
B_E1_T14 1 1.21
B_E1_T14 2 1.38
B_E1_T14 3 1.41
B_E1_T21 1 1.40
B_E1_T21 2 1.40
B_E1_T21 3 1.40
B_E1_T28 1 1.32
B_E1_T28 2 1.32
B_E1_T28 3 1.40
B_E1_T35 1 1.29
B_E1_T35 2 1.29
B_E1_T35 3 1.25
B_E0_T7 1 1.36
B_E0_T7 2 1.44
B_E0_T7 3 1.44
B_E0_T14 1 1.46
B_E0_T14 2 1.44
B_E0_T14 3 1.47
B_E0_T21 1 1.47
B_E0_T21 2 1.53
B_E0_T21 3 1.50
B_E0_T28 1 1.54
B_E0_T28 2 1.55
B_E0_T28 3 1.52
B_E0_T35 1 1.56
B_E0_T35 2 1.44
B_E0_T35 3 1.46
B_E1_T7 1 1.48
B_E1_T7 2 1.44
B_E1_T7 3 1.44
B_E1_T14 1 1.44
B_E1_T14 2 1.48
B_E1_T14 3 1.44
B_E1_T21 1 1.47
B_E1_T21 2 1.52
B_E1_T21 3 1.44
B_E1_T28 1 1.66
B_E1_T28 2 1.55
B_E1_T28 3 1.55
B_E1_T35 1 1.74
B_E1_T35 2 1.78
B_E1_T35 3 1.47

*AJUSTANDO UM MODELO LINEAR

# Definindo o modelo linear
lm3_dbc <- lm(teor_acucar ~ produtor + tratamento3, data = dados3)

*VERIFICAÇÃO DOS PRESSUPOSTOS

ANÁLISE: VISUALMENTE, O GRÁFICO NÃO INDICA NORMALIDADE, POIS EXISTEM VALORES MUITO DISTANTES DA RETA DE DISTRIBUICÃO. AO REALIZAR O TESTE DE NORMALIDADE, ENCONTRAMOS UM VALOR-P DE 0.002562, INDICANDO NÃO NORMALIDADE, BEM COMO NO TESTE DE BREUSCH-PAGAN (VALOR-P= 4.933e-07 << 0.05), ONDE VERIFICOU-SE A NÃO HOMOGENEIDADE DAS VARIÂNCIAS.

shapiro.test(res_3)
## 
##  Shapiro-Wilk normality test
## 
## data:  res_3
## W = 0.96375, p-value = 0.002562
bptest(lm3_dbc)
## 
##  studentized Breusch-Pagan test
## 
## data:  lm3_dbc
## BP = 69.079, df = 21, p-value = 4.933e-07