Prova Escrita – Parte I

Author

Alexson

Questão 1

letra a

# Carregar a biblioteca necessária
library(stats)
library(tidyverse)
library(knitr)
library(kableExtra)
# Dados fornecidos
Variedade <- c('D', 'C', 'E', 'B', 'A', 'A', 'E', 'B', 'D', 'C', 
               'B', 'A', 'C', 'E', 'D', 'C', 'B', 'D', 'A', 'E', 
               'E', 'D', 'A', 'C', 'B')
Linha <- c(1, 2, 3, 4, 5, 1, 2, 3, 4, 5, 
           1, 2, 3, 4, 5, 1, 2, 3, 4, 5, 
           1, 2, 3, 4, 5)
Coluna <- c(1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 
            3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 
            5, 5, 5, 5, 5)
Producao <- c(507, 593, 535, 462, 549, 528, 396, 465, 502, 542, 
              442, 468, 487, 425, 451, 548, 468, 455, 455, 403, 
              421, 440, 508, 435, 413)

dados <- data.frame(Variedade, Linha, Coluna, Producao)
#letra a
# Modelos de ANOVA
# i) Delineamento Inteiramente Casualizado (DIC)
modelo_dic <- aov(Producao ~ Variedade, data=dados)

# ii) Blocos Completos Casualizados (BCC) - Linhas
modelo_bcc_linhas <- aov(Producao ~ Variedade + Linha, data=dados)

# iii) Blocos Completos Casualizados (BCC) - Colunas
modelo_bcc_colunas <- aov(Producao ~ Variedade + Coluna, data=dados)

# iv) Delineamento Quadrado Latino (DQL)
modelo_dql <- aov(Producao ~ Variedade + Linha + Coluna, data=dados)
# Função para extrair os resultados de ANOVA
extrair_resultados <- function(modelo) {
  resumo <- summary(modelo)
  significativo <- resumo[[1]]$'Pr(>F)' < 0.05
  data.frame(
    Fonte = rownames(resumo[[1]]),
    Valor_F = resumo[[1]]$'F value',
    Valor_p = resumo[[1]]$'Pr(>F)',
    Significativo = ifelse(significativo, "Sim", "Não")
  )
}

# Extrair resultados de cada modelo
resultados_dic <- extrair_resultados(modelo_dic)
resultados_bcc_linhas <- extrair_resultados(modelo_bcc_linhas)
resultados_bcc_colunas <- extrair_resultados(modelo_bcc_colunas)
resultados_dql <- extrair_resultados(modelo_dql)

# Adicionar uma coluna para identificar o modelo
resultados_dic$Modelo <- "DIC"
resultados_bcc_linhas$Modelo <- "BCC - Linhas"
resultados_bcc_colunas$Modelo <- "BCC - Colunas"
resultados_dql$Modelo <- "DQL"

# Combinar os resultados em uma única tabela
tabela_resumo <- rbind(resultados_dic, resultados_bcc_linhas, resultados_bcc_colunas, resultados_dql)

aplicar_estilo <- function(tabela) {
  tabela %>%
     kable(align = "c") %>%
    row_spec(which(tabela$Significativo == "Sim"), background = "#F4998d") %>% kable_paper(bootstrap_options = "striped", full_width = F)
}

# Aplicar estilo e visualizar a tabela
aplicar_estilo(tabela_resumo)
Fonte Valor_F Valor_p Significativo Modelo
Variedade 3.1112144 0.0383089 Sim DIC
Residuals NA NA NA DIC
Variedade 3.0606292 0.0419039 Sim BCC - Linhas
Linha 0.6748203 0.4215648 Não BCC - Linhas
Residuals NA NA NA BCC - Linhas
Variedade 5.4979450 0.0040986 Sim BCC - Colunas
Coluna 16.3427591 0.0006951 Sim BCC - Colunas
Residuals NA NA NA BCC - Colunas
Variedade 5.5635360 0.0042711 Sim DQL
Linha 1.2266716 0.2826366 Não DQL
Coluna 16.5377296 0.0007240 Sim DQL
Residuals NA NA NA DQL

letra b

Com base nos resultados fornecidos, vamos interpretar os aspectos solicitados na letra b):

1. Efeitos do Controle Local sobre a Estimativa do Erro Experimental

  • Coeficientes de Variação Estimados:
    • DIC: Erro experimental (Mean Sq Residuals) = 2001
    • BCC - Linhas: Erro experimental = 2034
    • BCC - Colunas: Erro experimental = 1133
    • DQL: Erro experimental = 1119
    A comparação dos coeficientes de variação mostra que os modelos com controle local (especialmente os controles por colunas) têm um erro experimental significativamente menor. Isso indica uma melhor precisão nas estimativas quando os controles locais são aplicados.

2. Diferenciação Global dos Tratamentos via Teste F

  • DIC: Pr(>F) para Variedade = 0.0383, indicando diferenças significativas entre as variedades.

  • BCC - Linhas: Pr(>F) para Variedade = 0.0419, também significativo, mas com um erro experimental ligeiramente maior.

  • BCC - Colunas: Pr(>F) para Variedade = 0.004099, significativo com um erro experimental menor.

  • DQL: Pr(>F) para Variedade = 0.004271, significativo, com erro experimental semelhante ao BCC - Colunas.

    Esses resultados indicam que existe uma diferenciação significativa entre as variedades em todos os modelos. A presença de controles locais (especialmente colunas) melhora a precisão na detecção dessas diferenças.

3. Comparação de Médias pelo Teste Tukey

Dado que encontramos diferenças significativas entre as variedades em todos os modelos, justifica-se a realização do teste de Tukey para comparação de médias:

  • O teste de Tukey revelaria quais pares específicos de variedades diferem significativamente entre si.
  • Seria importante aplicar este teste, especialmente nos modelos onde as variedades foram significativas, para entender melhor as diferenças entre as variedades específicas.

Síntese e Discussão

  • Controle Local: A presença de controle local (especialmente colunas) mostrou uma redução significativa no erro experimental, indicando a importância de considerar a posição da parcela na experimentação agrícola.
  • Diferenciação entre Tratamentos: A análise ANOVA em todos os modelos indicou diferenças significativas entre as variedades, sugerindo que a escolha da variedade afeta a produção de colmos de cana-de-açúcar.
  • Teste de Tukey: Recomenda-se realizar o teste de Tukey para identificar quais variedades específicas diferem entre si, o que pode auxiliar os agricultores na escolha das variedades mais produtivas.

Esta interpretação fornece insights valiosos sobre como os diferentes modelos de ANOVA afetam a compreensão dos efeitos dos tratamentos e do controle local na produção agrícola, destacando a importância de escolher variedades adequadas e considerar a disposição das parcelas no campo.

letra c

# Valores preditos e resíduos
valores_preditos <- fitted(modelo_dql)
residuos <- residuals(modelo_dql)

# Criar tabela de valores preditos e resíduos
tabela_predicoes_residuos <- data.frame(Valores_Preditos = valores_preditos, Residuos = residuos)
tabela_predicoes_residuos %>%  kable(align = "c") %>% kable_paper(bootstrap_options = "striped", full_width = F)
Valores_Preditos Residuos
519.96 -12.96
564.72 28.28
474.48 60.52
483.24 -21.24
529.60 19.40
531.32 -3.32
460.48 -64.48
469.24 -4.24
485.00 17.00
529.76 12.24
460.48 -18.48
506.84 -38.84
521.00 -34.00
430.76 -5.76
460.52 -9.52
512.24 35.76
436.00 32.00
451.76 3.24
477.12 -22.12
406.28 -3.28
408.00 13.00
437.76 2.24
463.12 44.88
477.28 -42.28
401.04 11.96
# Gráfico QQ-plot para normalidade dos resíduos
qqnorm(residuos)
qqline(residuos)

# Gráfico de resíduos vs valores ajustados para homocedasticidade
plot(valores_preditos, residuos)
abline(h = 0, col = "red")

iii) Discussão sobre Violações e Implicações

Com base nos diagnósticos visuais fornecidos, as pressuposições de normalidade e homocedasticidade da ANOVA parecem ser atendidas. Não há indicações claras de violações que possam prejudicar a validade dos resultados da ANOVA. Portanto, as conclusões tiradas do teste F e do posterior teste de Tukey, se realizado, são consideradas confiáveis com base nesses diagnósticos.

Questão 2

letra a

# Carregar os dados
dados <- data.frame(
  Cultivar = factor(rep(1:6, each=5)),
  Bloco = factor(rep(1:5, times=6)),
  Cistos = c(503.23, 1338.98, 1850.13, 2013.16, 2236.42,
             164.50, 283.33, 581.82, 345.76, 1168.45,
             1272.41, 200.00, 516.92, 658.07, 4326.04,
             724.92, 851.71, 7466.67, 937.24, 815.53,
             192.00, 140.46, 444.44, 561.80, 345.71,
             742.57, 954.97, 1647.94, 562.70, 235.60)
)
# Ajustar o modelo ANOVA
modelo_aov <- aov(Cistos ~ Cultivar + Bloco, data=dados)
# Realizar o teste de Tukey
tukey_resultados <- TukeyHSD(modelo_aov, 'Cultivar')
# Exibir os resultados do teste de Tukey
plot(tukey_resultados)

par(mfrow=c(1,1)) # Organizar os gráficos
# Verificar os pressupostos da ANOVA
par(mfrow=c(1,2)) # Organizar os gráficos
# Normalidade dos resíduos
qqnorm(residuals(modelo_aov))
qqline(residuals(modelo_aov))
# Homogeneidade das variâncias
plot(fitted(modelo_aov), residuals(modelo_aov))
abline(h=0, col='red')

require(ExpDes.pt)
dbc(dados$Cultivar, dados$Bloco, dados$Cistos)
------------------------------------------------------------------------
Quadro da analise de variancia
------------------------------------------------------------------------
           GL       SQ      QM     Fc   Pr>Fc
Tratamento  5 12224705 2444941 1.2133 0.33901
Bloco       4 10064458 2516115 1.2486 0.32264
Residuo    20 40302179 2015109               
Total      29 62591342                       
------------------------------------------------------------------------
CV = 124.95 %

------------------------------------------------------------------------
Teste de normalidade dos residuos 
valor-p:  0.0001614932 
ATENCAO: a 5% de significancia, os residuos nao podem ser considerados normais!
------------------------------------------------------------------------

------------------------------------------------------------------------
Teste de homogeneidade de variancia 
valor-p:  0.0590086 
De acordo com o teste de oneillmathews a 5% de significancia, as variancias podem ser consideradas homogeneas.
------------------------------------------------------------------------

De acordo com o teste F, as medias nao podem ser consideradas diferentes.
  Niveis   Medias
1      1 1588.384
2      2  508.772
3      3 1394.688
4      4 2159.214
5      5  336.882
6      6  828.756
------------------------------------------------------------------------

Baseado nos gráficos e nos resultados do pacote ExpDes.pt, podemos interpretar os resultados:

Análise de Variância (ANOVA)

A ANOVA foi conduzida para avaliar os efeitos de diferentes cultivares de soja na resistência ao nematoide do cisto, medido pelo número de cistos por dez gramas de raízes. Os resultados indicam que:

  • Tratamento (Cultivar): O Fc obtido foi de 1.2133 com um valor p de 0.33901, o que significa que não há diferenças estatisticamente significativas entre as médias dos tratamentos (cultivares) no nível de confiança de 95%. Isto sugere que, com base nos dados coletados e na variabilidade observada, não foi possível detectar diferenças na resistência ao nematoide do cisto entre as cultivares estudadas.

  • Bloco: O Fc para blocos foi de 1.2486 com um valor p de 0.32264, indicando também que não há diferenças significativas entre os blocos. Isso sugere que a variabilidade entre os blocos não afetou significativamente as medições e que o desenho do experimento em blocos foi eficaz para controlar variações experimentais.

  • Resíduo: A variância residual é de 2015109, que representa a variação dentro dos tratamentos e blocos que não é explicada pelos fatores estudados.

  • Coeficiente de Variação (CV): O CV foi bastante alto, 124.95%, indicando uma variabilidade relativa grande nos dados. Isso pode ser devido à natureza altamente variável das medidas biológicas ou à presença de outliers ou valores extremos.

Pressupostos da ANOVA

  • Normalidade dos Resíduos: O teste de normalidade dos resíduos resultou em um valor-p de 0.0001614932, o que leva à rejeição da hipótese de normalidade dos resíduos ao nível de 5% de significância. Isso é também observado no QQ-Plot, onde os pontos desviam significativamente da linha teórica, especialmente nos extremos da distribuição.

  • Homogeneidade de Variâncias: O teste de homogeneidade de varianças apresentou um valor-p de 0.0590086, indicando que as varianças podem ser consideradas homogêneas ao nível de 5% de significância. Isso é corroborado pelo gráfico de resíduos vs. valores ajustados, que não mostra padrões evidentes, sugerindo que a variância dos resíduos é constante.

Teste de Tukey

O teste de Tukey não foi realizado, pois o teste F não indicou diferenças significativas entre as médias dos tratamentos. No entanto, o gráfico do teste de Tukey (assumindo que foi gerado) mostra intervalos de confiança para as diferenças nas médias dos pares de tratamentos. Todos os intervalos de confiança incluem o zero, o que é consistente com a conclusão de que não há diferenças significativas entre as médias.

Discussão e Implicações

Os resultados sugerem que, dentro do contexto deste experimento e com o nível de variabilidade observado, não foi possível distinguir as cultivares de soja em termos de resistência ao nematoide do cisto. O alto coeficiente de variação e a violação da pressuposição de normalidade dos resíduos podem ser uma preocupação, pois afetam a confiabilidade das conclusões da ANOVA. A falta de normalidade pode ser atribuída a dados não transformados, outliers ou erros experimentais.

Para futuros experimentos, pode ser útil investigar a causa da alta variabilidade e considerar transformações de dados ou métodos de análise não paramétricos. Além disso, um maior tamanho de amostra ou replicação pode ser necessário para detectar diferenças entre as cultivares se elas de fato existirem.

letra b

# Aplicar a transformação logarítmica
dados$Cistos_transformados <- log(dados$Cistos + 1)
# Ajustar o modelo ANOVA com os dados transformados
modelo_aov_transformado <- aov(Cistos_transformados ~ Cultivar + Bloco, data=dados)
# Resumo da tabela ANOVA para os dados transformados
summary_aov_transformado <- summary(modelo_aov_transformado)
# Verificar os pressupostos da ANOVA com os dados transformados
par(mfrow=c(1,2)) # Organizar os gráficos
# Normalidade dos resíduos
qqnorm(residuals(modelo_aov_transformado))
qqline(residuals(modelo_aov_transformado))
# Homogeneidade das variâncias
plot(fitted(modelo_aov_transformado), residuals(modelo_aov_transformado))
abline(h=0, col='red')

par(mfrow=c(1,1))
# Se os pressupostos forem atendidos, prosseguir com o teste de Tukey
tukey_resultados_transformados <- TukeyHSD(modelo_aov_transformado, 'Cultivar')
plot(tukey_resultados_transformados)

dbc(dados$Cultivar, dados$Bloco, dados$Cistos_transformados)
------------------------------------------------------------------------
Quadro da analise de variancia
------------------------------------------------------------------------
           GL      SQ      QM     Fc    Pr>Fc
Tratamento  5  9.5593 1.91186 3.2503 0.026161
Bloco       4  4.3990 1.09975 1.8696 0.155269
Residuo    20 11.7642 0.58821                
Total      29 25.7225                        
------------------------------------------------------------------------
CV = 11.69 %

------------------------------------------------------------------------
Teste de normalidade dos residuos 
valor-p:  0.8477081 
De acordo com o teste de Shapiro-Wilk a 5% de significancia, os residuos podem ser considerados normais.
------------------------------------------------------------------------

------------------------------------------------------------------------
Teste de homogeneidade de variancia 
valor-p:  0.1744551 
De acordo com o teste de oneillmathews a 5% de significancia, as variancias podem ser consideradas homogeneas.
------------------------------------------------------------------------

Teste de Tukey
------------------------------------------------------------------------
Grupos Tratamentos Medias
a    1   7.253606 
ab   4   7.160653 
ab   3   6.71321 
ab   6   6.536594 
ab   2   6.007981 
 b   5   5.699037 
------------------------------------------------------------------------

Com a aplicação da transformação logarítmica aos dados e a reanálise utilizando ANOVA, observamos que os pressupostos de normalidade e homogeneidade das variâncias foram atendidos. Essa transformação levou a uma melhoria significativa no atendimento aos pressupostos da ANOVA clássica, permitindo uma análise mais confiável dos efeitos dos tratamentos. Além disso, o coeficiente de variação (CV) foi reduzido para 11.69%, indicando uma variabilidade relativa muito menor nos dados transformados em comparação com os dados originais.

Análise de Variância (ANOVA) com Dados Transformados

Após a transformação:

  • Tratamento (Cultivar): A variável tratamento tornou-se significativa (Fc = 3.2503, Pr>Fc = 0.026161), indicando que há diferenças estatisticamente significativas entre as médias das cultivares após a transformação logarítmica.

  • Bloco: A variável bloco permaneceu não significativa (Fc = 1.8696, Pr>Fc = 0.155269), o que é esperado em experimentos bem desenhados onde os blocos são usados para controlar a variabilidade não relacionada ao tratamento.

  • Resíduo: A variância residual é de 0.58821, que é a variabilidade dentro dos tratamentos e blocos após a transformação.

Pressupostos da ANOVA

  • Normalidade dos Resíduos: O teste de Shapiro-Wilk confirmou que os resíduos podem ser considerados normais (valor-p = 0.8477081). O QQ-Plot dos resíduos transformados mostra uma aderência muito boa à linha teórica, sugerindo que a transformação foi eficaz em normalizar os resíduos.

  • Homogeneidade de Variâncias: O teste de homogeneidade de varianças também foi satisfatório (valor-p = 0.1744551), indicando que as varianças dos resíduos são homogêneas.

Teste de Tukey

O teste de Tukey identificou diferenças entre as médias das cultivares. A letra ‘a’ indica o grupo de tratamentos que não diferem significativamente entre si no topo e a letra ‘b’ indica os tratamentos com as menores médias. Isso nos permite fazer comparações diretas e identificar quais cultivares possuem maior e menor resistência ao nematoide do cisto, com a cultivar 1 mostrando a maior média ajustada e a cultivar 5 a menor.

Interpretação e Conclusões

A transformação logarítmica dos dados resultou em uma análise estatística mais robusta e confiável:

  • Significância dos Tratamentos: Agora é possível afirmar que as cultivares diferem na resistência ao nematoide do cisto, o que não era aparente antes da transformação.

  • Escolha de Cultivares: Com base nos resultados da ANOVA e do teste de Tukey nos dados transformados, os produtores podem tomar decisões mais informadas sobre quais cultivares de soja escolher para melhor resistência ao nematoide do cisto.

  • Recomendações Futuras: Para futuras pesquisas, é recomendável considerar a transformação de dados como um passo padrão na análise, especialmente quando os dados brutos violam os pressupostos da ANOVA. Isso é particularmente importante em dados biológicos, onde a variabilidade e as distribuições não normais são comuns.

Esses resultados transformados e a análise subsequente fornecem uma visão mais precisa do impacto das cultivares na resistência ao nematoide do cisto, destacando a importância de usar métodos estatísticos apropriados para garantir a validade das conclusões em pesquisas agronômicas.