Capítulo 1: Uso da Experimentação na Pesquisa Agrícola e Florestal

1.1 Introdução à Experimentação

A experimentação constitui a base do método científico e é uma ferramenta indispensável para o avanço do conhecimento nas ciências agrárias e florestais. Por meio de experimentos, pesquisadores podem investigar fenômenos, testar hipóteses e desenvolver novas tecnologias de forma sistemática e controlada. Na área florestal, a experimentação é crucial para o desenvolvimento de práticas de manejo sustentável, o melhoramento genético de espécies e a compreensão das complexas interações ecológicas que ocorrem nos ecossistemas florestais.

O processo experimental permite que os cientistas isolem variáveis de interesse e observem seus efeitos sob condições controladas, o que minimiza a influência de fatores externos que poderiam confundir os resultados. Essa abordagem estruturada garante que as conclusões obtidas sejam robustas e baseadas em evidências empíricas, e não em meras suposições ou observações casuais.

A experimentação florestal visa atender a uma variedade de objetivos que são fundamentais para a tomada de decisões informadas no setor:

  • Testar hipóteses de forma sistemática: Formular e testar suposições sobre o comportamento de espécies florestais, a eficácia de tratamentos silviculturais ou o impacto de fatores ambientais.
  • Comparar diferentes tratamentos e técnicas: Avaliar de maneira objetiva qual método de manejo, por exemplo, resulta em maior produção ou qualidade.
  • Quantificar efeitos e interações: Determinar a magnitude do efeito de um tratamento e investigar a interação entre diferentes fatores.
  • Tomar decisões baseadas em evidências: Fornecer dados confiáveis que subsidiem a tomada de decisões por parte de gestores, produtores e formuladores de políticas.

1.2 A Estatística e a Pesquisa Científica

A estatística desempenha um papel central em todas as etapas do processo de pesquisa experimental. Ela fornece as ferramentas para lidar com a variabilidade inerente aos sistemas biológicos e para extrair conclusões válidas a partir dos dados.

Tabela 1.1: Funções da Estatística na Experimentação

Tabela 1.1: Funções da Estatística na Experimentação

Função da Estatística

Descrição

Planejamento de experimentos

Ajuda a definir o delineamento, o número de repetições e a alocação da repetições dos tratamentos.

Análise de dados

Permite determinar se as diferenças observadas são estatisticamente significativas.

Quantificação da incerteza

Avalia a confiabilidade das conclusões por meio de intervalos de confiança e testes de hipóteses.

Modelagem de fenômenos

Descreve a relação entre variáveis e permite fazer previsões.

O procedimento da pesquisa científica, apoiado pela estatística, geralmente segue três etapas principais: Formulação de Hipóteses, Verificação Experimental e Análise e Interpretação dos resultados com rigor metodológico.

1.3 Etapas de um Experimento

O desenvolvimento de um experimento florestal segue um ciclo sistemático e iterativo, permitindo que as conclusões de um experimento sirvam de base para novas investigações.

1.4 Conceitos Fundamentais

Os conceitos fundamentais da experimentação são os pilares sobre os quais todo experimento bem-sucedido é construído. Compreender claramente cada um desses termos é essencial para o planejamento e execução de pesquisas de qualidade.

Exemplos Práticos Detalhados

Exemplo 1: Quebra de Dormência em Sementes de Pinus

Este exemplo ilustra um experimento de laboratório com estrutura simples, mas rigorosa.

Figura 1.3: Esquema completo do experimento de quebra de dormência em sementes de Pinus, mostrando tratamentos, unidades experimentais e variável resposta.

Objetivo: Testar métodos para superar a dormência em sementes de Pinus e identificar qual tratamento resulta na maior porcentagem de germinação.

Tratamentos: O experimento compara cinco tratamentos diferentes: * Água quente (imersão em água a 80°C por 30 minutos) * Água fria (imersão em água a 4°C por 24 horas) * Ácido (imersão em ácido sulfúrico por 15 minutos) * Escarificação (lixamento manual da testa da semente) * Controle (sem tratamento)

Unidade Experimental: Placas de Petri com papel germitest, contendo um número padronizado de sementes (geralmente 25 ou 50 sementes por placa).

Variável Resposta: Porcentagem de germinação, calculada como (número de sementes germinadas / número total de sementes) × 100.

Repetições: Múltiplas repetições (mínimo 3, recomendado 4-5) de cada tratamento para garantir precisão dos resultados.

Conclusão esperada: Os tratamentos com ácido e água quente apresentarão as maiores porcentagens de quebra de dormência em sementes de Pinus, enquanto o controle apresentará a menor taxa de germinação.

Exemplo 2: Experimento de Adubação em Eucalipto

Este exemplo representa um experimento de campo mais complexo, típico da pesquisa florestal aplicada.

Figura 1.4: Esquema do experimento de adubação em Eucalipto em campo, mostrando o delineamento em blocos casualizados com cinco repetições.

Objetivo: Avaliar o efeito de diferentes doses de NPK no crescimento inicial de eucalipto e determinar a dose mais econômica e eficiente.

Tratamentos: O experimento compara quatro níveis de adubação NPK: * T1: 0 g/cova (Controle sem adubação) * T2: 100 g/cova de NPK (formulação 10-10-10) * T3: 200 g/cova de NPK (formulação 10-10-10) * T4: 300 g/cova de NPK (formulação 10-10-10)

Delineamento: Delineamento em Blocos Casualizados (DBC) com 5 repetições, totalizando 20 parcelas (4 tratamentos × 5 blocos).

Unidade Experimental: Parcelas de 36 plantas (arranjo 6×6), com uma área útil de 16 plantas (arranjo 4×4) no centro, e uma bordadura de uma linha ao redor para proteger a área útil.

Variáveis Resposta: Três características foram medidas aos 12 meses após o plantio: * Altura (m): Distância vertical do solo até o ápice da árvore, medida com régua ou clinômetro. * DAP (cm): Diâmetro à altura do peito (1,30 m), medido com suta ou fita métrica. * Sobrevivência (%): Porcentagem de plantas vivas ao final do período de avaliação.

Repetições: 5 blocos, cada um contendo os 4 tratamentos, garantindo controle de variações ambientais no campo.

Conclusão esperada: Espera-se que o crescimento em altura e DAP aumente com as doses de adubação até um ponto ótimo, após o qual pode haver redução nos ganhos (relação quadrática). A sobrevivência deve ser elevada em todos os tratamentos, mas potencialmente maior nos tratamentos com adubação.

1.5 Tipos de Experimentos e Fontes de Variação

Classificação dos Experimentos

Figura 1.5: Classificação dos experimentos florestais segundo seus objetivos e características.

Os experimentos podem ser classificados de acordo com seus objetivos e o rigor metodológico empregado:

Experimento Preliminar: Faz uma triagem inicial de muitos tratamentos com o objetivo de identificar os mais promissores. Geralmente apresenta menor rigor metodológico e é usado para reduzir o número de tratamentos a serem testados em experimentos posteriores.

Experimento Crítico: Compara menos tratamentos com alto rigor metodológico. Estes experimentos são mais precisos e permitem conclusões mais confiáveis sobre os efeitos dos tratamentos.

Experimento Demonstrativo: Visa demonstrar a eficácia de uma nova técnica para um público específico, como produtores ou técnicos. Geralmente é instalado em condições de campo e busca validar resultados obtidos em experimentos anteriores.

Fontes de Variabilidade

Figura 1.6: As três principais fontes de variação em experimentos florestais.

A variabilidade observada em um experimento pode ser decomposta em três componentes principais:

Variação Premeditada: Introduzida intencionalmente pelo pesquisador através dos tratamentos. Esta é a variação de interesse, pois representa os efeitos que estão sendo estudados. Quanto maior esta variação em relação ao erro experimental, mais fácil será detectar diferenças significativas entre os tratamentos.

Variação Externa: Causada por fatores externos não controláveis, como variações climáticas (temperatura, precipitação), pragas, doenças e outros eventos ambientais. Embora não possam ser completamente eliminadas, estas fontes de variação podem ser reduzidas através de técnicas de controle local, como o uso de blocos.

Variação Acidental (Erro Experimental): Variação que ocorre ao acaso entre unidades experimentais idênticas. Inclui pequenas diferenças no solo, na aplicação de tratamentos, em medições e outras fontes não identificáveis. O erro experimental é reduzido através de bom planejamento, técnica cuidadosa e aumento do número de repetições.

1.6 Redução do Erro Experimental

A precisão de um experimento é inversamente proporcional ao erro experimental. Quanto menor o erro experimental, maior a capacidade de detectar diferenças reais entre os tratamentos. Existem várias estratégias para minimizar o erro experimental em experimentos florestais.

Forma e Tamanho da Parcela

Figura 1.7: Diferentes formas e tamanhos de parcelas recomendados para diferentes tipos de experimentos florestais.

A escolha da forma e tamanho da parcela é fundamental para o sucesso do experimento. Parcelas menores (300-600 m²) são recomendadas para plantios homogêneos de espécies únicas com espaçamento regular, pois permitem maior precisão e menor variabilidade. Parcelas maiores (≥1000 m²) são necessárias para florestas nativas ou sistemas heterogêneos, onde é importante capturar a diversidade e complexidade do ecossistema.

A forma da parcela também influencia a precisão. Parcelas quadradas ou com proporções próximas ao quadrado geralmente apresentam menor variabilidade que parcelas muito alongadas. No entanto, em terrenos de florestas naturais, parcelas retangulares alongadas no sentido da inclinação podem ser mais eficientes.

Orientação das Parcelas

Figura 1.8: Comparação entre orientação de um plantio de eucalipto e floresta natural em terrenos com declividade.

Na montagem de um experimento, como avaliação da produção de eucaliptos em diferentes curvas de nível em terrenos com declividade, a orientação das parcelas é crítica. Para plantios comerciais homogêneos, o maior comprimento da parcela deve ser orientado no sentido da inclinação (paralelo às curvas de nível), não perpendicular a ela. Isto reduz a variação dentro da parcela, pois minimiza as diferenças em fatores como luz solar, umidade do solo e disponibilidade de nutrientes que variam com a declividade. Quando as parcelas são orientadas incorretamente (atravessando o gradiente de inclinação), cada parcela captura uma grande variação em condições ambientais, aumentando o erro experimental e reduzindo a capacidade de detectar diferenças entre os tratamentos.

No caso de florestas naturais, a estratégia de orientação é completamente diferente. As parcelas devem ter seu maior comprimento orientado perpendicularmente ao rio ou às curvas de nível para verificar a maior variação do terreno e melhorar os estudos da floresta nativa. Esta orientação permite capturar o máximo de heterogeneidade ambiental presente no ecossistema, incluindo variações em umidade do solo, tipo de solo, composição de espécies e disponibilidade de luz, que são fundamentais para compreender como as comunidades florestais respondem aos gradientes ambientais. A escolha correta da orientação das parcelas é uma decisão de planejamento que não pode ser corrigida após a instalação do experimento. Portanto, é essencial que o pesquisador identifique claramente o tipo de experimento (plantio comercial ou floresta natural), avalie a topografia do local antes de instalar as parcelas, determine a direção das curvas de nível e do gradiente de declividade, e oriente as parcelas adequadamente de acordo com o tipo de estudo. Esta atenção ao detalhe na fase de planejamento pode significar a diferença entre um experimento com alta precisão e um com erro experimental elevado e resultados inconclusivos.

Efeito de Bordadura

Figura 1.9: Esquema do efeito de bordadura, mostrando a área útil e a área de proteção.

O efeito de bordadura refere-se à influência de fatores externos nas plantas localizadas nas bordas da parcela. Plantas nas bordas podem receber mais luz solar, sofrer mais com vento, estar sujeitas a competição reduzida ou estar expostas a outras condições diferentes das plantas no interior da parcela. Para controlar este efeito e garantir que os dados coletados representem verdadeiramente o efeito do tratamento, utiliza-se uma área de borda (bordadura) que protege a área útil da parcela.

A bordadura geralmente consiste em uma ou duas fileiras de plantas ao redor da parcela, que recebem o tratamento, mas cujos dados não são incluídos na análise. Apenas as plantas da área útil (interior da parcela) são medidas e analisadas. Esta prática elimina a influência de efeitos de borda, garantindo que as medições reflitam exclusivamente o efeito do tratamento aplicado, sem confundimento com fatores externos.

Em plantios em campo, como estudos de fertilizantes, deve ser feita bordadura tanto ao redor das repetições dos tratamentos quanto entre elas. A bordadura entre repetições reduz o erro experimental causado pela competição entre tratamentos adjacentes e pela variabilidade espacial do ambiente, aumentando significativamente a precisão e confiabilidade dos resultados experimentais.

Falhas de Plantas: Monitoramento e Controle

Figura 1.10: Impacto das falhas de plantas no experimento e estratégias de controle.

Falhas de plantas (morte ou ausência de plantas) comprometem a uniformidade da parcela e aumentam o erro experimental. As causas comuns incluem seca, pragas, doenças e compactamento do solo. É essencial monitorar regularmente a parcela e registrar o número e localização das falhas.

Um máximo de 10% de falhas é geralmente tolerado em experimentos. Se o número de falhas exceder este limite, a parcela pode ser descartada da análise. Se o número de falhas for aceitável, podem ser aplicadas correções estatísticas ou as plantas podem ser replantadas (embora isto complique a análise posterior).

Número de Repetições

Figura 1.11: Efeito do número de repetições na precisão do experimento, mostrando intervalos de confiança.

O número de repetições é um dos fatores mais importantes para a precisão do experimento. Aumentar o número de repetições reduz o erro padrão das médias, estreita os intervalos de confiança e amplia a capacidade de detectar diferenças significativas entre os tratamentos.

As recomendações gerais são: * Mínimo: 3 repetições (apenas em casos muito específicos) * Recomendado: ≥4 repetições (para a maioria dos experimentos) * Ideal: 5-6 repetições (para maior precisão)

A escolha do número de repetições deve considerar fatores como disponibilidade de recursos, tamanho da área disponível e a magnitude das diferenças que se espera detectar.

1.7 Delineamentos Experimentais

O delineamento experimental é a forma como os tratamentos são distribuídos nas unidades experimentais. A escolha do delineamento apropriado é fundamental para a eficiência do experimento.

Figura 1.12: Comparação visual dos delineamentos DIC, DBC e DQL.

Delineamento Inteiramente Casualizado (DIC): Sorteio totalmente aleatório dos tratamentos entre as unidades experimentais. Este delineamento é usado em condições homogêneas, como em laboratórios ou câmaras de crescimento, onde há pouca variação ambiental.

Delineamento Casualizado em Blocos (DBC): Agrupamento das unidades experimentais em blocos homogêneos, com os tratamentos casualizados dentro de cada bloco. Este delineamento controla uma fonte de variação e é o mais usado em experimentos de campo.

Delineamento em Quadrado Latino (DQL): Controle de duas fontes de variação simultaneamente através de uma distribuição especial dos tratamentos em linhas e colunas. Requer que o número de tratamentos, linhas e colunas seja igual, limitando sua aplicação.

1.8 Qualidade de um Bom Experimento

Um bom experimento deve apresentar as seguintes características: * Simplicidade de Execução: Procedimentos claros, bem documentados e fáceis de executar, reduzindo erros operacionais. * Ausência de Erros Sistemáticos: Evitar vieses que comprometam a validade dos resultados, como aplicação inconsistente de tratamentos. * Alta Precisão: Baixa variabilidade entre repetições, refletida em intervalos de confiança estreitos. * Exatidão: Resultados próximos do valor real, refletindo a verdadeira magnitude do efeito dos tratamentos. * Fornecer Amplos Resultados: Informações abrangentes e aplicáveis a situações práticas, com conclusões que extrapolam para o contexto real.

1.9 Exercícios de Fixação

  1. Defina, com suas próprias palavras, o que é experimentação e por que ela é fundamental para a pesquisa florestal.
  2. Para o exemplo da adubação em Eucalipto (Figura 1.4), defina: (a) um possível tratamento, (b) a unidade experimental, e (c) duas possíveis variáveis resposta.
  3. Uma empresa florestal recebeu 50 novos clones de eucalipto e deseja selecionar os 5 melhores. Qual tipo de experimento seria mais adequado para a primeira fase de avaliação? Justifique.
  4. O que é o “efeito de bordadura” e como ele pode ser controlado? Desenhe um esquema de uma parcela com 49 plantas (7×7), indicando a área útil e a bordadura.
  5. Explique como o Delineamento em Blocos Casualizados (DBC) controla o erro experimental.
  6. Diferencie os conceitos de precisão e exatidão em um experimento.
  7. Por que o número de repetições é importante para a precisão de um experimento? Qual é o número mínimo recomendado?
  8. Cite três causas comuns de falhas de plantas em experimentos florestais e explique como elas podem ser prevenidas.

1.10 Referências Bibliográficas

  • BARBIN, D. Planejamento e análise estatística de experimentos agronômicos. 2. ed. Arapongas: Midas, 2003.
  • BANZATTO, D. A.; KRONKA, S. N. Experimentação agrícola. 4. ed. Jaboticabal: FUNEP, 2006.
  • COCHRAN, W. G.; COX, G. M. Experimental designs. 2. ed. New York: John Wiley & Sons, 1957.
  • GÓMEZ, K. A.; GÓMEZ, A. A. Statistical procedures for agricultural research. 2. ed. New York: John Wiley & Sons, 1984.
  • PIMENTEL-GOMES, F. Curso de estatística experimental. 15. ed. Piracicaba: FEALQ, 2009.

Capítulo 2: Hipótese Estatística e Teste de Hipótese

2.1 Introdução à Inferência Estatística

A inferência estatística é o ramo da estatística que permite tirar conclusões sobre uma população a partir de dados coletados de uma amostra representativa. Em áreas como a pesquisa agrícola e florestal, muitas vezes é impraticável coletar dados de todos os elementos da população, de modo que a amostragem se torna essencial para obter informações e realizar generalizações com determinado grau de confiança.

O processo de inferência estatística envolve o uso de estimativas calculadas a partir da amostra para inferir sobre parâmetros desconhecidos da população. Por exemplo, a média amostral é utilizada como estimativa da média populacional, e a variância amostral como estimativa da variância populacional. A confiabilidade dessas inferências é crucial, e a estatística oferece ferramentas para quantificá-la.

Figura 2.1: Relação entre população, amostragem, amostra e inferência estatística.

2.2 Conceitos Fundamentais de Testes de Hipótese

O teste de hipótese é uma ferramenta central da inferência estatística para tomada de decisão com base em evidências amostrais. Ele permite aceitar ou rejeitar uma afirmação sobre um parâmetro populacional dentro de um nível de confiança especificado. Por exemplo, em engenharia florestal, pode-se verificar se a infestação de lagartas em uma plantação de eucalipto ultrapassa um nível de controle economicamente importante.

Os testes de hipótese são classificados em paramétricos e não paramétricos:

  • Testes Paramétricos: Adequados quando os dados seguem uma distribuição específica (geralmente normal) e quando as variâncias entre grupos são homogêneas. A Análise de Variância (ANOVA) é um exemplo.
  • Testes Não Paramétricos: Indicados quando os dados não atendem aos pressupostos dos testes paramétricos (como normalidade e homogeneidade de variâncias). Exemplos incluem os testes de Mann-Whitney, Wilcoxon e Qui-Quadrado.

Figura 2.5: Fluxograma para auxiliar na escolha entre testes paramétricos e não paramétricos.

2.3 Distribuição Normal e Normal Padrão

A distribuição normal é uma das distribuições de probabilidade mais importantes em estatística. Suas principais propriedades incluem simetria, unimodalidade, formato em sino e coincidência entre média, mediana e moda. A curva normal padrão é um caso especial com média igual a zero e desvio-padrão igual a um.

A transformação para escore Z é dada pela fórmula Z = (X - μ) / σ, onde X é o valor observado, μ é a média populacional e σ é o desvio-padrão populacional. Os valores Z permitem comparar observações de diferentes distribuições normais e determinar probabilidades. A regra empírica da distribuição normal estabelece que aproximadamente 68% dos dados ficam dentro de um desvio-padrão da média, 95% dentro de dois desvios-padrão e 99% dentro de três desvios-padrão.

Figura 2.2: Curva da distribuição normal com as áreas correspondentes à regra empírica.

2.4 Formulação de Hipóteses Estatísticas

Em um teste de hipótese, formulam-se duas hipóteses mutuamente exclusivas:

  • Hipótese Nula (H0): Representa a afirmação inicialmente assumida como verdadeira até que haja evidências suficientes para rejeitá-la (ex: H0: μ = 50).
  • Hipótese Alternativa (H1 ou Ha): Contradiz a hipótese nula e representa o que o pesquisador busca evidenciar.

A hipótese alternativa pode ser:

  • Unilateral à direita: H1: μ > μ0
  • Unilateral à esquerda: H1: μ < μ0
  • Bilateral: H1: μ ≠ μ0

A escolha entre teste unilateral e bilateral depende da pergunta de pesquisa e da existência de uma direção específica esperada para a diferença ou efeito.

2.5 Erros nos Testes de Hipótese e Tomada de Decisão

Ao realizar um teste de hipótese, dois tipos de erros podem ocorrer:

  • Erro Tipo I: Rejeição incorreta de uma hipótese nula verdadeira, associado ao nível de significância α (ex: 0,05 ou 0,01).
  • Erro Tipo II: Aceitação incorreta de uma hipótese nula falsa, com probabilidade representada por β. O poder do teste é dado por 1 − β.

Existe uma relação inversa entre as probabilidades dos erros tipo I e tipo II. A decisão sobre qual erro é mais grave depende do contexto da pesquisa.

Figura 2.3: Representação visual do caminho de decisão em testes de hipótese, com regiões de aceitação e rejeição.

2.6 Procedimentos para a Realização de um Teste de Hipótese

A realização de um teste de hipótese segue uma sequência de cinco passos:

  1. Enunciar as hipóteses: Definir H0 e H1.
  2. Fixar o nível de significância e identificar a estatística do teste: Escolher α e a estatística apropriada (Z, t, F, χ²).
  3. Calcular o valor da estatística do teste: Usar os dados da amostra para obter o valor da estatística.
  4. Determinar as regiões crítica e de aceitação: Definir os valores críticos com base na distribuição e no nível de significância.
  5. Concluir o teste: Comparar o valor calculado com os valores críticos para decidir se H0 é rejeitada ou não.

Essa sequência sistematiza a tomada de decisão baseada em dados e reduz a subjetividade.

2.7 Testes Paramétricos para Uma Amostra

2.7.1 Teste Z para uma amostra (variância populacional conhecida)

O teste Z é utilizado para comparar a média de uma amostra com uma média populacional conhecida, assumindo variância populacional conhecida e distribuição normal dos dados, ou tamanho amostral suficientemente grande para aplicação do Teorema Central do Limite. A estatística do teste é apresentada como:

\[Z_{calc} = \frac{\bar{X} - \mu_0}{\sigma/\sqrt{n}}\]

As hipóteses possíveis para o teste bilateral e unilateral são definidas, e a regra de decisão é baseada na comparação entre o valor calculado e o valor crítico tabelado.

Exemplo 2.1: Resistência à Tração da Madeira

Uma máquina cuja produção tem média conhecida de 72 kg/mm² e desvio-padrão populacional de 2,0 kg/mm². Após ajuste na máquina, foram obtidas 10 observações: 74,2; 75,3; 72,4; 73,7; 77,6; 72,4; 73,7; 72,2; 73,3; 74,2. Verificar, ao nível de 5% de significância, se houve diferença na média da resistência à tração da madeira.

Resolução:

  • Parâmetros: σ = 2 kg/mm², α = 0,05, μ0 = 72 kg/mm², n = 10.
  • Hipóteses: H0: μ = 72; H1: μ ≠ 72 (teste bilateral).
  • Média Amostral: X̄ = 73,9 kg/mm².
  • Estatística do Teste: Zcalc = (73,9 - 72) / (2/√10) = 1,9 / 0,632 = 3,00.
  • Valor Crítico: Para α = 0,05 em teste bilateral, Ztab = ±1,96.
  • Decisão: Como |3,00| > 1,96, rejeita-se H0.
  • Conclusão: Há evidências estatísticas de diferença significativa na média da resistência à tração da madeira após o ajuste da máquina.

2.7.2 Teste t para uma amostra (variância populacional desconhecida)

Nesse caso, utiliza-se a variância amostral como estimativa da variância populacional, assumindo-se distribuição normal dos dados. A estatística é dada por:

\[t_{calc} = \frac{\bar{X} - \mu_0}{s/\sqrt{n}}\]

Onde s representa o desvio-padrão amostral. A distribuição t de Student depende dos graus de liberdade gl = n - 1 e se aproxima da normal padrão à medida que os graus de liberdade aumentam. É importante o uso correto da tabela t, distinguindo os casos bilaterais e unilaterais.

2.8 Testes Paramétricos para Duas Amostras Independentes

2.8.1 Teste F para comparação de variâncias

Antes de comparar médias com teste t, é necessário verificar se as variâncias das duas populações ou amostras podem ser consideradas homogêneas ou heterogêneas. As hipóteses são:

  • H0: σ1² = σ2²
  • H1: σ1² ≠ σ2² (ou σ1² > σ2² ou σ1² < σ2²)

A estatística do teste é calculada pela razão entre a maior e a menor variância amostral. A distribuição F de Snedecor possui dois graus de liberdade. A regra de decisão é: se Fcalc > Ftab, rejeita-se H0 e conclui-se que as variâncias são diferentes; caso contrário, não se rejeita H0.

2.8.1.1 Teste t para duas amostras independentes com variâncias homogêneas

Este teste é aplicado quando se deseja comparar as médias de duas amostras independentes e o teste F indicou homogeneidade das variâncias populacionais. As hipóteses são:

  • H0: μ1 = μ2
  • H1: μ1 ≠ μ2 (ou μ1 > μ2 ou μ1 < μ2)

A fórmula da variância comum ponderada é utilizada, e a estatística tcalc é baseada nessa variância. Os graus de liberdade são dados por gl = n1 + n2 − 2. A regra de decisão é descrita a partir da comparação entre |tcalc| e ttab.

Exemplo 2.2: Medição de DAP com Suta e Fita

Figura 2.6: Comparação de medições de DAP com suta e fita diamétrica.

Um grupo de árvores teve seu DAP medido com dois instrumentos distintos, uma suta e uma fita diamétrica. Verificar, ao nível de 5% de probabilidade, se os diâmetros médios medidos pela suta são superiores aos medidos com a fita.

Dados:

## Suta (A):
##   Média (X¯): 23.93 cm
##   Variância (s²): 8.28 cm²
##   n: 6
## Fita (B):
##   Média (X¯): 23.37 cm
##   Variância (s²): 5.71 cm²
##   n: 6

Resolução:

Passo 1: Calcular Média e Variância das Amostras

  • Suta (A):
    • X̄A = 23,93 cm
    • sA² = 8,28 cm²
    • nA = 6
  • Fita (B):
    • X̄B = 23,37 cm
    • sB² = 5,71 cm²
    • nB = 6

Passo 2: Teste F para Comparação de Variâncias

  • H0: σA² = σB²
  • H1: σA² ≠ σB² (ou σA² > σB², pois sA² > sB²)
  • Fcalc: sA² / sB² = 8,28 / 5,71 = 1,45
  • Graus de liberdade: gl1 = nA - 1 = 5, gl2 = nB - 1 = 5.
  • Para α = 0,05 e gl1 = 5, gl2 = 5, Ftab = 5,05.
  • Decisão: 1,45 < 5,05. Não se rejeita H0. As variâncias são homogêneas.

Passo 3: Teste t para Duas Amostras Independentes com Variâncias Homogêneas

  • H0: μA = μB
  • H1: μA > μB (Teste unilateral à direita, pois se prevê superestimativa da suta)
  • Variância Comum (s²p): \[s_p^2 = \frac{(n_A-1)s_A^2 + (n_B-1)s_B^2}{n_A+n_B-2} = \frac{(6-1)8.28 + (6-1)5.71}{6+6-2} = \frac{5 \times 8.28 + 5 \times 5.71}{10} = \frac{41.4 + 28.55}{10} = \frac{69.95}{10} = 7.00\]
  • Estatística do Teste (tcalc): \[t_{calc} = \frac{\bar{X}_A - \bar{X}_B}{\sqrt{s_p^2 (\frac{1}{n_A} + \frac{1}{n_B})}} = \frac{23.93 - 23.37}{\sqrt{7.00 (\frac{1}{6} + \frac{1}{6})}} = \frac{0.56}{\sqrt{7.00 \times 0.333}} = \frac{0.56}{\sqrt{2.331}} \approx \frac{0.56}{1.526} \approx 0.37\]
  • Graus de liberdade: gl = nA + nB - 2 = 6 + 6 - 2 = 10.
  • Para um teste unilateral à direita com α = 0,05 e gl = 10, ttab = 1,812.
  • Decisão: |0,37| < 1,812. Não se rejeita H0.
  • Conclusão: Ao nível de 5% de significância, não há evidências estatísticas para afirmar que os diâmetros medidos pela suta são superiores aos medidos com fita. Não há diferença significativa entre as médias.

2.8.1.2 Teste t para duas amostras independentes com variâncias heterogêneas

Este teste é aplicado quando se deseja comparar as médias de duas amostras independentes e o Teste F indicou que as variâncias populacionais são heterogêneas.

Passo 1: Definição das Hipóteses

  • H0: μ1 = μ2
  • H1: μ1 ≠ μ2 (ou μ1 > μ2 ou μ1 < μ2)

Passo 2: Definir o Nível de Significância (α)

Passo 3: Estatística do Teste (tcalc)

\[t_{calc} = \frac{\bar{X}_1 - \bar{X}_2}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}}\]

Onde X̄1 e X̄2 são as médias amostrais, s1² e s2² são as variâncias amostrais, n1 e n2 são os tamanhos das amostras.

Os graus de liberdade para este teste são calculados utilizando a correção de Satterthwaite:

\[n^* = \frac{(\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2})^2}{\frac{(s_1^2/n_1)^2}{n_1-1} + \frac{(s_2^2/n_2)^2}{n_2-1}}\]

O valor de n* deve ser arredondado para o número inteiro mais próximo.

Passo 4: Definir o Valor de t Tabelado (ttab)

O valor de ttab é obtido em tabelas da distribuição t de Student, considerando o nível de significância (α) e os graus de liberdade (n*).

Passo 5: Regra de Decisão e Conclusão

  • Se |tcalc| ≥ ttab: Rejeita-se H0. Conclui-se que há diferença significativa entre as médias dos pares.
  • Se |tcalc| < ttab: Não se rejeita H0. Conclui-se que não há evidências suficientes para afirmar que há diferença significativa entre as médias dos pares.

Exemplo 2.3: Altura de Árvores em Floresta Tropical

Figura 2.7: Comparação de alturas de árvores em floresta tropical.

Alturas de árvores de dois grupos de uma mesma floresta tropical foram mensuradas com auxílio de um hipsômetro VERTEX. Verificar ao nível de 5% de probabilidade se existe diferença entre as alturas dos dois grupos analisados.

Dados:

Tabela 2.1: Médias e Variâncias das Alturas de Árvores por Grupo

Grupo

Média (X¯)

Variância (s²)

n

A

32.8

18.3

500

B

31.0

30.3

500

Resolução:

Informações: α = 0,05

Passo 1: Teste F para Comparação de Variâncias

  • H0: σA² = σB²
  • H1: σA² ≠ σB² (ou σB² > σA², pois sB² > sA²)
  • Fcalc: sB² / sA² = 30,3 / 18,3 = 1,65
  • Graus de liberdade: gl1 = nB - 1 = 499, gl2 = nA - 1 = 499.
  • Para α = 0,05 e gl1 = 499, gl2 = 499, Ftab ≈ 1,35.
  • Decisão: 1,65 > 1,35. Rejeita-se H0. As variâncias são heterogêneas.

Passo 2: Teste t para Duas Amostras Independentes com Variâncias Heterogêneas

  • H0: μA = μB
  • H1: μA ≠ μB (Teste bilateral, pois se pergunta se existe “diferença”)
  • Estatística do Teste (tcalc): \[t_{calc} = \frac{32.8 - 31.0}{\sqrt{\frac{18.3}{500} + \frac{30.3}{500}}} = \frac{1.8}{\sqrt{0.0366 + 0.0606}} = \frac{1.8}{\sqrt{0.0972}} = \frac{1.8}{0.3117} \approx 5.77\]
  • **Graus de Liberdade (n*):** \[n^* = \frac{(\frac{18.3}{500} + \frac{30.3}{500})^2}{\frac{(18.3/500)^2}{500-1} + \frac{(30.3/500)^2}{500-1}} = \frac{(0.0366 + 0.0606)^2}{\frac{0.00133956}{499} + \frac{0.00367236}{499}} = \frac{0.00944784}{0.000002684 + 0.000007359} = \frac{0.00944784}{0.000010043} \approx 940\]
  • Para um teste bilateral com α = 0,05 e gl = 940, ttab ≈ 1,96.
  • Decisão: |5,77| > 1,96. Rejeita-se H0.
  • Conclusão: Ao nível de 5% de significância, há evidências estatísticas para afirmar que existe diferença entre as alturas médias dos dois grupos de árvores analisados.

2.9 Testes Paramétricos para Duas Amostras Dependentes (Pareadas)

O teste t para amostras dependentes (ou pareadas) é utilizado quando as duas amostras não são independentes, ou seja, as observações em uma amostra estão relacionadas de alguma forma com as observações na outra amostra. Isso ocorre frequentemente em estudos onde a mesma unidade experimental é medida antes e depois de um tratamento, ou quando pares de unidades são combinados com base em alguma característica comum.

Nesse tipo de teste, a análise foca nas diferenças entre os pares de observações, transformando o problema de duas amostras em um problema de uma amostra (das diferenças).

Passo 1: Definição das Hipóteses

  • H0: μd = 0 (Não houve aumento do DAP)
  • H1: μd ≠ 0 (Houve aumento do DAP) - Teste unilateral à direita, pois se deseja verificar se houve “aumento”.

Passo 2: Definir o Nível de Significância (α)

Passo 3: Estatística do Teste (tcalc)

\[t_{calc} = \frac{\bar{d}}{s_d/\sqrt{n}}\]

Onde d̄ é a média das diferenças, sd é o desvio padrão das diferenças, e n é o número de pares de observações.

Os graus de liberdade para este teste são gl = n - 1.

Passo 4: Definir o Valor de t Tabelado (ttab)

O valor de ttab é obtido em tabelas da distribuição t de Student, considerando o nível de significância (α) e os graus de liberdade.

Passo 5: Regra de Decisão e Conclusão

  • Se |tcalc| ≥ ttab: Rejeita-se H0. Conclui-se que há diferença significativa entre as médias dos pares.
  • Se |tcalc| < ttab: Não se rejeita H0. Conclui-se que não há evidências suficientes para afirmar que há diferença significativa entre as médias dos pares.

Exemplo 2.4: Aumento do DAP em Fustes

Em um processo de dinâmica natural, foram medidos os diâmetros de seis fustes em um ano (n) e no ano subsequente (n+1), a fim de verificar se houve aumento do DAP no período de 1 ano. Utilize α = 1%.

Dados:

Tabela 2.2: Medições de DAP em Fustes ao longo de um ano

Fuste

Ano 1 (cm)

Ano 2 (cm)

Diferença (d_i = Ano 2 - Ano 1)

1

19.10

20.75

1.65

2

17.55

19.05

1.50

3

15.20

17.40

2.20

4

24.75

26.68

1.93

5

17.53

18.48

0.95

6

17.15

18.00

0.85

Resolução:

  • Média das diferenças: d̄ = 1,51 cm
  • Desvio padrão das diferenças: sd ≈ 0,53 cm
  • Hipóteses: H0: μd = 0; H1: μd > 0 (teste unilateral à direita).
  • Estatística do Teste: tcalc = 1,51 / (0,53/√6) ≈ 1,51 / 0,216 ≈ 6,99.
  • Graus de liberdade: gl = n - 1 = 6 - 1 = 5.
  • Para α = 0,01 em teste unilateral à direita com gl = 5, ttab = 3,365.
  • Decisão: |6,99| > 3,365. Rejeita-se H0.
  • Conclusão: Ao nível de 1% de significância, há evidências estatísticas para afirmar que houve um aumento significativo no DAP dos fustes no período considerado.

2.10 Teste Qui-Quadrado (χ²)

O Teste Qui-Quadrado (χ²) é um teste não paramétrico amplamente utilizado para analisar dados categóricos. Suas principais aplicações incluem:

  • Verificar se a distribuição de frequências observadas difere significativamente das frequências esperadas (Teste de Aderência).
  • Analisar a associação entre variáveis categóricas (Teste de Independência).

As características da distribuição Qui-Quadrado são:

  • Assimétrica à direita: A curva é assimétrica e se estende para a direita.
  • Sempre positiva: Os valores de χ² são sempre maiores ou iguais a zero.
  • Varia sua forma com os graus de liberdade: O formato da curva muda dependendo do número de graus de liberdade.
  • Tende à normalidade com o aumento dos graus de liberdade: À medida que os graus de liberdade aumentam, a distribuição Qui-Quadrado se aproxima da distribuição normal.

Figura 2.4: Rede complexa de espécies de árvores e doenças, ilustrando a associação em um teste Qui-Quadrado.

2.10.1 Teste Qui-Quadrado para Independência (Associação entre Variáveis Categóricas)

Este teste é utilizado para verificar se existe associação entre duas variáveis categóricas. Por exemplo, em análises florestais, pode-se verificar a associação entre a ocorrência de doenças e tipos de solo, ou entre espécies e classes de diâmetro.

Passo 1: Definição das Hipóteses

  • H0: Não há associação entre as variáveis categóricas (as frequências observadas não diferem significativamente das esperadas).
  • H1: Há associação entre as variáveis categóricas (as frequências observadas diferem significativamente das esperadas).

Passo 2: Definir o Nível de Significância (α)

Passo 3: Calcular a Estatística do Teste (χ²calc)

A estatística Qui-Quadrado é calculada comparando as frequências observadas (Fo) com as frequências esperadas (Fe) para cada categoria:

\[\chi^2_{calc} = \sum \frac{(F_o - F_e)^2}{F_e}\]

As frequências esperadas (Fe) são calculadas sob a suposição de que a hipótese nula é verdadeira (ou seja, não há associação entre as variáveis):

\[F_e = \frac{\text{Total da Linha} \times \text{Total da Coluna}}{\text{Total Geral}}\]

Os graus de liberdade para o Teste Qui-Quadrado de independência são calculados como:

\[gl = (r-1)(c-1)\]

Onde: r é o número de linhas da tabela de contingência, e c é o número de colunas da tabela de contingência.

O valor de χ²tab é obtido em tabelas da distribuição Qui-Quadrado, considerando o nível de significância (α) e os graus de liberdade.

Passo 5: Regra de Decisão e Conclusão

  • Se χ²calc ≥ χ²tab: Rejeita-se H0. Conclui-se que há associação significativa entre as variáveis categóricas.
  • Se χ²calc < χ²tab: Não se rejeita H0. Conclui-se que não há evidências suficientes para afirmar que há associação significativa entre as variáveis categóricas.

Exemplo 2.5: Associação entre Espécies de Árvores e Doenças

Um engenheiro florestal deseja saber se existe associação entre três espécies de árvores (A, B e C) e a ocorrência de uma doença. Para isso, ele coletou dados de 150 árvores, observando se a árvore estava doente ou sadia, utilizando um nível α = 5%.

Dados Observados (Fo):

Tabela 2.3: Frequências Observadas de Espécies e Doenças

Espécie

Doente

Sadia

Total

A

15

35

50

B

25

25

50

C

10

40

50

Total

50

100

150

Resolução:

Passo 1: Definição das Hipóteses

  • H0: Não há associação entre a espécie e a doença.
  • H1: Há associação entre a espécie e a doença.

Passo 2: Calcular as Frequências Esperadas (Fe)

  • Fe(A, Doente) = (50 × 50) / 150 = 16,67
  • Fe(A, Sadia) = (50 × 100) / 150 = 33,33
  • Fe(B, Doente) = (50 × 50) / 150 = 16,67
  • Fe(B, Sadia) = (50 × 100) / 150 = 33,33
  • Fe(C, Doente) = (50 × 50) / 150 = 16,67
  • Fe(C, Sadia) = (50 × 100) / 150 = 33,33

Passo 3: Calcular a Estatística do Teste (χ²calc)

Tabela 2.4: Cálculo da Estatística Qui-Quadrado

Categoria

Fo

Fe

Fo - Fe

(Fo - Fe)^2

(Fo - Fe)^2 / Fe

A, Doente

15

16.67

-1.67

2.79

0.17

A, Sadia

35

33.33

1.67

2.79

0.08

B, Doente

25

16.67

8.33

69.39

4.16

B, Sadia

25

33.33

-8.33

69.39

2.08

C, Doente

10

16.67

-6.67

44.49

2.67

C, Sadia

40

33.33

6.67

44.49

1.33

Total

150

150.00

0.00

233.33

10.50

## 
## 
## χ²calc = 10.50
  • χ²calc = 10,49

Passo 4: Definir o Valor de χ² Tabelado (χ²tab)

  • Graus de liberdade: gl = (r - 1)(c - 1) = (3 - 1)(2 - 1) = 2 × 1 = 2.
  • Para α = 0,05 e gl = 2, χ²tab = 5,991.

Passo 5: Regra de Decisão e Conclusão

  • Decisão: χ²calc (10,49) > χ²tab (5,991). Rejeita-se H0.

Passo 6: Conclusão

Ao nível de 5% de significância, há evidências estatísticas para afirmar que existe uma associação significativa entre a espécie da árvore e a ocorrência da doença.

2.11 Fluxograma de Decisão para Testes de Hipótese

A escolha do teste estatístico apropriado é um passo crucial na análise de dados. A Figura 2.5 ilustra um fluxograma simplificado que auxilia na decisão entre os diferentes tipos de testes de hipótese abordados neste capítulo.

Figura 2.5: Fluxograma de decisão para a escolha do teste estatístico apropriado.

2.12 Referências Bibliográficas

  • BANZATTO, D. A.; KRONKA, S. N. Experimentação agrícola. 4. ed. Jaboticabal: FUNEP, 2006.

Capítulo 3: Princípios Básicos da Experimentação

3.1 Introdução à Experimentação

A experimentação é um ramo essencial da pesquisa científica, especialmente nas ciências agrárias e florestais. Ela se dedica ao estudo sistemático de experimentos, abrangendo desde o seu planejamento e execução até a análise dos dados e a interpretação dos resultados obtidos. O objetivo principal é fornecer uma base sólida para a tomada de decisões com base em evidências quantitativas.

“A experimentação tem por objetivo o estudo dos experimentos, isto é, seu planejamento, execução, análise dos dados obtidos e interpretação dos resultados.”

Para ilustrar o fluxo de um trabalho experimental, considere a Figura 3.1, que esquematiza as etapas fundamentais de um projeto de pesquisa.

Figura 3.1: O processo de experimentação científica, desde o planejamento até a interpretação dos resultados.

3.2 Conceitos Fundamentais

Para compreender a lógica da experimentação, é necessário dominar alguns conceitos básicos que estruturam qualquer ensaio científico. A Figura 3.2 apresenta uma visão integrada desses conceitos.

Figura 3.2: Integração dos conceitos fundamentais: Fator, Nível, Unidade Experimental e Variável Resposta.

3.2.1 Experimento

Um experimento é um trabalho previamente planejado, que segue princípios estatísticos rigorosos. Nele, busca-se realizar a comparação dos efeitos de diferentes tratamentos sobre uma determinada unidade de estudo.

3.2.2 Tratamento ou Fator

O tratamento (ou fator) é o método, elemento ou material cujo efeito desejamos medir ou comparar. Exemplos: Diferentes variedades de clones de eucalipto ou diferentes níveis de adubação nitrogenada.

3.2.3 Nível

Os níveis são as diferentes manifestações ou doses de um determinado fator. Por exemplo, se o fator é “Adubação”, os níveis podem ser 0, 50, 100 e 150 kg/ha de N.

3.2.4 Unidade Experimental (Parcela)

É a menor unidade que recebe um tratamento e fornece os dados para análise. Pode ser um vaso, uma área de solo, um tubete ou até mesmo uma única planta, dependendo do objetivo do estudo.

3.2.5 Delineamento Experimental

Refere-se à maneira como os tratamentos são designados às unidades experimentais. Os principais tipos são: DIC (Delineamento Inteiramente Casualizado), DBC (Delineamento Casualizado em Blocos) e DQL (Delineamento em Quadrado Latino).

3.2.6 Esquema ou Ensaio

Quando avaliamos dois ou mais fatores simultaneamente, a forma como combinamos seus níveis define o esquema. Exemplos comuns incluem o Esquema Fatorial e o Esquema em Parcelas Subdivididas.

3.2.7 Variável Resposta

É a característica mensurada para avaliar o efeito dos tratamentos. Importante ressaltar que, para fins de análise estatística convencional, essa variável deve ser quantitativa (ex: altura, diâmetro, biomassa).

3.2.8 Erro Experimental

Representa o efeito de fatores que atuam de forma aleatória e que não podem ser controlados pelo pesquisador. É a variação natural entre unidades experimentais que receberam o mesmo tratamento.

3.3 Princípios Básicos da Experimentação

Para que as conclusões de um experimento sejam estatisticamente válidas, três princípios fundamentais devem ser rigorosamente seguidos.

Tabela 3.1: Princípios Fundamentais da Experimentação

Princípio

Descrição

Objetivo Principal

Repetição

Aplicação do mesmo tratamento em várias parcelas

Estimar o erro experimental e aumentar a precisão

Casualização

Distribuição dos tratamentos por sorteio

Garantir a independência dos erros e validade dos testes

Controle Local

Divisão da área em blocos homogêneos

Reduzir o erro experimental em áreas heterogêneas

3.3.1 Princípio da Repetição

A repetição consiste no uso de várias unidades experimentais para um mesmo tratamento. Ela é fundamental para permitir a estimativa do erro experimental. Como regra prática, recomenda-se que um experimento tenha pelo menos 20 parcelas no total e 12 graus de liberdade para o resíduo (erro).

Figura 3.3: O princípio da repetição ilustrado pela multiplicidade de unidades experimentais idênticas para um mesmo tratamento.

3.3.2 Princípio da Casualização

A casualização (ou sorteio) garante que todas as unidades experimentais tenham a mesma probabilidade de receber qualquer um dos tratamentos. Isso evita que tendências subjetivas do pesquisador ou variações sistemáticas do ambiente favoreçam um tratamento em detrimento de outro.

Figura 3.4: O princípio da casualização garantindo a distribuição aleatória dos tratamentos nas unidades experimentais.

3.3.3 Princípio do Controle Local

O controle local é utilizado quando a área experimental não é uniforme. Ao agrupar parcelas semelhantes em blocos, conseguimos isolar a variação devida ao ambiente, impedindo que ela “infle” o erro experimental.

Figura 3.5: Representação de um campo experimental com aplicação do controle local via blocos.

3.4 Fontes de Variação

Em qualquer experimento, a variação total observada nos dados pode ser decomposta em três fontes principais:

  1. Variação Premeditada: Introduzida propositalmente pelo pesquisador (os tratamentos). É o que queremos estudar.
  2. Variação Externa: Fatores não intencionais, mas que podem ser controlados ou isolados (ex: heterogeneidade do solo via blocos).
  3. Variação Aleatória: Variações de origem desconhecida que constituem o erro experimental. Resultam da variabilidade natural do material biológico e de imprecisões nas condições experimentais.

Capítulo 4: Delineamento Inteiramente Casualizado (DIC)

4.1 Introdução à Homogeneidade Experimental

O Delineamento Inteiramente Casualizado (DIC) representa o pilar fundamental da experimentação estatística. Sua característica distintiva é a exigência de homogeneidade total do ambiente para todas as unidades experimentais envolvidas no estudo. Este delineamento é frequentemente empregado em condições laboratoriais, casas de vegetação ou viveiros, onde as variáveis ambientais (como luminosidade, temperatura e umidade) podem ser rigorosamente controladas pelo pesquisador.

“Este é o delineamento básico; os demais se originam dele pela imposição de restrições (controle local). Envolve dois princípios básicos da experimentação: a repetição e a casualização.”

Diferentemente de delineamentos mais complexos, no DIC a distribuição dos tratamentos às unidades experimentais é realizada de forma completamente ao acaso. Isso significa que não há restrições na casualização, permitindo que cada parcela tenha a mesma probabilidade de receber qualquer um dos tratamentos em teste. Para ilustrar este conceito, considere a Figura 4.1, que esquematiza a casualização de um experimento com três adubos fosfatados em mudas de eucalipto.

Figura 4.1: Processo de casualização plena em um ambiente homogêneo de casa de vegetação.

4.1.1 Vantagens do DIC

  • Flexibilidade Excepcional: Permite o uso de qualquer número de tratamentos e de repetições. O número de repetições pode inclusive variar entre os tratamentos (experimentos desbalanceados).
  • Simplicidade Analítica: A análise estatística e os testes de hipóteses são os mais diretos entre todos os delineamentos.
  • Poder Estatístico: Proporciona o maior número de graus de liberdade associado ao resíduo (erro experimental), o que aumenta a sensibilidade do teste F para detectar diferenças reais.

4.1.2 Desvantagens do DIC

  • Exigência de Homogeneidade: Se o ambiente apresentar gradientes de variação (como fertilidade do solo ou declividade), o DIC pode inflar a variância residual, mascarando os efeitos dos tratamentos.
  • Sensibilidade ao Erro: Por não haver controle local, qualquer variação ambiental não controlada será contabilizada diretamente como erro experimental.

4.2 Exemplo de Casualização no Delineamento Inteiramente Casualizado (DIC)

Para compreender a aplicação prática do Delineamento Inteiramente Casualizado (DIC), considera-se um experimento cujo objetivo é avaliar três adubos fosfatados diferentes na produção de um híbrido de Eucalyptus grandis × Eucalyptus urophylla. O pesquisador busca determinar qual dos adubos (Superfosfato simples, Superfosfato triplo ou Fosfato Natural) promove o melhor desenvolvimento do híbrido.

Neste experimento, cada adubo representa um tratamento distinto. Para garantir a confiabilidade dos resultados, foram definidas 4 repetições por tratamento, totalizando 12 unidades experimentais (plantas ou vasos). As repetições são cruciais para estimar o erro experimental e aumentar a precisão das estimativas dos efeitos dos tratamentos.

O princípio da casualização é aplicado de forma integral no DIC. Isso significa que a alocação de cada um dos três adubos às 12 unidades experimentais é feita de maneira completamente aleatória, sem qualquer restrição espacial. Por exemplo, se as unidades experimentais são vasos dispostos em uma bancada, qualquer vaso pode receber qualquer um dos tratamentos, independentemente de sua posição. A Figura 4.3 ilustra um possível arranjo casualizado para este experimento.

O controle local é um aspecto fundamental no DIC. Ele pressupõe que o ambiente onde o experimento é conduzido é intrinsecamente homogêneo. Em um ambiente de casa de vegetação, por exemplo, espera-se que fatores como luz, temperatura, umidade e substrato sejam uniformes para todas as unidades experimentais. Se houver qualquer gradiente ambiental não controlado, a variação resultante será incorporada ao erro experimental, podendo mascarar os verdadeiros efeitos dos tratamentos.

Tabela 4.1: Detalhes do Experimento de Adubação em Eucalipto

Tabela 4.1: Detalhes do Experimento de Adubação em Eucalipto

Elemento

Descrição

Objetivo

Avaliar o melhor adubo fosfatado para o híbrido de eucalipto.

Tratamentos

1. Superfosfato simples 2. Superfosfato triplo 3. Fosfato Natural

Repetições

4 repetições por tratamento

Casualização

Alocação completamente aleatória dos tratamentos às unidades experimentais.

Controle Local

Ambiente homogêneo (ex: casa de vegetação).

Este exemplo demonstra como a simplicidade do DIC, aliada à casualização e à exigência de homogeneidade, permite isolar e avaliar o efeito dos tratamentos de forma eficiente em condições controladas.

Figura 4.2: Processo de casualização de adubos em Eucalipto.

4.2 O Modelo Estatístico Linear Aditivo

Cada delineamento possui um modelo matemático que descreve como diferentes fontes de variação contribuem para o valor observado na variável resposta. Para o DIC, o modelo é:

\[Y_{ij} = \mu + \tau_i + \epsilon_{ij}\]

Em que:

  • \(Y_{ij}\): É o valor observado (variável resposta) referente ao \(i\)-ésimo tratamento na \(j\)-ésima repetição.
  • \(\mu\): É a média geral de todas as unidades experimentais para a variável em estudo.
  • \(\tau_i\): É o efeito do particular tratamento \(i\) no valor observado \(Y_{ij}\).
  • \(\epsilon_{ij}\): É o erro experimental associado à observação, representando o efeito de todos os fatores não controlados na parcela.

Importante: O erro experimental reflete a variação observada entre as repetições do mesmo tratamento. Como não é possível controlar 100% das condições, esse erro é inerente a qualquer processo biológico.

4.3 Quadro de Tabulação de Dados e Fórmulas de Sumarização no DIC

No Delineamento Inteiramente Casualizado (DIC), a organização dos dados coletados é um passo fundamental antes de qualquer análise estatística. O Quadro de Tabulação de Dados serve como uma estrutura padronizada para registrar as observações, facilitando a visualização e os cálculos subsequentes. Esse quadro organiza os dados em função dos tratamentos e de suas respectivas repetições.

4.3.1 Estrutura do Quadro de Tabulação

Considere um experimento instalado no DIC com \(I\) tratamentos e \(J\) repetições por tratamento. O quadro de tabulação de dados pode ser resumido da seguinte forma:

Tabela 4.2: Estrutura do Quadro de Tabulação de Dados

Repetições

1

2

3

...

I

1

Y11

Y21

Y31

...

YI1

2

Y12

Y22

Y32

...

YI2

3

Y13

Y23

Y33

...

YI3

...

...

...

...

...

...

J

Y1J

Y2J

Y3J

...

YIJ

Totais

T1

T2

T3

...

TI

Neste quadro:

  • \(Y_{ij}\): Representa o valor observado (variável resposta) da \(j\)-ésima repetição do \(i\)-ésimo tratamento. Por exemplo, \(Y_{23}\) seria a observação da 3ª repetição do 2º tratamento.
  • \(T_i\): Denota o total das observações para o \(i\)-ésimo tratamento. É a soma de todas as repetições daquele tratamento.

4.3.2 Informações de Interesse Derivadas do Quadro

Do quadro de tabulação, podemos extrair informações cruciais para a análise:

  • Número de unidades experimentais (\(N\)): É o número total de parcelas ou unidades experimentais no experimento. Para um DIC balanceado (com o mesmo número de repetições por tratamento), \(N = I \times J\). Para um DIC desbalanceado, \(N = \sum_{i=1}^{I} r_i\), onde \(r_i\) é o número de repetições para o \(i\)-ésimo tratamento.

4.3.3 Fórmulas de Sumarização

Para a realização da Análise de Variância (ANOVA), é necessário calcular algumas somas e médias a partir dos dados tabulados.

  1. Total Geral (\(G\)): É a soma de todas as observações do experimento. Pode ser calculado somando-se todos os \(Y_{ij}\) ou somando-se os totais de cada tratamento (\(T_i\)).

    \[G = \sum_{i=1}^{I} \sum_{j=1}^{J} Y_{ij} = \sum_{i=1}^{I} T_i\]

  2. Total para o tratamento \(i\) (\(T_i\)): É a soma das observações para um tratamento específico \(i\).

    \[T_i = \sum_{j=1}^{J} Y_{ij}\]

  3. Média para o tratamento \(i\) (\(\bar{m}_i\)): É a média das observações para um tratamento específico \(i\). Se o número de repetições for igual para todos os tratamentos (\(J\)), utiliza-se \(J\). Se for diferente (\(r_i\)), utiliza-se \(r_i\).

    \[\bar{m}_i = \frac{T_i}{J} \text{ ou } \bar{m}_i = \frac{T_i}{r_i}\]

  4. Média geral do experimento (\(\bar{m}\)): É a média de todas as observações do experimento. Pode ser calculada dividindo o Total Geral (\(G\)) pelo número total de unidades experimentais (\(N\)).

    \[\bar{m} = \frac{G}{N}\]

Essas somas e médias são os blocos construtivos para o cálculo das Somas de Quadrados na ANOVA, que permitem decompor a variabilidade total dos dados e testar a significância dos efeitos dos tratamentos.

5. Análise de Variância (ANOVA)

A Análise de Variância (ANOVA), introduzida por Ronald Fisher, é uma técnica estatística robusta e amplamente utilizada para comparar as médias de três ou mais grupos simultaneamente. Essencialmente, a ANOVA opera sob o princípio da decomposição da variação total observada em um conjunto de dados. Isso significa que a variabilidade global entre todas as observações é particionada em componentes atribuíveis a diferentes fontes: a variação explicada pelas diferenças entre os efeitos dos tratamentos aplicados e a variação não explicada, conhecida como erro experimental ou resíduo, que representa a variabilidade aleatória ou não controlada no experimento. Ao comparar a magnitude da variação entre tratamentos com a variação residual, a ANOVA permite inferir se as diferenças observadas entre as médias dos grupos são estatisticamente significativas ou meramente devidas ao acaso, desde que certas pressuposições estatísticas sejam satisfeitas para a validade da análise.

Quando as pressuposições fundamentais para a aplicação da ANOVA não são atendidas pelos dados, o pesquisador dispõe de algumas alternativas para prosseguir com a análise. Uma abordagem comum é a transformação de dados, que envolve a aplicação de funções matemáticas (como logaritmo ou raiz quadrada) com o objetivo de adequá-los às exigências de normalidade e homocedasticidade. No entanto, se as transformações não se mostrarem eficazes ou se não forem apropriadas para a natureza dos dados, a alternativa mais indicada é recorrer a testes não paramétricos. Estes testes não vantajosos por não dependerem de pressuposições rigorosas sobre a distribuição dos dados, oferecendo uma metodologia válida para a comparação de grupos em cenários onde a ANOVA pareceria inadequada. A escolha da abordagem correta é crucial para garantir a validade estatística das conclusões e a robustez da análise experimental.

5.1 Pressuposições para a Validade da ANOVA

Para que a técnica de Análise de Variância (ANOVA) seja aplicada de forma legítima, os dados devem satisfazer quatro pressuposições fundamentais:

  1. Aditividade: Os efeitos dos componentes do modelo (média, tratamento e erro) devem ser aditivos.
  2. Independência dos Erros: Cada observação deve possuir um erro independente dos demais. O princípio da casualização é o que assegura essa independência, evitando favorecimentos sistemáticos.
  3. Normalidade: Os erros experimentais devem seguir uma distribuição normal com média zero e variância constante (\(\sigma^2\)). Pequenas violações dessa suposição geralmente não invalidam o teste, mas grandes desvios requerem transformações de dados.
  4. Homocedasticidade (Homogeneidade de Variâncias): As variâncias das amostras dos diferentes tratamentos devem ser homogêneas. Isso é crucial porque o Quadrado Médio do Resíduo (QMRes) é uma média ponderada dessas variâncias.

NORMALIDADE E HOMOGENEIDADE NA ANOVA Uma das principais condições para a aplicação da Análise de Variância (ANOVA) é que os resíduos sejam normalmente distribuídos e que as variâncias sejam homogêneas entre os tratamentos. Contudo, na prática experimental, pequenas violações da normalidade não invalidam a ANOVA, desde que as variâncias sejam homogêneas e o número de repetições seja equilibrado.

5.1.1 Verificação de Homocedasticidade: Teste de Levene

O Teste de Levene é amplamente utilizado para verificar se as variâncias entre os tratamentos são estatisticamente iguais.

A hipótese nula (\(H_0\)) assume que as variâncias são homogêneas, enquanto a hipótese alternativa (\(H_a\)) sugere que pelo menos uma variância é diferente.

O teste é baseado na análise de variância dos desvios absolutos das observações em relação à mediana de cada grupo.

Fórmula da Estatística de Levene (\(F_Z\)):

\[F_Z = \frac{(N-I) \sum_{i=1}^{I} N_i (\bar{Z}_i - \bar{Z})^2}{(I-1) \sum_{i=1}^{I} \sum_{j=1}^{N_i} (Z_{ij} - \bar{Z}_i)^2}\]

Onde:

  • \(N\): Número total de observações.
  • \(I\): Número de grupos (tratamentos).
  • \(N_i\): Número de observações no \(i\)-ésimo grupo.
  • \(Y_{ij}\): Valor da \(j\)-ésima observação do \(i\)-ésimo grupo.
  • \(\tilde{Y}_i\): Mediana do \(i\)-ésimo grupo.
  • \(Z_{ij} = |Y_{ij} - \tilde{Y}_i|\): Desvio absoluto da \(j\)-ésima observação do \(i\)-ésimo grupo em relação à sua mediana.
  • \(\bar{Z}_i\): Média dos desvios absolutos para o \(i\)-ésimo grupo.
  • \(\bar{Z}\): Média geral de todos os desvios absolutos.

Passo a Passo para o Teste de Levene:

  1. Para cada grupo (tratamento), calcule a mediana (\(\tilde{Y}_i\)) dos dados observados.
  2. Para cada observação \(Y_{ij}\), calcule o desvio absoluto em relação à mediana do seu grupo: \(Z_{ij} = |Y_{ij} - \tilde{Y}_i|\).
  3. Com os valores de \(Z_{ij}\), realize uma Análise de Variância (ANOVA).

A estatística \(F_Z\) resultante dessa ANOVA é a estatística \(F_Z\) de Levene. Compare o \(F_Z\) com o \(F_{tab}\) (com \(I-1\) e \(N-I\) graus de liberdade).

  • \(H_0\): \(\sigma_1^2 = \sigma_2^2 = ... = \sigma_k^2\) (As variâncias são homogêneas).
  • \(H_a\): Pelo menos uma variância é diferente.

Regra de Decisão:

  • Se \(F_Z \ge F_{tab}\), rejeita-se \(H_0\). As variâncias não são homogêneas.
  • Se \(F_Z < F_{tab}\), não se rejeita \(H_0\). As variâncias são homogêneas.

5.1.2 Verificação de Normalidade: Teste de Shapiro-Wilk

O Teste de Shapiro-Wilk é um dos testes mais poderosos para verificar a normalidade de uma distribuição. Ele compara a distribuição observada dos dados com uma distribuição normal teórica.

  • \(H_0\): Os erros provêm de uma população com distribuição normal.
  • \(H_a\): Os erros não provêm de uma população com distribuição normal.

Fórmula da Estatística de Shapiro-Wilk (\(W\)):

\[W = \frac{b^2}{S^2}\]

Onde:

  • \(S^2 = \sum_{i=1}^{N} (x_i - \bar{x})^2\)

  • \(b = \sum_{i=1}^{k} a_i (x_{N-i+1} - x_i)\), onde \(k = N/2\) se \(N\) é par, ou \(k = (N-1)/2\) se \(N\) é ímpar.

  • \(x_i\): são as observações ordenadas (do menor para o maior).

  • \(a_i\): são os coeficientes de Shapiro-Wilk, que dependem do tamanho da amostra \(N\) e são obtidos de tabelas específicas.

  • \(\bar{x}\): é a média da amostra.

Passo a Passo para o Teste de Shapiro-Wilk:

  1. Ordene os dados: Organize as \(N\) observações em ordem crescente: \(x_{(1)} \le x_{(2)} \le ... \le x_{(N)}\).
  2. Calcule a média da amostra: \(\bar{x} = \frac{\sum x_i}{N}\).
  3. Calcule o denominador: \(S^2 = \sum_{i=1}^{N} (x_i - \bar{x})^2\).
  4. Obtenha os coeficientes \(a_i\): Consulte uma tabela de coeficientes de Shapiro-Wilk para o tamanho da sua amostra \(N\). Para \(N\) par, os coeficientes são simétricos, ou seja, \(a_i = -a_{N-i+1}\).
  5. Calcule o numerador: \(b = \sum_{i=1}^{k} a_i (x_{N-i+1} - x_i)\), onde \(k = N/2\) se \(N\) é par, ou \(k = (N-1)/2\) se \(N\) é ímpar.
  6. Calcule a estatística \(W\): \(W = b^2 / S^2\).
  7. Compare \(W_{calc}\) com \(W_{tab}\): Consulte uma tabela de valores críticos de Shapiro-Wilk para o nível de significância \(\alpha\) e o tamanho da amostra \(N\).

Regra de Decisão:

  • Se \(W_{calc} \ge W_{tab}(\alpha, N)\), não se rejeita \(H_0\) ao nível de \(\alpha\)% de probabilidade, ou seja, a amostra provém de uma distribuição normal.
  • Se \(W_{calc} < W_{tab}(\alpha, N)\), rejeita-se \(H_0\) ao nível de \(\alpha\)% de probabilidade, ou seja, a amostra não provém de uma distribuição normal.

Observação importante: Se os dados não seguirem uma distribuição normal, pode-se tentar transformações matemáticas (como logarítmica ou raiz quadrada) para aproximá-los da normalidade, ou utilizar testes não paramétricos.

5.1.3 Procedimentos da Análise de Variância (ANOVA)

A ANOVA consiste na decomposição da Soma de Quadrados Total (\(SQ_{Total}\)) em duas partes: a variação devida aos tratamentos (\(SQ_{Trat}\)) e a variação devida ao acaso (\(SQ_{Res}\)).

\[SQ_{Total} = SQ_{Trat} + SQ_{Res}\]

5.1.3.1 Quadro da ANOVA para DIC (Balanceado)

Tabela 4.3: Quadro da ANOVA para Delineamento Inteiramente Casualizado (DIC) Balanceado

Fonte de Variação (FV)

Graus de Liberdade (GL)

Soma de Quadrados (SQ)

Quadrado Médio (QM)

Fcalc

Tratamento

I - 1

SQTrat

QMTrat = SQTrat / GLTrat

QMTrat / QMRes

Resíduo

I(J - 1)

SQRes

QMRes = SQRes / GLRes

-

Total

IJ - 1

SQTotal

-

-

Onde \(I\) é o número de tratamentos e \(J\) o número de repetições por tratamento.

5.1.3.2 Fórmulas de Cálculo

  1. Fator de Correção (\(C\)):

    \[C = \frac{(\sum_{i=1}^{I} \sum_{j=1}^{J} Y_{ij})^2}{N}\]

  2. Onde \(N\) é o número total de observações, sendo \(N = I \times J\) para dados balanceados e \(N = \sum_{i=1}^{I} r_i\) para dados desbalanceados.

  3. Soma de Quadrados Total (\(SQ_{Total}\)):

    \[SQ_{Total} = \sum_{i=1}^{I} \sum_{j=1}^{J} Y_{ij}^2 - C\]

  4. Soma de Quadrados de Tratamentos (\(SQ_{Trat}\)):

    • Para dados balanceados:

      \[SQ_{Trat} = \sum_{i=1}^{I} \frac{T_i^2}{J} - C\]

    • Para dados desbalanceados:

      \[SQ_{Trat} = \sum_{i=1}^{I} \frac{T_i^2}{r_i} - C\]

  5. Onde \(T_i\) é o total do tratamento \(i\).

  6. Soma de Quadrados do Resíduo (\(SQ_{Res}\)):

    \[SQ_{Res} = SQ_{Total} - SQ_{Trat}\]

4.3.4 Hipóteses do Teste F

  • \(H_0\): \(\mu_1 = \mu_2 = ... = \mu_I = \mu\) (As médias dos tratamentos são estatisticamente iguais).
  • \(H_a\): Não \(H_0\) (Existe pelo menos uma média de tratamento que difere das demais).

Regra de Decisão:

  • Se \(F_{calc} \ge F_{tab}(\alpha, GL_{Trat}, GL_{Res})\), rejeita-se \(H_0\) ao nível de \(\alpha\)% de probabilidade. Isso indica que existe diferença estatística significativa entre os tratamentos.
  • Se \(F_{calc} < F_{tab}(\alpha, GL_{Trat}, GL_{Res})\), não se rejeita \(H_0\) ao nível de \(\alpha\)% de probabilidade. Isso significa que não há evidência suficiente para afirmar que os tratamentos diferem entre si.

6. Estudo de Caso 1: Produtividade de Variedades de Pequi

Um engenheiro florestal conduziu um experimento para comparar a produtividade (em kg) de quatro variedades de pequi (A, B, C, D), utilizando um Delineamento Inteiramente Casualizado (DIC) com 5 repetições para cada variedade. O objetivo é verificar se existe diferença significativa na produtividade entre as variedades ao nível de 5% de significância. Além disso, é necessário realizar os testes de homogeneidade de variância (Levene) e normalidade (Shapiro-Wilk).

Dados:

Tabela 4.4: Produtividade (kg) de Variedades de Pequi

Variedade A

Variedade B

Variedade C

Variedade D

19

32

22

33

18

29

26

29

17

23

28

34

21

27

25

28

21

25

29

27

## 
## 
## TA: 96, TB: 136, TC: 130, TD: 151
## Total Geral (G): 513
## Número total de observações (N): 4 variedades × 5 repetições = 20

6.1 Resolução do teste de Levene: passo a passo

Para aplicar o Teste de Levene ao Estudo de Caso 1, seguiríamos os seguintes passos:

  1. Enunciar a Hipótese:

    • \(H_0\): \(\sigma_A^2 = \sigma_B^2 = \sigma_C^2 = \sigma_D^2\)
    • \(H_a\): Não \(H_0\)
  2. Calcular a mediana de cada variedade:

    Tabela 4.5: Mediana da Produtividade por Variedade

    Variedade

    Mediana

    Variedade A

    19

    Variedade B

    27

    Variedade C

    26

    Variedade D

    29

  3. Calcular os desvios absolutos (\(Z_{ij}\)): Para cada observação de produtividade, subtrairíamos a mediana do seu respectivo grupo e tomaríamos o valor absoluto. Isso geraria um novo conjunto de dados (\(Z_{ij}\)). Por exemplo, para a Variedade A, se a mediana fosse 19, os novos dados seriam \(|19-19|\), \(|18-19|\), etc.

    Tabela 4.6: Desvios Absolutos da Produtividade por Variedade

    Variedade

    Z_ij (desvios absolutos)

    A

    0, 1, 2, 2, 2

    B

    5, 2, 4, 0, 2

    C

    4, 0, 2, 1, 3

    D

    4, 0, 5, 1, 2

  4. Realizar o cálculo do \(F_Z\) de Levene a partir da seguinte fórmula:

    \[F_Z = \frac{(N-I) \sum_{i=1}^{I} N_i (\bar{Z}_i - \bar{Z})^2}{(I-1) \sum_{i=1}^{I} \sum_{j=1}^{N_i} (Z_{ij} - \bar{Z}_i)^2}\]

    Dados:

    • \(N = 20\)
    • \(I = 4\)
    • \(N_i = 5\) (para todos os grupos)

    Médias dos desvios absolutos (\(\bar{Z}_i\)):

    • A = 1,4
    • B = 2,6
    • C = 2,0
    • D = 2,4
    • Média geral (\(\bar{Z}\)) = 2,1

    Numerador:

    \[ \sum_{i=1}^{I} N_i (\bar{Z}_i - \bar{Z})^2 = 4,20\]

    Denominador:

    \[ \sum_{i=1}^{I} \sum_{j=1}^{N_i} (Z_{ij} - \bar{Z}_i)^2 = 45,60\]

    Cálculo:

    \[F_Z = (16/3) \times (4,20/45,60) \approx 0,49\]

    Resultado final:

    \(F_Z \approx 0,49\)

  5. Comparar \(F_Z\) com \(F_{tab}\): Com \(GL_{Trat} = 3\) e \(GL_{Res} = 16\), consultaríamos a tabela F para obter \(F_{tab}\) e concluir.

    \(0,49 < 3,24\) (para \(\alpha = 0,05\)). Não rejeitamos \(H_0\). Logo, não há evidências estatísticas para rejeitar a hipótese nula de igualdade das variâncias ao nível de 5% de probabilidade. Portanto, as variâncias das produtividades das variedades podem ser consideradas homogêneas.

6.2 Resolução do teste de Shapiro-Wilk: Passo a Passo

Para aplicar o Teste de Shapiro-Wilk aos resíduos do Estudo de Caso 1, seguiríamos:

  1. Enunciar a Hipótese:

    • \(H_0\): Os erros seguem distribuição normal
    • \(H_a\): Os erros não seguem distribuição normal
  2. Obter os resíduos: Primeiro, seria necessário calcular os resíduos do modelo da ANOVA \(e_{ij} = Y_{ij} - \hat{Y}_{ij}\), onde \(\hat{Y}_{ij}\) é o valor predito.

    Tabela 4.7: Resíduos do Modelo da ANOVA por Variedade e Repetição

    Repetição

    Variedade A

    Variedade B

    Variedade C

    Variedade D

    1

    -0.2

    4.8

    -4

    2.8

    2

    -1.2

    1.8

    0

    -1.2

    3

    -2.2

    -4.2

    2

    3.8

    4

    1.8

    -0.2

    -1

    -2.2

    5

    1.8

    -2.2

    3

    -3.2

  3. Ordenar os resíduos: Organizar os \(N=20\) resíduos em ordem crescente: \(x_{(1)} \le x_{(2)} \le ... \le x_{(20)}\).

    Tabela 4.8: Resíduos Ordenados

    i

    xi

    1

    -4.2

    2

    -4.0

    3

    -3.2

    4

    -2.2

    5

    -2.2

    6

    -2.2

    7

    -1.2

    8

    -1.2

    9

    -1.0

    10

    -0.2

    11

    -0.2

    12

    0.0

    13

    1.8

    14

    1.8

    15

    1.8

    16

    2.0

    17

    2.8

    18

    3.0

    19

    3.8

    20

    4.8

  4. Calcular a média dos resíduos: \(\bar{x}\). Se os resíduos forem calculados corretamente essa média será zero ou um valor próximo a zero.

  5. Calcular o denominador \(S^2 = \sum_{i=1}^{N} (x_i - \bar{x})^2\).

    Tabela 4.9: Cálculo de (xi - x_bar)^2 para Resíduos

    Residuo

    (xi - x_bar)^2

    -0.2

    0.04

    -1.2

    1.44

    -2.2

    4.84

    1.8

    3.24

    1.8

    3.24

    4.8

    23.04

    1.8

    3.24

    -4.2

    17.64

    -0.2

    0.04

    -2.2

    4.84

    -4.0

    16.00

    0.0

    0.00

    2.0

    4.00

    -1.0

    1.00

    3.0

    9.00

    2.8

    7.84

    -1.2

    1.44

    3.8

    14.44

    -2.2

    4.84

    -3.2

    10.24

    ## 
    ## 
    ## S² = 130.40
  6. Obter os coeficientes \(a_i\): Para \(N=20\), os coeficientes \(a_i\) são obtidos de tabelas. A apresentação fornece os valores para \(a_1\) até \(a_{10}\).

    Tabela 4.10: Coeficientes a_i e Cálculo Parcial do Numerador b

    i

    a_i

    x_i

    x_N-i+1

    a_i(x_N-i+1 - x_i)

    1

    0.4734

    -4.2

    4.8

    4.2606

    2

    0.3211

    -4.0

    3.8

    2.5046

    3

    0.2565

    -3.2

    3.0

    1.9503

    4

    0.2085

    -2.2

    2.8

    1.0425

    5

    0.1686

    -2.2

    2.0

    0.7081

    6

    0.1334

    -2.2

    1.8

    0.8336

    7

    0.1013

    -1.2

    1.8

    0.3039

    8

    0.0711

    -1.2

    1.8

    0.2133

    9

    0.0422

    -1.0

    0.0

    0.0000

    10

    0.0140

    -0.2

    -0.2

    -0.0028

    ## 
    ## 
    ## b = 11.1991
  7. Calcular o numerador \(b = \sum_{i=1}^{k} a_i (x_{N-i+1} - x_i)\).

    \(b = 11,1991\)

  8. Calcular a estatística \(W\): \(W = b^2 / S^2\).

    \(W_{calc} = 0,96\)

  9. Comparar \(W_{calc}\) com \(W_{tab}\): Para \(\alpha = 0,05\) e \(N = 20\), \(W_{tab} = 0,905\).

    Conclusão: Como \(W_{calc}(0,96) \ge W_{tab}(0,905)\), não se rejeita \(H_0\) ao nível de 5% de probabilidade. Isso indica que a amostra provém de uma distribuição normal.

6.3 Resolução da ANOVA: Passo a Passo

  1. Cálculo do Fator de Correção (\(C\)):

    \[C = \frac{(513)^2}{20} = \frac{263169}{20} = 13158,45\]

  2. Cálculo da Soma de Quadrados Total (\(SQ_{Total}\)):

    \[SQ_{Total} = \sum Y_{ij}^2 - C\]

    \(\sum Y_{ij}^2 = 19^2 + 18^2 + 17^2 + 21^2 + 21^2 + 32^2 + 29^2 + 23^2 + 27^2 + 25^2 + 22^2 + 26^2 + 28^2 + 25^2 + 29^2 + 33^2 + 29^2 + 34^2 + 28^2 + 27^2\)

    \(\sum Y_{ij}^2 = 361 + 324 + 289 + 441 + 441 + 1024 + 841 + 529 + 729 + 625 + 484 + 676 + 784 + 625 + 841 + 1089 + 841 + 1156 + 784 + 729 = 13613\)

    \(SQ_{Total} = 13613 - 13158,45 = 454,55\)

  3. Cálculo da Soma de Quadrados de Tratamentos (\(SQ_{Trat}\)):

    \[SQ_{Trat} = \sum \frac{T_i^2}{J} - C\]

    \(SQ_{Trat} = \frac{96^2}{5} + \frac{136^2}{5} + \frac{130^2}{5} + \frac{151^2}{5} - 13158,45\)

    \(SQ_{Trat} = \frac{9216}{5} + \frac{18496}{5} + \frac{16900}{5} + \frac{22801}{5} - 13158,45\)

    \(SQ_{Trat} = 1843,2 + 3699,2 + 3380 + 4560,2 - 13158,45 = 13482,6 - 13158,45 = 324,15\)

  4. Cálculo da Soma de Quadrados do Resíduo (\(SQ_{Res}\)):

    \(SQ_{Res} = SQ_{Total} - SQ_{Trat} = 454,55 - 324,15 = 130,40\)

  5. Quadro Final da ANOVA

    • \(H_0\): \(\mu_A = \mu_B = \mu_C = \mu_D\)
    • \(H_a\): Não \(H_0\)
    Tabela 4.11: Quadro da ANOVA Final para Produtividade de Pequi

    FV

    GL

    SQ

    QM

    Fcalc

    Ftab_5

    Tratamento

    I-1 = 4-1 = 3

    324.15

    108.05

    13.2576687116564

    3.24

    Resíduo

    I(J-1) = 4(5-1) = 16

    130.40

    8.15

    -

    -

    Total

    IJ-1 = 20-1 = 19

    454.55

    -

    -

    -

    Conclusão: Como \(F_{calc}(13,26) > F_{tab}(3,24)\), rejeita-se a hipótese nula (\(H_0\)) ao nível de 5% de significância. Isso significa que existe diferença estatística significativa entre a produtividade das variedades de pequi.

7. Estudo de Caso 2: Eficiência de Vendedores de Pesticidas

O resultado das vendas efetuadas por 3 vendedores (A, B, C) de uma indústria de pesticidas durante certo período é dado a seguir. Ao nível de 5% de probabilidade e considerando os vendedores como tratamentos de um DIC, verifique se há diferença de eficiência entre os vendedores. (Utilizar \(\alpha = 5\%\); considerar variâncias homogêneas e erros seguindo distribuição normal).

Dados:

Tabela 4.12: Vendas de Pesticidas por Vendedor

Vendedor A

Vendedor B

Vendedor C

29

27

30

27

27

30

31

30

31

29

28

27

32

29

30

## 
## 
## TA = 178, TB = 112, TC = 147
## Nº Repetições (J_i): 6, 4, 5
## Total Geral (G): 437
## Número total de observações (N): 15

7.1.1 Resolução da ANOVA: Passo a Passo

  1. Cálculo do Fator de Correção (\(C\)):

    \[C = \frac{(437)^2}{15} = \frac{190969}{15} \approx 12731,27\]

  2. Cálculo da Soma de Quadrados Total (\(SQ_{Total}\)):

    \[SQ_{Total} = \sum Y_{ij}^2 - C\]

    \(\sum Y_{ij}^2 = 29^2 + 27^2 + 31^2 + 29^2 + 32^2 + 30^2 + 27^2 + 27^2 + 30^2 + 28^2 + 30^2 + 30^2 + 31^2 + 27^2 + 29^2 = 12769\)

    \(SQ_{Total} = 12769 - 12731,27 = 37,73\)

  3. Cálculo da Soma de Quadrados de Tratamentos (\(SQ_{Trat}\)): Neste caso, o número de repetições é diferente para cada tratamento, então usamos a fórmula para tratamentos desbalanceados:

    \[SQ_{Trat} = \sum \frac{T_i^2}{r_i} - C\]

    \(SQ_{Trat} = \frac{178^2}{6} + \frac{112^2}{4} + \frac{147^2}{5} - 12731,27\)

    \(SQ_{Trat} = \frac{31684}{6} + \frac{12544}{4} + \frac{21609}{5} - 12731,27\)

    \(SQ_{Trat} = 5280,6667 + 3136 + 4321,8 - 12731,27 = 12738,47 - 12731,27 = 7,20\)

  4. Cálculo da Soma de Quadrados do Resíduo (\(SQ_{Res}\)):

    \(SQ_{Res} = SQ_{Total} - SQ_{Trat} = 37,73 - 7,20 = 30,53\)

  5. Quadro da ANOVA

    • \(H_0\): \(\mu_A = \mu_B = \mu_C\)
    • \(H_a\): Não \(H_0\)
    Tabela 4.13: Quadro da ANOVA para Eficiência de Vendedores

    FV

    GL

    SQ

    QM

    Fcalc

    Ftab_5

    Tratamento

    I-1 = 3-1 = 2

    7.20

    3.6

    1.41500163773338

    3.89

    Resíduo

    N-I = 15-3 = 12

    30.53

    2.54416666666667

    -

    -

    Total

    N-1 = 15-1 = 14

    37.73

    -

    -

    -

    Conclusão: Como \(F_{calc}(1,41) < F_{tab}(3,89)\), não se rejeita a hipótese nula (\(H_0\)) ao nível de 5% de probabilidade. Isso significa que não há evidência estatística suficiente para afirmar que existe diferença na eficiência entre os vendedores.