A experimentação constitui a base do método científico e é uma ferramenta indispensável para o avanço do conhecimento nas ciências agrárias e florestais. Por meio de experimentos, pesquisadores podem investigar fenômenos, testar hipóteses e desenvolver novas tecnologias de forma sistemática e controlada. Na área florestal, a experimentação é crucial para o desenvolvimento de práticas de manejo sustentável, o melhoramento genético de espécies e a compreensão das complexas interações ecológicas que ocorrem nos ecossistemas florestais.
O processo experimental permite que os cientistas isolem variáveis de interesse e observem seus efeitos sob condições controladas, o que minimiza a influência de fatores externos que poderiam confundir os resultados. Essa abordagem estruturada garante que as conclusões obtidas sejam robustas e baseadas em evidências empíricas, e não em meras suposições ou observações casuais.
A experimentação florestal visa atender a uma variedade de objetivos que são fundamentais para a tomada de decisões informadas no setor:
A estatística desempenha um papel central em todas as etapas do processo de pesquisa experimental. Ela fornece as ferramentas para lidar com a variabilidade inerente aos sistemas biológicos e para extrair conclusões válidas a partir dos dados.
Função da Estatística | Descrição |
|---|---|
Planejamento de experimentos | Ajuda a definir o delineamento, o número de repetições e a alocação da repetições dos tratamentos. |
Análise de dados | Permite determinar se as diferenças observadas são estatisticamente significativas. |
Quantificação da incerteza | Avalia a confiabilidade das conclusões por meio de intervalos de confiança e testes de hipóteses. |
Modelagem de fenômenos | Descreve a relação entre variáveis e permite fazer previsões. |
O procedimento da pesquisa científica, apoiado pela estatística, geralmente segue três etapas principais: Formulação de Hipóteses, Verificação Experimental e Análise e Interpretação dos resultados com rigor metodológico.
O desenvolvimento de um experimento florestal segue um ciclo
sistemático e iterativo, permitindo que as conclusões de um experimento
sirvam de base para novas investigações.
Os conceitos fundamentais da experimentação são os pilares sobre os quais todo experimento bem-sucedido é construído. Compreender claramente cada um desses termos é essencial para o planejamento e execução de pesquisas de qualidade.
Este exemplo ilustra um experimento de laboratório com estrutura simples, mas rigorosa.
Figura 1.3: Esquema completo do experimento de quebra de dormência em sementes de Pinus, mostrando tratamentos, unidades experimentais e variável resposta.
Objetivo: Testar métodos para superar a dormência em sementes de Pinus e identificar qual tratamento resulta na maior porcentagem de germinação.
Tratamentos: O experimento compara cinco tratamentos diferentes: * Água quente (imersão em água a 80°C por 30 minutos) * Água fria (imersão em água a 4°C por 24 horas) * Ácido (imersão em ácido sulfúrico por 15 minutos) * Escarificação (lixamento manual da testa da semente) * Controle (sem tratamento)
Unidade Experimental: Placas de Petri com papel germitest, contendo um número padronizado de sementes (geralmente 25 ou 50 sementes por placa).
Variável Resposta: Porcentagem de germinação, calculada como (número de sementes germinadas / número total de sementes) × 100.
Repetições: Múltiplas repetições (mínimo 3, recomendado 4-5) de cada tratamento para garantir precisão dos resultados.
Conclusão esperada: Os tratamentos com ácido e água quente apresentarão as maiores porcentagens de quebra de dormência em sementes de Pinus, enquanto o controle apresentará a menor taxa de germinação.
Este exemplo representa um experimento de campo mais complexo, típico da pesquisa florestal aplicada.
Figura 1.4: Esquema do experimento de adubação em Eucalipto em campo, mostrando o delineamento em blocos casualizados com cinco repetições.
Objetivo: Avaliar o efeito de diferentes doses de NPK no crescimento inicial de eucalipto e determinar a dose mais econômica e eficiente.
Tratamentos: O experimento compara quatro níveis de adubação NPK: * T1: 0 g/cova (Controle sem adubação) * T2: 100 g/cova de NPK (formulação 10-10-10) * T3: 200 g/cova de NPK (formulação 10-10-10) * T4: 300 g/cova de NPK (formulação 10-10-10)
Delineamento: Delineamento em Blocos Casualizados (DBC) com 5 repetições, totalizando 20 parcelas (4 tratamentos × 5 blocos).
Unidade Experimental: Parcelas de 36 plantas (arranjo 6×6), com uma área útil de 16 plantas (arranjo 4×4) no centro, e uma bordadura de uma linha ao redor para proteger a área útil.
Variáveis Resposta: Três características foram medidas aos 12 meses após o plantio: * Altura (m): Distância vertical do solo até o ápice da árvore, medida com régua ou clinômetro. * DAP (cm): Diâmetro à altura do peito (1,30 m), medido com suta ou fita métrica. * Sobrevivência (%): Porcentagem de plantas vivas ao final do período de avaliação.
Repetições: 5 blocos, cada um contendo os 4 tratamentos, garantindo controle de variações ambientais no campo.
Conclusão esperada: Espera-se que o crescimento em altura e DAP aumente com as doses de adubação até um ponto ótimo, após o qual pode haver redução nos ganhos (relação quadrática). A sobrevivência deve ser elevada em todos os tratamentos, mas potencialmente maior nos tratamentos com adubação.
Figura 1.5: Classificação dos experimentos florestais segundo seus objetivos e características.
Os experimentos podem ser classificados de acordo com seus objetivos e o rigor metodológico empregado:
Experimento Preliminar: Faz uma triagem inicial de muitos tratamentos com o objetivo de identificar os mais promissores. Geralmente apresenta menor rigor metodológico e é usado para reduzir o número de tratamentos a serem testados em experimentos posteriores.
Experimento Crítico: Compara menos tratamentos com alto rigor metodológico. Estes experimentos são mais precisos e permitem conclusões mais confiáveis sobre os efeitos dos tratamentos.
Experimento Demonstrativo: Visa demonstrar a eficácia de uma nova técnica para um público específico, como produtores ou técnicos. Geralmente é instalado em condições de campo e busca validar resultados obtidos em experimentos anteriores.
Figura 1.6: As três principais fontes de variação em experimentos florestais.
A variabilidade observada em um experimento pode ser decomposta em três componentes principais:
Variação Premeditada: Introduzida intencionalmente pelo pesquisador através dos tratamentos. Esta é a variação de interesse, pois representa os efeitos que estão sendo estudados. Quanto maior esta variação em relação ao erro experimental, mais fácil será detectar diferenças significativas entre os tratamentos.
Variação Externa: Causada por fatores externos não controláveis, como variações climáticas (temperatura, precipitação), pragas, doenças e outros eventos ambientais. Embora não possam ser completamente eliminadas, estas fontes de variação podem ser reduzidas através de técnicas de controle local, como o uso de blocos.
Variação Acidental (Erro Experimental): Variação que ocorre ao acaso entre unidades experimentais idênticas. Inclui pequenas diferenças no solo, na aplicação de tratamentos, em medições e outras fontes não identificáveis. O erro experimental é reduzido através de bom planejamento, técnica cuidadosa e aumento do número de repetições.
A precisão de um experimento é inversamente proporcional ao erro experimental. Quanto menor o erro experimental, maior a capacidade de detectar diferenças reais entre os tratamentos. Existem várias estratégias para minimizar o erro experimental em experimentos florestais.
Figura 1.7: Diferentes formas e tamanhos de parcelas recomendados para diferentes tipos de experimentos florestais.
A escolha da forma e tamanho da parcela é fundamental para o sucesso do experimento. Parcelas menores (300-600 m²) são recomendadas para plantios homogêneos de espécies únicas com espaçamento regular, pois permitem maior precisão e menor variabilidade. Parcelas maiores (≥1000 m²) são necessárias para florestas nativas ou sistemas heterogêneos, onde é importante capturar a diversidade e complexidade do ecossistema.
A forma da parcela também influencia a precisão. Parcelas quadradas ou com proporções próximas ao quadrado geralmente apresentam menor variabilidade que parcelas muito alongadas. No entanto, em terrenos de florestas naturais, parcelas retangulares alongadas no sentido da inclinação podem ser mais eficientes.
Figura 1.8: Comparação entre orientação de um plantio de eucalipto e floresta natural em terrenos com declividade.
Na montagem de um experimento, como avaliação da produção de eucaliptos em diferentes curvas de nível em terrenos com declividade, a orientação das parcelas é crítica. Para plantios comerciais homogêneos, o maior comprimento da parcela deve ser orientado no sentido da inclinação (paralelo às curvas de nível), não perpendicular a ela. Isto reduz a variação dentro da parcela, pois minimiza as diferenças em fatores como luz solar, umidade do solo e disponibilidade de nutrientes que variam com a declividade. Quando as parcelas são orientadas incorretamente (atravessando o gradiente de inclinação), cada parcela captura uma grande variação em condições ambientais, aumentando o erro experimental e reduzindo a capacidade de detectar diferenças entre os tratamentos.
No caso de florestas naturais, a estratégia de orientação é completamente diferente. As parcelas devem ter seu maior comprimento orientado perpendicularmente ao rio ou às curvas de nível para verificar a maior variação do terreno e melhorar os estudos da floresta nativa. Esta orientação permite capturar o máximo de heterogeneidade ambiental presente no ecossistema, incluindo variações em umidade do solo, tipo de solo, composição de espécies e disponibilidade de luz, que são fundamentais para compreender como as comunidades florestais respondem aos gradientes ambientais. A escolha correta da orientação das parcelas é uma decisão de planejamento que não pode ser corrigida após a instalação do experimento. Portanto, é essencial que o pesquisador identifique claramente o tipo de experimento (plantio comercial ou floresta natural), avalie a topografia do local antes de instalar as parcelas, determine a direção das curvas de nível e do gradiente de declividade, e oriente as parcelas adequadamente de acordo com o tipo de estudo. Esta atenção ao detalhe na fase de planejamento pode significar a diferença entre um experimento com alta precisão e um com erro experimental elevado e resultados inconclusivos.
Figura 1.9: Esquema do efeito de bordadura, mostrando a área útil e a área de proteção.
O efeito de bordadura refere-se à influência de fatores externos nas plantas localizadas nas bordas da parcela. Plantas nas bordas podem receber mais luz solar, sofrer mais com vento, estar sujeitas a competição reduzida ou estar expostas a outras condições diferentes das plantas no interior da parcela. Para controlar este efeito e garantir que os dados coletados representem verdadeiramente o efeito do tratamento, utiliza-se uma área de borda (bordadura) que protege a área útil da parcela.
A bordadura geralmente consiste em uma ou duas fileiras de plantas ao redor da parcela, que recebem o tratamento, mas cujos dados não são incluídos na análise. Apenas as plantas da área útil (interior da parcela) são medidas e analisadas. Esta prática elimina a influência de efeitos de borda, garantindo que as medições reflitam exclusivamente o efeito do tratamento aplicado, sem confundimento com fatores externos.
Em plantios em campo, como estudos de fertilizantes, deve ser feita bordadura tanto ao redor das repetições dos tratamentos quanto entre elas. A bordadura entre repetições reduz o erro experimental causado pela competição entre tratamentos adjacentes e pela variabilidade espacial do ambiente, aumentando significativamente a precisão e confiabilidade dos resultados experimentais.
Figura 1.10: Impacto das falhas de plantas no experimento e estratégias de controle.
Falhas de plantas (morte ou ausência de plantas) comprometem a uniformidade da parcela e aumentam o erro experimental. As causas comuns incluem seca, pragas, doenças e compactamento do solo. É essencial monitorar regularmente a parcela e registrar o número e localização das falhas.
Um máximo de 10% de falhas é geralmente tolerado em experimentos. Se o número de falhas exceder este limite, a parcela pode ser descartada da análise. Se o número de falhas for aceitável, podem ser aplicadas correções estatísticas ou as plantas podem ser replantadas (embora isto complique a análise posterior).
Figura 1.11: Efeito do número de repetições na precisão do experimento, mostrando intervalos de confiança.
O número de repetições é um dos fatores mais importantes para a precisão do experimento. Aumentar o número de repetições reduz o erro padrão das médias, estreita os intervalos de confiança e amplia a capacidade de detectar diferenças significativas entre os tratamentos.
As recomendações gerais são: * Mínimo: 3 repetições (apenas em casos muito específicos) * Recomendado: ≥4 repetições (para a maioria dos experimentos) * Ideal: 5-6 repetições (para maior precisão)
A escolha do número de repetições deve considerar fatores como disponibilidade de recursos, tamanho da área disponível e a magnitude das diferenças que se espera detectar.
O delineamento experimental é a forma como os tratamentos são distribuídos nas unidades experimentais. A escolha do delineamento apropriado é fundamental para a eficiência do experimento.
Figura 1.12: Comparação visual dos delineamentos DIC, DBC e DQL.
Delineamento Inteiramente Casualizado (DIC): Sorteio totalmente aleatório dos tratamentos entre as unidades experimentais. Este delineamento é usado em condições homogêneas, como em laboratórios ou câmaras de crescimento, onde há pouca variação ambiental.
Delineamento Casualizado em Blocos (DBC): Agrupamento das unidades experimentais em blocos homogêneos, com os tratamentos casualizados dentro de cada bloco. Este delineamento controla uma fonte de variação e é o mais usado em experimentos de campo.
Delineamento em Quadrado Latino (DQL): Controle de duas fontes de variação simultaneamente através de uma distribuição especial dos tratamentos em linhas e colunas. Requer que o número de tratamentos, linhas e colunas seja igual, limitando sua aplicação.
Um bom experimento deve apresentar as seguintes características: * Simplicidade de Execução: Procedimentos claros, bem documentados e fáceis de executar, reduzindo erros operacionais. * Ausência de Erros Sistemáticos: Evitar vieses que comprometam a validade dos resultados, como aplicação inconsistente de tratamentos. * Alta Precisão: Baixa variabilidade entre repetições, refletida em intervalos de confiança estreitos. * Exatidão: Resultados próximos do valor real, refletindo a verdadeira magnitude do efeito dos tratamentos. * Fornecer Amplos Resultados: Informações abrangentes e aplicáveis a situações práticas, com conclusões que extrapolam para o contexto real.
A inferência estatística é o ramo da estatística que permite tirar conclusões sobre uma população a partir de dados coletados de uma amostra representativa. Em áreas como a pesquisa agrícola e florestal, muitas vezes é impraticável coletar dados de todos os elementos da população, de modo que a amostragem se torna essencial para obter informações e realizar generalizações com determinado grau de confiança.
O processo de inferência estatística envolve o uso de estimativas calculadas a partir da amostra para inferir sobre parâmetros desconhecidos da população. Por exemplo, a média amostral é utilizada como estimativa da média populacional, e a variância amostral como estimativa da variância populacional. A confiabilidade dessas inferências é crucial, e a estatística oferece ferramentas para quantificá-la.
Figura 2.1: Relação entre população, amostragem, amostra e inferência estatística.
O teste de hipótese é uma ferramenta central da inferência estatística para tomada de decisão com base em evidências amostrais. Ele permite aceitar ou rejeitar uma afirmação sobre um parâmetro populacional dentro de um nível de confiança especificado. Por exemplo, em engenharia florestal, pode-se verificar se a infestação de lagartas em uma plantação de eucalipto ultrapassa um nível de controle economicamente importante.
Os testes de hipótese são classificados em paramétricos e não paramétricos:
Figura 2.5: Fluxograma para auxiliar na escolha entre testes paramétricos e não paramétricos.
A distribuição normal é uma das distribuições de probabilidade mais importantes em estatística. Suas principais propriedades incluem simetria, unimodalidade, formato em sino e coincidência entre média, mediana e moda. A curva normal padrão é um caso especial com média igual a zero e desvio-padrão igual a um.
A transformação para escore Z é dada pela fórmula Z = (X - μ) / σ, onde X é o valor observado, μ é a média populacional e σ é o desvio-padrão populacional. Os valores Z permitem comparar observações de diferentes distribuições normais e determinar probabilidades. A regra empírica da distribuição normal estabelece que aproximadamente 68% dos dados ficam dentro de um desvio-padrão da média, 95% dentro de dois desvios-padrão e 99% dentro de três desvios-padrão.
Figura 2.2: Curva da distribuição normal com as áreas correspondentes à regra empírica.
Em um teste de hipótese, formulam-se duas hipóteses mutuamente exclusivas:
A hipótese alternativa pode ser:
A escolha entre teste unilateral e bilateral depende da pergunta de pesquisa e da existência de uma direção específica esperada para a diferença ou efeito.
Ao realizar um teste de hipótese, dois tipos de erros podem ocorrer:
Existe uma relação inversa entre as probabilidades dos erros tipo I e tipo II. A decisão sobre qual erro é mais grave depende do contexto da pesquisa.
Figura 2.3: Representação visual do caminho de decisão em testes de hipótese, com regiões de aceitação e rejeição.
A realização de um teste de hipótese segue uma sequência de cinco passos:
Essa sequência sistematiza a tomada de decisão baseada em dados e reduz a subjetividade.
O teste Z é utilizado para comparar a média de uma amostra com uma média populacional conhecida, assumindo variância populacional conhecida e distribuição normal dos dados, ou tamanho amostral suficientemente grande para aplicação do Teorema Central do Limite. A estatística do teste é apresentada como:
\[Z_{calc} = \frac{\bar{X} - \mu_0}{\sigma/\sqrt{n}}\]
As hipóteses possíveis para o teste bilateral e unilateral são definidas, e a regra de decisão é baseada na comparação entre o valor calculado e o valor crítico tabelado.
Uma máquina cuja produção tem média conhecida de 72 kg/mm² e desvio-padrão populacional de 2,0 kg/mm². Após ajuste na máquina, foram obtidas 10 observações: 74,2; 75,3; 72,4; 73,7; 77,6; 72,4; 73,7; 72,2; 73,3; 74,2. Verificar, ao nível de 5% de significância, se houve diferença na média da resistência à tração da madeira.
Resolução:
Nesse caso, utiliza-se a variância amostral como estimativa da variância populacional, assumindo-se distribuição normal dos dados. A estatística é dada por:
\[t_{calc} = \frac{\bar{X} - \mu_0}{s/\sqrt{n}}\]
Onde s representa o desvio-padrão amostral. A distribuição t de Student depende dos graus de liberdade gl = n - 1 e se aproxima da normal padrão à medida que os graus de liberdade aumentam. É importante o uso correto da tabela t, distinguindo os casos bilaterais e unilaterais.
Antes de comparar médias com teste t, é necessário verificar se as variâncias das duas populações ou amostras podem ser consideradas homogêneas ou heterogêneas. As hipóteses são:
A estatística do teste é calculada pela razão entre a maior e a menor variância amostral. A distribuição F de Snedecor possui dois graus de liberdade. A regra de decisão é: se Fcalc > Ftab, rejeita-se H0 e conclui-se que as variâncias são diferentes; caso contrário, não se rejeita H0.
Este teste é aplicado quando se deseja comparar as médias de duas amostras independentes e o teste F indicou homogeneidade das variâncias populacionais. As hipóteses são:
A fórmula da variância comum ponderada é utilizada, e a estatística tcalc é baseada nessa variância. Os graus de liberdade são dados por gl = n1 + n2 − 2. A regra de decisão é descrita a partir da comparação entre |tcalc| e ttab.
Figura 2.6: Comparação de medições de DAP com suta e fita diamétrica.
Um grupo de árvores teve seu DAP medido com dois instrumentos distintos, uma suta e uma fita diamétrica. Verificar, ao nível de 5% de probabilidade, se os diâmetros médios medidos pela suta são superiores aos medidos com a fita.
Dados:
## Suta (A):
## Média (X¯): 23.93 cm
## Variância (s²): 8.28 cm²
## n: 6
## Fita (B):
## Média (X¯): 23.37 cm
## Variância (s²): 5.71 cm²
## n: 6
Resolução:
Passo 1: Calcular Média e Variância das Amostras
Passo 2: Teste F para Comparação de Variâncias
Passo 3: Teste t para Duas Amostras Independentes com Variâncias Homogêneas
Este teste é aplicado quando se deseja comparar as médias de duas amostras independentes e o Teste F indicou que as variâncias populacionais são heterogêneas.
Passo 1: Definição das Hipóteses
Passo 2: Definir o Nível de Significância (α)
Passo 3: Estatística do Teste (tcalc)
\[t_{calc} = \frac{\bar{X}_1 - \bar{X}_2}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}}\]
Onde X̄1 e X̄2 são as médias amostrais, s1² e s2² são as variâncias amostrais, n1 e n2 são os tamanhos das amostras.
Os graus de liberdade para este teste são calculados utilizando a correção de Satterthwaite:
\[n^* = \frac{(\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2})^2}{\frac{(s_1^2/n_1)^2}{n_1-1} + \frac{(s_2^2/n_2)^2}{n_2-1}}\]
O valor de n* deve ser arredondado para o número inteiro mais próximo.
Passo 4: Definir o Valor de t Tabelado (ttab)
O valor de ttab é obtido em tabelas da distribuição t de Student, considerando o nível de significância (α) e os graus de liberdade (n*).
Passo 5: Regra de Decisão e Conclusão
Figura 2.7: Comparação de alturas de árvores em floresta tropical.
Alturas de árvores de dois grupos de uma mesma floresta tropical foram mensuradas com auxílio de um hipsômetro VERTEX. Verificar ao nível de 5% de probabilidade se existe diferença entre as alturas dos dois grupos analisados.
Dados:
Grupo | Média (X¯) | Variância (s²) | n |
|---|---|---|---|
A | 32.8 | 18.3 | 500 |
B | 31.0 | 30.3 | 500 |
Resolução:
Informações: α = 0,05
Passo 1: Teste F para Comparação de Variâncias
Passo 2: Teste t para Duas Amostras Independentes com Variâncias Heterogêneas
O teste t para amostras dependentes (ou pareadas) é utilizado quando as duas amostras não são independentes, ou seja, as observações em uma amostra estão relacionadas de alguma forma com as observações na outra amostra. Isso ocorre frequentemente em estudos onde a mesma unidade experimental é medida antes e depois de um tratamento, ou quando pares de unidades são combinados com base em alguma característica comum.
Nesse tipo de teste, a análise foca nas diferenças entre os pares de observações, transformando o problema de duas amostras em um problema de uma amostra (das diferenças).
Passo 1: Definição das Hipóteses
Passo 2: Definir o Nível de Significância (α)
Passo 3: Estatística do Teste (tcalc)
\[t_{calc} = \frac{\bar{d}}{s_d/\sqrt{n}}\]
Onde d̄ é a média das diferenças, sd é o desvio padrão das diferenças, e n é o número de pares de observações.
Os graus de liberdade para este teste são gl = n - 1.
Passo 4: Definir o Valor de t Tabelado (ttab)
O valor de ttab é obtido em tabelas da distribuição t de Student, considerando o nível de significância (α) e os graus de liberdade.
Passo 5: Regra de Decisão e Conclusão
Em um processo de dinâmica natural, foram medidos os diâmetros de seis fustes em um ano (n) e no ano subsequente (n+1), a fim de verificar se houve aumento do DAP no período de 1 ano. Utilize α = 1%.
Dados:
Fuste | Ano 1 (cm) | Ano 2 (cm) | Diferença (d_i = Ano 2 - Ano 1) |
|---|---|---|---|
1 | 19.10 | 20.75 | 1.65 |
2 | 17.55 | 19.05 | 1.50 |
3 | 15.20 | 17.40 | 2.20 |
4 | 24.75 | 26.68 | 1.93 |
5 | 17.53 | 18.48 | 0.95 |
6 | 17.15 | 18.00 | 0.85 |
Resolução:
O Teste Qui-Quadrado (χ²) é um teste não paramétrico amplamente utilizado para analisar dados categóricos. Suas principais aplicações incluem:
As características da distribuição Qui-Quadrado são:
Figura 2.4: Rede complexa de espécies de árvores e doenças, ilustrando a associação em um teste Qui-Quadrado.
Este teste é utilizado para verificar se existe associação entre duas variáveis categóricas. Por exemplo, em análises florestais, pode-se verificar a associação entre a ocorrência de doenças e tipos de solo, ou entre espécies e classes de diâmetro.
Passo 1: Definição das Hipóteses
Passo 2: Definir o Nível de Significância (α)
Passo 3: Calcular a Estatística do Teste (χ²calc)
A estatística Qui-Quadrado é calculada comparando as frequências observadas (Fo) com as frequências esperadas (Fe) para cada categoria:
\[\chi^2_{calc} = \sum \frac{(F_o - F_e)^2}{F_e}\]
As frequências esperadas (Fe) são calculadas sob a suposição de que a hipótese nula é verdadeira (ou seja, não há associação entre as variáveis):
\[F_e = \frac{\text{Total da Linha} \times \text{Total da Coluna}}{\text{Total Geral}}\]
Os graus de liberdade para o Teste Qui-Quadrado de independência são calculados como:
\[gl = (r-1)(c-1)\]
Onde: r é o número de linhas da tabela de contingência, e c é o número de colunas da tabela de contingência.
O valor de χ²tab é obtido em tabelas da distribuição Qui-Quadrado, considerando o nível de significância (α) e os graus de liberdade.
Passo 5: Regra de Decisão e Conclusão
Um engenheiro florestal deseja saber se existe associação entre três espécies de árvores (A, B e C) e a ocorrência de uma doença. Para isso, ele coletou dados de 150 árvores, observando se a árvore estava doente ou sadia, utilizando um nível α = 5%.
Dados Observados (Fo):
Espécie | Doente | Sadia | Total |
|---|---|---|---|
A | 15 | 35 | 50 |
B | 25 | 25 | 50 |
C | 10 | 40 | 50 |
Total | 50 | 100 | 150 |
Resolução:
Passo 1: Definição das Hipóteses
Passo 2: Calcular as Frequências Esperadas (Fe)
Passo 3: Calcular a Estatística do Teste (χ²calc)
Categoria | Fo | Fe | Fo - Fe | (Fo - Fe)^2 | (Fo - Fe)^2 / Fe |
|---|---|---|---|---|---|
A, Doente | 15 | 16.67 | -1.67 | 2.79 | 0.17 |
A, Sadia | 35 | 33.33 | 1.67 | 2.79 | 0.08 |
B, Doente | 25 | 16.67 | 8.33 | 69.39 | 4.16 |
B, Sadia | 25 | 33.33 | -8.33 | 69.39 | 2.08 |
C, Doente | 10 | 16.67 | -6.67 | 44.49 | 2.67 |
C, Sadia | 40 | 33.33 | 6.67 | 44.49 | 1.33 |
Total | 150 | 150.00 | 0.00 | 233.33 | 10.50 |
##
##
## χ²calc = 10.50
Passo 4: Definir o Valor de χ² Tabelado (χ²tab)
Passo 5: Regra de Decisão e Conclusão
Passo 6: Conclusão
Ao nível de 5% de significância, há evidências estatísticas para afirmar que existe uma associação significativa entre a espécie da árvore e a ocorrência da doença.
A escolha do teste estatístico apropriado é um passo crucial na análise de dados. A Figura 2.5 ilustra um fluxograma simplificado que auxilia na decisão entre os diferentes tipos de testes de hipótese abordados neste capítulo.
Figura 2.5: Fluxograma de decisão para a escolha do teste estatístico apropriado.
A experimentação é um ramo essencial da pesquisa científica, especialmente nas ciências agrárias e florestais. Ela se dedica ao estudo sistemático de experimentos, abrangendo desde o seu planejamento e execução até a análise dos dados e a interpretação dos resultados obtidos. O objetivo principal é fornecer uma base sólida para a tomada de decisões com base em evidências quantitativas.
“A experimentação tem por objetivo o estudo dos experimentos, isto é, seu planejamento, execução, análise dos dados obtidos e interpretação dos resultados.”
Para ilustrar o fluxo de um trabalho experimental, considere a Figura 3.1, que esquematiza as etapas fundamentais de um projeto de pesquisa.
Figura 3.1: O processo de experimentação científica, desde o planejamento até a interpretação dos resultados.
Para compreender a lógica da experimentação, é necessário dominar alguns conceitos básicos que estruturam qualquer ensaio científico. A Figura 3.2 apresenta uma visão integrada desses conceitos.
Figura 3.2: Integração dos conceitos fundamentais: Fator, Nível, Unidade Experimental e Variável Resposta.
Um experimento é um trabalho previamente planejado, que segue princípios estatísticos rigorosos. Nele, busca-se realizar a comparação dos efeitos de diferentes tratamentos sobre uma determinada unidade de estudo.
O tratamento (ou fator) é o método, elemento ou material cujo efeito desejamos medir ou comparar. Exemplos: Diferentes variedades de clones de eucalipto ou diferentes níveis de adubação nitrogenada.
Os níveis são as diferentes manifestações ou doses de um determinado fator. Por exemplo, se o fator é “Adubação”, os níveis podem ser 0, 50, 100 e 150 kg/ha de N.
É a menor unidade que recebe um tratamento e fornece os dados para análise. Pode ser um vaso, uma área de solo, um tubete ou até mesmo uma única planta, dependendo do objetivo do estudo.
Refere-se à maneira como os tratamentos são designados às unidades experimentais. Os principais tipos são: DIC (Delineamento Inteiramente Casualizado), DBC (Delineamento Casualizado em Blocos) e DQL (Delineamento em Quadrado Latino).
Quando avaliamos dois ou mais fatores simultaneamente, a forma como combinamos seus níveis define o esquema. Exemplos comuns incluem o Esquema Fatorial e o Esquema em Parcelas Subdivididas.
É a característica mensurada para avaliar o efeito dos tratamentos. Importante ressaltar que, para fins de análise estatística convencional, essa variável deve ser quantitativa (ex: altura, diâmetro, biomassa).
Representa o efeito de fatores que atuam de forma aleatória e que não podem ser controlados pelo pesquisador. É a variação natural entre unidades experimentais que receberam o mesmo tratamento.
Para que as conclusões de um experimento sejam estatisticamente válidas, três princípios fundamentais devem ser rigorosamente seguidos.
Princípio | Descrição | Objetivo Principal |
|---|---|---|
Repetição | Aplicação do mesmo tratamento em várias parcelas | Estimar o erro experimental e aumentar a precisão |
Casualização | Distribuição dos tratamentos por sorteio | Garantir a independência dos erros e validade dos testes |
Controle Local | Divisão da área em blocos homogêneos | Reduzir o erro experimental em áreas heterogêneas |
A repetição consiste no uso de várias unidades experimentais para um mesmo tratamento. Ela é fundamental para permitir a estimativa do erro experimental. Como regra prática, recomenda-se que um experimento tenha pelo menos 20 parcelas no total e 12 graus de liberdade para o resíduo (erro).
Figura 3.3: O princípio da repetição ilustrado pela multiplicidade de unidades experimentais idênticas para um mesmo tratamento.
A casualização (ou sorteio) garante que todas as unidades experimentais tenham a mesma probabilidade de receber qualquer um dos tratamentos. Isso evita que tendências subjetivas do pesquisador ou variações sistemáticas do ambiente favoreçam um tratamento em detrimento de outro.
Figura 3.4: O princípio da casualização garantindo a distribuição aleatória dos tratamentos nas unidades experimentais.
O controle local é utilizado quando a área experimental não é uniforme. Ao agrupar parcelas semelhantes em blocos, conseguimos isolar a variação devida ao ambiente, impedindo que ela “infle” o erro experimental.
Figura 3.5: Representação de um campo experimental com aplicação do controle local via blocos.
Em qualquer experimento, a variação total observada nos dados pode ser decomposta em três fontes principais:
O Delineamento Inteiramente Casualizado (DIC) representa o pilar fundamental da experimentação estatística. Sua característica distintiva é a exigência de homogeneidade total do ambiente para todas as unidades experimentais envolvidas no estudo. Este delineamento é frequentemente empregado em condições laboratoriais, casas de vegetação ou viveiros, onde as variáveis ambientais (como luminosidade, temperatura e umidade) podem ser rigorosamente controladas pelo pesquisador.
“Este é o delineamento básico; os demais se originam dele pela imposição de restrições (controle local). Envolve dois princípios básicos da experimentação: a repetição e a casualização.”
Diferentemente de delineamentos mais complexos, no DIC a distribuição dos tratamentos às unidades experimentais é realizada de forma completamente ao acaso. Isso significa que não há restrições na casualização, permitindo que cada parcela tenha a mesma probabilidade de receber qualquer um dos tratamentos em teste. Para ilustrar este conceito, considere a Figura 4.1, que esquematiza a casualização de um experimento com três adubos fosfatados em mudas de eucalipto.
Figura 4.1: Processo de casualização plena em um ambiente homogêneo de casa de vegetação.
Para compreender a aplicação prática do Delineamento Inteiramente Casualizado (DIC), considera-se um experimento cujo objetivo é avaliar três adubos fosfatados diferentes na produção de um híbrido de Eucalyptus grandis × Eucalyptus urophylla. O pesquisador busca determinar qual dos adubos (Superfosfato simples, Superfosfato triplo ou Fosfato Natural) promove o melhor desenvolvimento do híbrido.
Neste experimento, cada adubo representa um tratamento distinto. Para garantir a confiabilidade dos resultados, foram definidas 4 repetições por tratamento, totalizando 12 unidades experimentais (plantas ou vasos). As repetições são cruciais para estimar o erro experimental e aumentar a precisão das estimativas dos efeitos dos tratamentos.
O princípio da casualização é aplicado de forma integral no DIC. Isso significa que a alocação de cada um dos três adubos às 12 unidades experimentais é feita de maneira completamente aleatória, sem qualquer restrição espacial. Por exemplo, se as unidades experimentais são vasos dispostos em uma bancada, qualquer vaso pode receber qualquer um dos tratamentos, independentemente de sua posição. A Figura 4.3 ilustra um possível arranjo casualizado para este experimento.
O controle local é um aspecto fundamental no DIC. Ele pressupõe que o ambiente onde o experimento é conduzido é intrinsecamente homogêneo. Em um ambiente de casa de vegetação, por exemplo, espera-se que fatores como luz, temperatura, umidade e substrato sejam uniformes para todas as unidades experimentais. Se houver qualquer gradiente ambiental não controlado, a variação resultante será incorporada ao erro experimental, podendo mascarar os verdadeiros efeitos dos tratamentos.
Elemento | Descrição |
|---|---|
Objetivo | Avaliar o melhor adubo fosfatado para o híbrido de eucalipto. |
Tratamentos | 1. Superfosfato simples 2. Superfosfato triplo 3. Fosfato Natural |
Repetições | 4 repetições por tratamento |
Casualização | Alocação completamente aleatória dos tratamentos às unidades experimentais. |
Controle Local | Ambiente homogêneo (ex: casa de vegetação). |
Este exemplo demonstra como a simplicidade do DIC, aliada à casualização e à exigência de homogeneidade, permite isolar e avaliar o efeito dos tratamentos de forma eficiente em condições controladas.
Figura 4.2: Processo de casualização de adubos em Eucalipto.
Cada delineamento possui um modelo matemático que descreve como diferentes fontes de variação contribuem para o valor observado na variável resposta. Para o DIC, o modelo é:
\[Y_{ij} = \mu + \tau_i + \epsilon_{ij}\]
Em que:
Importante: O erro experimental reflete a variação observada entre as repetições do mesmo tratamento. Como não é possível controlar 100% das condições, esse erro é inerente a qualquer processo biológico.
No Delineamento Inteiramente Casualizado (DIC), a organização dos dados coletados é um passo fundamental antes de qualquer análise estatística. O Quadro de Tabulação de Dados serve como uma estrutura padronizada para registrar as observações, facilitando a visualização e os cálculos subsequentes. Esse quadro organiza os dados em função dos tratamentos e de suas respectivas repetições.
Considere um experimento instalado no DIC com \(I\) tratamentos e \(J\) repetições por tratamento. O quadro de tabulação de dados pode ser resumido da seguinte forma:
Repetições | 1 | 2 | 3 | ... | I |
|---|---|---|---|---|---|
1 | Y11 | Y21 | Y31 | ... | YI1 |
2 | Y12 | Y22 | Y32 | ... | YI2 |
3 | Y13 | Y23 | Y33 | ... | YI3 |
... | ... | ... | ... | ... | ... |
J | Y1J | Y2J | Y3J | ... | YIJ |
Totais | T1 | T2 | T3 | ... | TI |
Neste quadro:
Do quadro de tabulação, podemos extrair informações cruciais para a análise:
Para a realização da Análise de Variância (ANOVA), é necessário calcular algumas somas e médias a partir dos dados tabulados.
Total Geral (\(G\)): É a soma de todas as observações do experimento. Pode ser calculado somando-se todos os \(Y_{ij}\) ou somando-se os totais de cada tratamento (\(T_i\)).
\[G = \sum_{i=1}^{I} \sum_{j=1}^{J} Y_{ij} = \sum_{i=1}^{I} T_i\]
Total para o tratamento \(i\) (\(T_i\)): É a soma das observações para um tratamento específico \(i\).
\[T_i = \sum_{j=1}^{J} Y_{ij}\]
Média para o tratamento \(i\) (\(\bar{m}_i\)): É a média das observações para um tratamento específico \(i\). Se o número de repetições for igual para todos os tratamentos (\(J\)), utiliza-se \(J\). Se for diferente (\(r_i\)), utiliza-se \(r_i\).
\[\bar{m}_i = \frac{T_i}{J} \text{ ou } \bar{m}_i = \frac{T_i}{r_i}\]
Média geral do experimento (\(\bar{m}\)): É a média de todas as observações do experimento. Pode ser calculada dividindo o Total Geral (\(G\)) pelo número total de unidades experimentais (\(N\)).
\[\bar{m} = \frac{G}{N}\]
Essas somas e médias são os blocos construtivos para o cálculo das Somas de Quadrados na ANOVA, que permitem decompor a variabilidade total dos dados e testar a significância dos efeitos dos tratamentos.
A Análise de Variância (ANOVA), introduzida por Ronald Fisher, é uma técnica estatística robusta e amplamente utilizada para comparar as médias de três ou mais grupos simultaneamente. Essencialmente, a ANOVA opera sob o princípio da decomposição da variação total observada em um conjunto de dados. Isso significa que a variabilidade global entre todas as observações é particionada em componentes atribuíveis a diferentes fontes: a variação explicada pelas diferenças entre os efeitos dos tratamentos aplicados e a variação não explicada, conhecida como erro experimental ou resíduo, que representa a variabilidade aleatória ou não controlada no experimento. Ao comparar a magnitude da variação entre tratamentos com a variação residual, a ANOVA permite inferir se as diferenças observadas entre as médias dos grupos são estatisticamente significativas ou meramente devidas ao acaso, desde que certas pressuposições estatísticas sejam satisfeitas para a validade da análise.
Quando as pressuposições fundamentais para a aplicação da ANOVA não são atendidas pelos dados, o pesquisador dispõe de algumas alternativas para prosseguir com a análise. Uma abordagem comum é a transformação de dados, que envolve a aplicação de funções matemáticas (como logaritmo ou raiz quadrada) com o objetivo de adequá-los às exigências de normalidade e homocedasticidade. No entanto, se as transformações não se mostrarem eficazes ou se não forem apropriadas para a natureza dos dados, a alternativa mais indicada é recorrer a testes não paramétricos. Estes testes não vantajosos por não dependerem de pressuposições rigorosas sobre a distribuição dos dados, oferecendo uma metodologia válida para a comparação de grupos em cenários onde a ANOVA pareceria inadequada. A escolha da abordagem correta é crucial para garantir a validade estatística das conclusões e a robustez da análise experimental.
Para que a técnica de Análise de Variância (ANOVA) seja aplicada de forma legítima, os dados devem satisfazer quatro pressuposições fundamentais:
NORMALIDADE E HOMOGENEIDADE NA ANOVA Uma das principais condições para a aplicação da Análise de Variância (ANOVA) é que os resíduos sejam normalmente distribuídos e que as variâncias sejam homogêneas entre os tratamentos. Contudo, na prática experimental, pequenas violações da normalidade não invalidam a ANOVA, desde que as variâncias sejam homogêneas e o número de repetições seja equilibrado.
O Teste de Levene é amplamente utilizado para verificar se as variâncias entre os tratamentos são estatisticamente iguais.
A hipótese nula (\(H_0\)) assume que as variâncias são homogêneas, enquanto a hipótese alternativa (\(H_a\)) sugere que pelo menos uma variância é diferente.
O teste é baseado na análise de variância dos desvios absolutos das observações em relação à mediana de cada grupo.
Fórmula da Estatística de Levene (\(F_Z\)):
\[F_Z = \frac{(N-I) \sum_{i=1}^{I} N_i (\bar{Z}_i - \bar{Z})^2}{(I-1) \sum_{i=1}^{I} \sum_{j=1}^{N_i} (Z_{ij} - \bar{Z}_i)^2}\]
Onde:
Passo a Passo para o Teste de Levene:
A estatística \(F_Z\) resultante dessa ANOVA é a estatística \(F_Z\) de Levene. Compare o \(F_Z\) com o \(F_{tab}\) (com \(I-1\) e \(N-I\) graus de liberdade).
Regra de Decisão:
O Teste de Shapiro-Wilk é um dos testes mais poderosos para verificar a normalidade de uma distribuição. Ele compara a distribuição observada dos dados com uma distribuição normal teórica.
Fórmula da Estatística de Shapiro-Wilk (\(W\)):
\[W = \frac{b^2}{S^2}\]
Onde:
\(S^2 = \sum_{i=1}^{N} (x_i - \bar{x})^2\)
\(b = \sum_{i=1}^{k} a_i (x_{N-i+1} - x_i)\), onde \(k = N/2\) se \(N\) é par, ou \(k = (N-1)/2\) se \(N\) é ímpar.
\(x_i\): são as observações ordenadas (do menor para o maior).
\(a_i\): são os coeficientes de Shapiro-Wilk, que dependem do tamanho da amostra \(N\) e são obtidos de tabelas específicas.
\(\bar{x}\): é a média da amostra.
Passo a Passo para o Teste de Shapiro-Wilk:
Regra de Decisão:
Observação importante: Se os dados não seguirem uma distribuição normal, pode-se tentar transformações matemáticas (como logarítmica ou raiz quadrada) para aproximá-los da normalidade, ou utilizar testes não paramétricos.
A ANOVA consiste na decomposição da Soma de Quadrados Total (\(SQ_{Total}\)) em duas partes: a variação devida aos tratamentos (\(SQ_{Trat}\)) e a variação devida ao acaso (\(SQ_{Res}\)).
\[SQ_{Total} = SQ_{Trat} + SQ_{Res}\]
Fonte de Variação (FV) | Graus de Liberdade (GL) | Soma de Quadrados (SQ) | Quadrado Médio (QM) | Fcalc |
|---|---|---|---|---|
Tratamento | I - 1 | SQTrat | QMTrat = SQTrat / GLTrat | QMTrat / QMRes |
Resíduo | I(J - 1) | SQRes | QMRes = SQRes / GLRes | - |
Total | IJ - 1 | SQTotal | - | - |
Onde \(I\) é o número de tratamentos e \(J\) o número de repetições por tratamento.
Fator de Correção (\(C\)):
\[C = \frac{(\sum_{i=1}^{I} \sum_{j=1}^{J} Y_{ij})^2}{N}\]
Onde \(N\) é o número total de observações, sendo \(N = I \times J\) para dados balanceados e \(N = \sum_{i=1}^{I} r_i\) para dados desbalanceados.
Soma de Quadrados Total (\(SQ_{Total}\)):
\[SQ_{Total} = \sum_{i=1}^{I} \sum_{j=1}^{J} Y_{ij}^2 - C\]
Soma de Quadrados de Tratamentos (\(SQ_{Trat}\)):
Para dados balanceados:
\[SQ_{Trat} = \sum_{i=1}^{I} \frac{T_i^2}{J} - C\]
Para dados desbalanceados:
\[SQ_{Trat} = \sum_{i=1}^{I} \frac{T_i^2}{r_i} - C\]
Onde \(T_i\) é o total do tratamento \(i\).
Soma de Quadrados do Resíduo (\(SQ_{Res}\)):
\[SQ_{Res} = SQ_{Total} - SQ_{Trat}\]
Regra de Decisão:
Um engenheiro florestal conduziu um experimento para comparar a produtividade (em kg) de quatro variedades de pequi (A, B, C, D), utilizando um Delineamento Inteiramente Casualizado (DIC) com 5 repetições para cada variedade. O objetivo é verificar se existe diferença significativa na produtividade entre as variedades ao nível de 5% de significância. Além disso, é necessário realizar os testes de homogeneidade de variância (Levene) e normalidade (Shapiro-Wilk).
Dados:
Variedade A | Variedade B | Variedade C | Variedade D |
|---|---|---|---|
19 | 32 | 22 | 33 |
18 | 29 | 26 | 29 |
17 | 23 | 28 | 34 |
21 | 27 | 25 | 28 |
21 | 25 | 29 | 27 |
##
##
## TA: 96, TB: 136, TC: 130, TD: 151
## Total Geral (G): 513
## Número total de observações (N): 4 variedades × 5 repetições = 20
Para aplicar o Teste de Levene ao Estudo de Caso 1, seguiríamos os seguintes passos:
Enunciar a Hipótese:
Calcular a mediana de cada variedade:
Variedade | Mediana |
|---|---|
Variedade A | 19 |
Variedade B | 27 |
Variedade C | 26 |
Variedade D | 29 |
Calcular os desvios absolutos (\(Z_{ij}\)): Para cada observação de produtividade, subtrairíamos a mediana do seu respectivo grupo e tomaríamos o valor absoluto. Isso geraria um novo conjunto de dados (\(Z_{ij}\)). Por exemplo, para a Variedade A, se a mediana fosse 19, os novos dados seriam \(|19-19|\), \(|18-19|\), etc.
Variedade | Z_ij (desvios absolutos) |
|---|---|
A | 0, 1, 2, 2, 2 |
B | 5, 2, 4, 0, 2 |
C | 4, 0, 2, 1, 3 |
D | 4, 0, 5, 1, 2 |
Realizar o cálculo do \(F_Z\) de Levene a partir da seguinte fórmula:
\[F_Z = \frac{(N-I) \sum_{i=1}^{I} N_i (\bar{Z}_i - \bar{Z})^2}{(I-1) \sum_{i=1}^{I} \sum_{j=1}^{N_i} (Z_{ij} - \bar{Z}_i)^2}\]
Dados:
Médias dos desvios absolutos (\(\bar{Z}_i\)):
Numerador:
\[ \sum_{i=1}^{I} N_i (\bar{Z}_i - \bar{Z})^2 = 4,20\]
Denominador:
\[ \sum_{i=1}^{I} \sum_{j=1}^{N_i} (Z_{ij} - \bar{Z}_i)^2 = 45,60\]
Cálculo:
\[F_Z = (16/3) \times (4,20/45,60) \approx 0,49\]
Resultado final:
\(F_Z \approx 0,49\)
Comparar \(F_Z\) com \(F_{tab}\): Com \(GL_{Trat} = 3\) e \(GL_{Res} = 16\), consultaríamos a tabela F para obter \(F_{tab}\) e concluir.
\(0,49 < 3,24\) (para \(\alpha = 0,05\)). Não rejeitamos \(H_0\). Logo, não há evidências estatísticas para rejeitar a hipótese nula de igualdade das variâncias ao nível de 5% de probabilidade. Portanto, as variâncias das produtividades das variedades podem ser consideradas homogêneas.
Para aplicar o Teste de Shapiro-Wilk aos resíduos do Estudo de Caso 1, seguiríamos:
Enunciar a Hipótese:
Obter os resíduos: Primeiro, seria necessário calcular os resíduos do modelo da ANOVA \(e_{ij} = Y_{ij} - \hat{Y}_{ij}\), onde \(\hat{Y}_{ij}\) é o valor predito.
Repetição | Variedade A | Variedade B | Variedade C | Variedade D |
|---|---|---|---|---|
1 | -0.2 | 4.8 | -4 | 2.8 |
2 | -1.2 | 1.8 | 0 | -1.2 |
3 | -2.2 | -4.2 | 2 | 3.8 |
4 | 1.8 | -0.2 | -1 | -2.2 |
5 | 1.8 | -2.2 | 3 | -3.2 |
Ordenar os resíduos: Organizar os \(N=20\) resíduos em ordem crescente: \(x_{(1)} \le x_{(2)} \le ... \le x_{(20)}\).
i | xi |
|---|---|
1 | -4.2 |
2 | -4.0 |
3 | -3.2 |
4 | -2.2 |
5 | -2.2 |
6 | -2.2 |
7 | -1.2 |
8 | -1.2 |
9 | -1.0 |
10 | -0.2 |
11 | -0.2 |
12 | 0.0 |
13 | 1.8 |
14 | 1.8 |
15 | 1.8 |
16 | 2.0 |
17 | 2.8 |
18 | 3.0 |
19 | 3.8 |
20 | 4.8 |
Calcular a média dos resíduos: \(\bar{x}\). Se os resíduos forem calculados corretamente essa média será zero ou um valor próximo a zero.
Calcular o denominador \(S^2 = \sum_{i=1}^{N} (x_i - \bar{x})^2\).
Residuo | (xi - x_bar)^2 |
|---|---|
-0.2 | 0.04 |
-1.2 | 1.44 |
-2.2 | 4.84 |
1.8 | 3.24 |
1.8 | 3.24 |
4.8 | 23.04 |
1.8 | 3.24 |
-4.2 | 17.64 |
-0.2 | 0.04 |
-2.2 | 4.84 |
-4.0 | 16.00 |
0.0 | 0.00 |
2.0 | 4.00 |
-1.0 | 1.00 |
3.0 | 9.00 |
2.8 | 7.84 |
-1.2 | 1.44 |
3.8 | 14.44 |
-2.2 | 4.84 |
-3.2 | 10.24 |
##
##
## S² = 130.40Obter os coeficientes \(a_i\): Para \(N=20\), os coeficientes \(a_i\) são obtidos de tabelas. A apresentação fornece os valores para \(a_1\) até \(a_{10}\).
i | a_i | x_i | x_N-i+1 | a_i(x_N-i+1 - x_i) |
|---|---|---|---|---|
1 | 0.4734 | -4.2 | 4.8 | 4.2606 |
2 | 0.3211 | -4.0 | 3.8 | 2.5046 |
3 | 0.2565 | -3.2 | 3.0 | 1.9503 |
4 | 0.2085 | -2.2 | 2.8 | 1.0425 |
5 | 0.1686 | -2.2 | 2.0 | 0.7081 |
6 | 0.1334 | -2.2 | 1.8 | 0.8336 |
7 | 0.1013 | -1.2 | 1.8 | 0.3039 |
8 | 0.0711 | -1.2 | 1.8 | 0.2133 |
9 | 0.0422 | -1.0 | 0.0 | 0.0000 |
10 | 0.0140 | -0.2 | -0.2 | -0.0028 |
##
##
## b = 11.1991Calcular o numerador \(b = \sum_{i=1}^{k} a_i (x_{N-i+1} - x_i)\).
\(b = 11,1991\)
Calcular a estatística \(W\): \(W = b^2 / S^2\).
\(W_{calc} = 0,96\)
Comparar \(W_{calc}\) com \(W_{tab}\): Para \(\alpha = 0,05\) e \(N = 20\), \(W_{tab} = 0,905\).
Conclusão: Como \(W_{calc}(0,96) \ge W_{tab}(0,905)\), não se rejeita \(H_0\) ao nível de 5% de probabilidade. Isso indica que a amostra provém de uma distribuição normal.
Cálculo do Fator de Correção (\(C\)):
\[C = \frac{(513)^2}{20} = \frac{263169}{20} = 13158,45\]
Cálculo da Soma de Quadrados Total (\(SQ_{Total}\)):
\[SQ_{Total} = \sum Y_{ij}^2 - C\]
\(\sum Y_{ij}^2 = 19^2 + 18^2 + 17^2 + 21^2 + 21^2 + 32^2 + 29^2 + 23^2 + 27^2 + 25^2 + 22^2 + 26^2 + 28^2 + 25^2 + 29^2 + 33^2 + 29^2 + 34^2 + 28^2 + 27^2\)
\(\sum Y_{ij}^2 = 361 + 324 + 289 + 441 + 441 + 1024 + 841 + 529 + 729 + 625 + 484 + 676 + 784 + 625 + 841 + 1089 + 841 + 1156 + 784 + 729 = 13613\)
\(SQ_{Total} = 13613 - 13158,45 = 454,55\)
Cálculo da Soma de Quadrados de Tratamentos (\(SQ_{Trat}\)):
\[SQ_{Trat} = \sum \frac{T_i^2}{J} - C\]
\(SQ_{Trat} = \frac{96^2}{5} + \frac{136^2}{5} + \frac{130^2}{5} + \frac{151^2}{5} - 13158,45\)
\(SQ_{Trat} = \frac{9216}{5} + \frac{18496}{5} + \frac{16900}{5} + \frac{22801}{5} - 13158,45\)
\(SQ_{Trat} = 1843,2 + 3699,2 + 3380 + 4560,2 - 13158,45 = 13482,6 - 13158,45 = 324,15\)
Cálculo da Soma de Quadrados do Resíduo (\(SQ_{Res}\)):
\(SQ_{Res} = SQ_{Total} - SQ_{Trat} = 454,55 - 324,15 = 130,40\)
Quadro Final da ANOVA
FV | GL | SQ | QM | Fcalc | Ftab_5 |
|---|---|---|---|---|---|
Tratamento | I-1 = 4-1 = 3 | 324.15 | 108.05 | 13.2576687116564 | 3.24 |
Resíduo | I(J-1) = 4(5-1) = 16 | 130.40 | 8.15 | - | - |
Total | IJ-1 = 20-1 = 19 | 454.55 | - | - | - |
Conclusão: Como \(F_{calc}(13,26) > F_{tab}(3,24)\), rejeita-se a hipótese nula (\(H_0\)) ao nível de 5% de significância. Isso significa que existe diferença estatística significativa entre a produtividade das variedades de pequi.
O resultado das vendas efetuadas por 3 vendedores (A, B, C) de uma indústria de pesticidas durante certo período é dado a seguir. Ao nível de 5% de probabilidade e considerando os vendedores como tratamentos de um DIC, verifique se há diferença de eficiência entre os vendedores. (Utilizar \(\alpha = 5\%\); considerar variâncias homogêneas e erros seguindo distribuição normal).
Dados:
Vendedor A | Vendedor B | Vendedor C |
|---|---|---|
29 | 27 | 30 |
27 | 27 | 30 |
31 | 30 | 31 |
29 | 28 | 27 |
32 | 29 | |
30 |
##
##
## TA = 178, TB = 112, TC = 147
## Nº Repetições (J_i): 6, 4, 5
## Total Geral (G): 437
## Número total de observações (N): 15
Cálculo do Fator de Correção (\(C\)):
\[C = \frac{(437)^2}{15} = \frac{190969}{15} \approx 12731,27\]
Cálculo da Soma de Quadrados Total (\(SQ_{Total}\)):
\[SQ_{Total} = \sum Y_{ij}^2 - C\]
\(\sum Y_{ij}^2 = 29^2 + 27^2 + 31^2 + 29^2 + 32^2 + 30^2 + 27^2 + 27^2 + 30^2 + 28^2 + 30^2 + 30^2 + 31^2 + 27^2 + 29^2 = 12769\)
\(SQ_{Total} = 12769 - 12731,27 = 37,73\)
Cálculo da Soma de Quadrados de Tratamentos (\(SQ_{Trat}\)): Neste caso, o número de repetições é diferente para cada tratamento, então usamos a fórmula para tratamentos desbalanceados:
\[SQ_{Trat} = \sum \frac{T_i^2}{r_i} - C\]
\(SQ_{Trat} = \frac{178^2}{6} + \frac{112^2}{4} + \frac{147^2}{5} - 12731,27\)
\(SQ_{Trat} = \frac{31684}{6} + \frac{12544}{4} + \frac{21609}{5} - 12731,27\)
\(SQ_{Trat} = 5280,6667 + 3136 + 4321,8 - 12731,27 = 12738,47 - 12731,27 = 7,20\)
Cálculo da Soma de Quadrados do Resíduo (\(SQ_{Res}\)):
\(SQ_{Res} = SQ_{Total} - SQ_{Trat} = 37,73 - 7,20 = 30,53\)
Quadro da ANOVA
FV | GL | SQ | QM | Fcalc | Ftab_5 |
|---|---|---|---|---|---|
Tratamento | I-1 = 3-1 = 2 | 7.20 | 3.6 | 1.41500163773338 | 3.89 |
Resíduo | N-I = 15-3 = 12 | 30.53 | 2.54416666666667 | - | - |
Total | N-1 = 15-1 = 14 | 37.73 | - | - | - |
Conclusão: Como \(F_{calc}(1,41) < F_{tab}(3,89)\), não se rejeita a hipótese nula (\(H_0\)) ao nível de 5% de probabilidade. Isso significa que não há evidência estatística suficiente para afirmar que existe diferença na eficiência entre os vendedores.