Test t

Author

Isabela Oliveira

Dados Normais e test T - Exemplo dieta

Contextualização: Os pesos corporais de 50 frangos submetidos por 4 tipos de dietas distintas, foram medidos quanto ao peso do dia 0 ao 21(dois em dois dias). As colunas dos dados contém: weight=peso dos pintos (quantitativa contínua); time=n° de dias do nascimento a realização da medição (quantitativa nominal); Chick=saber qual pinto do dia 0 ao 21 (quantitativa nominal);Diet=indica numericamente qual dieta o animal recebeu (quantitativa nominal).

Objetivo

Submeter os dados a uma análise exploratória (para dados completos e para amostra determinadas); teste de normalidade de dados e teste de médias.

Histograma dados completos

Conseguimos observar o peso máximo dos pintinhos concentram-se entre 50-100 (g)

Boxplot dados completos

  1. Dieta 1:

    • Mediana mais baixa (frangos tendem a ser mais leves).

    • Possíveis outliers .

  2. Dietas 2, 3 e 4:

    • Medianas progressivamente mais altas (dieta 4 > 3 > 2).

    • Dieta 4 tem a maior variabilidade (caixa mais larga).

  3. Diferenças visíveis:

    • As dietas 3 e 4 parecem levar a pesos maiores que 1 e 2.
[1] "weight" "Time"   "Chick"  "Diet"  
Estatísticas Descritivas Completas
Variável Média Mediana Q1.25% Q3.75% DP Variância CV
weight 121.82 103 63 163.75 71.07 5051.22 58.34

Analisa os dados da tabela de dados descritivos podemos observar que :

1- Média e mediana : Indica uma distribuição a direita e que provavelmente tem valores mais altos que “puxam” a média para cima

2-Variância: Dispersão elevada indicando que as médias estão bem dispersas em volta da média .

3-Desvio padrão: Alta variabilidade do preço do frango.

Agora vamos avaliar de forma descritiva apenas a dieta 1 e 3

Histograma dados dieta 1 e 3

A dieta 3 apresentaram dados mais homogêneos (entre 100-200g). Já a dieta 1 possuem valores de peso menores (entre 0-100) e sem valores extremos como a dieta 3.

Boxplot dados dieta 1 e 3

Dieta 1 : Presença de outlier, mediana menor que dieta 3

Dieta 3: Caixa maior- maior disperssão dos dados . Valor máximo superior a dieta 1

Estatísticas Descritivas de Peso por Dieta (1 e 3)
Diet Observações Média Mediana Desvio_Padrão Variância CV Mínimo Máximo Q1 Q3
1 220 102.6 88.0 56.7 3210.0 55.2 35 305 57.75 136.50
3 120 142.9 125.5 86.5 7489.5 60.5 39 373 67.50 198.75

Para as próximas análises vamos considerar apenas uma amostra (n=25) dentro do grupo das dietas 1 e 3.

Histograma dados dieta 1 e 3 (n=25)

Distribuição da dieta 1 semelhante para população total. Dieta 3 concentração ficou mais a esquerda (0-150g) difernte da amostra total.

Boxplot dados dieta 1 e 3 (n=25)

Amostra da dieta 1 mediana superior e mais próximo da média comparados a população total

Estatísticas Descritivas de Peso por Dieta (1 e 3)
Diet Média Mediana Desvio_Padrão Variância CV Mínimo Máximo Q1 Q3
1 117.40 110 59.65386 3558.6 50.8 39 259 74 138
3 112.92 87 71.32258 5086.9 63.2 39 280 61 146

Teste de normalidade (Shapiro-Wilk)

Baseado na amostra estabelecida e fixada (n=25) realizamos um teste de normalidade, a fim de analisar se os dados da amostra possuem uma distribuição normal. Os dado foram analisados três vezes sendo um para cada dieta e um combinado.

-Hipótese nula (H0): Os dados seguem uma distribuição normal

-Hipótese alternativa (H1): Os dados não seguem uma distribuição normal .

Regra de decisão:

-p-valor>0.05- não rejeita a H0; Dados seguem uma distribuição normal

- p.valor<0,05= rejeita a H0; Dados NÃO seguem uma distribuição normal

Teste de normalidade- Shapiro-Wilk
Grupo W p_valor Normalidade
Dieta 1 0.9135736 0.0366497 Rejeita normalidade
Dieta 3 0.8706285 0.0044536 Rejeita normalidade
Combinado 0.8971312 0.0003869 Rejeita normalidade

Foi possível observar que os três testes rejeitaram a H0, ou seja, os dados não segue uma distribuição normal

Teste de Homogeneidade de variância (Levene)

Esse teste é utilizado para verificar se os grupos analisados (no caso as duas dietas) possuem variância iguais. Esse teste é importante para a aplicação de testes estatísticos (como ANOVA) que tem como premissa a variãncia igual. Há varios tipos mas utilizamos o teste de Levene.

-Hipótese nula (H0): as variâncias são iguais.

-Hipótese alternativa (H1): as variâncias são diferentes .

Regra de decisão:

-p-valor>0.05- não rejeita a H0; variâncias são iguais.

- p.valor<0,05= rejeita a H0; variâncias são diferentes.

Teste de Levene: Homogeneidade de Variâncias
F df1 df2 p-valor
group 1 0.651403 0.4235929
48 NA NA

Podemos observar que p-valor= 0.423>0.05, assim não rejeitamos a hipótese nula, e consideramos que as variâncias são iguais.

Teste de Mann-Whitney para não normalidade

Como os nossos dados não demonstraram uma distribuição normal, não podemos realizar um test t-student para a anlisar a significância, mas podemos realizar outros teste não paramêtricos como Mann-Whitney que faz uma comparação entre medianas.

-Hipótese nula (H0): a dieta 1 e 3 tem o mesmo efeito sobre o peso dos frangos

-Hipótese alternativa (H1): a dieta 1 e 3 tem efeitos diferentes sobre o peso do frango.

Regra de decisão:

-p-valor>0.05- não rejeita a H0; dietas iguais.

- p.valor<0,05= rejeita a H0; dietas diferentes.

Resultados do Teste de Mann-Whitney para Comparação de Peso entre Dietas 1 e 3
Teste Estatística W p-valor Diferença de Medianas IC 95% Inferior IC 95% Superior
W Mann-Whitney 343.5 0.5539 9 -25 42

Podemos observar que o p-valor=0.553>0.05, assim as dietas não possuem diferenças significativas, ou seja, não há uma superior quanto a maior ganho de peso dos frangos.