Test t
Dados Normais e test T - Exemplo dieta
Contextualização: Os pesos corporais de 50 frangos submetidos por 4 tipos de dietas distintas, foram medidos quanto ao peso do dia 0 ao 21(dois em dois dias). As colunas dos dados contém: weight=peso dos pintos (quantitativa contínua); time=n° de dias do nascimento a realização da medição (quantitativa nominal); Chick=saber qual pinto do dia 0 ao 21 (quantitativa nominal);Diet=indica numericamente qual dieta o animal recebeu (quantitativa nominal).
Objetivo
Submeter os dados a uma análise exploratória (para dados completos e para amostra determinadas); teste de normalidade de dados e teste de médias.
Histograma dados completos
Conseguimos observar o peso máximo dos pintinhos concentram-se entre 50-100 (g)
Boxplot dados completos
Dieta 1:
Mediana mais baixa (frangos tendem a ser mais leves).
Possíveis outliers .
Dietas 2, 3 e 4:
Medianas progressivamente mais altas (dieta 4 > 3 > 2).
Dieta 4 tem a maior variabilidade (caixa mais larga).
Diferenças visíveis:
- As dietas 3 e 4 parecem levar a pesos maiores que 1 e 2.
[1] "weight" "Time" "Chick" "Diet"
Variável | Média | Mediana | Q1.25% | Q3.75% | DP | Variância | CV |
---|---|---|---|---|---|---|---|
weight | 121.82 | 103 | 63 | 163.75 | 71.07 | 5051.22 | 58.34 |
Analisa os dados da tabela de dados descritivos podemos observar que :
1- Média e mediana : Indica uma distribuição a direita e que provavelmente tem valores mais altos que “puxam” a média para cima
2-Variância: Dispersão elevada indicando que as médias estão bem dispersas em volta da média .
3-Desvio padrão: Alta variabilidade do preço do frango.
Agora vamos avaliar de forma descritiva apenas a dieta 1 e 3
Histograma dados dieta 1 e 3
A dieta 3 apresentaram dados mais homogêneos (entre 100-200g). Já a dieta 1 possuem valores de peso menores (entre 0-100) e sem valores extremos como a dieta 3.
Boxplot dados dieta 1 e 3
Dieta 1 : Presença de outlier, mediana menor que dieta 3
Dieta 3: Caixa maior- maior disperssão dos dados . Valor máximo superior a dieta 1
Diet | Observações | Média | Mediana | Desvio_Padrão | Variância | CV | Mínimo | Máximo | Q1 | Q3 |
---|---|---|---|---|---|---|---|---|---|---|
1 | 220 | 102.6 | 88.0 | 56.7 | 3210.0 | 55.2 | 35 | 305 | 57.75 | 136.50 |
3 | 120 | 142.9 | 125.5 | 86.5 | 7489.5 | 60.5 | 39 | 373 | 67.50 | 198.75 |
Para as próximas análises vamos considerar apenas uma amostra (n=25) dentro do grupo das dietas 1 e 3.
Histograma dados dieta 1 e 3 (n=25)
Distribuição da dieta 1 semelhante para população total. Dieta 3 concentração ficou mais a esquerda (0-150g) difernte da amostra total.
Boxplot dados dieta 1 e 3 (n=25)
Amostra da dieta 1 mediana superior e mais próximo da média comparados a população total
Diet | Média | Mediana | Desvio_Padrão | Variância | CV | Mínimo | Máximo | Q1 | Q3 |
---|---|---|---|---|---|---|---|---|---|
1 | 117.40 | 110 | 59.65386 | 3558.6 | 50.8 | 39 | 259 | 74 | 138 |
3 | 112.92 | 87 | 71.32258 | 5086.9 | 63.2 | 39 | 280 | 61 | 146 |
Teste de normalidade (Shapiro-Wilk)
Baseado na amostra estabelecida e fixada (n=25) realizamos um teste de normalidade, a fim de analisar se os dados da amostra possuem uma distribuição normal. Os dado foram analisados três vezes sendo um para cada dieta e um combinado.
-Hipótese nula (H0): Os dados seguem uma distribuição normal
-Hipótese alternativa (H1): Os dados não seguem uma distribuição normal .
Regra de decisão:
-p-valor>0.05- não rejeita a H0; Dados seguem uma distribuição normal
- p.valor<0,05= rejeita a H0; Dados NÃO seguem uma distribuição normal
Grupo | W | p_valor | Normalidade |
---|---|---|---|
Dieta 1 | 0.9135736 | 0.0366497 | Rejeita normalidade |
Dieta 3 | 0.8706285 | 0.0044536 | Rejeita normalidade |
Combinado | 0.8971312 | 0.0003869 | Rejeita normalidade |
Foi possível observar que os três testes rejeitaram a H0, ou seja, os dados não segue uma distribuição normal
Teste de Homogeneidade de variância (Levene)
Esse teste é utilizado para verificar se os grupos analisados (no caso as duas dietas) possuem variância iguais. Esse teste é importante para a aplicação de testes estatísticos (como ANOVA) que tem como premissa a variãncia igual. Há varios tipos mas utilizamos o teste de Levene.
-Hipótese nula (H0): as variâncias são iguais.
-Hipótese alternativa (H1): as variâncias são diferentes .
Regra de decisão:
-p-valor>0.05- não rejeita a H0; variâncias são iguais.
- p.valor<0,05= rejeita a H0; variâncias são diferentes.
F | df1 | df2 | p-valor |
---|---|---|---|
group | 1 | 0.651403 | 0.4235929 |
48 | NA | NA |
Podemos observar que p-valor= 0.423>0.05, assim não rejeitamos a hipótese nula, e consideramos que as variâncias são iguais.
Teste de Mann-Whitney para não normalidade
Como os nossos dados não demonstraram uma distribuição normal, não podemos realizar um test t-student para a anlisar a significância, mas podemos realizar outros teste não paramêtricos como Mann-Whitney que faz uma comparação entre medianas.
-Hipótese nula (H0): a dieta 1 e 3 tem o mesmo efeito sobre o peso dos frangos
-Hipótese alternativa (H1): a dieta 1 e 3 tem efeitos diferentes sobre o peso do frango.
Regra de decisão:
-p-valor>0.05- não rejeita a H0; dietas iguais.
- p.valor<0,05= rejeita a H0; dietas diferentes.
Teste | Estatística W | p-valor | Diferença de Medianas | IC 95% Inferior | IC 95% Superior | |
---|---|---|---|---|---|---|
W | Mann-Whitney | 343.5 | 0.5539 | 9 | -25 | 42 |
Podemos observar que o p-valor=0.553>0.05, assim as dietas não possuem diferenças significativas, ou seja, não há uma superior quanto a maior ganho de peso dos frangos.