1 Informações sobre a base de dados

A base de dados ToothGrowth se refere à crescimento de dentes em porquinhos da Índia. Cada animal recebeu uma das 3 doses de vitamina C (0.5, 1, ou 2 mg/dia) por um dos dois métodos: suco de laranja (OJ) ou ácido ascórbico, vitamina C (VC).

  • Variáveis na base de dados:

    • len: comprimento do dente.

    • supp: tipo de suplemento.

    • dose: a dose tomada em miligramas/dia.

2 Preparando o ambiente

Prepare o ambiente de trabalho com os pacotes necessários.

3 Carregando a base de dados.

Carregue a base de dados “ToothGrowth.csv”.

Use a função glimpse para ter uma visão geral das variáveis na base de dados.

Faça uma tabela para a variável suplemento: supp. Quantas observações há em cada grupo de suplemento?

4 Teste t

4.1 Estatística descritiva

Gere as estatísticas de resumo para a variável len agrupada por supp. Use média e desvio padrão como as estatísticas descritivas escolhidas.

4.2 Primeira Visualização

Gere um gráfico (boxplot) comparativo para a variável len em relação à supp. O que este gráfico mostra?

4.3 Suposições do teste

As observações são independentes? O que significa ser independente neste caso?

Cheque se há outliers extremos nos dados.

Cheque a normalidade dos dados entre os grupos usando o teste de Shapiro-Wilk. O que foi encontrado?

Cheque a normalidade dos dados entre os grupos usando o QQplot? O que você identifica nestes gráficos? É possível realizar um teste paramétrico?

Cheque se ambos os grupos de suplemento tem variâncias iguais.

Compute o teste t. Lembre-se de especificar se as variâncias são iguais. O que o resultado do teste informa?

Como interpretar o resultado teste? Escreva um parágrafo reportando todas as informações necessárias sobre o teste executado.

Finalize a visualização inicial modificando o título dos eixos e adicionando as informações do teste realizado.

5 Teste t pareado

Para a realização do teste t pareado, vamos usar a base de dados notas. Queremos identificar se houve aumento estatisticamente significativo nas notas dos alunos após uma nova metodologia aplicada pelo professor.

  • Variáveis na base de dados:

    • X1: número do aluno

    • antes: notas antes do curso.

    • depois: notas após o curso.

Lembre-se de criar uma outra base de dados no formato longo.Chame esta nva base de dados de notas_long

Crie a coluna diferença na base de dados notas, para computar a diferença nas notas antes e depois do curso.

Teste as suposições para a realização de um teste t pareado.

Execute o teste t pareado. Houve diferença nas notas dos alunos antes e depois da aplicação da nova metodologia?

Gere o gráfico final do teste t pareado usando o ggpaired e também o ggboxplot.