A base de dados ToothGrowth
se refere à crescimento de dentes em porquinhos da Índia. Cada animal recebeu uma das 3 doses de vitamina C (0.5, 1, ou 2 mg/dia) por um dos dois métodos: suco de laranja (OJ) ou ácido ascórbico, vitamina C (VC).
Variáveis na base de dados:
len
: comprimento do dente.
supp
: tipo de suplemento.
dose
: a dose tomada em miligramas/dia.
Prepare o ambiente de trabalho com os pacotes necessários.
Carregue a base de dados “ToothGrowth.csv”.
Use a função
glimpse
para ter uma visão geral das variáveis na base de dados.
Faça uma tabela para a variável suplemento:
supp
. Quantas observações há em cada grupo de suplemento?
Gere as estatísticas de resumo para a variável
len
agrupada porsupp
. Use média e desvio padrão como as estatísticas descritivas escolhidas.
Gere um gráfico (boxplot) comparativo para a variável
len
em relação àsupp
. O que este gráfico mostra?
As observações são independentes? O que significa ser independente neste caso?
Cheque se há outliers extremos nos dados.
Cheque a normalidade dos dados entre os grupos usando o teste de Shapiro-Wilk. O que foi encontrado?
Cheque a normalidade dos dados entre os grupos usando o QQplot? O que você identifica nestes gráficos? É possível realizar um teste paramétrico?
Cheque se ambos os grupos de suplemento tem variâncias iguais.
Compute o teste t. Lembre-se de especificar se as variâncias são iguais. O que o resultado do teste informa?
Como interpretar o resultado teste? Escreva um parágrafo reportando todas as informações necessárias sobre o teste executado.
Finalize a visualização inicial modificando o título dos eixos e adicionando as informações do teste realizado.
Para a realização do teste t pareado, vamos usar a base de dados notas
. Queremos identificar se houve aumento estatisticamente significativo nas notas dos alunos após uma nova metodologia aplicada pelo professor.
Variáveis na base de dados:
X1
: número do aluno
antes
: notas antes do curso.
depois
: notas após o curso.
Lembre-se de criar uma outra base de dados no formato longo.Chame esta nva base de dados de
notas_long
Crie a coluna diferença na base de dados
notas
, para computar a diferença nas notas antes e depois do curso.
Teste as suposições para a realização de um teste t pareado.
Execute o teste t pareado. Houve diferença nas notas dos alunos antes e depois da aplicação da nova metodologia?
Gere o gráfico final do teste t pareado usando o
ggpaired
e também oggboxplot
.