Questão 1

É solicitado que, nos exercícios elencados do capítulo 15 de Bussab & Morettin (2017) se teste a igualdade das variâncias mediante os testes de Levene e de Bartlett e compare as médias, se a hipótese nula for rejeitada.

Exercício 13

Neste exercício compara-se três métodos de ensino, aos quais 3 grupos de 8 pessoas foram submetidos e em seguir testados utilizando o mesmo teste. As amostras testadas são, portanto, independentes.

Primeiramente opta-se por visualizar a distribuição das notas para cada um desses métodos utilizando o boxplot da Figura 1 a seguir.


Figura 1: boxplot de notas por método de ensino

Figura 1: boxplot de notas por método de ensino


É possível observar que apesar de apresentarem medidas de posição próximas - o losângo representa a média e a barra centra da caixa a mediana - o método 1 apresenta maior variabilidade em relação ao método 2. Além disso, o método 3 apresenta notas em geral mais altas que os demais métodos.

Em seguida, testa-se a normalidade da distribuição das notas para auxiliar na decisão de teste de homocedasticidade e para verificação dos pressupostos para análise de variância. Utilizando o teste Shapiro-Wilk, obtem-se um p-valor de 0.14, o que indica que a distribuição das notas pode ser descrita por uma distribuição normal.

Dado que se trata de uma distribuição normal, opta-se preferencialmente pelo teste de Bartlett para homocedasticidade. No entanto, será realizado também o teste de Levene e sua variação Brown para comparação. Para esses testes, tem-se como hipótese nula a igualdade de variâncias entre todos os grupos e como hipótese alternativa a desigualdade de pelo menos um grupo em relação aos demais. Seus resultados podem ser verificados na tabela 1 a seguir.


Tabela 1: Teste de homocedasticidade para avaliação de métodos de ensino
Método p-valor
Levene 0.47
Levene (Brown) 0.77
Bartlett 0.43
Fonte: Bussab & Morettin (2017)


Conclui-se portanto que se tratam de populações de variâncias iguais, o que permite realizar análise de variância considerando todos seus pressupostos.

A tabela 2 a seguir resume os resultados da análise de variância, que toma por hipótese nula a igualdade entre médias de todos os grupos.


Tabela 2: análise de variância para comparação de métodos de ensino
Fonte g.l. SQ Quadrado Médio F p-valor
Entre métodos 2 50.083 25.042 6.053 0.008
Dentro dos métodos 21 86.875 4.137 NA NA
Fonte: Bussab & Morettin (2017)


Pela análise de variância, há pelo menos um grupo cuja média difere das demais. Em seguida realiza-se teste de comparação múltipla de médias para identificar quais grupos diferem em média. Considerando os pressupostos verificados, opta-se por testes t dois a dois. A tabela 3 a seguir sintetiza os resultados desses testes.


Tabela 3: Testes de comparação múltipla das médias de métodos de ensino
Grupo i Grupo j p-valor
Método 2 Método 1 1.00
Método 3 Método 1 0.02
Método 3 Método 2 0.02
Fonte: Bussab & Morettin (2017)


Por fim, os resultados dos testes de comparações múltiplas de médias confirmam a suposição inicial de que apenas o método 3 apresenta resultados diferentes. Neste caso, o método apresenta resultados significativamente superiores, evidenciados pelas notas dos sujeitos experimentais nas avaliações.


Exercício 17

Neste exercício deseja-se investigar se quatro livros foram escritos pelo mesmo autor. Como estratégia, são realizadas amostras de páginas de diferentes tamanhos de cada obra e conta-se o número de vezes que uma determinada construção sintática foi usada.

Primeiramente opta-se por visualizar a distribuição da variável de interesse para cada livro utilizando o boxplot da Figura 1 a seguir.


Figura 2: boxplot de construções sintáticas por livro

Figura 2: boxplot de construções sintáticas por livro


É possível observar que os livros 1 e 3 aparentam ter mesmas médias, enquanto os livros 2 e 4 aparentam diferir dos primeiros.

Em seguida, testa-se a normalidade da distribuição das notas para auxiliar na decisão de teste de homocedasticidade e para verificação dos pressupostos para análise de variância. Utilizando o teste Shapiro-Wilk, obtem-se um p-valor de 0.93, o que indica que a distribuição das notas pode ser descrita por uma distribuição normal.

Dado que se trata de uma distribuição normal, opta-se preferencialmente pelo teste de Bartlett para homocedasticidade. No entanto, será realizado também o teste de Levene e sua variação Brown para comparação. Para esses testes, tem-se como hipótese nula a igualdade de variâncias entre todos os grupos e como hipótese alternativa a desigualdade de pelo menos um grupo em relação aos demais. Seus resultados podem ser verificados na tabela 4 a seguir.


Tabela 4: Teste de homocedasticidade para amostras de livros
Método p-valor
Levene 0.97
Levene (Brown) 0.99
Bartlett 0.96
Fonte: Bussab & Morettin (2017)


Conclui-se portanto que se tratam de populações de variâncias iguais, o que permite realizar análise de variância considerando todos seus pressupostos.

A tabela 5 a seguir resume os resultados da análise de variância, que toma por hipótese nula a igualdade entre médias de todos os grupos.


Tabela 5: análise de variância para comparação de médias de construções sintáticas
Fonte g.l. SQ Quadrado Médio F p-valor
Entre livros 3 340.081 113.360 6.71 0.002
Dentro dos livros 23 388.586 16.895 NA NA
Fonte: Bussab & Morettin (2017)


Pela análise de variância, há pelo menos um grupo cuja média difere das demais. Em seguida realiza-se teste de comparação múltipla de médias para identificar quais grupos diferem em média. Considerando os pressupostos verificados, opta-se por testes t dois a dois. A tabela 6 a seguir sintetiza os resultados desses testes.


Tabela 6: Testes de comparação múltipla das médias de construções sintáticas
Grupo i Grupo j p-valor
Livro 2 Livro 1 0.274
Livro 3 Livro 1 1.000
Livro 3 Livro 2 0.251
Livro 4 Livro 1 0.007
Livro 4 Livro 2 1.000
Livro 4 Livro 3 0.005
Fonte: Bussab & Morettin (2017)


Por fim, os resultados dos testes de comparações múltiplas de médias indicam que apenas o livro 4 difere significativamente dos livros 1 e 3, enquanto o livro 2, apesar da análise descritiva inicial, não difere significativamente de nenhum dos demais. Seria possível dizer que os livros 1 e 3 pertencem ao mesmo autor quando comparados ao livro 4. Não se pode dizer muito, no entanto, sobre o livro 2.


Questão 2

Nesta questão deseja-se inferir se o nível de ansiedade entre quatro tipos de sujeitos, que diferiam quanto aos hábitos de fumar, é diferente. Cada sujeito tem seu nível de ansiedade medido individualmente, de modo que se tratam de amostragens independentes.

Para realizar uma breve análise descritiva, expõe-se a figura 3 a seguir com boxplot da distribuição dos níveis de ansiedade por grupo de hábitos de fumo. Pela figura, pode-se supor que o nível de ansiedade entre fumantes difere daqueles que não são fumantes.


Figura 3: boxplot de níveis de ansiedade por hábito de fumo

Figura 3: boxplot de níveis de ansiedade por hábito de fumo


Para decidir qual teste utilizar para a comparação das médias, realiza-se o teste Shapiro-Wilk sobre os níveis de ansiedade, obtendo-se p-valor de 0.49, indicando normalidade dos dados. Complementarmente, testa-se homogeneidade de variâncias utilizando o teste Bartlett e obtem-se p-valor de 0.36, indicando homogeneidade das variâncias para os grupos da amostra.

Dado que se cumprem as premissas para se realizar análise de variância, conduz-se a análise e seus resultados são expostos na tabela 7 a seguir.


Tabela 7: análise de variância para comparação de médias de ansiedade entre grupos
Fonte g.l. SQ Quadrado Médio F p-valor
Entre grupos 3 7.119 2.373 20.432 < 0.001
Dentro dos grupos 14 1.626 0.116 NA NA
Fonte: elaboração própria.


O p-valor observado na tabela indica que há pelo menos um grupo cuja média é divergente das demais. Por esse motivo e dado que se cumprem premissas para testes paramétricos, realiza-se múltiplas comparações via teste t com correção para nível de significância pelo método de Bonferroni. Seus resultados são expostos na tabela 8 a seguir.


Tabela 8: Testes de comparação múltipla das médias de construções sintáticas
Grupo i Grupo j p-valor
Fuma pouco Fuma muito 0.001
Fuma razoavelmente Fuma muito 0.011
Fuma razoavelmente Fuma pouco 1
Não Fumante Fuma muito < 0.001
Não Fumante Fuma pouco 0.066
Não Fumante Fuma razoavelmente 0.005
Fonte: elaboração própria.


Conclui-se portanto que, a nível de significância de \(\alpha = 0.05\), diferem: Fuma muito dos demais e Não fumante de Fuma razoavelmente.


Questão 3

Neste exercício é solicitado que se averigue diferença entre as preferências de jardineiros por quatro tipos de grama. A variável medida é portanto ordinal, postos de preferência, contando como variável fator o tipo de grama e como bloco os jardineiros.

Inicialmente, elabora-se boxplot para análise descritiva das distribuições dos postos. A figura 4 a seguir expõe as distribuições dos postos por tipo de grama.


Figura 4: boxplot de distribuição de preferências por tipo de grama

Figura 4: boxplot de distribuição de preferências por tipo de grama


Pela análise do boxplot, é possível supor que os tipos de grama A e D estão entre as menos preferidas, enquanto os tipos B e C então entre as mais preferidas.

Dado que não se tratam de dados que poderiam ser descritos por uma distribuição normal, de natureza ordinal e advindos de amostras correlacionadas - os postos só podem ser dados de modo comparativo entre os tipos de grama -, opta-se pelo teste de Friedman para se comparar as medidas de posição. Sob a hipótese nula de que não há diferença entre a distribuição dos postos entre os blocos (neste caso os jardineiros), obtém-se p-valor de 0.04 para o teste, o que indica a um nível de significância \(\alpha = 0.05\) que a distribuição dos postos dentro dos blocos não é igualmente provável.

Ao se realizar teste de comparações múltiplas, aqui realizado mediante a função PMCMR::posthoc.friedman.conover.test(y, grupo, bloco), obtém-se diferenças significativas entre a distribuição dos postos dos tipos de grama A e D em relação aos tipos de grama B e C, confirmando a suposição inicial.


Questão 4

Neste exercício é solicitado que se averigue diferença entre a facilidade de aprender o conteúdo de quatro listas de palavras diferentes. A variável medida é portanto racional, quantidade de palavras acertadas, contando como variável fator a lista, enumeradas de 1 a 4, e como bloco 8 alunos amostrados.

Inicialmente, elabora-se boxplot para análise descritiva das distribuições da quantidade de palavras lembradas. A figura 5 a seguir expõe essas distribuições.


Figura 5: boxplot de distribuição de palavras acertadas por lista

Figura 5: boxplot de distribuição de palavras acertadas por lista


Pela análise do boxplot, é possível supor que os alunos amostrados acertam em média mais palavras da lista 4 em relação às demais listas.

Dado que não se tratam de dados que poderiam ser descritos por uma distribuição normal, de natureza racional e advindos de amostras correlacionadas - os alunos foram testados nas quatro listas -, opta-se pelo teste de Quade para se comparar as medidas de posição, poderadas pela amplitude dos fatores. Sob a hipótese nula de que não há diferença entre a distribuição dos postos entre os blocos (neste caso os alunos), obtém-se p-valor de 0.01 para o teste, o que indica a um nível de significância \(\alpha = 0.05\) que a distribuição dos postos dentro dos blocos não é igualmente provável.

Ao se realizar teste de comparações múltiplas, aqui realizado mediante a função PMCMRplus::quadeAllPairsTest(y, grupo, bloco), obtém-se diferenças significativas entre a distribuição dos postos da lista 4 em relação às listas 2 e 3, mas não em relação à lista 1, em acordo com a suposição inicial.