Test t

História

O test t de Student foi introduzido em 1908 por William Sealy Gosset, matemático e estatístico que trabalhava na cervejaria Guinness, em Dublin, na Irlanda. A Guinness considerava de grande ipmortância recrutar os melhores graduados de Oxford e Cambridge para os cargos de bioquímico e estatístico de testes de sua cerveja.

Guinness

Guinness

Gosset desenvolveu o teste t como um modo para monitorar a qualidade da cerveja tipo stout. O grande diferencial desse teste é justamente o fato de poder ser aplicado quando o tamanho da amostra é pequeno. Isso permite que se façam inferências usando um menor número de elementos, reduzindo os custos da pesquisa de qualidade.

A importancia dada ao trabalho estatístico na Guinnes era tamanha o uso de métodos estatísticos na fabricação da cerveja era considerado um segredo industrial. Assim, quando Gosset publicou o artigo sobre o teste t na revista acadêmica Biometrika em 1908, teve de usar um pseudônimo “Student” em seus trabalhos e por isso o teste t passou a ser conhecido como teste t de Student.

Pra que serve o teste t de Student?

O teste t de Studente (ou simplesmente teste t) compara duas médias e mostra se as diferenças entre essas médias são significativas. Em outras palavras, permite que você avalie se essas diferenças ocorreram por um mero por acaso ou não.

A necessidade de determinar se duas médias de amostras são diferentes entre si é uma situação extremamente frequente em pesquisas científicas.

Por exemplo se um grupo experimental difere de um grupo controle, se uma amostra difere da população, se um grupo difere antes de depois de um procedimento. Nessas diversas situações, um método bastante comum é a comparação das médias da medida de interesse.

Por exemplo, a média de peso de dois grupos submetidos a diferentes dietas.

Entretanto, a simples percepção da diferença não é suficiente. Afinal de contas, é possível que a diferença encontrada seja devida ao mero acaso e não à dieta ou à intervenção em estudo. Assim, é necessário algo mais do que simplesmente verificar que houve uma diferença, é preciso analisar se essa diferença é estatisticamente significativa. Em outras palavras, é preciso uma estimativa do quão provável essa diferença poderia ser devida ao acaso. O test t serve justamente para isso, para estimar se a diferença das médias de dois conjuntos de dados é ou não estatisticamente significativa.

Como interpretar o resultado do teste t

Como todo teste estatístico, a teste t também tem como produto a medida do valor de p. Ou seja, no final das contas, teremos calculado a probabilidade da diferença encontrada (entre as médias) terem sido por acaso. Se esse valor for menor que 5% ( p < 0.05), a tradição científica é de rejeitarmos a hipótese de que as diferenças sejam por acaso (rejeitamos a hipótese nula) e alegamos termos encontrado uma diferença estatísticamente significativa.

Os vários tipos de teste t

Existem 3 tipos comuns de teste t:

  1. teste t para duas amostras independentes (ou não pareadas)
  2. teste t para duas amostras dependentes (ou pareadas)
  3. teste t para uma amostra

Esses testes servem para:

  1. Comparar as médias de duas amostras independentes (teste-t de para duas amostras independentes)
  2. Comparar as médias de duas amostras pareadas - mesmos sujeitos em diferentes momentos de tempo (teste-t pareado)
  3. Comparar a média de uma amostra com a média de uma população (teste de de uma amostra)

Realizando o test t padrão do R: teste t para amostras independentes

O R tem uma função muito simples de usar para realizar o teste t: t.test().

Para usar essa função basta incluir como argumentos os valores obtidos de cada grupo da pesquisa e o próprio essa função do R já calcula a média de cada grupo e faz a comparação estatística.

Veja o exemplo a seguir, no qual existem dois grupos diferentes de pacientes (controle e experimental), com os valores de uma medida fictícia:

controle     <- c(21, 28, 24, 23, 23, 19, 28, 20, 22, 20, 26, 26)
experimental <- c(26, 27, 23, 25, 25, 29, 30, 31, 36, 23, 32, 22)

Um gráfico de boxplot pode nos mostrar que o grupo experimental tem uma média maior.

Para comparar a média de cada um desses dois grupos, usamos a função t.test().

t.test(controle, experimental)
## 
##  Welch Two Sample t-test
## 
## data:  controle and experimental
## t = -2.6837, df = 20.163, p-value = 0.01421
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -7.2555305 -0.9111362
## sample estimates:
## mean of x mean of y 
##  23.33333  27.41667

A função t. test() como acima realiza o teste t de student para amostras independentes.

Interpretando o resultado do teste-t para duas amostras independentes

A primeira linha do resultado do teste informra o nome do teste que foi feito:
Welch Two Sample t-test (teste-t de Welch de duas amostras).

O teste-t de Welch é uma adaptação do teste t de Student, que é mais confiável quando as duas amostras têm variâncias desiguais e tamanhos de amostra desiguais. O teste-t padrão do R utiliza essa variação do teste-t.

Era uma prática usual testar se as variâncias das amostras eram semelhantes ou não antes de aplicar o teste-t. Atualmente não se se usa mais mais fazer esse teste e se usa sempre a variação de Welch do teste-t. Por isso o padrão do R é que o teste-t já seja feito dessa forma.

A segunda linha informa de onde foram extraídos os dados para o teste:
da variáveis controle and experimental

A terceira linha traz várias informações:
o valor da estatística t: t = -2.68372
os graus de liberdade da curva de distribuição t: df = 20.163
o valor de p: p-value = 0.01421

A quarta linha informa qual a hipótese alternativa do teste: true difference in means is not equal to 0
A hipótese alternativa é que as médias da amostras são diferentes.
Podemos então inferir que a hipótese nula do teste é que as médias das amostra são iguais
Por essa linha podemos ver que o teste realizado foi um teste bicaudal (que é o padrão do R)

A quinta e a sexta linha informam o intervalo de confiança do teste.

A sétima, oitava e nona linha informam os dados da amostra: a média de cada amostra: 23.33333 27.41667

O teste t no R tem como padrão admitir que os grupos não sejam pareados, isto é, que os grupos sejam independentes. Além disso, o teste t assume que o nível de significância seja de 0.05 (\(\alpha\)= 5%) e que teste seja realizado de forma bicaudal. Todas esses parâmetros podem ser modificados quando necessário.

Argumentos do test t no R

O teste-t usa valores default em vários de seus argumentos que são importantes serem conhecidos:

paired = FALSE -> por default o teste admite que os grupos não sejam pareados

conf.level = 0.95 -> por default o teste admite um nível de confiança de 95% (ou \(\alpha\)= 5%)

alternative = two.sided - > por default o teste é bicaudal, podemos escolher também “greater” ou “less”

Quando desejarmos realizar um teste t pareado, basta alterar o argumento paired para TRUE: paired = TRUE.

teste t pareado

Veja o exemplo a seguir, no qual existem um grupo de pacientes que teve alguma medida realizada antes da intervenção e outra depois da intervenção. Por exemplo, o peso de atletas antes e depois da maratona, ou a medida da glicemia antes e depois de um tratamento. O importante aqui é entendermos que as duas medidas são realizadas num mesmo grupo de pessoas, antes e depois de uma intervenção.

Vamos usar os mesmo dados de antes, modificando apenas o nome da variável para que fique mais claro que estamos agora num mesmo grupo de pessoas, cujas medidas foram tomadas antes e depois.

O teste t para amostras indepententes não exige que os grupos tenham o mesmo tamanho, mas observe que o teste t pareado exige que existam exatamente o mesmo número de medidas antes e depois.

antes  <- c(21, 28, 24, 23, 23, 19, 28, 20, 22, 20, 26, 26)
depois <- c(26, 27, 23, 25, 25, 29, 30, 31, 36, 23, 32, 22)

Para usar o teste t pareado, iremos simplesmente alterar o argumento paired:

t.test(antes, depois, paired = TRUE)
## 
##  Paired t-test
## 
## data:  antes and depois
## t = -2.6353, df = 11, p-value = 0.02319
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -7.493713 -0.672954
## sample estimates:
## mean of the differences 
##               -4.083333

Interpretando o resultado do teste-t pareado

A primeira linha do resultado do teste informra o nome do teste que foi feito:
Paired t-test (teste t pareado).

O restante do teste é interpretado da mesma forma que o teste t para amostras independentes.

O teste-t de Student para uma amostra

O teste-t de Student para uma amostra compara a medida média de um grupo com a média da população.

Suponha que você queira saber se a altura das mulheres mineiras é maior que a média da população no brasileira. Conhecendo a média da população (suponha que a média da população seja 160cm), você reúne uma amostra aleatória de 25 mulheres de minas gerais e mensura as alturas dessas mulheres.

As alturas das mulheres de sua amostra de 25 mulheres foram as seguintes (em cm): 152.0, 153.1, 154.6, 157.8, 158.8, 159.6, 161.1, 161.6, 162.7, 163.7, 164.1, 165.5, 165.8, 168.4, 168.4, 169.1, 169.1, 170.2, 172.4, 172.9, 173.1, 173.3, 175.6, 176.9, 179.0.

A média da altura das mulheres mineiras de sua amostra foi de 165.952cm, enquanto que a média de altura da população é de 160cm. Ou seja, as mineiras de sua amostra tem uma altura média 5.952cm acima da média da população.

A questão é, a média da altura das mineiras foi maior, mas será que essa diferença de altura é estatisticamente significativa? Um teste estatístico pretende tentar responder essa questão.

O teste a ser usado para resolver essa questão é o teste-t de Student para uma amostra.

  1. Primeira etapa é inserir os dados no R.
# medidas da amostra de 25 mulheres de minas gerais (dados fictícios)
altura <- c(152.0, 153.1, 154.6, 157.8,
            158.8, 159.6, 161.1, 161.6,
            162.7, 163.7, 164.1, 165.5,
            165.8, 168.4, 168.4, 169.1,
            169.1, 170.2, 172.4, 172.9,
            173.1, 173.3, 175.6, 176.9,
            179.0)
  1. Segunda Etapa: o teste propriamente dito

Para fazer o teste usamos a função t.test() e incluímos como argumentos a variável com os dados altura e a média da população mu=160, com a qual desejamos fazer a comparação:

t.test(altura, mu= 160)
## 
##  One Sample t-test
## 
## data:  altura
## t = 3.9881, df = 24, p-value = 0.000543
## alternative hypothesis: true mean is not equal to 160
## 95 percent confidence interval:
##  162.8718 169.0322
## sample estimates:
## mean of x 
##   165.952

Como você pode ver, fazer um teste-t é muito simples no R.

O importante é saber quando se pode usar esse teste, para que ele serve e como intrepretar o resultado.

Interpretando o resultado do teste-t para uma amostra

A primeira linha do resultado do teste informra o nome do teste que foi feito:
One Sample t-test (teste-t de uma amostra).

A segunda linha informa de onde foram extraídos os dados para o teste:
da variável altura que foi anteriormente criada.

A terceira linha traz várias informações:
o valor da estatística t: t = 3.9881
os graus de liberdade da curva de distribuição t: df = 24 (lembrando: df = n-1 = 25 - 1)
o valor de p: p-value = 0.000543

A quarta linha informa qual a hipótese alternativa do teste: true mean is not equal to 160 Pois a hipótese alternativa é que a média da amostras é diferente de 160.
Podemos então inferir que a hipótese nula do teste é que a média da amostra é IGUAL a 160.

Por essa linha podemos ver que o teste realizado foi um teste bicaudal.

A quinta e a sexta linha informam o intervalo de confiança do teste.

A sétima, oitava e nona linha informam os dados da amostra: a média da amostra foi de 165.952cm.

A análise das notas de estatística entre homens e mulheres.

Abaixo estão as notas da prova teórica de estatística de 2018 de homens e mulheres.

homens   <- c(15,9,7,13,10,11,14,8,12,5,10,10,6,6,5,13,12,5,12,6)
mulheres <- c(13,11,11,10,11,11,15,14,10,9,13,11,9,9,12,9,12,9,15,13,9,15,11,13,11,11,12,11,11,11)

E as médias de cada grupo:

mean(homens)
## [1] 9.45
mean(mulheres)
## [1] 11.4

A média das notas das mulheres foi maior. A questão estatística é: foi um mero acaso?

Um teste t serve para responder essa pergunta. Veja que como será usado um teste t independente, pois são dois grupos diferentes, não há problema no fato dos grupos terem tamanhos diferentes.

t.test(homens, mulheres)
## 
##  Welch Two Sample t-test
## 
## data:  homens and mulheres
## t = -2.4265, df = 27.006, p-value = 0.0222
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -3.5988712 -0.3011288
## sample estimates:
## mean of x mean of y 
##      9.45     11.40

** Analisando o resultado acima**

É preciso verificar o valor de p no teste acima:

p = 0.0222

Um valor de p menor que 0.05 indica que a diferença é estatisticamente significativa.

Conclusão final

As mulheres tem uma média nas notas maiores que a dos homens e essa diferença é estatisticamente significativa.

Ou seja, parece que as mulheres vão mesmo dominar o mundo

Teremos a reposta na próxima prova !!!