Amostragem, Intervalos de Confiança e Testes de Hipóteses
Departamento de Estatística – UFPB
julho, 2026
A qualidade de toda conclusão estatística começa na forma como a amostra foi selecionada.
Definição
População ou universo é o conjunto de unidades sobre o qual desejamos informação.
Definição
Amostra é todo subconjunto de unidades retiradas da população para obter a informação desejada.
A população configurada para amostragem é necessariamente menor do que a população-alvo.
Definição
Parâmetro é um valor numérico que descreve uma característica da população. Não varia — é um valor fixo.
Definição
Estatística é um valor numérico que descreve uma característica de uma amostra, usado para estimar o parâmetro correspondente.
Definição
Erro de amostragem é a diferença entre a estatística de uma amostra e o parâmetro (desconhecido) da população.
Definição
Numere cada unidade da população e, depois, selecione ao acaso os números que formarão a amostra (gerador de números aleatórios).
Situação: Um dentista quer amostrar 2% dos 500 pacientes de sua clínica para entrevistá-los sobre a qualidade do atendimento.
✅ Interpretação: o sorteio garante que cada paciente tem a mesma chance de compor a amostra, evitando viés na seleção.
Definição
Se a população está dividida em grupos naturais (estratos), retira-se de cada estrato uma amostra casual simples proporcional ao seu tamanho.
Situação: o mesmo dentista supõe que homens são mais bem atendidos que mulheres. Aproximadamente 3/5 dos 500 pacientes são mulheres.
✅ Interpretação: separando homens e mulheres antes de sortear, o dentista garante que ambos os grupos estarão representados na amostra final.
Definição
Unidades retiradas seguindo um sistema preestabelecido (a cada \(k\)-ésima unidade), a partir de um ponto de partida sorteado.
Situação: o dentista quer 2% de 500 pacientes usando amostragem sistemática.
Passo 1 — Calcule o intervalo: \(500 / 10 = 50\).
Passo 2 — Sorteie um número entre 1 e 50. Suponha que saiu 27.
Passo 3 — A partir do prontuário 27, conte de 50 em 50: \(27, 77, 127, \dots\)
✅ Interpretação: não é preciso ter a lista completa sorteável — basta que os prontuários estejam organizados sequencialmente.
Definição
Conglomerados são grupos que já existem na população (um hospital, uma escola). Sorteia-se um ou mais conglomerados inteiros.
Não confunda com amostra estratificada:
| Estratos | Conglomerados |
|---|---|
| Criados pelo pesquisador | Já existem na população |
| Diferentes entre si | Similares entre si |
| Amostra-se dentro de cada um | Usa-se todos os membros do sorteado |
Situação: um professor de Educação Física quer estudar o efeito da reposição hormonal sobre o desempenho em exercícios de mulheres na pós-menopausa.
✅ Interpretação: o acesso a poucos conglomerados substitui o acesso a toda a cidade — mais viável na prática clínica e de campo.
Definição
Divide-se a população heterogênea em quotas (como estratos), mas as unidades são amostradas por facilidade de acesso, sem sorteio.
Situação: pesquisa de opinião sobre serviços públicos de saúde em uma metrópole.
✅ Interpretação: o procedimento reproduz a proporção populacional (sexo, idade, renda) sem exigir lista completa de nomes.
Definição
Constituída por unidades reunidas simplesmente porque o pesquisador tem fácil acesso a elas — sem qualquer procedimento aleatório.
Exemplo: um nutricionista que trabalha em uma escola entrevista as mães das crianças matriculadas ali para estudar hábitos alimentares infantis.
⚠️ A amostra obtida pode não ter representatividade da população mais ampla.
Pergunta: em uma cidade há dois hospitais — um com 120 nascimentos/dia, outro com 12. Em qual é mais provável nascerem, em um dia, o dobro de meninos do que meninas?
✅ É mais provável no hospital menor — amostras pequenas se afastam mais facilmente do valor verdadeiro.
Antes de coletar os dados, o pesquisador deve planejar quantas unidades amostrar, dada a margem de erro (\(E\)) que está disposto a aceitar e o nível de confiança desejado.
Para estimar uma média: \[ n = \left(\frac{z_{\alpha/2}\,\sigma}{E}\right)^2 \]
Para estimar uma proporção: \[ n = \frac{z_{\alpha/2}^2\; p(1-p)}{E^2} \]
Estimando uma média
Margem de erro desejada: \(E=3\) mmHg de pressão sistólica, 95% de confiança (\(z=1{,}96\)). Estudo piloto indica \(\sigma = 15\) mmHg.
\[ n = \left(\frac{1{,}96 \times 15}{3}\right)^2 \approx 96{,}0 \]
✅ Amostrar 97 pacientes (arredonda-se sempre para cima).
Estimando uma proporção
Margem de erro desejada: \(E=4\) pontos percentuais, 95% de confiança. Sem estimativa prévia de \(p\) → usa-se \(p=0{,}5\).
\[ n = \frac{(1{,}96)^2 \times 0{,}5 \times 0{,}5}{(0{,}04)^2} \approx 600{,}25 \]
✅ Amostrar 601 indivíduos.
Quanto menor a margem de erro exigida, maior o tamanho de amostra necessário — a precisão tem um custo.
Definição
Tendência (viés) é a diferença entre a estimativa obtida na amostra e o parâmetro que se quer estimar.
Caso histórico (Shere Hite, 1988): questionário sobre sexualidade feminina inserido em revistas americanas.
✅ Interpretação: tamanho de amostra grande não elimina viés de seleção — respondentes voluntários tendem a ter opiniões mais polarizadas.
| Técnica | Aleatória? | Exige lista completa? | Uso típico em saúde |
|---|---|---|---|
| Casual simples | Sim | Sim | Sorteio de prontuários |
| Casual estratificada | Sim | Sim (por estrato) | Garantir subgrupos (sexo, idade) |
| Sistemática | Parcial | Não (só organização) | Prontuários em arquivo |
| Conglomerados | Parcial | Não | Hospitais, escolas, academias |
| Quotas | Não | Não | Pesquisas de opinião em saúde pública |
| Conveniência | Não | Não | Pacientes de uma clínica específica |
Neste bloco: como fornecer não apenas uma média, mas um intervalo com alta probabilidade de conter a média populacional.
Definição
Estimativa por ponto é o uso de um único número (a média da amostra) para descrever toda a amostra.
Exemplo 1: a média de altura de uma amostra aleatória de 100 alunos do sexo masculino com 18 anos foi de 175 cm.
✅ Essa é uma estimativa por ponto da média populacional — mas não informa quanta confiança depositar nela.
Situação: um professor tem quatro alunos com notas 1, 6, 8 e 9. Sorteará dois para apresentar um trabalho.
| Amostra | Média |
|---|---|
| 1 e 6 | 3,5 |
| 1 e 8 | 4,5 |
| 1 e 9 | 5,0 |
| 6 e 8 | 7,0 |
| 6 e 9 | 7,5 |
| 8 e 9 | 8,5 |
✅ Interpretação: as médias amostrais variam de 3,5 a 8,5, mas a média das médias é exatamente 6 — igual à média da população.
Definição
Erro padrão da média (\(s_{\bar{x}}\)) é a raiz quadrada positiva da variância da média — mede a variabilidade das médias que se obteria repetindo a amostragem.
\[ s_{\bar{x}} = \frac{s}{\sqrt{n}} \]
Retome o exemplo da altura: média = 175 cm, desvio-padrão \(s = 10\) cm, \(n = 100\).
\[ s_{\bar{x}} = \frac{s}{\sqrt{n}} = \frac{10}{\sqrt{100}} = \frac{10}{10} = 1 \text{ cm} \]
✅ Interpretação: se repetíssemos essa amostragem muitas vezes, as médias obtidas variariam, em média, apenas 1 cm em torno da verdadeira média populacional.
Figura 1
Definição
Margem de erro é a diferença máxima esperada entre o parâmetro e sua estimativa, associada a um nível de confiança.
\[ \text{Margem de erro} = t_\alpha \times s_{\bar{x}} = t_\alpha \times \frac{s}{\sqrt{n}} \]
Passos:
| gl | α = 0,01 | α = 0,05 | α = 0,10 |
|---|---|---|---|
| 13 | 3,01 | 2,16 | 1,77 |
| 14 | 2,98 | 2,14 | 1,76 |
| 15 | 2,95 | 2,13 | 1,75 |
Situação: medida de perímetro torácico em uma amostra de \(n = 15\) soldados. Média = 42, desvio-padrão \(s = 2\). Calcule a margem de erro com 95% de confiança.
Graus de liberdade: \(gl = 15 - 1 = 14\).
Na tabela, com \(gl=14\) e \(\alpha=0{,}05\): \(t = 2{,}14\).
Erro padrão da média: \[ s_{\bar{x}} = \frac{2}{\sqrt{15}} = 0{,}516 \]
\[ \text{Margem de erro} = 2{,}14 \times 0{,}516 = 1{,}10 \]
✅ Interpretação: com 95% de confiança, o verdadeiro perímetro torácico médio populacional está a, no máximo, 1,10 unidade de distância da média amostral (42).
\[ \bar{x} - t_\alpha \cdot \frac{s}{\sqrt{n}} \;<\; \mu \;<\; \bar{x} + t_\alpha \cdot \frac{s}{\sqrt{n}} \]
Retome: altura média de 100 alunos = 175 cm, \(s = 10\) cm, \(s_{\bar{x}} = 1\) cm.
\[ 175 - 2{,}00 < \mu < 175 + 2{,}00 \]
\[ 173 < \mu < 177 \]
✅ Interpretação clínica: estamos 95% confiantes de que a altura média verdadeira dos universitários dessa faixa etária está entre 173 cm e 177 cm.
Situação: amostra de 30 homens sadios (30–48 anos), não fumantes, com atividade física regular. Pressão diastólica média = 80 mmHg, \(s = 7{,}1\) mmHg.
\[ 80 \pm 2{,}045 \times 1{,}296 = 80 \pm 2{,}65 \]
\[ 77{,}3 \le \mu \le 82{,}7 \]
✅ Interpretação clínica: a pressão diastólica média verdadeira, em repouso, de homens sadios de 30–48 anos, não fumantes e fisicamente ativos, está, com 95% de confiança, entre 77,3 e 82,7 mmHg.
Figura 2
Erro Padrão da Média: \[s_{\bar{x}} = \frac{s}{\sqrt{n}}\]
Margem de Erro: \[t_\alpha \times s_{\bar{x}}\]
Intervalo de Confiança: \[\bar{x} \pm t_\alpha \cdot \frac{s}{\sqrt{n}}\]
Regra: quanto maior \(n\), menor a margem de erro.
Você compra um carro: faz ou não o seguro contra roubo?
Seja qual for a decisão, você pode acertar ou errar — só saberá depois.
Um pesquisador não pode decidir por intuição. Precisa de um teste estatístico que quantifique a probabilidade de erro.
Exemplo A: a OMS recomenda 15% para a taxa de parto cesáreo. Uma maternidade afirma manter essa taxa. Como confirmar objetivamente, com base em uma amostra de prontuários?
Exemplo B: um dentifrício deve conter determinada quantidade de flúor especificada na embalagem. Como verificar, com base em uma amostra de tubos, se a média realmente corresponde ao especificado?
✅ Ambos os casos exigem comparar uma média (ou proporção) amostral com um valor de referência — usando um teste t para uma amostra.
Vamos detalhar cada passo usando um exemplo motivador: meninos de 7 anos no Sul do Brasil pesam, em média, 25 kg (segundo a literatura)?
Definição
Hipótese da nulidade (\(H_0\)): afirma que não há diferença — a média populacional é igual ao valor especificado.
Hipótese alternativa (\(H_1\)): contradiz \(H_0\).
\[ H_0: \mu = 25 \text{ kg} \qquad H_1: \mu \neq 25 \text{ kg} \]
⚠️ As hipóteses são sempre sobre parâmetros populacionais, nunca sobre a amostra observada.
Definição
No teste bilateral, a hipótese alternativa afirma apenas que a média é diferente do valor especificado — pode ser maior ou menor.
Exemplo: analgésicos tradicionais aliviam a cefaleia em 30 minutos. Testa-se um novo fármaco com 10 voluntários.
\[ H_0: \mu = 30 \text{ min} \qquad H_1: \mu \neq 30 \text{ min} \]
Definição
No teste unilateral, a hipótese alternativa afirma que a média é maior (ou menor) que o valor especificado — uma direção específica.
Exemplo: a OMS informa peso médio ao nascer de 3,400 kg em países desenvolvidos. Pesquisadoras suspeitam que filhos de mães usuárias de maconha durante a gestação nascem com peso menor.
\[ H_0: \mu = 3{,}400 \text{ kg} \qquad H_1: \mu < 3{,}400 \text{ kg} \]
Retome o exemplo da maconha e peso ao nascer (\(H_0: \mu = 3{,}400\) kg; \(H_1: \mu < 3{,}400\) kg).
Caso Surgisphere (2020): alegou dados de 14.888 pacientes em 671 hospitais para testar a eficácia da hidroxicloroquina/cloroquina contra Covid-19.
⚠️ Lição: um resultado estatisticamente “significante” só é confiável se os dados e o delineamento forem confiáveis.
Definição
Nível de significância (\(\alpha\)) é a probabilidade de cometer erro tipo I — rejeitar \(H_0\) quando ela é verdadeira.
\[ \alpha = 1 - \text{nível de confiança} \]
Retome o exemplo da maconha: no nível \(\alpha = 0{,}05\), o teste t resultou significante.
✅ Conclusão do estudo: o uso contínuo de maconha durante a gestação está associado a menor peso ao nascer (\(\alpha = 5\%\)).
Situação: o tempo médio de sono de idosos internados em casas de repouso é de 6h08min (= 6,13 h). Uma amostra de 4 idosos de outro pavilhão forneceu: 5; 4; 6; 5 horas.
Dados da amostra: \(5;\ 4;\ 6;\ 5\) horas.
\[ \bar{x} = \frac{5+4+6+5}{4} = 5{,}0 \text{ h} \]
\[ s^2 = \frac{\sum(x_i-\bar{x})^2}{n-1} = \frac{(0)^2+(-1)^2+(1)^2+(0)^2}{3} = 0{,}667 \]
\[ \mu_0 = 6\text{h}08\text{min} = 6 + \frac{8}{60} = 6{,}13 \text{ h} \]
\[ t = \frac{5{,}0 - 6{,}13}{0{,}816/\sqrt{4}} = \frac{-1{,}13}{0{,}408} = -2{,}77 \]
Graus de liberdade: \(n - 1 = 3\). Valor crítico (bilateral, \(\alpha=0{,}10\), gl=3): \(t = 2{,}533\).
\[ |{-2{,}77}| = 2{,}77 > 2{,}533 \]
✅ Rejeita-se \(H_0\) no nível de 10% de significância.
Interpretação clínica: os idosos amostrados nesse pavilhão dormem, em média, tempo diferente (menor) do que os 6h08min típicos de outras instituições — merece investigação (conforto, rotina, medicação).
Definição
O p-valor diz o quão provável seria obter uma amostra como a que foi observada, se \(H_0\) fosse verdadeira.
Exemplo de saída de um software para o exemplo do sono:
| n | Média | DP | EP média | IC 95% | t | p-valor |
|---|---|---|---|---|---|---|
| 4 | 5,0 | 0,816 | 0,408 | (3,70; 6,30) | −2,77 | 0,070 |
✅ Interpretação: sob \(H_0\), a probabilidade de obter uma amostra como essa é de 7%. Como \(0{,}070 < 0{,}10\) (o \(\alpha\) adotado), rejeita-se \(H_0\).
Situação: requisição de 8 ratos Wistar com peso médio de 70 g. Pesos recebidos: 76; 81; 50; 47; 63; 65; 63; 64. O pesquisador suspeita que a média seja menor.
\[ \bar{x} = \frac{76+81+50+47+63+65+63+64}{8} = 63{,}6 \text{ g} \]
\[ s = \sqrt{\frac{\sum(x_i-\bar{x})^2}{n-1}} = 11{,}5 \text{ g} \]
\[ t = \frac{63{,}6 - 70}{11{,}5/\sqrt{8}} \approx -1{,}57 \]
✅ Não se rejeita \(H_0\).
Como redigir no trabalho: não se encontrou evidência de que os oito ratos machos da raça Wistar com 30 dias (média = 63,6 g; DP = 11,5 g) tinham peso médio diferente do especificado (70 g).
Hipóteses: \[H_0: \mu = \mu_0 \qquad H_1: \mu \neq \mu_0 \text{ (ou } < \text{ / } > \text{)}\]
Estatística de teste: \[t = \frac{\bar{x}-\mu_0}{s/\sqrt{n}}\]
Regra de decisão:
Definição
Dados são pareados quando cada observação de um grupo tem uma contraparte lógica no outro grupo.
Situação: comparar dois antitussígenos (A e B) quanto ao tempo de sono, em 9 voluntários (cada um testou ambos, em noites diferentes). \(\alpha = 0{,}05\).
| Voluntário | A | B | Diferença (\(A-B\)) |
|---|---|---|---|
| 1 | 7 | 9 | −2 |
| 2 | 7 | 7 | 0 |
| 3 | 6 | 6 | 0 |
| 4 | 6 | 8 | −2 |
| 5 | 9 | 10 | −1 |
| 6 | 6 | 8 | −2 |
| 7 | 7 | 7 | 0 |
| 8 | 8 | 8 | 0 |
| 9 | 5 | 7 | −2 |
\[ \left\{ \begin{array}{c} H_0: \bar{d} = 0 \\ H_1: \bar{d} \neq 0 \end{array} \right. \]
\[ \bar{d} = \frac{-2+0+0-2-1-2+0+0-2}{9} = -1{,}0 \]
\[ s_d = \sqrt{\frac{\sum(d_i-\bar{d})^2}{n-1}} = 1{,}0 \]
\[ t = \frac{-1{,}0}{1{,}0/\sqrt{9}} = -3{,}00 \]
Graus de liberdade: \(8\). Valor crítico (\(\alpha=0{,}05\), gl=8): \(2{,}306\).
\[ |{-3{,}00}| = 3{,}00 > 2{,}306 \]
✅ Rejeita-se \(H_0\) no nível de 5% de significância (p-valor = 0,0171).
Interpretação clínica: os dois antitussígenos não produzem, em média, o mesmo tempo de sono. O antitussígeno B (média 7,78h) proporcionou tempo de sono maior do que A (média 6,78h).
Situação: comparar tempo de alívio da dor (enxaqueca) entre medicamento de referência e genérico, em 7 voluntários. $ 05$.
| Voluntário | Referência | Genérico | Diferença (Gen. − Ref.) |
|---|---|---|---|
| 1 | 4,5 | 4,0 | −0,5 |
| 2 | 5,5 | 5,5 | 0 |
| 3 | 6,0 | 6,0 | 0 |
| 4 | 6,0 | 5,0 | −1,0 |
| 5 | 5,5 | 4,5 | −1,0 |
| 6 | 5,5 | 6,0 | 0,5 |
| 7 | 8,0 | 6,5 | −1,5 |
\[ \left\{ \begin{array}{c} H_0: \mu_{ref} = \mu_{gen} \\ H_1: \mu_{gen} < \mu_{ref} \end{array} \right. \]
\[ \bar{d} = \frac{-0{,}5+0+0-1{,}0-1{,}0+0{,}5-1{,}5}{7} = -0{,}5 \]
\[ s_d = \sqrt{\frac{\sum(d_i-\bar{d})^2}{n-1}} \approx 0{,}707 \]
\[ t = \frac{-0{,}5}{0{,}707/\sqrt{7}} \approx -1{,}871 \]
\[ |{-1{,}871}| = 1{,}871 < 1{,}943 \]
✅ Não se rejeita \(H_0\) (p-valor = 0,0553 > 0,05).
Interpretação clínica: não há evidência estatística de que o tempo de alívio da dor seja menor com o medicamento genérico — os dois produtos podem ser considerados equivalentes nesse aspecto.
Definição
Compara as médias de dois grupos independentes (sem qualquer pareamento) para verificar se as populações de origem diferem, em média.
Situação: comparar a variabilidade de sódio (mg/100ml) entre duas marcas de sopa industrializada, 10 amostras cada.
| Marca A | Marca B |
|---|---|
| 860 | 540 |
| 850 | 640 |
| 750 | 600 |
| 870 | 640 |
| 940 | 300 |
| 410 | 610 |
| 410 | 430 |
| 820 | 280 |
| 890 | 300 |
| 890 | 610 |
\[ s_A^2 = \frac{\sum (x_i-\bar{x}_A)^2}{n-1} = 38.254 \\ s_B^2 = \frac{\sum (x_i-\bar{x}_B)^2}{n-1} = 23.117 \]
\[ F = \frac{s_A^2}{s_B^2} = \frac{38.254}{23.117} = 1{,}65 \]
✅ Como \(1{,}65 < 4{,}03\), não se rejeita a hipótese de variâncias iguais → use o teste t homocedástico.
Variância ponderada: \[ s_p^2 = \frac{(n_1-1)s_1^2 + (n_2-1)s_2^2}{n_1+n_2-2} \]
Estatística de teste (com \(n_1+n_2-2\) graus de liberdade): \[ t = \frac{\bar{x}_1 - \bar{x}_2}{\sqrt{s_p^2\left(\frac{1}{n_1}+\frac{1}{n_2}\right)}} \]
\[H_0: \mu_A = \mu_B \qquad H_1: \mu_A \neq \mu_B \qquad \alpha = 0{,}05\]
\[ \bar{x}_A = \frac{\sum x_i}{10} = 769{,}0 \qquad \bar{x}_B = \frac{\sum x_i}{10} = 495{,}0 \]
\[ s_p^2 = \frac{9 \times 38.254 + 9 \times 23.117}{10+10-2} = 30.686 \]
\[ t = \frac{769{,}0 - 495{,}0}{\sqrt{30.686\left(\frac{1}{10}+\frac{1}{10}\right)}} = 3{,}50 \]
\(gl = 10+10-2 = 18\). Valor crítico (\(\alpha=0{,}05\)): \(t = 2{,}101\).
\[ |3{,}50| > 2{,}101 \qquad (\text{p-valor} = 0{,}00257) \]
✅ Rejeita-se \(H_0\) no nível de 5%.
Interpretação clínica/nutricional: a marca A tem, em média, quantidade de sódio significativamente maior que a marca B — relevante para pacientes com restrição de sódio (hipertensos, cardiopatas).
Quando o teste F rejeita a igualdade de variâncias:
\[ t = \frac{\bar{x}_1 - \bar{x}_2}{\sqrt{\dfrac{s_1^2}{n_1}+\dfrac{s_2^2}{n_2}}} \]
Situação: tempo (min) para alívio da dor pós-ortodôntica, dois tratamentos, 5 pacientes cada.
| Anti-inflamatório | Laser |
|---|---|
| 80 | 100 |
| 93 | 103 |
| 83 | 104 |
| 89 | 99 |
| 98 | 102 |
\[ s_{AI}^2 = \frac{\sum(x_i-\bar{x}_{AI})^2}{n-1} = 53{,}3 \qquad s_{L}^2 = \frac{\sum(x_i-\bar{x}_L)^2}{n-1} = 4{,}3 \]
\[ F = \frac{s_{AI}^2}{s_L^2} = \frac{53{,}3}{4{,}3} = 12{,}40 \]
✅ Use o teste t heterocedástico (variâncias diferentes).
\[ \bar{x}_{AI} = \frac{80+93+83+89+98}{5} = 88{,}6 \qquad \bar{x}_L = \frac{100+103+104+99+102}{5} = 101{,}6 \]
\[ t = \frac{88{,}6 - 101{,}6}{\sqrt{\dfrac{53{,}3}{5}+\dfrac{4{,}3}{5}}} \approx -3{,}83 \]
\[ |{-3{,}83}| = 3{,}83 > 2{,}571 \qquad (\text{p-valor} = 0{,}019) \]
✅ Rejeita-se \(H_0\) no nível de 5%.
Interpretação clínica: o tempo para alívio da dor é, em média, significativamente maior no grupo laser — o anti-inflamatório tradicional proporcionou alívio mais rápido nesse ensaio.
| Critério | Dados Pareados | Amostras Independentes |
|---|---|---|
| Estrutura | Mesma unidade (ou par lógico) medida duas vezes | Grupos distintos e não relacionados |
| Exemplo clínico | Antes/depois de um tratamento | Grupo tratado vs. grupo controle |
| Pré-requisito extra | — | Teste F para variâncias |
| Vantagem | Reduz variabilidade individual | Mais simples de delinear |
Figura 3
Pareado: \[t = \frac{\bar{d}}{s_d/\sqrt{n}}\]
Independentes (var. iguais): \[t = \frac{\bar{x}_1-\bar{x}_2}{\sqrt{s_p^2(1/n_1+1/n_2)}}\]
Independentes (var. diferentes): \[t = \frac{\bar{x}_1-\bar{x}_2}{\sqrt{s_1^2/n_1+s_2^2/n_2}}\]
Sempre teste F primeiro para escolher a fórmula correta.
Definição
Ensaio clínico randomizado: designa aleatoriamente intervenções relacionadas à saúde para avaliar seu efeito.
Definição
Estudos observacionais: o pesquisador observa, sem intervir — podem ser prospectivos, retrospectivos ou transversais.
| Variável X | Y1 | Y2 | Total |
|---|---|---|---|
| X1 | \(a\) | \(b\) | \(a+b\) |
| X2 | \(c\) | \(d\) | \(c+d\) |
| Total | \(a+c\) | \(b+d\) | \(n\) |
Situação: efeito da betametasona no alívio da dor após instrumentação endodôntica.
| Grupo | Relato de dor: Sim | Relato de dor: Não | Total |
|---|---|---|---|
| Placebo | 2 | 15 | 17 |
| Betametasona | 12 | 9 | 21 |
| Total | 14 | 24 | 38 |
\[H_0: \text{sem efeito} \qquad H_1: \text{betametasona é efetiva} \qquad \alpha=0{,}05\]
\[ \chi^2 = \frac{n(ad-bc)^2}{(a+b)(c+d)(a+c)(b+d)} = \frac{38\left[(2)(9)-(15)(12)\right]^2}{(17)(21)(14)(24)} = 8{,}31 \]
\(\chi^2_{calc} = 8{,}31 > 3{,}84\) (valor crítico, gl=1, \(\alpha=5\%\)).
✅ Rejeita-se \(H_0\). Interpretação clínica: a betametasona é efetiva no alívio da dor após a instrumentação endodôntica.
\[ \chi^2_{corr} = \frac{38\left(|(2)(9)-(15)(12)|-\dfrac{38}{2}\right)^2}{(17)(21)(14)(24)} = 6{,}48 \]
⚠️ A correção reduz o valor de χ² — pode mudar a conclusão de “significante” para “não significante”. Em caso de conflito, prevaleça o resultado com correção.
Situação: 1.229 gestantes de Campinas (2004–2006), consumo de tabaco vs. baixo peso/prematuridade.
| Fumou na gestação | Baixo peso/Prematuro: Sim | Não | Total |
|---|---|---|---|
| Sim | 44 | 121 | 165 |
| Não | 146 | 918 | 1.064 |
| Total | 190 | 1.039 | 1.229 |
\[ \chi^2_{corr} = \frac{1.229\left(|(44)(918)-(121)(146)|-\dfrac{1.229}{2}\right)^2}{(165)(1.064)(190)(1.039)} = 17{,}34 \]
\(\chi^2_{calc}\) (com correção de continuidade) \(= 17{,}34 > 3{,}84\) → rejeita-se \(H_0\).
✅ Interpretação clínica: o consumo de tabaco durante a gestação tem impacto negativo sobre o peso ao nascer e/ou a prematuridade — reforça a orientação de cessação do tabagismo no pré-natal.
Situação: 142 jovens com distúrbios temporomandibulares (DTM) e 228 sem DTM — uso prévio de aparelho ortodôntico.
| DTM | Usou aparelho: Sim | Não | Total |
|---|---|---|---|
| Sim | 87 | 55 | 142 |
| Não | 113 | 115 | 228 |
| Total | 200 | 170 | 370 |
\[ \chi^2_{corr} = \frac{370\left(|(87)(115)-(55)(113)|-\dfrac{370}{2}\right)^2}{(142)(228)(200)(170)} = 4{,}37 \]
\(\chi^2_{calc}\) (com correção de continuidade) \(= 4{,}37 > 3{,}84\) → rejeita-se \(H_0\).
✅ Interpretação clínica: o uso de aparelho ortodôntico pode aumentar a probabilidade de distúrbios temporomandibulares.
Situação: 1.091 pessoas entrevistadas na Região Sul, classificadas por sexo e tabagismo.
| Sexo | Não fumante | Fumante | Total |
|---|---|---|---|
| Homens | 423 | 177 | 600 |
| Mulheres | 287 | 204 | 491 |
| Total | 710 | 381 | 1.091 |
\[ \chi^2 = \frac{1.091\left[(423)(204)-(177)(287)\right]^2}{(600)(491)(710)(381)} = 17{,}25 \]
\(\chi^2_{calc} = 17{,}25 > 3{,}84\) → rejeita-se a hipótese de independência.
✅ Interpretação clínica: nessa população, o hábito de fumar está significativamente associado ao sexo.
| Delineamento | Medida apropriada |
|---|---|
| Ensaio clínico / Prospectivo | Risco Relativo (RR) |
| Retrospectivo | Razão de Chances (OR) |
| Transversal | Coeficientes φ e γ |
O teste χ² diz se há associação; as medidas abaixo dizem quão forte e em qual direção.
Definição
Risco é a probabilidade de ocorrência de um dano. Risco relativo (RR) é a razão entre duas estimativas de risco.
\[ RR = \frac{\text{Risco no grupo exposto}}{\text{Risco no grupo não exposto}} \]
Retome o exemplo da betametasona: risco de dor com betametasona = 11,8%; risco de dor com placebo = 57,1%.
\[ RR = \frac{0{,}571}{0{,}118} \approx 4{,}84 \]
✅ Interpretação clínica: é cerca de 5 vezes mais provável relatar dor se o paciente não recebeu betametasona.
Definição
Chance (\(w\)) é a razão entre a probabilidade de um evento ocorrer (\(p\)) e a de não ocorrer (\(q\)): \(w = p/q\).
\[ OR = \frac{a \times d}{b \times c} \]
Situação: de 20 amigos em uma festa, 7 passaram mal (casos). Dos casos, 5 comeram peixe; dos 13 que passaram bem (controles), 3 comeram peixe.
| Condição | Caso | Controle |
|---|---|---|
| Exposto (peixe) | 5 | 3 |
| Não exposto | 2 | 10 |
| Total | 7 | 13 |
\[ OR = \frac{a \times d}{b \times c} = \frac{5 \times 10}{3 \times 2} = 8{,}33 \]
✅ Interpretação clínica: a chance de ter passado mal é cerca de 8,3 vezes maior entre quem comeu o prato de peixe — forte indício de que o peixe foi a causa da intoxicação alimentar.
Estudo de Doll & Hill (1950): 649 pacientes com câncer de pulmão e 649 internados por outros motivos.
| Fumante | Câncer de pulmão | Outro motivo |
|---|---|---|
| Sim | 27 | 2 |
| Não | 622 | 647 |
\[ OR = \frac{27 \times 647}{2 \times 622} \approx 14{,}04 \]
✅ A chance de ter câncer de pulmão é cerca de 14 vezes maior entre fumantes.
Definição
Mede o grau de associação entre duas variáveis qualitativas em estudos transversais (o teste χ² só indica significância, não intensidade).
\[ \varphi = \sqrt{\frac{\chi^2}{n}} \qquad (0 \le \varphi \le 1) \]
Retome o exemplo tabagismo × sexo: \(\chi^2 = 17{,}25\) (sem correção), \(n = 1.091\).
\[ \varphi = \sqrt{\frac{17{,}25}{1.091}} \approx 0{,}1257 \]
✅ Interpretação: embora estatisticamente significante (χ² grande), a associação entre tabagismo e sexo é apenas trivial — não é clinicamente relevante para prever o comportamento individual.
Compara a proporção observada com um valor especificado \(\theta\):
Situação: 2.964 recém-nascidos em Campinas, 73 com anomalias. A literatura internacional cita prevalência de 3%.
\[ p = \frac{X}{n} = \frac{73}{2.964} \approx 0{,}0246 \]
\[H_0: P = 0{,}03 \qquad H_1: P \neq 0{,}03 \qquad \alpha=0{,}05\]
\[ z = \frac{p-\theta}{\sqrt{\theta(1-\theta)/n}} = \frac{0{,}0246 - 0{,}03}{\sqrt{0{,}03(0{,}97)/2.964}} \approx -1{,}714 \]
(amostra grande — aproximação sem correção de continuidade)
\(|z| = 1{,}714 < 1{,}96\) (valor crítico, \(\alpha=0{,}05\), teste bilateral)
✅ Não se rejeita \(H_0\). Interpretação clínica: a prevalência de anomalias em recém-nascidos em Campinas é compatível com o valor de referência internacional de 3%.
Figura 4
Teste χ²: \[\chi^2 = \frac{n(ad-bc)^2}{(a+b)(c+d)(a+c)(b+d)}\]
Risco Relativo: \[RR = \frac{\text{risco exposto}}{\text{risco não exposto}}\]
Razão de Chances: \[OR = \frac{ad}{bc}\]
Coeficiente \(\varphi\): \[\varphi = \sqrt{\chi^2/n}\]
| Delineamento | Medida |
|---|---|
| Prospectivo/Ensaio | RR |
| Retrospectivo | OR |
| Transversal | φ, γ |
Erro padrão da média: \[s_{\bar{x}} = \frac{s}{\sqrt{n}}\]
Intervalo de confiança: \[\bar{x} \pm t_\alpha \cdot \frac{s}{\sqrt{n}}\]
Teste t (1 amostra): \[t = \frac{\bar{x}-\mu_0}{s/\sqrt{n}}\]
Teste t (2 grupos independentes): \[t = \frac{\bar{x}_1-\bar{x}_2}{\sqrt{s_p^2(1/n_1+1/n_2)}}\]
Teste χ²: \[\chi^2 = \frac{n(ad-bc)^2}{(a+b)(c+d)(a+c)(b+d)}\]
Odds Ratio: \[OR = \frac{ad}{bc}\]
Toda pesquisa clínica confiável começa em uma amostra bem planejada e termina em uma decisão estatisticamente fundamentada.
t.test(), chisq.test(), var.test(), prop.test() para cálculos automáticos.epitools fornece RR e OR diretamente.Valores críticos de \(t\) para diferentes graus de liberdade (gl) e níveis de significância \(\alpha\) bilateral. Para teste unilateral, use a coluna de \(\alpha\) correspondente ao dobro do nível desejado (ex.: unilateral 5% → coluna 0,10).
| gl | 0,20 | 0,10 | 0,05 | 0,02 | 0,01 |
|---|---|---|---|---|---|
| 1 | 3,078 | 6,314 | 12,706 | 31,821 | 63,657 |
| 2 | 1,886 | 2,920 | 4,303 | 6,965 | 9,925 |
| 3 | 1,638 | 2,353 | 3,182 | 4,541 | 5,841 |
| 4 | 1,533 | 2,132 | 2,776 | 3,747 | 4,604 |
| 5 | 1,476 | 2,015 | 2,571 | 3,365 | 4,032 |
| 6 | 1,440 | 1,943 | 2,447 | 3,143 | 3,707 |
| 7 | 1,415 | 1,895 | 2,365 | 2,998 | 3,499 |
| 8 | 1,397 | 1,860 | 2,306 | 2,896 | 3,355 |
| 9 | 1,383 | 1,833 | 2,262 | 2,821 | 3,250 |
| 10 | 1,372 | 1,812 | 2,228 | 2,764 | 3,169 |
| 11 | 1,363 | 1,796 | 2,201 | 2,718 | 3,106 |
| 12 | 1,356 | 1,782 | 2,179 | 2,681 | 3,055 |
| 13 | 1,350 | 1,771 | 2,160 | 2,650 | 3,012 |
| 14 | 1,345 | 1,761 | 2,145 | 2,624 | 2,977 |
| 15 | 1,341 | 1,753 | 2,131 | 2,602 | 2,947 |
| 16 | 1,337 | 1,746 | 2,120 | 2,583 | 2,921 |
| 17 | 1,333 | 1,740 | 2,110 | 2,567 | 2,898 |
| 18 | 1,330 | 1,734 | 2,101 | 2,552 | 2,878 |
| 19 | 1,328 | 1,729 | 2,093 | 2,539 | 2,861 |
| 20 | 1,325 | 1,725 | 2,086 | 2,528 | 2,845 |
| 21 | 1,323 | 1,721 | 2,080 | 2,518 | 2,831 |
| 22 | 1,321 | 1,717 | 2,074 | 2,508 | 2,819 |
| 23 | 1,319 | 1,714 | 2,069 | 2,500 | 2,807 |
| 24 | 1,318 | 1,711 | 2,064 | 2,492 | 2,797 |
| 25 | 1,316 | 1,708 | 2,060 | 2,485 | 2,787 |
| 26 | 1,315 | 1,706 | 2,056 | 2,479 | 2,779 |
| 27 | 1,314 | 1,703 | 2,052 | 2,473 | 2,771 |
| 28 | 1,313 | 1,701 | 2,048 | 2,467 | 2,763 |
| 29 | 1,311 | 1,699 | 2,045 | 2,462 | 2,756 |
| 30 | 1,310 | 1,697 | 2,042 | 2,457 | 2,750 |
| 40 | 1,303 | 1,684 | 2,021 | 2,423 | 2,704 |
| 60 | 1,296 | 1,671 | 2,000 | 2,390 | 2,660 |
| 120 | 1,289 | 1,658 | 1,980 | 2,358 | 2,617 |
| ∞ | 1,282 | 1,645 | 1,960 | 2,326 | 2,576 |
Valores críticos de \(\chi^2\) para diferentes graus de liberdade (gl) e níveis de significância \(\alpha\).
| gl | 0,10 | 0,05 | 0,025 | 0,01 | 0,005 |
|---|---|---|---|---|---|
| 1 | 2,71 | 3,84 | 5,02 | 6,63 | 7,88 |
| 2 | 4,61 | 5,99 | 7,38 | 9,21 | 10,60 |
| 3 | 6,25 | 7,81 | 9,35 | 11,34 | 12,84 |
| 4 | 7,78 | 9,49 | 11,14 | 13,28 | 14,86 |
| 5 | 9,24 | 11,07 | 12,83 | 15,09 | 16,75 |
| 6 | 10,64 | 12,59 | 14,45 | 16,81 | 18,55 |
| 7 | 12,02 | 14,07 | 16,01 | 18,48 | 20,28 |
| 8 | 13,36 | 15,51 | 17,53 | 20,09 | 21,95 |
| 9 | 14,68 | 16,92 | 19,02 | 21,67 | 23,59 |
| 10 | 15,99 | 18,31 | 20,48 | 23,21 | 25,19 |
| 11 | 17,28 | 19,68 | 21,92 | 24,72 | 26,76 |
| 12 | 18,55 | 21,03 | 23,34 | 26,22 | 28,30 |
| 13 | 19,81 | 22,36 | 24,74 | 27,69 | 29,82 |
| 14 | 21,06 | 23,68 | 26,12 | 29,14 | 31,32 |
| 15 | 22,31 | 25,00 | 27,49 | 30,58 | 32,80 |
| 16 | 23,54 | 26,30 | 28,85 | 32,00 | 34,27 |
| 17 | 24,77 | 27,59 | 30,19 | 33,41 | 35,72 |
| 18 | 25,99 | 28,87 | 31,53 | 34,81 | 37,16 |
| 19 | 27,20 | 30,14 | 32,85 | 36,19 | 38,58 |
| 20 | 28,41 | 31,41 | 34,17 | 37,57 | 40,00 |
| 25 | 34,38 | 37,65 | 40,65 | 44,31 | 46,93 |
| 30 | 40,26 | 43,77 | 46,98 | 50,89 | 53,67 |
| 40 | 51,81 | 55,76 | 59,34 | 63,69 | 66,77 |
| 50 | 63,17 | 67,50 | 71,42 | 76,15 | 79,49 |
| 60 | 74,40 | 79,08 | 83,30 | 88,38 | 91,95 |
Valores críticos de \(F\) para teste bilateral de igualdade de variâncias com \(\alpha_{total} = 0{,}05\) (ou seja, \(\alpha/2 = 0{,}025\) em cada tabela unilateral). Linhas: graus de liberdade do denominador; colunas: graus de liberdade do numerador.
| gl denom. gl numer. | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
|---|---|---|---|---|---|---|---|---|---|---|
| 4 | 12,22 | 10,65 | 9,98 | 9,60 | 9,36 | 9,20 | 9,07 | 8,98 | 8,90 | 8,84 |
| 5 | 10,01 | 8,43 | 7,76 | 7,39 | 7,15 | 6,98 | 6,85 | 6,76 | 6,68 | 6,62 |
| 6 | 8,81 | 7,26 | 6,60 | 6,23 | 5,99 | 5,82 | 5,70 | 5,60 | 5,52 | 5,46 |
| 7 | 8,07 | 6,54 | 5,89 | 5,52 | 5,29 | 5,12 | 4,99 | 4,90 | 4,82 | 4,76 |
| 8 | 7,57 | 6,06 | 5,42 | 5,05 | 4,82 | 4,65 | 4,53 | 4,43 | 4,36 | 4,30 |
| 9 | 7,21 | 5,71 | 5,08 | 4,72 | 4,48 | 4,32 | 4,20 | 4,10 | 4,03 | 3,96 |
| 10 | 6,94 | 5,46 | 4,83 | 4,47 | 4,24 | 4,07 | 3,95 | 3,85 | 3,78 | 3,72 |
| 12 | 6,55 | 5,10 | 4,47 | 4,12 | 3,89 | 3,73 | 3,61 | 3,51 | 3,44 | 3,37 |
| 15 | 6,20 | 4,77 | 4,15 | 3,80 | 3,58 | 3,41 | 3,29 | 3,20 | 3,12 | 3,06 |
| 20 | 5,87 | 4,46 | 3,86 | 3,51 | 3,29 | 3,13 | 3,01 | 2,91 | 2,84 | 2,77 |
Valores de \(z_{\alpha/2}\) para os níveis de confiança mais utilizados em Bioestatística — usados diretamente no cálculo de tamanho de amostra e em testes com amostras grandes.
| Nível de confiança | α (bilateral) | z crítico |
|---|---|---|
| 80% | 0,200 | 1,282 |
| 85% | 0,150 | 1,440 |
| 90% | 0,100 | 1,645 |
| 95% | 0,050 | 1,960 |
| 98% | 0,020 | 2,326 |
| 99% | 0,010 | 2,576 |
| 99,5% | 0,005 | 2,807 |
Para \(n\) grande (tipicamente \(n \ge 30\)), a distribuição t converge para a distribuição normal padrão — compare a última linha da tabela t (\(gl=\infty\)) com esta tabela.
VIEIRA, Sonia. Introdução à Bioestatística. 6. ed. Rio de Janeiro: Guanabara Koogan, 2021.
Capítulos utilizados:
Bioestatística – UFPB