Bioestatística

Amostragem, Intervalos de Confiança e Testes de Hipóteses

Prof. Marcelo R.P. Ferreira

Departamento de Estatística – UFPB

julho, 2026

Agenda da Apresentação

Bloco 1: Noções sobre Amostragem — como escolher quem estudar
Bloco 2: Intervalo de Confiança — estimando parâmetros com margem de erro
Bloco 3: Teste t para uma Amostra — comparando com um valor de referência
Bloco 4: Teste t para Comparação de Médias — comparando dois grupos
Bloco 5: Teste χ² para Variáveis Qualitativas — associação entre categorias
Síntese: Integrando o percurso da amostra até a decisão clínica

Por que estes temas importam na saúde?

Toda pesquisa clínica trabalha com amostras, nunca com a população inteira de pacientes.
Um ensaio clínico só é confiável se a amostra foi bem selecionada e o tamanho foi adequado.
Resultados de laboratório, escores de dor, tempos de resposta a um tratamento — tudo isso varia de amostra para amostra.
Sem intervalos de confiança e testes de hipóteses, não é possível saber se uma diferença observada é real ou apenas fruto do acaso.

Bloco 1 — Noções sobre Amostragem

Por que Estudar Amostragem?

Imagine medir o peso e a altura de 100 crianças de 7 anos para descrever todas as crianças dessa idade em uma região.
Isso só é possível porque existe um conjunto de técnicas que permite, a partir de uma amostra, fazer inferência sobre a população.
Este bloco trata de como essa amostra deve ser obtida.

A qualidade de toda conclusão estatística começa na forma como a amostra foi selecionada.

População e Amostra

Definição

População ou universo é o conjunto de unidades sobre o qual desejamos informação.

Definição

Amostra é todo subconjunto de unidades retiradas da população para obter a informação desejada.

População não se restringe a pessoas: pode ser radiografias de um curso de Radiologia, prontuários de um hospital, certidões de óbito de uma cidade etc.

População-Alvo vs. População Configurada

Exemplo: um instituto quer saber a proporção de moradores de uma cidade favoráveis à instalação de ciclovias.
A população-alvo é todo morador da cidade.
Mas nem todos estarão disponíveis: hospitalizados, cuidando de alguém, crianças pequenas, quem não aceita responder, etc.

A população configurada para amostragem é necessariamente menor do que a população-alvo.

Parâmetros e Estatísticas

Definição

Parâmetro é um valor numérico que descreve uma característica da população. Não varia — é um valor fixo.

Definição

Estatística é um valor numérico que descreve uma característica de uma amostra, usado para estimar o parâmetro correspondente.

Diferentes amostras da mesma população geram diferentes estatísticas — mas todas variam em torno do parâmetro verdadeiro.

Erro de Amostragem

Definição

Erro de amostragem é a diferença entre a estatística de uma amostra e o parâmetro (desconhecido) da população.

Esse erro é inevitável — mesmo em amostras bem planejadas.
O que a Bioestatística oferece são ferramentas para quantificar esse erro, não para eliminá-lo.

A seguir: por que, então, usar amostras em vez de estudar toda a população?

Razões para o Uso de Amostras

Técnicas de Amostragem — Visão Geral

Amostra Casual Simples

Definição

Numere cada unidade da população e, depois, selecione ao acaso os números que formarão a amostra (gerador de números aleatórios).

Também chamada amostra aleatória simples.
Sorteio de papéis ou bolas ainda é usado, mas deve ser evitado — nem sempre estão bem misturados.

Exemplo: Amostra Casual Simples — Resolução

Situação: Um dentista quer amostrar 2% dos 500 pacientes de sua clínica para entrevistá-los sobre a qualidade do atendimento.

Tamanho da amostra: $2\% \times 500 = 10$ pacientes.
Procedimento: escrever os nomes em papéis, misturar bem e sortear 10.

✅ Interpretação: o sorteio garante que cada paciente tem a mesma chance de compor a amostra, evitando viés na seleção.

Amostra Casual Estratificada

Definição

Se a população está dividida em grupos naturais (estratos), retira-se de cada estrato uma amostra casual simples proporcional ao seu tamanho.

Só a amostra estratificada garante representação de todos os estratos (categorias) da população.

Exemplo: Amostra Estratificada — Resolução

Situação: o mesmo dentista supõe que homens são mais bem atendidos que mulheres. Aproximadamente 3/5 dos 500 pacientes são mulheres.

Amostra total: 10 pacientes.
Estrato “mulheres” ($3/5$): $6$ pacientes.
Estrato “homens” ($2/5$): $4$ pacientes.

✅ Interpretação: separando homens e mulheres antes de sortear, o dentista garante que ambos os grupos estarão representados na amostra final.

Amostra Sistemática

Definição

Unidades retiradas seguindo um sistema preestabelecido (a cada $k$-ésima unidade), a partir de um ponto de partida sorteado.

Exige que as unidades estejam organizadas: filas, prontuários em ordem alfabética, casas em uma rua etc.

Exemplo: Amostra Sistemática — Resolução

Situação: o dentista quer 2% de 500 pacientes usando amostragem sistemática.

Passo 1 — Calcule o intervalo: $500 / 10 = 50$.
Passo 2 — Sorteie um número entre 1 e 50. Suponha que saiu 27.
Passo 3 — A partir do prontuário 27, conte de 50 em 50: $27, 77, 127, \dots$

✅ Interpretação: não é preciso ter a lista completa sorteável — basta que os prontuários estejam organizados sequencialmente.

Amostra por Conglomerados

Definição

Conglomerados são grupos que já existem na população (um hospital, uma escola). Sorteia-se um ou mais conglomerados inteiros.

Não confunda com amostra estratificada:

Estratos	Conglomerados
Criados pelo pesquisador	Já existem na população
Diferentes entre si	Similares entre si
Amostra-se dentro de cada um	Usa-se todos os membros do sorteado

Exemplo: Amostra por Conglomerados — Resolução

Situação: um professor de Educação Física quer estudar o efeito da reposição hormonal sobre o desempenho em exercícios de mulheres na pós-menopausa.

Sorteia duas academias (conglomerados) da cidade.
Avalia todas as mulheres que as frequentam.

✅ Interpretação: o acesso a poucos conglomerados substitui o acesso a toda a cidade — mais viável na prática clínica e de campo.

Amostra por Quotas

Definição

Divide-se a população heterogênea em quotas (como estratos), mas as unidades são amostradas por facilidade de acesso, sem sorteio.

Vantagem: barata. Muito usada em pesquisas de opinião e de mercado.
Diferença crucial: quota não é aleatória; estrato é.

Exemplo: Amostra por Quotas — Resolução

Situação: pesquisa de opinião sobre serviços públicos de saúde em uma metrópole.

Entrevistadores recebem quotas: ex. “30 homens com mais de 50 anos, renda entre 6 e 10 salários mínimos”.
O entrevistador julga pela aparência quem se encaixa e aborda a pessoa.

✅ Interpretação: o procedimento reproduz a proporção populacional (sexo, idade, renda) sem exigir lista completa de nomes.

Amostra de Conveniência

Definição

Constituída por unidades reunidas simplesmente porque o pesquisador tem fácil acesso a elas — sem qualquer procedimento aleatório.

Exemplo: um nutricionista que trabalha em uma escola entrevista as mães das crianças matriculadas ali para estudar hábitos alimentares infantis.

⚠️ A amostra obtida pode não ter representatividade da população mais ampla.

Avaliação das Técnicas de Amostragem

Amostras aleatórias exigem listagem completa da população — nem sempre viável.
Amostra sistemática não exige lista, mas exige organização (filas, arquivos).
Conglomerados exigem livre acesso — nem sempre concedido por instituições.
Quotas exigem apenas conhecimento da proporção populacional.
Amostras probabilísticas são preferíveis, mas em saúde o pesquisador trabalha, muitas vezes, com quem tem acesso (critérios de elegibilidade em ensaios clínicos).

Noções sobre o Tamanho das Amostras

Pergunta: em uma cidade há dois hospitais — um com 120 nascimentos/dia, outro com 12. Em qual é mais provável nascerem, em um dia, o dobro de meninos do que meninas?

✅ É mais provável no hospital menor — amostras pequenas se afastam mais facilmente do valor verdadeiro.

A qualidade de uma estimativa depende do tamanho da amostra, não do tamanho da população (desde que a população seja muito maior).
Amostra grande demais → desperdício de recursos. Amostra pequena demais → resultado pouco útil.

Cálculo do Tamanho da Amostra — Amostragem Aleatória Simples

Antes de coletar os dados, o pesquisador deve planejar quantas unidades amostrar, dada a margem de erro ($E$) que está disposto a aceitar e o nível de confiança desejado.

Para estimar uma média: \[ n = \left(\frac{z_{\alpha/2}\,\sigma}{E}\right)^2 \]

Para estimar uma proporção: \[ n = \frac{z_{\alpha/2}^2\; p(1-p)}{E^2} \]

$\sigma$ (ou $p$) geralmente é desconhecido antes da coleta — usa-se um estudo piloto, a literatura, ou, para proporções, o cenário mais conservador $p=0{,}5$ (maximiza o produto $p(1-p)$).
Correção para população finita: $\qquad n = \frac{n_0}{1+\dfrac{n_0-1}{N}}$

Exemplo: Tamanho da Amostra na Prática Clínica

Estimando uma média

Margem de erro desejada: $E=3$ mmHg de pressão sistólica, 95% de confiança ($z=1{,}96$). Estudo piloto indica $\sigma = 15$ mmHg.

\[ n = \left(\frac{1{,}96 \times 15}{3}\right)^2 \approx 96{,}0 \]

✅ Amostrar 97 pacientes (arredonda-se sempre para cima).

Estimando uma proporção

Margem de erro desejada: $E=4$ pontos percentuais, 95% de confiança. Sem estimativa prévia de $p$ → usa-se $p=0{,}5$.

\[ n = \frac{(1{,}96)^2 \times 0{,}5 \times 0{,}5}{(0{,}04)^2} \approx 600{,}25 \]

✅ Amostrar 601 indivíduos.

Quanto menor a margem de erro exigida, maior o tamanho de amostra necessário — a precisão tem um custo.

Representatividade e Tendência

Definição

Tendência (viés) é a diferença entre a estimativa obtida na amostra e o parâmetro que se quer estimar.

Amostra grande não garante representatividade.
É preciso bom senso: como a amostra foi tomada? Há fatores que induzem viés?

Exemplo: Amostra Tendenciosa

Caso histórico (Shere Hite, 1988): questionário sobre sexualidade feminina inserido em revistas americanas.

Cerca de 100.000 mulheres tiveram contato com o questionário.
Apenas 4.500 responderam (amostra grande, mas de voluntárias).
O comportamento de quem se voluntaria a responder é diferente do de quem não responde.

✅ Interpretação: tamanho de amostra grande não elimina viés de seleção — respondentes voluntários tendem a ter opiniões mais polarizadas.

Resumo do Bloco 1

Técnica	Aleatória?	Exige lista completa?	Uso típico em saúde
Casual simples	Sim	Sim	Sorteio de prontuários
Casual estratificada	Sim	Sim (por estrato)	Garantir subgrupos (sexo, idade)
Sistemática	Parcial	Não (só organização)	Prontuários em arquivo
Conglomerados	Parcial	Não	Hospitais, escolas, academias
Quotas	Não	Não	Pesquisas de opinião em saúde pública
Conveniência	Não	Não	Pacientes de uma clínica específica

Do Planejamento Amostral à Estimação

Até aqui, vimos como obter uma boa amostra.
Mas, tendo a amostra, como usá-la para estimar características da população, com uma margem de erro conhecida?

Próximo Bloco: Intervalo de Confiança

Bloco 2 — Intervalo de Confiança

Da Amostra à Estimativa Populacional

Um pesquisador quer estimar a média de idade com que crianças começam a falar.
Ele tem apenas uma amostra — mas quer generalizar o resultado para toda a população.
É legítimo fazer isso? Sim, desde que sigamos regras estatísticas rígidas.

Neste bloco: como fornecer não apenas uma média, mas um intervalo com alta probabilidade de conter a média populacional.

Estimativa por Ponto

Definição

Estimativa por ponto é o uso de um único número (a média da amostra) para descrever toda a amostra.

Exemplo 1: a média de altura de uma amostra aleatória de 100 alunos do sexo masculino com 18 anos foi de 175 cm.

✅ Essa é uma estimativa por ponto da média populacional — mas não informa quanta confiança depositar nela.

Variabilidade das Médias Amostrais — Parte 1

Situação: um professor tem quatro alunos com notas 1, 6, 8 e 9. Sorteará dois para apresentar um trabalho.

Média da “população” de 4 alunos: $\bar{x} = \dfrac{1+6+8+9}{4} = 6$.
Quantas amostras diferentes de 2 alunos existem? $\binom{4}{2}=6$ amostras.

Variabilidade das Médias Amostrais — Parte 2

Amostra	Média
1 e 6	3,5
1 e 8	4,5
1 e 9	5,0
6 e 8	7,0
6 e 9	7,5
8 e 9	8,5

✅ Interpretação: as médias amostrais variam de 3,5 a 8,5, mas a média das médias é exatamente 6 — igual à média da população.

Erro Padrão da Média

Definição

Erro padrão da média ($s_{\bar{x}}$) é a raiz quadrada positiva da variância da média — mede a variabilidade das médias que se obteria repetindo a amostragem.

\[ s_{\bar{x}} = \frac{s}{\sqrt{n}} \]

$s$ é o desvio-padrão da amostra; $n$ é o tamanho da amostra.
Quanto maior a amostra, menor o erro padrão da média.

Exemplo: Cálculo do Erro Padrão

Retome o exemplo da altura: média = 175 cm, desvio-padrão $s = 10$ cm, $n = 100$.

\[ s_{\bar{x}} = \frac{s}{\sqrt{n}} = \frac{10}{\sqrt{100}} = \frac{10}{10} = 1 \text{ cm} \]

✅ Interpretação: se repetíssemos essa amostragem muitas vezes, as médias obtidas variariam, em média, apenas 1 cm em torno da verdadeira média populacional.

A Distribuição t de Student

Para amostras pequenas (variável com distribuição normal, mas desvio-padrão populacional desconhecido), a distribuição normal não é adequada.
Usa-se a distribuição t, mais “espalhada” nas caudas — reflete a incerteza extra de estimar o desvio-padrão a partir de amostra pequena.

Figura 1

Margem de Erro

Definição

Margem de erro é a diferença máxima esperada entre o parâmetro e sua estimativa, associada a um nível de confiança.

\[ \text{Margem de erro} = t_\alpha \times s_{\bar{x}} = t_\alpha \times \frac{s}{\sqrt{n}} \]

$t_\alpha$ é obtido na Tabela de valores de t, com $n-1$ graus de liberdade.

A Tabela de Valores de t — Como Usar

Passos:

Calcule os graus de liberdade: $gl = n - 1$.
Escolha o nível de confiança (ex.: 95%) → nível de significância $\alpha = 1 - 0{,}95 = 0{,}05$.
Cruze a linha $gl$ com a coluna $\alpha$ na tabela.

gl	α = 0,01	α = 0,05	α = 0,10
13	3,01	2,16	1,77
14	2,98	2,14	1,76
15	2,95	2,13	1,75

Exemplo: Margem de Erro — Parte 1

Situação: medida de perímetro torácico em uma amostra de $n = 15$ soldados. Média = 42, desvio-padrão $s = 2$. Calcule a margem de erro com 95% de confiança.

Graus de liberdade: $gl = 15 - 1 = 14$.
Na tabela, com $gl=14$ e $\alpha=0{,}05$: $t = 2{,}14$.
Erro padrão da média: \[ s_{\bar{x}} = \frac{2}{\sqrt{15}} = 0{,}516 \]

Exemplo: Margem de Erro — Resolução

\[ \text{Margem de erro} = 2{,}14 \times 0{,}516 = 1{,}10 \]

✅ Interpretação: com 95% de confiança, o verdadeiro perímetro torácico médio populacional está a, no máximo, 1,10 unidade de distância da média amostral (42).

Intervalo de Confiança para uma Média

\[ \bar{x} - t_\alpha \cdot \frac{s}{\sqrt{n}} \;<\; \mu \;<\; \bar{x} + t_\alpha \cdot \frac{s}{\sqrt{n}} \]

$\bar{x}$: média da amostra
$s$: desvio-padrão da amostra
$n$: tamanho da amostra
Interpretação: se tomássemos muitas amostras e calculássemos o IC de cada uma, 95% desses intervalos conteriam $\mu$.

Exemplo: Cálculo do IC — Parte 1

Retome: altura média de 100 alunos = 175 cm, $s = 10$ cm, $s_{\bar{x}} = 1$ cm.

Graus de liberdade: $n - 1 = 99$ (aproxime $t \approx 2{,}00$).
Margem de erro: $2{,}00 \times 1 = 2{,}00$.

Exemplo: Cálculo do IC — Resolução

\[ 175 - 2{,}00 < \mu < 175 + 2{,}00 \]

\[ 173 < \mu < 177 \]

✅ Interpretação clínica: estamos 95% confiantes de que a altura média verdadeira dos universitários dessa faixa etária está entre 173 cm e 177 cm.

Exemplo: IC — Pressão Diastólica — Parte 1

Situação: amostra de 30 homens sadios (30–48 anos), não fumantes, com atividade física regular. Pressão diastólica média = 80 mmHg, $s = 7{,}1$ mmHg.

$gl = 30 - 1 = 29$. Na Tabela A6, com $\alpha = 0{,}05$: $t = 2{,}045$.
Erro padrão da média: \[ s_{\bar{x}} = \frac{7{,}1}{\sqrt{30}} = 1{,}296 \]

Exemplo: IC — Pressão Diastólica — Resolução

\[ 80 \pm 2{,}045 \times 1{,}296 = 80 \pm 2{,}65 \]

\[ 77{,}3 \le \mu \le 82{,}7 \]

✅ Interpretação clínica: a pressão diastólica média verdadeira, em repouso, de homens sadios de 30–48 anos, não fumantes e fisicamente ativos, está, com 95% de confiança, entre 77,3 e 82,7 mmHg.

Outras Maneiras de Estabelecer Intervalos

$\bar{x} \pm s$: não é intervalo de confiança — refere-se à variabilidade dos dados, contendo cerca de 2/3 deles se a amostra for grande.
$\bar{x} \pm 2s_{\bar{x}}$: aproxima um IC de 95%, mas só é válido para amostras grandes.
Revistas científicas exigem que se especifique claramente o que compõe o intervalo relatado.

Cuidados na Interpretação dos Intervalos de Confiança

O pesquisador tem uma única amostra e não sabe se o parâmetro está ou não contido no IC calculado.
Correto: “há 95% de probabilidade de que intervalos calculados dessa forma contenham μ”.
Errado: dizer que “este intervalo específico tem 95% de chance de conter μ” — ele contém ou não contém, ponto final.
Amostra maior → menor margem de erro, mas isso não muda a probabilidade de conter o parâmetro.

Visualizando a Cobertura do Intervalo de Confiança

Figura 2

Por que os Intervalos de Confiança Importam na Saúde

Um IC informa não apenas o quê foi encontrado, mas quão incerta é essa estimativa.
Dois estudos podem relatar a mesma média, mas ICs de larguras muito diferentes indicam confiabilidades diferentes.
Órgãos reguladores e revistas científicas exigem ICs, não apenas a média pontual, para decisões clínicas responsáveis.

Resumo do Bloco 2

Erro Padrão da Média: \[s_{\bar{x}} = \frac{s}{\sqrt{n}}\]

Margem de Erro: \[t_\alpha \times s_{\bar{x}}\]

Intervalo de Confiança: \[\bar{x} \pm t_\alpha \cdot \frac{s}{\sqrt{n}}\]

Regra: quanto maior $n$, menor a margem de erro.

Da Estimação à Decisão

Até aqui, estimamos um intervalo plausível para $\mu$.
E se quisermos decidir se a média populacional é igual (ou diferente) de um valor de referência específico?

Próximo Bloco: Teste t para uma Amostra

Bloco 3 — Teste t para uma Amostra

Tomada de Decisão em Condições de Incerteza

Você compra um carro: faz ou não o seguro contra roubo?
Seja qual for a decisão, você pode acertar ou errar — só saberá depois.
Um pesquisador não pode decidir por intuição. Precisa de um teste estatístico que quantifique a probabilidade de erro.

O Teste Estatístico — Motivação

Exemplo A: a OMS recomenda 15% para a taxa de parto cesáreo. Uma maternidade afirma manter essa taxa. Como confirmar objetivamente, com base em uma amostra de prontuários?

Exemplo B: um dentifrício deve conter determinada quantidade de flúor especificada na embalagem. Como verificar, com base em uma amostra de tubos, se a média realmente corresponde ao especificado?

✅ Ambos os casos exigem comparar uma média (ou proporção) amostral com um valor de referência — usando um teste t para uma amostra.

Passos do Teste Estatístico

Construir as hipóteses.
Especificar o nível de significância.
Calcular o valor do teste.
Interpretar o resultado.

Vamos detalhar cada passo usando um exemplo motivador: meninos de 7 anos no Sul do Brasil pesam, em média, 25 kg (segundo a literatura)?

Construção das Hipóteses

Definição

Hipótese da nulidade ($H_0$): afirma que não há diferença — a média populacional é igual ao valor especificado.

Hipótese alternativa ($H_1$): contradiz $H_0$.

\[ H_0: \mu = 25 \text{ kg} \qquad H_1: \mu \neq 25 \text{ kg} \]

⚠️ As hipóteses são sempre sobre parâmetros populacionais, nunca sobre a amostra observada.

Testes Bilaterais

Definição

No teste bilateral, a hipótese alternativa afirma apenas que a média é diferente do valor especificado — pode ser maior ou menor.

Exemplo: analgésicos tradicionais aliviam a cefaleia em 30 minutos. Testa-se um novo fármaco com 10 voluntários.

\[ H_0: \mu = 30 \text{ min} \qquad H_1: \mu \neq 30 \text{ min} \]

Testes Unilaterais

Definição

No teste unilateral, a hipótese alternativa afirma que a média é maior (ou menor) que o valor especificado — uma direção específica.

Exemplo: a OMS informa peso médio ao nascer de 3,400 kg em países desenvolvidos. Pesquisadoras suspeitam que filhos de mães usuárias de maconha durante a gestação nascem com peso menor.

\[ H_0: \mu = 3{,}400 \text{ kg} \qquad H_1: \mu < 3{,}400 \text{ kg} \]

Erro Tipo I e Erro Tipo II

Exemplo: Identificação dos Erros

Retome o exemplo da maconha e peso ao nascer ($H_0: \mu = 3{,}400$ kg; $H_1: \mu < 3{,}400$ kg).

Erro Tipo I: concluir que o peso médio é menor do que o da OMS, quando, na verdade, não é — rejeitar $H_0$ sendo ela verdadeira.
Erro Tipo II: concluir que o peso médio é igual ao da OMS, quando, na verdade, é menor — não rejeitar $H_0$ sendo ela falsa.

Caso Real: Erro Tipo I na Prática

Caso Surgisphere (2020): alegou dados de 14.888 pacientes em 671 hospitais para testar a eficácia da hidroxicloroquina/cloroquina contra Covid-19.

$H_0$: eficácia é zero. Os pesquisadores rejeitaram $H_0$.
Outros cientistas pediram os dados brutos para reanálise — os dados não foram encontrados.
O artigo foi retirado de publicação (retraction).

⚠️ Lição: um resultado estatisticamente “significante” só é confiável se os dados e o delineamento forem confiáveis.

Nível de Significância

Definição

Nível de significância ($\alpha$) é a probabilidade de cometer erro tipo I — rejeitar $H_0$ quando ela é verdadeira.

\[ \alpha = 1 - \text{nível de confiança} \]

Valores usuais: $\alpha = 0{,}10$; $0{,}05$; $0{,}01$.
Pesquisadores preferem minimizar o erro tipo I: dizer que um tratamento funciona quando não funciona é considerado mais grave.

Exemplo: Nível de Significância

Retome o exemplo da maconha: no nível $\alpha = 0{,}05$, o teste t resultou significante.

✅ Conclusão do estudo: o uso contínuo de maconha durante a gestação está associado a menor peso ao nascer ($\alpha = 5\%$).

Se $\alpha = 0{,}05$: resultado significante.
Se $\alpha = 0{,}01$: resultado altamente significante.

O Teste t para uma Amostra — Procedimento

Estabeleça as hipóteses: $H_0: \mu = \mu_0$; $H_1: \mu \neq \mu_0$.
Estabeleça o nível de significância $\alpha$.
Calcule a média $\bar{x}$ e a variância $s^2$ da amostra.
Calcule: \[t = \dfrac{\bar{x} - \mu_0}{s/\sqrt{n}}\]
Compare $|t|$ calculado com o valor crítico ($n-1$ gl, nível $\alpha$).
Rejeite $H_0$ se $|t|$ calculado $\ge$ valor crítico.

Exemplo: Teste t — Parte 1

Situação: o tempo médio de sono de idosos internados em casas de repouso é de 6h08min (= 6,13 h). Uma amostra de 4 idosos de outro pavilhão forneceu: 5; 4; 6; 5 horas.

Hipóteses: \[H_0: \mu = 6{,}13 \text{ h} \qquad H_1: \mu \neq 6{,}13 \text{ h}\]
Nível de significância: $\alpha = 0{,}10$.

Exemplo: Teste t — Parte 2

Dados da amostra: $5;\ 4;\ 6;\ 5$ horas.

\[ \bar{x} = \frac{5+4+6+5}{4} = 5{,}0 \text{ h} \]

\[ s^2 = \frac{\sum(x_i-\bar{x})^2}{n-1} = \frac{(0)^2+(-1)^2+(1)^2+(0)^2}{3} = 0{,}667 \]

Média: $\bar{x} = 5{,}0$ h
Variância: $s^2 = 0{,}667$; Desvio-padrão: $s = 0{,}816$ h

Exemplo: Teste t — Parte 3

\[ \mu_0 = 6\text{h}08\text{min} = 6 + \frac{8}{60} = 6{,}13 \text{ h} \]

\[ t = \frac{5{,}0 - 6{,}13}{0{,}816/\sqrt{4}} = \frac{-1{,}13}{0{,}408} = -2{,}77 \]

Graus de liberdade: $n - 1 = 3$. Valor crítico (bilateral, $\alpha=0{,}10$, gl=3): $t = 2{,}533$.

Exemplo: Teste t — Resolução e Interpretação

\[ |{-2{,}77}| = 2{,}77 > 2{,}533 \]

✅ Rejeita-se $H_0$ no nível de 10% de significância.

Interpretação clínica: os idosos amostrados nesse pavilhão dormem, em média, tempo diferente (menor) do que os 6h08min típicos de outras instituições — merece investigação (conforto, rotina, medicação).

O p-valor

Definição

O p-valor diz o quão provável seria obter uma amostra como a que foi observada, se $H_0$ fosse verdadeira.

$p < 0{,}05$: resultado significante.
$p < 0{,}01$: resultado altamente significante.
Softwares estatísticos calculam o p-valor automaticamente — não é preciso fixar $\alpha$ a priori.

Exemplo: Interpretação do p-valor

Exemplo de saída de um software para o exemplo do sono:

n	Média	DP	EP média	IC 95%	t	p-valor
4	5,0	0,816	0,408	(3,70; 6,30)	−2,77	0,070

✅ Interpretação: sob $H_0$, a probabilidade de obter uma amostra como essa é de 7%. Como $0{,}070 < 0{,}10$ (o $\alpha$ adotado), rejeita-se $H_0$.

Fluxograma da Tomada de Decisão

Segundo Exemplo Completo: Teste t Unilateral — Parte 1

Situação: requisição de 8 ratos Wistar com peso médio de 70 g. Pesos recebidos: 76; 81; 50; 47; 63; 65; 63; 64. O pesquisador suspeita que a média seja menor.

Hipóteses: \[H_0: \mu = 70 \text{ g} \qquad H_1: \mu < 70 \text{ g}\]
Nível de significância: $\alpha = 0{,}05$.

Segundo Exemplo — Parte 2

\[ \bar{x} = \frac{76+81+50+47+63+65+63+64}{8} = 63{,}6 \text{ g} \]

\[ s = \sqrt{\frac{\sum(x_i-\bar{x})^2}{n-1}} = 11{,}5 \text{ g} \]

\[ t = \frac{63{,}6 - 70}{11{,}5/\sqrt{8}} \approx -1{,}57 \]

Segundo Exemplo — Resolução e Interpretação

Teste unilateral, $gl = 7$, $\alpha = 0{,}05$: valor crítico $t = 1{,}895$.
$|{-1{,}57}| = 1{,}57 < 1{,}895$

✅ Não se rejeita $H_0$.

Como redigir no trabalho: não se encontrou evidência de que os oito ratos machos da raça Wistar com 30 dias (média = 63,6 g; DP = 11,5 g) tinham peso médio diferente do especificado (70 g).

Resumo do Bloco 3

Hipóteses: \[H_0: \mu = \mu_0 \qquad H_1: \mu \neq \mu_0 \text{ (ou } < \text{ / } > \text{)}\]

Estatística de teste: \[t = \frac{\bar{x}-\mu_0}{s/\sqrt{n}}\]

Regra de decisão:

$|t_{calc}| \ge t_{crítico}$ → rejeita $H_0$
$p < \alpha$ → rejeita $H_0$

De uma Amostra para Duas

Até aqui, comparamos uma amostra com um valor de referência fixo.
Mas, muitas vezes, o interesse é comparar dois grupos — tratamento vs. controle, antes vs. depois.

Próximo Bloco: Teste t para Comparação de Médias

Bloco 4 — Teste t para Comparação de Médias

Comparando Dois Grupos

Um psicólogo quer saber se o nível de ansiedade de meninos difere do de meninas no primeiro dia de aula.
Um ortodontista quer comparar o tempo de alívio da dor entre anti-inflamatório e laser.
Duas situações distintas exigem abordagens diferentes: dados pareados e amostras independentes.

Dados Pareados — Definição e Situações

Definição

Dados são pareados quando cada observação de um grupo tem uma contraparte lógica no outro grupo.

Medir a mesma variável nas mesmas unidades, antes e depois de uma intervenção.
Recrutar participantes aos pares (idade, sexo, estágio da doença) e sortear o tratamento dentro de cada par.
Medir a mesma variável em gêmeos ou outro tipo de par (mãe e filho).

Procedimento do Teste t para Dados Pareados

Hipóteses: $H_0$: a média das diferenças é zero; $H_1$: é diferente de zero.
Escolha o nível de significância $\alpha$.
Calcule as diferenças: $d = x_2 - x_1$.
Calcule a média $\bar{d}$ e a variância $s_d^2$ das diferenças.
Calcule: \[t = \frac{\bar{d}}{s_d/\sqrt{n}}\]
Compare com o valor crítico ($n-1$ gl) e decida.

Exemplo: Antitussígenos — Parte 1

Situação: comparar dois antitussígenos (A e B) quanto ao tempo de sono, em 9 voluntários (cada um testou ambos, em noites diferentes). $\alpha = 0{,}05$.

Voluntário	A	B	Diferença ($A-B$)
1	7	9	−2
2	7	7	0
3	6	6	0
4	6	8	−2
5	9	10	−1
6	6	8	−2
7	7	7	0
8	8	8	0
9	5	7	−2

\[ \left\{ \begin{array}{c} H_0: \bar{d} = 0 \\ H_1: \bar{d} \neq 0 \end{array} \right. \]

Exemplo: Antitussígenos — Parte 2

\[ \bar{d} = \frac{-2+0+0-2-1-2+0+0-2}{9} = -1{,}0 \]

Média das diferenças: $\bar{d} = -1{,}0$

Exemplo: Antitussígenos — Parte 3

\[ s_d = \sqrt{\frac{\sum(d_i-\bar{d})^2}{n-1}} = 1{,}0 \]

\[ t = \frac{-1{,}0}{1{,}0/\sqrt{9}} = -3{,}00 \]

Graus de liberdade: $8$. Valor crítico ($\alpha=0{,}05$, gl=8): $2{,}306$.

Exemplo: Antitussígenos — Resolução

\[ |{-3{,}00}| = 3{,}00 > 2{,}306 \]

✅ Rejeita-se $H_0$ no nível de 5% de significância (p-valor = 0,0171).

Interpretação clínica: os dois antitussígenos não produzem, em média, o mesmo tempo de sono. O antitussígeno B (média 7,78h) proporcionou tempo de sono maior do que A (média 6,78h).

Teste t Pareado Unilateral — Exemplo Genérico vs. Referência

Situação: comparar tempo de alívio da dor (enxaqueca) entre medicamento de referência e genérico, em 7 voluntários. $ 05$.

Voluntário	Referência	Genérico	Diferença (Gen. − Ref.)
1	4,5	4,0	−0,5
2	5,5	5,5	0
3	6,0	6,0	0
4	6,0	5,0	−1,0
5	5,5	4,5	−1,0
6	5,5	6,0	0,5
7	8,0	6,5	−1,5

\[ \left\{ \begin{array}{c} H_0: \mu_{ref} = \mu_{gen} \\ H_1: \mu_{gen} < \mu_{ref} \end{array} \right. \]

Exemplo Genérico — Cálculos

\[ \bar{d} = \frac{-0{,}5+0+0-1{,}0-1{,}0+0{,}5-1{,}5}{7} = -0{,}5 \]

\[ s_d = \sqrt{\frac{\sum(d_i-\bar{d})^2}{n-1}} \approx 0{,}707 \]

\[ t = \frac{-0{,}5}{0{,}707/\sqrt{7}} \approx -1{,}871 \]

Teste unilateral, $gl=6$, $\alpha=0{,}05$: valor crítico $t = 1{,}943$.

Exemplo Genérico — Resolução

\[ |{-1{,}871}| = 1{,}871 < 1{,}943 \]

✅ Não se rejeita $H_0$ (p-valor = 0,0553 > 0,05).

Interpretação clínica: não há evidência estatística de que o tempo de alívio da dor seja menor com o medicamento genérico — os dois produtos podem ser considerados equivalentes nesse aspecto.

Teste t para Amostras Independentes

Definição

Compara as médias de dois grupos independentes (sem qualquer pareamento) para verificar se as populações de origem diferem, em média.

Exige: variável contínua, distribuição normal ou aproximadamente normal.
Exige verificar homogeneidade de variâncias antes de escolher a fórmula do teste t.
Compara apenas dois grupos — para mais grupos, usa-se Anova (Capítulo 13).

Teste F para Homogeneidade de Variâncias

Hipóteses: $H_0$: variâncias iguais; $H_1$: variâncias diferentes.
Nível de significância $\alpha$.
Calcule a variância de cada grupo.
$F = s^2_{maior}/s^2_{menor}$, com $(n_1-1, n_2-1)$ graus de liberdade.
Compare com a Tabela F, usando $\alpha/2$.
Rejeite $H_0$ (variâncias iguais) se $F_{calc} \ge F_{tabela}$.

Exemplo: Teste F — Sódio em Sopas — Parte 1

Situação: comparar a variabilidade de sódio (mg/100ml) entre duas marcas de sopa industrializada, 10 amostras cada.

Marca A	Marca B
860	540
850	640
750	600
870	640
940	300
410	610
410	430
820	280
890	300
890	610

\[ s_A^2 = \frac{\sum (x_i-\bar{x}_A)^2}{n-1} = 38.254 \\ s_B^2 = \frac{\sum (x_i-\bar{x}_B)^2}{n-1} = 23.117 \]

Exemplo: Teste F — Resolução

\[ F = \frac{s_A^2}{s_B^2} = \frac{38.254}{23.117} = 1{,}65 \]

$F$ calculado $= 1{,}65$, com $gl=(9,9)$.
Valor crítico da Tabela F ($\alpha=2{,}5\%$, 9 e 9 gl): $F = 4{,}03$.

✅ Como $1{,}65 < 4{,}03$, não se rejeita a hipótese de variâncias iguais → use o teste t homocedástico.

Teste t (Variâncias Iguais) — Fórmula

Variância ponderada: \[ s_p^2 = \frac{(n_1-1)s_1^2 + (n_2-1)s_2^2}{n_1+n_2-2} \]

Estatística de teste (com $n_1+n_2-2$ graus de liberdade): \[ t = \frac{\bar{x}_1 - \bar{x}_2}{\sqrt{s_p^2\left(\frac{1}{n_1}+\frac{1}{n_2}\right)}} \]

Exemplo: Teste t Variâncias Iguais — Parte 1

\[H_0: \mu_A = \mu_B \qquad H_1: \mu_A \neq \mu_B \qquad \alpha = 0{,}05\]

\[ \bar{x}_A = \frac{\sum x_i}{10} = 769{,}0 \qquad \bar{x}_B = \frac{\sum x_i}{10} = 495{,}0 \]

Exemplo: Teste t Variâncias Iguais — Parte 2

\[ s_p^2 = \frac{9 \times 38.254 + 9 \times 23.117}{10+10-2} = 30.686 \]

\[ t = \frac{769{,}0 - 495{,}0}{\sqrt{30.686\left(\frac{1}{10}+\frac{1}{10}\right)}} = 3{,}50 \]

$gl = 10+10-2 = 18$. Valor crítico ($\alpha=0{,}05$): $t = 2{,}101$.

Exemplo: Teste t Variâncias Iguais — Resolução

\[ |3{,}50| > 2{,}101 \qquad (\text{p-valor} = 0{,}00257) \]

✅ Rejeita-se $H_0$ no nível de 5%.

Interpretação clínica/nutricional: a marca A tem, em média, quantidade de sódio significativamente maior que a marca B — relevante para pacientes com restrição de sódio (hipertensos, cardiopatas).

Teste t (Variâncias Diferentes) — Fórmula de Welch

Quando o teste F rejeita a igualdade de variâncias:

\[ t = \frac{\bar{x}_1 - \bar{x}_2}{\sqrt{\dfrac{s_1^2}{n_1}+\dfrac{s_2^2}{n_2}}} \]

Graus de liberdade aproximados (fórmula de Welch-Satterthwaite), geralmente não inteiros — usa-se a parte inteira.

Exemplo: Anti-inflamatório vs. Laser — Parte 1

Situação: tempo (min) para alívio da dor pós-ortodôntica, dois tratamentos, 5 pacientes cada.

Anti-inflamatório	Laser
80	100
93	103
83	104
89	99
98	102

\[ s_{AI}^2 = \frac{\sum(x_i-\bar{x}_{AI})^2}{n-1} = 53{,}3 \qquad s_{L}^2 = \frac{\sum(x_i-\bar{x}_L)^2}{n-1} = 4{,}3 \]

Exemplo: Anti-inflamatório vs. Laser — Teste F

\[ F = \frac{s_{AI}^2}{s_L^2} = \frac{53{,}3}{4{,}3} = 12{,}40 \]

$gl=(4,4)$. Valor crítico ($\alpha=2{,}5\%$): $F = 9{,}60$.
$F_{calc} = 12{,}40 > 9{,}60$ → rejeita-se a igualdade de variâncias.

✅ Use o teste t heterocedástico (variâncias diferentes).

Exemplo: Teste t de Welch — Cálculo

\[ \bar{x}_{AI} = \frac{80+93+83+89+98}{5} = 88{,}6 \qquad \bar{x}_L = \frac{100+103+104+99+102}{5} = 101{,}6 \]

\[ t = \frac{88{,}6 - 101{,}6}{\sqrt{\dfrac{53{,}3}{5}+\dfrac{4{,}3}{5}}} \approx -3{,}83 \]

$t \approx -3{,}83$, com aproximadamente 5 graus de liberdade.
Valor crítico (gl=5, $\alpha=0{,}05$): $t=2{,}571$.

Exemplo: Teste t de Welch — Resolução

\[ |{-3{,}83}| = 3{,}83 > 2{,}571 \qquad (\text{p-valor} = 0{,}019) \]

✅ Rejeita-se $H_0$ no nível de 5%.

Interpretação clínica: o tempo para alívio da dor é, em média, significativamente maior no grupo laser — o anti-inflamatório tradicional proporcionou alívio mais rápido nesse ensaio.

Comparação: Pareado vs. Independentes

Critério	Dados Pareados	Amostras Independentes
Estrutura	Mesma unidade (ou par lógico) medida duas vezes	Grupos distintos e não relacionados
Exemplo clínico	Antes/depois de um tratamento	Grupo tratado vs. grupo controle
Pré-requisito extra	—	Teste F para variâncias
Vantagem	Reduz variabilidade individual	Mais simples de delinear

Visualizando a Comparação de Dois Grupos

Figura 3

Resumo do Bloco 4

Pareado: \[t = \frac{\bar{d}}{s_d/\sqrt{n}}\]

Independentes (var. iguais): \[t = \frac{\bar{x}_1-\bar{x}_2}{\sqrt{s_p^2(1/n_1+1/n_2)}}\]

Independentes (var. diferentes): \[t = \frac{\bar{x}_1-\bar{x}_2}{\sqrt{s_1^2/n_1+s_2^2/n_2}}\]

Sempre teste F primeiro para escolher a fórmula correta.

De Variáveis Contínuas a Variáveis Qualitativas

Até aqui, comparamos médias de variáveis contínuas (peso, tempo, pressão).
Mas em saúde, muitas variáveis são qualitativas: fumante/não fumante, curou/não curou, exposto/não exposto.

Próximo Bloco: Teste χ² para Variáveis Qualitativas

Bloco 5 — Teste χ² para Variáveis Qualitativas

Motivação: Variáveis Qualitativas em Saúde

“Fumante” (sim/não) e “câncer de pulmão” (sim/não) formam o exemplo mais citado na literatura de saúde.
A ferramenta mais usada para mostrar esse tipo de resultado é a tabela 2×2.
O teste mais simples e conhecido para analisá-la é o teste de χ² (qui-quadrado).

Ensaios Clínicos vs. Estudos Observacionais

Definição

Ensaio clínico randomizado: designa aleatoriamente intervenções relacionadas à saúde para avaliar seu efeito.

Definição

Estudos observacionais: o pesquisador observa, sem intervir — podem ser prospectivos, retrospectivos ou transversais.

Estudos Prospectivos, Retrospectivos e Transversais

Tabelas 2×2 — Estrutura e Notação

Variável X	Y1	Y2	Total
X1	$a$	$b$	$a+b$
X2	$c$	$d$	$c+d$
Total	$a+c$	$b+d$	$n$

$a, b, c, d$ são as frequências observadas nas quatro combinações possíveis.

O Teste Qui-Quadrado — Fórmula e Procedimento

Hipóteses: $H_0: P_1 = P_2$; $H_1: P_1 \neq P_2$.
Nível de significância $\alpha$.
Estatística de teste: \[ \chi^2 = \frac{n(ad-bc)^2}{(a+b)(c+d)(a+c)(b+d)} \]
Rejeite $H_0$ se $\chi^2_{calc} \ge \chi^2_{tabela}$ (1 grau de liberdade, nível $\alpha$).

Exemplo: Ensaio Clínico — Betametasona — Parte 1

Situação: efeito da betametasona no alívio da dor após instrumentação endodôntica.

Grupo	Relato de dor: Sim	Relato de dor: Não	Total
Placebo	2	15	17
Betametasona	12	9	21
Total	14	24	38

\[H_0: \text{sem efeito} \qquad H_1: \text{betametasona é efetiva} \qquad \alpha=0{,}05\]

Exemplo: Betametasona — Resolução

\[ \chi^2 = \frac{n(ad-bc)^2}{(a+b)(c+d)(a+c)(b+d)} = \frac{38\left[(2)(9)-(15)(12)\right]^2}{(17)(21)(14)(24)} = 8{,}31 \]

$\chi^2_{calc} = 8{,}31 > 3{,}84$ (valor crítico, gl=1, $\alpha=5\%$).

✅ Rejeita-se $H_0$. Interpretação clínica: a betametasona é efetiva no alívio da dor após a instrumentação endodôntica.

Correção de Continuidade

Recomendada, especialmente em amostras pequenas: \[ \chi^2_{corr} = \frac{n\left(|ad-bc|-\dfrac{n}{2}\right)^2}{(a+b)(c+d)(a+c)(b+d)} \]

\[ \chi^2_{corr} = \frac{38\left(|(2)(9)-(15)(12)|-\dfrac{38}{2}\right)^2}{(17)(21)(14)(24)} = 6{,}48 \]

⚠️ A correção reduz o valor de χ² — pode mudar a conclusão de “significante” para “não significante”. Em caso de conflito, prevaleça o resultado com correção.

Restrições ao Uso do Teste χ²

Os dados devem estar em tabelas de contingência.
As variáveis devem ser, obrigatoriamente, qualitativas.
A amostra deve ter sido obtida por processo aleatório.
A população deve ter, no mínimo, 10 vezes o tamanho da amostra.

Exemplo: Estudo Prospectivo — Tabagismo na Gestação — Parte 1

Situação: 1.229 gestantes de Campinas (2004–2006), consumo de tabaco vs. baixo peso/prematuridade.

Fumou na gestação	Baixo peso/Prematuro: Sim	Não	Total
Sim	44	121	165
Não	146	918	1.064
Total	190	1.039	1.229

Exemplo: Estudo Prospectivo — Resolução

\[ \chi^2_{corr} = \frac{1.229\left(|(44)(918)-(121)(146)|-\dfrac{1.229}{2}\right)^2}{(165)(1.064)(190)(1.039)} = 17{,}34 \]

$\chi^2_{calc}$ (com correção de continuidade) $= 17{,}34 > 3{,}84$ → rejeita-se $H_0$.

✅ Interpretação clínica: o consumo de tabaco durante a gestação tem impacto negativo sobre o peso ao nascer e/ou a prematuridade — reforça a orientação de cessação do tabagismo no pré-natal.

Exemplo: Estudo Retrospectivo — DTM e Aparelho Ortodôntico — Parte 1

Situação: 142 jovens com distúrbios temporomandibulares (DTM) e 228 sem DTM — uso prévio de aparelho ortodôntico.

DTM	Usou aparelho: Sim	Não	Total
Sim	87	55	142
Não	113	115	228
Total	200	170	370

Exemplo: Estudo Retrospectivo — Resolução

\[ \chi^2_{corr} = \frac{370\left(|(87)(115)-(55)(113)|-\dfrac{370}{2}\right)^2}{(142)(228)(200)(170)} = 4{,}37 \]

$\chi^2_{calc}$ (com correção de continuidade) $= 4{,}37 > 3{,}84$ → rejeita-se $H_0$.

✅ Interpretação clínica: o uso de aparelho ortodôntico pode aumentar a probabilidade de distúrbios temporomandibulares.

Exemplo: Estudo Transversal — Tabagismo e Sexo — Parte 1

Situação: 1.091 pessoas entrevistadas na Região Sul, classificadas por sexo e tabagismo.

Sexo	Não fumante	Fumante	Total
Homens	423	177	600
Mulheres	287	204	491
Total	710	381	1.091

Exemplo: Estudo Transversal — Resolução

\[ \chi^2 = \frac{1.091\left[(423)(204)-(177)(287)\right]^2}{(600)(491)(710)(381)} = 17{,}25 \]

$\chi^2_{calc} = 17{,}25 > 3{,}84$ → rejeita-se a hipótese de independência.

✅ Interpretação clínica: nessa população, o hábito de fumar está significativamente associado ao sexo.

Medidas de Associação — Visão Geral

Delineamento	Medida apropriada
Ensaio clínico / Prospectivo	Risco Relativo (RR)
Retrospectivo	Razão de Chances (OR)
Transversal	Coeficientes φ e γ

O teste χ² diz se há associação; as medidas abaixo dizem quão forte e em qual direção.

Risco Relativo

Definição

Risco é a probabilidade de ocorrência de um dano. Risco relativo (RR) é a razão entre duas estimativas de risco.

\[ RR = \frac{\text{Risco no grupo exposto}}{\text{Risco no grupo não exposto}} \]

$RR = 1$: sem diferença de risco. $RR > 1$: exposição aumenta o risco. $RR < 1$: exposição reduz o risco.

Exemplo: Risco Relativo

Retome o exemplo da betametasona: risco de dor com betametasona = 11,8%; risco de dor com placebo = 57,1%.

\[ RR = \frac{0{,}571}{0{,}118} \approx 4{,}84 \]

✅ Interpretação clínica: é cerca de 5 vezes mais provável relatar dor se o paciente não recebeu betametasona.

Razão de Chances (Odds Ratio)

Definição

Chance ($w$) é a razão entre a probabilidade de um evento ocorrer ($p$) e a de não ocorrer ($q$): $w = p/q$.

\[ OR = \frac{a \times d}{b \times c} \]

$OR=1$: sem associação. $OR>1$: exposição associada positivamente ao desfecho. $OR<1$: associação negativa.
Usada quando não é possível estimar risco (estudos retrospectivos).

Exemplo: Razão de Chances — Parte 1

Situação: de 20 amigos em uma festa, 7 passaram mal (casos). Dos casos, 5 comeram peixe; dos 13 que passaram bem (controles), 3 comeram peixe.

Condição	Caso	Controle
Exposto (peixe)	5	3
Não exposto	2	10
Total	7	13

Exemplo: Razão de Chances — Resolução

\[ OR = \frac{a \times d}{b \times c} = \frac{5 \times 10}{3 \times 2} = 8{,}33 \]

✅ Interpretação clínica: a chance de ter passado mal é cerca de 8,3 vezes maior entre quem comeu o prato de peixe — forte indício de que o peixe foi a causa da intoxicação alimentar.

Exemplo Clássico: Fumo e Câncer de Pulmão

Estudo de Doll & Hill (1950): 649 pacientes com câncer de pulmão e 649 internados por outros motivos.

Fumante	Câncer de pulmão	Outro motivo
Sim	27	2
Não	622	647

\[ OR = \frac{27 \times 647}{2 \times 622} \approx 14{,}04 \]

✅ A chance de ter câncer de pulmão é cerca de 14 vezes maior entre fumantes.

Coeficiente $\varphi$ (fi)

Definição

Mede o grau de associação entre duas variáveis qualitativas em estudos transversais (o teste χ² só indica significância, não intensidade).

\[ \varphi = \sqrt{\frac{\chi^2}{n}} \qquad (0 \le \varphi \le 1) \]

$\varphi < 0{,}30$ (aprox.): associação trivial, mesmo que estatisticamente significante.

Exemplo: Coeficiente $\varphi$ — Cálculo e Interpretação

Retome o exemplo tabagismo × sexo: $\chi^2 = 17{,}25$ (sem correção), $n = 1.091$.

\[ \varphi = \sqrt{\frac{17{,}25}{1.091}} \approx 0{,}1257 \]

✅ Interpretação: embora estatisticamente significante (χ² grande), a associação entre tabagismo e sexo é apenas trivial — não é clinicamente relevante para prever o comportamento individual.

Teste de uma Proporção — Fórmula e Procedimento

Compara a proporção observada com um valor especificado $\theta$:

$H_0: P = \theta$; $H_1: P \neq \theta$.
Nível de significância $\alpha$.
Estatística de teste (com correção de continuidade): \[ z = \frac{|p-\theta| - \frac{1}{2n}}{\sqrt{\theta(1-\theta)/n}} \]
Compare $z$ com o valor crítico da normal padrão.

Exemplo: Teste de uma Proporção — Parte 1

Situação: 2.964 recém-nascidos em Campinas, 73 com anomalias. A literatura internacional cita prevalência de 3%.

\[ p = \frac{X}{n} = \frac{73}{2.964} \approx 0{,}0246 \]

\[H_0: P = 0{,}03 \qquad H_1: P \neq 0{,}03 \qquad \alpha=0{,}05\]

Exemplo: Teste de uma Proporção — Resolução

\[ z = \frac{p-\theta}{\sqrt{\theta(1-\theta)/n}} = \frac{0{,}0246 - 0{,}03}{\sqrt{0{,}03(0{,}97)/2.964}} \approx -1{,}714 \]

(amostra grande — aproximação sem correção de continuidade)

$|z| = 1{,}714 < 1{,}96$ (valor crítico, $\alpha=0{,}05$, teste bilateral)

✅ Não se rejeita $H_0$. Interpretação clínica: a prevalência de anomalias em recém-nascidos em Campinas é compatível com o valor de referência internacional de 3%.

Visualizando o Teste Qui-Quadrado

Figura 4

Resumo do Bloco 5

Teste χ²: \[\chi^2 = \frac{n(ad-bc)^2}{(a+b)(c+d)(a+c)(b+d)}\]

Risco Relativo: \[RR = \frac{\text{risco exposto}}{\text{risco não exposto}}\]

Razão de Chances: \[OR = \frac{ad}{bc}\]

Coeficiente $\varphi$: \[\varphi = \sqrt{\chi^2/n}\]

Delineamento	Medida
Prospectivo/Ensaio	RR
Retrospectivo	OR
Transversal	φ, γ

Fechando o Percurso

Vimos como planejar a amostra (Bloco 1), estimar parâmetros com margem de erro conhecida (Bloco 2), testar médias contra um padrão (Bloco 3) ou entre grupos (Bloco 4), e associar variáveis qualitativas (Bloco 5).

A seguir: síntese geral e referências

Síntese Geral

Do Planejamento Amostral à Decisão Clínica

Síntese das Fórmulas-Chave

Erro padrão da média: \[s_{\bar{x}} = \frac{s}{\sqrt{n}}\]

Intervalo de confiança: \[\bar{x} \pm t_\alpha \cdot \frac{s}{\sqrt{n}}\]

Teste t (1 amostra): \[t = \frac{\bar{x}-\mu_0}{s/\sqrt{n}}\]

Teste t (2 grupos independentes): \[t = \frac{\bar{x}_1-\bar{x}_2}{\sqrt{s_p^2(1/n_1+1/n_2)}}\]

Teste χ²: \[\chi^2 = \frac{n(ad-bc)^2}{(a+b)(c+d)(a+c)(b+d)}\]

Odds Ratio: \[OR = \frac{ad}{bc}\]

A Estatística a Serviço da Saúde

Dominar amostragem, estimação e testes de hipóteses não é um exercício matemático abstrato.
É a capacidade de ler evidências clínicas com espírito crítico — distinguir efeito real de flutuação do acaso.
Profissionais de saúde que compreendem esses conceitos tomam decisões mais seguras e baseadas em evidências.

Toda pesquisa clínica confiável começa em uma amostra bem planejada e termina em uma decisão estatisticamente fundamentada.

Recursos para Continuar

Tabela de valores de t, χ² e F: Apêndice A do livro-texto.
Software R: funções t.test(), chisq.test(), var.test(), prop.test() para cálculos automáticos.
Tabelas de contingência no R: pacote epitools fornece RR e OR diretamente.
Pratique com dados reais da sua área de atuação (Enfermagem, Odontologia, Educação Física).

Tabela t de Student

Valores críticos de $t$ para diferentes graus de liberdade (gl) e níveis de significância $\alpha$ bilateral. Para teste unilateral, use a coluna de $\alpha$ correspondente ao dobro do nível desejado (ex.: unilateral 5% → coluna 0,10).

gl	0,20	0,10	0,05	0,02	0,01
1	3,078	6,314	12,706	31,821	63,657
2	1,886	2,920	4,303	6,965	9,925
3	1,638	2,353	3,182	4,541	5,841
4	1,533	2,132	2,776	3,747	4,604
5	1,476	2,015	2,571	3,365	4,032
6	1,440	1,943	2,447	3,143	3,707
7	1,415	1,895	2,365	2,998	3,499
8	1,397	1,860	2,306	2,896	3,355
9	1,383	1,833	2,262	2,821	3,250
10	1,372	1,812	2,228	2,764	3,169
11	1,363	1,796	2,201	2,718	3,106
12	1,356	1,782	2,179	2,681	3,055
13	1,350	1,771	2,160	2,650	3,012
14	1,345	1,761	2,145	2,624	2,977
15	1,341	1,753	2,131	2,602	2,947
16	1,337	1,746	2,120	2,583	2,921
17	1,333	1,740	2,110	2,567	2,898
18	1,330	1,734	2,101	2,552	2,878
19	1,328	1,729	2,093	2,539	2,861
20	1,325	1,725	2,086	2,528	2,845
21	1,323	1,721	2,080	2,518	2,831
22	1,321	1,717	2,074	2,508	2,819
23	1,319	1,714	2,069	2,500	2,807
24	1,318	1,711	2,064	2,492	2,797
25	1,316	1,708	2,060	2,485	2,787
26	1,315	1,706	2,056	2,479	2,779
27	1,314	1,703	2,052	2,473	2,771
28	1,313	1,701	2,048	2,467	2,763
29	1,311	1,699	2,045	2,462	2,756
30	1,310	1,697	2,042	2,457	2,750
40	1,303	1,684	2,021	2,423	2,704
60	1,296	1,671	2,000	2,390	2,660
120	1,289	1,658	1,980	2,358	2,617
∞	1,282	1,645	1,960	2,326	2,576

Tabela Qui-Quadrado (χ²)

Valores críticos de $\chi^2$ para diferentes graus de liberdade (gl) e níveis de significância $\alpha$.

gl	0,10	0,05	0,025	0,01	0,005
1	2,71	3,84	5,02	6,63	7,88
2	4,61	5,99	7,38	9,21	10,60
3	6,25	7,81	9,35	11,34	12,84
4	7,78	9,49	11,14	13,28	14,86
5	9,24	11,07	12,83	15,09	16,75
6	10,64	12,59	14,45	16,81	18,55
7	12,02	14,07	16,01	18,48	20,28
8	13,36	15,51	17,53	20,09	21,95
9	14,68	16,92	19,02	21,67	23,59
10	15,99	18,31	20,48	23,21	25,19
11	17,28	19,68	21,92	24,72	26,76
12	18,55	21,03	23,34	26,22	28,30
13	19,81	22,36	24,74	27,69	29,82
14	21,06	23,68	26,12	29,14	31,32
15	22,31	25,00	27,49	30,58	32,80
16	23,54	26,30	28,85	32,00	34,27
17	24,77	27,59	30,19	33,41	35,72
18	25,99	28,87	31,53	34,81	37,16
19	27,20	30,14	32,85	36,19	38,58
20	28,41	31,41	34,17	37,57	40,00
25	34,38	37,65	40,65	44,31	46,93
30	40,26	43,77	46,98	50,89	53,67
40	51,81	55,76	59,34	63,69	66,77
50	63,17	67,50	71,42	76,15	79,49
60	74,40	79,08	83,30	88,38	91,95

Tabela F (α = 0,025)

Valores críticos de $F$ para teste bilateral de igualdade de variâncias com $\alpha_{total} = 0{,}05$ (ou seja, $\alpha/2 = 0{,}025$ em cada tabela unilateral). Linhas: graus de liberdade do denominador; colunas: graus de liberdade do numerador.

gl denom. gl numer.	1	2	3	4	5	6	7	8	9	10
4	12,22	10,65	9,98	9,60	9,36	9,20	9,07	8,98	8,90	8,84
5	10,01	8,43	7,76	7,39	7,15	6,98	6,85	6,76	6,68	6,62
6	8,81	7,26	6,60	6,23	5,99	5,82	5,70	5,60	5,52	5,46
7	8,07	6,54	5,89	5,52	5,29	5,12	4,99	4,90	4,82	4,76
8	7,57	6,06	5,42	5,05	4,82	4,65	4,53	4,43	4,36	4,30
9	7,21	5,71	5,08	4,72	4,48	4,32	4,20	4,10	4,03	3,96
10	6,94	5,46	4,83	4,47	4,24	4,07	3,95	3,85	3,78	3,72
12	6,55	5,10	4,47	4,12	3,89	3,73	3,61	3,51	3,44	3,37
15	6,20	4,77	4,15	3,80	3,58	3,41	3,29	3,20	3,12	3,06
20	5,87	4,46	3,86	3,51	3,29	3,13	3,01	2,91	2,84	2,77

Tabela Normal Padrão (Z) — Valores Críticos Usuais

Valores de $z_{\alpha/2}$ para os níveis de confiança mais utilizados em Bioestatística — usados diretamente no cálculo de tamanho de amostra e em testes com amostras grandes.

Nível de confiança	α (bilateral)	z crítico
80%	0,200	1,282
85%	0,150	1,440
90%	0,100	1,645
95%	0,050	1,960
98%	0,020	2,326
99%	0,010	2,576
99,5%	0,005	2,807

Para $n$ grande (tipicamente $n \ge 30$), a distribuição t converge para a distribuição normal padrão — compare a última linha da tabela t ($gl=\infty$) com esta tabela.

Referências Bibliográficas

VIEIRA, Sonia. Introdução à Bioestatística. 6. ed. Rio de Janeiro: Guanabara Koogan, 2021.

Capítulos utilizados:

Capítulo 7 — Noções sobre Amostragem
Capítulo 9 — Intervalo de Confiança
Capítulo 10 — Teste t para uma Amostra
Capítulo 11 — Teste t para Comparação de Médias
Capítulo 12 — Teste χ² para Variáveis Qualitativas

Dúvidas e Discussão

🎯 Amostragem: a base de toda inferência confiável.
📏 Intervalo de Confiança: estimar com honestidade sobre a incerteza.
⚖️ Teste t: comparar médias com rigor estatístico.
🔗 Teste χ²: associação entre variáveis qualitativas em saúde.

Variável X	Y1	Y2	Total
X1	\(a\)	\(b\)	\(a+b\)
X2	\(c\)	\(d\)	\(c+d\)
Total	\(a+c\)	\(b+d\)	\(n\)

Marca A	Marca B
860	540
850	640
750	600
870	640
940	300
410	610
410	430
820	280
890	300
890	610

Marca A	Marca B
860	540
850	640
750	600
870	640
940	300
410	610
410	430
820	280
890	300
890	610

Marca A	Marca B
860	540
850	640
750	600
870	640
940	300
410	610
410	430
820	280
890	300
890	610