Introdução à Bioestatística

Prof. Marcelo R.P. Ferreira

Departamento de Estatística – UFPB

maio, 2026

Bioestatística Aplicada à Saúde

Probabilidades · Distribuição Binomial · Distribuição Normal

Base: VIEIRA, Sonia (2021) — Cap. 14, 15 e 8

Agenda da Apresentação

Bloco 1: Probabilidades — O acaso na saúde
Bloco 2: Distribuição Binomial — Eventos discretos
Bloco 3: Distribuição Normal — A curva da vida
Síntese: Integrando os três modelos

Por que estudar o acaso?

A chance de um filho herdar um alelo defeituoso é obra do acaso.
O desenvolvimento de uma doença envolve genética, ambiente e aleatoriedade.
O diagnóstico e o tratamento nunca possuem 100% de certeza.
Dois indivíduos com o mesmo histórico de exposição podem ter desfechos completamente distintos — o acaso é um componente real do adoecimento.

A bioestatística nos ensina a tomar decisões clínicas seguras sob incerteza.

Bloco 1 — Probabilidades

A Natureza do Acaso

A probabilidade é a ferramenta matemática para quantificar a incerteza.
Na prática clínica, lidamos com eventos que não podem ser previstos com exatidão para um único paciente.
Mas, em grandes populações, o acaso revela padrões estáveis.

Experimento e Espaço Amostral

Experimento: Qualquer processo que gera resultados sujeitos ao acaso (ex: testar um fármaco).
Espaço Amostral (\(\Omega\)): Conjunto de todos os resultados possíveis.

Exemplo clínico: Tipagem sanguínea de um recém-nascido.

\[\Omega = \{A,\; B,\; AB,\; O\}\]

O Conceito de Evento

Evento (\(E\)): Qualquer subconjunto do espaço amostral.
Representa o resultado de interesse que o profissional de saúde quer investigar.
Exemplo: Qual a chance de o sangue do paciente ser do tipo O?
Aqui, o Evento \(E = \{O\}\).

A Regra de Laplace

Como calcular a probabilidade clássica?
Divisão do número de casos favoráveis pelo total de casos possíveis.
Válida quando todos os resultados têm a mesma chance de ocorrer.

\[P(E) = \frac{\text{número de casos favoráveis}}{\text{número total de casos possíveis}}\]

A probabilidade \(P\) sempre varia de 0 (impossível) a 1 (certeza absoluta).

Exemplo: Banco de Sangue — Parte 1

Situação: Banco de Sangue em um dia típico.

Foram registrados 40 doadores no total.
Destes, 15 possuíam sangue Tipo O.

Pergunta

Qual a probabilidade de um doador sorteado ter sangue Tipo O?

Exemplo: Banco de Sangue — Resolução

Casos favoráveis (Tipo O): 15
Total de casos (doadores): 40

\[P(\text{Tipo O}) = \frac{15}{40} = 0{,}375\]

✅ Interpretação: Há 37,5% de chance de o próximo doador sorteado ser do tipo O.

Eventos Mutuamente Exclusivos

Ocorrem quando a realização de um evento impede a do outro.
Quem pertence a uma categoria não pode pertencer à outra simultaneamente.
Exemplo clínico: Estado de saúde do paciente.
Um paciente não pode estar simultaneamente sadio e doente.

Eventos Mutuamente Exclusivos — Diagrama

Figura 1

Teorema da Soma — Regra do “OU”

Utilizada para calcular a chance de ocorrer o Evento A “OU” o Evento B.
Para eventos mutuamente exclusivos, basta somar as probabilidades individuais.

A palavra “OU” na estatística traduz-se na operação de soma:

\[P(A \cup B) = P(A) + P(B)\]

Exemplo: Tabagismo e Câncer — Parte 1

Estudo caso-controle com 19.077 pessoas.

Cigarros/dia	Total de pessoas
20 a 29	5.235
30 ou mais	3.115
Total geral	19.077

Pergunta: Qual a probabilidade de um indivíduo fumar de 20 a 29 cigarros OU 30 ou mais cigarros por dia?

Exemplo: Tabagismo e Câncer — Parte 2

Evento A (20–29 cigarros): \(P(A) = \dfrac{5.235}{19.077} = 0{,}274\)

Evento B (≥30 cigarros): \(P(B) = \dfrac{3.115}{19.077} = 0{,}163\)

Exemplo: Tabagismo e Câncer — Resolução

\[P(A \cup B) = P(A) + P(B)\]

\[P(\geq 20 \text{ cigarros}) = 0{,}274 + 0{,}163 = \mathbf{0{,}437}\]

✅ Interpretação: A probabilidade de um indivíduo fumar um maço ou mais por dia é de 43,7%. O agrupamento de riscos evidencia alta exposição nesse grupo.

Eventos Não Mutuamente Exclusivos

Ocorrem quando a realização de um evento NÃO impede a do outro.
Existe uma interseção: o paciente pode possuir ambos os diagnósticos.
Exemplo: Um paciente pode ser diabético e também hipertenso.
Se simplesmente somarmos as probabilidades, contamos os casos da interseção duas vezes.

Eventos Não Mutuamente Exclusivos — Diagrama

Figura 2

Regra do “OU” — Não Mutuamente Exclusivos

Para evitar a dupla contagem, subtraímos a interseção.
Soma-se a chance de A, a chance de B, e retira-se a probabilidade dos casos simultâneos.

\[P(A \cup B) = P(A) + P(B) - P(A \cap B)\]

Exemplo: Infarto e Diabetes — Parte 1

Estudo sobre fatores de risco cardíaco. Total: 591 pessoas.

	Diabetes: Sim	Diabetes: Não	Total
Infarto: Sim	82	217	299
Infarto: Não	32	260	292
Total	114	477	591

Pergunta: Qual a chance de ser diabético OU ter sofrido infarto?

Exemplo: Infarto e Diabetes — Parte 2

Evento A (Infarto): \(P(A) = \dfrac{299}{591} = 0{,}506\)
Evento B (Diabetes): \(P(B) = \dfrac{114}{591} = 0{,}193\)

Interseção (Ambos): \(P(A \cap B) = \dfrac{82}{591} = 0{,}139\)

Exemplo: Infarto e Diabetes — Resolução

\[P(A \cup B) = P(A) + P(B) - P(A \cap B)\]

\[P(A \cup B) = 0{,}506 + 0{,}193 - 0{,}139 = \mathbf{0{,}560}\]

✅ Há 56% de probabilidade — sem a correção seria 69,9%, uma superestimativa perigosa.

A subtração da interseção é obrigatória para não inflar o risco calculado.

Teorema do Produto — Regra do “E”

E se quisermos que dois eventos ocorram simultaneamente de forma independente?
Eventos independentes: o resultado de um NÃO afeta o resultado do outro.
A palavra “E” na estatística traduz-se na operação de multiplicação.

\[P(A \cap B) = P(A) \times P(B)\]

Exemplo: Cirurgia Pediátrica — Parte 1

O risco cirúrgico de mortalidade para uma anomalia grave é de 20%.
Logo, a chance de sobrevivência é de 80% (\(p = 0{,}80\)).
Dois recém-nascidos são submetidos a essa cirurgia no mesmo dia.

Pergunta: Qual a probabilidade de AMBOS sobreviverem?

Exemplo: Cirurgia Pediátrica — Resolução

Evento A (Sobrevivência do RN 1): \(P(A) = 0{,}80\)
Evento B (Sobrevivência do RN 2): \(P(B) = 0{,}80\)

\[P(\text{Ambos vivos}) = 0{,}80 \times 0{,}80 = \mathbf{0{,}64}\]

Exemplo: Cirurgia Pediátrica — Interpretação

✅ Interpretação: Apesar de a sobrevida individual ser alta (80%), a garantia de sucesso em ambas as cirurgias cai para 64%.

O acúmulo de riscos paralelos reduz a margem de sucesso global. Este conceito é fundamental em auditorias de qualidade e gestão de riscos hospitalares.

A Condição de Independência

E se quisermos provar que duas doenças não têm relação entre si?
Usamos a condição de independência de forma reversa.
Se \(P(A \cap B) = P(A) \times P(B)\) → as doenças são independentes.
Se os valores diferirem → há associação entre elas.

\[\text{Independência: } P(A \cap B) = P(A) \times P(B)\]

Exemplo: Implantes e Doenças — Parte 1

Suspeita: Implantes mamários causam doenças do tecido conjuntivo?

Estudo com 2.247 mulheres:

	Doença: Sim	Doença: Não	Total
Implante: Sim	5	744	749
Implante: Não	10	1488	1498
Total	15	2232	2247

Exemplo: Implantes e Doenças — Parte 2

\(P(\text{Implante}) = \dfrac{749}{2247} = \dfrac{1}{3}\)
\(P(\text{Doença}) = \dfrac{15}{2247}\)

\[P(A) \times P(B) = \frac{1}{3} \times \frac{15}{2247} = \frac{5}{2247}\]

\[P(A \cap B) = \frac{5}{2247}\]

Exemplo: Implantes e Doenças — Resolução

\[P(A \cap B) = P(A) \times P(B) \implies \text{Eventos independentes}\]

✅ Os valores são matematicamente iguais.

Interpretação epidemiológica: Ter a doença do tecido conjuntivo é estatisticamente independente de ter implante mamário. A coocorrência se deu por acaso biológico, não por causalidade.

Probabilidade Condicional — Ideia Geral

Às vezes, o cenário muda porque já temos uma informação prévia sobre o paciente.
É a probabilidade de um evento ocorrer sabendo que outro já ocorreu.
Exemplo: Risco de câncer pulmonar dado que o paciente fumou por 30 anos.
O espaço amostral é reduzido pela informação prévia disponível.

A Fórmula da Probabilidade Condicional

A probabilidade de \(A\) ocorrer dado que \(B\) já ocorreu:

\[P(A \mid B) = \frac{P(A \cap B)}{P(B)}, \quad P(B) > 0\]

O símbolo “\(\mid\)” lê-se “dado que” ou “sabendo que”.
\(P(B)\) torna-se o novo espaço amostral — o universo é restrito aos casos em que \(B\) ocorreu.
Em geral, \(P(A \mid B) \neq P(B \mid A)\).

Exemplo: Probabilidade Condicional — Parte 1

Em um hospital, 500 prontuários foram analisados:

	Hipertenso (H)	Não hipertenso	Total
Cardíaco (C)	120	40	160
Não cardíaco	130	210	340
Total	250	250	500

Pergunta: Qual a probabilidade de um paciente ser cardíaco, sabendo que é hipertenso?

Exemplo: Probabilidade Condicional — Parte 2

Calculando as probabilidades necessárias:

\(P(C \cap H) = 120/500 = 0{,}240\)
\(P(H) = 250/500 = 0{,}500\)

\[P(C \mid H) = \frac{P(C \cap H)}{P(H)} = \frac{0{,}240}{0{,}500} = \mathbf{0{,}480}\]

Exemplo: Probabilidade Condicional — Interpretação

✅ Entre os pacientes hipertensos, 48% também apresentam doença cardíaca — contra apenas 32% na população geral.

Saber que o paciente é hipertenso praticamente dobra nossa estimativa de risco cardíaco. A informação prévia transforma o raciocínio diagnóstico.

Probabilidade Condicional e Independência

Se A e B forem independentes, a ocorrência de B não altera a chance de A.
Matematicamente: \(P(A \mid B) = P(A)\)
Se \(P(A \mid B) \neq P(A)\), os eventos são dependentes (há associação).

Verificação:

\[P(C) = 160/500 = 0{,}32 \quad \neq \quad P(C \mid H) = 0{,}48\]

✅ Confirmado: ser hipertenso está associado a maior risco cardíaco.

A Regra da Multiplicação (forma geral)

Da definição de probabilidade condicional, isolando \(P(A \cap B)\):

\[P(A \cap B) = P(B) \cdot P(A \mid B)\]

Para eventos independentes: \(P(A \mid B) = P(A)\), logo \(P(A \cap B) = P(A) \cdot P(B)\).
Para eventos dependentes: é obrigatório usar a probabilidade condicional.
Essa regra é a base para o Teorema de Bayes.

Probabilidade Total

Quando o espaço amostral pode ser particionado em causas mutuamente exclusivas \(B_1, B_2, \ldots, B_k\):

\[P(A) = \sum_{i=1}^{k} P(A \mid B_i) \cdot P(B_i)\]

Exemplo: \(A\) = teste positivo; \(B_1\) = doente; \(B_2\) = sadio.

\[P(\text{Positivo}) = P(+ \mid D)\cdot P(D) + P(+ \mid \bar{D})\cdot P(\bar{D})\]

O Teorema de Bayes — Motivação

Um teste diagnóstico volta positivo.
Qual a probabilidade de o paciente estar realmente doente?
Depende de quão prevalente é a doença e de quão bom é o teste.
O Teorema de Bayes formaliza exatamente esse raciocínio de atualização de crença.

O Teorema de Bayes — Fórmula

Dada uma partição \(\{B_1, \ldots, B_k\}\) do espaço amostral e um evento \(A\):

\[\boxed{P(B_i \mid A) = \frac{P(A \mid B_i) \cdot P(B_i)}{\displaystyle\sum_{j=1}^{k} P(A \mid B_j) \cdot P(B_j)}}\]

Termo	Nome	Significado
\(P(B_i)\)	Probabilidade a priori	Crença antes de observar \(A\)
\(P(A \mid B_i)\)	Verossimilhança	Chance de \(A\) dado \(B_i\)
\(P(B_i \mid A)\)	Probabilidade a posteriori	Crença revisada após observar \(A\)

Sensibilidade, Especificidade e VPP

Sensibilidade: \(P(\text{Teste}+ \mid \text{Doente})\) — detecta verdadeiros doentes.
Especificidade: \(P(\text{Teste}- \mid \text{Sadio})\) — identifica verdadeiros sadios.
Prevalência: \(P(\text{Doente})\) — proporção de doentes na população.
Valor Preditivo Positivo (VPP): \(P(\text{Doente} \mid \text{Teste}+)\) — é o que Bayes nos dá!

Exemplo: Teste de HIV — Parte 1

Contexto clínico:

Prevalência de HIV em população de baixo risco: 0,1% — \(P(D) = 0{,}001\)
Sensibilidade do ELISA: 99% — \(P(+ \mid D) = 0{,}99\)
Especificidade: 99% — \(P(- \mid \bar{D}) = 0{,}99\), logo \(P(+ \mid \bar{D}) = 0{,}01\)

Pergunta: Um paciente testou positivo. Qual a probabilidade de estar realmente infectado?

\[P(D \mid +) = \; ?\]

Exemplo: Teste de HIV — Parte 2 (Prob. Total)

Calculamos primeiro a probabilidade de um resultado positivo na população:

\[P(+) = P(+ \mid D)\cdot P(D) + P(+ \mid \bar{D})\cdot P(\bar{D})\]

\[P(+) = 0{,}99 \times 0{,}001 + 0{,}01 \times 0{,}999\]

\[P(+) = 0{,}00099 + 0{,}00999 = \mathbf{0{,}01098}\]

A maioria dos positivos vem de falsos positivos, porque a doença é muito rara na população.

Exemplo: Teste de HIV — Parte 3 (Bayes)

Aplicando o Teorema de Bayes:

\[P(D \mid +) = \frac{P(+ \mid D)\cdot P(D)}{P(+)}\]

\[P(D \mid +) = \frac{0{,}99 \times 0{,}001}{0{,}01098} = \frac{0{,}00099}{0{,}01098} \approx \mathbf{0{,}090}\]

✅ Resultado surpreendente: Mesmo com teste excelente, apenas 9% dos positivos estão realmente infectados em população de baixo risco!

Exemplo: Teste de HIV — Interpretação

Este é o principal argumento para não rastrear doenças raras em populações de baixo risco com testes de alta especificidade: a maioria dos positivos será falso positivo, causando dano psicológico e custos desnecessários.

Repetindo para população de alto risco (\(P(D) = 0{,}30\)):

\[P(+) = 0{,}99 \times 0{,}30 + 0{,}01 \times 0{,}70 = 0{,}304\]

\[P(D \mid +) = \frac{0{,}99 \times 0{,}30}{0{,}304} \approx \mathbf{0{,}977}\]

✅ O mesmo teste em população de alto risco tem VPP de 97,7%.

O Efeito da Prevalência no VPP

Figura 3

Bayes em Dois Momentos de Raciocínio

Antes do teste → usamos a prevalência como probabilidade a priori: \(P(D)\).
Após o teste positivo → atualizamos para a probabilidade a posteriori: \(P(D \mid +)\).
Após um segundo teste positivo → a posteriori do primeiro vira a priori do segundo.
O raciocínio bayesiano é iterativo: cada evidência nova atualiza a crença anterior.

Aplicações do Teorema de Bayes na Área da Saúde

Triagem neonatal: Alta sensibilidade é essencial. O VPP pode ser baixo para doenças raras.
Protocolos de rastreamento: A decisão de rastrear deve considerar a prevalência no grupo-alvo.
Sequências de testes: Repetir o teste em positivos aumenta o VPP sem mudar a tecnologia.
Medicina baseada em evidências: Cada estudo publicado atualiza a probabilidade a priori do efeito de uma intervenção.

Cuidado com a Interpretação de Riscos

Risco absoluto não deve ser confundido com risco relativo.
Uma doença rara passar de 1 para 2 casos por milhão representa 100% de aumento relativo.
Contudo, a probabilidade absoluta continua ínfima.
Profissionais da área da saúde devem contextualizar os percentuais para o paciente.

Resumo do Bloco 1

Situação	Fórmula
Laplace	\(P(E) = \text{favoráveis}/\text{possíveis}\)
OU (exclusivos)	\(P(A \cup B) = P(A) + P(B)\)
OU (não exclusivos)	\(P(A \cup B) = P(A) + P(B) - P(A\cap B)\)
E (independentes)	\(P(A \cap B) = P(A) \times P(B)\)
Condicional	\(P(A \mid B) = P(A\cap B)/P(B)\)
Bayes	\(P(B_i \mid A) = P(A \mid B_i)P(B_i)/P(A)\)

Do Acaso Isolado às Distribuições Teóricas

Até aqui, calculamos probabilidades de eventos isolados a partir de tabelas já construídas.
E se quisermos prever o risco de vários pacientes apresentarem o mesmo desfecho sem ter os dados brutos?
Entraremos no mundo das distribuições teóricas de probabilidade.

Próximo Bloco: A Distribuição Binomial

Bloco 2 — Distribuição Binomial

Eventos discretos na saúde

Variáveis Aleatórias Discretas

Variáveis discretas assumem valores inteiros resultantes de contagens.
Quando um experimento só possui duas possibilidades excludentes, a variável é chamada de binária.
Sucesso (o resultado de interesse) vs. Fracasso (todos os demais resultados).
Exemplos: sobreviveu/não sobreviveu; curou/não curou; infectado/não infectado.

O que é a Distribuição Binomial?

Modelo matemático para prever contagens de eventos binários em um grupo.

Observamos o número de “sucessos” em uma série de \(n\) pacientes ou ensaios.
Permite responder: se tratar 10 doentes, qual a chance de exatamente 3 se curarem?

Características da Binomial

Consiste em \(n\) ensaios idênticos (ex: \(n\) pacientes avaliados).
Cada ensaio resulta apenas em Sucesso (1) ou Fracasso (0).
A probabilidade de sucesso (\(p\)) é constante para todos os ensaios.
Os ensaios são independentes entre si.

Os Parâmetros da Binomial

Símbolo	Significado
\(n\)	Tamanho da amostra ou número de repetições
\(x\)	Número exato de sucessos desejados
\(p\)	Probabilidade de sucesso em cada ensaio
\(q\)	Probabilidade de fracasso: \(q = 1 - p\)

A Lógica Combinatória — O Fatorial

Ao testar vários pacientes, o sucesso pode ocorrer em diferentes ordens.
Precisamos da matemática combinatória para não omitir nenhum arranjo possível.

O símbolo de fatorial (\(!\)) significa multiplicar um número por todos os seus antecessores até 1.
Exemplo: \(3! = 3 \times 2 \times 1 = 6\)

\[n! = n \times (n-1) \times \cdots \times 1\]

A Fórmula da Distribuição Binomial

\[\boxed{P(X = x) = \frac{n!}{x!(n-x)!}\, p^x\, q^{n-x}}\]

A primeira parte (combinação) conta todos os arranjos possíveis dos sucessos.
A segunda parte (\(p^x\)) representa a probabilidade acumulada dos sucessos.
A terceira parte (\(q^{n-x}\)) representa a probabilidade acumulada dos fracassos restantes.

Exemplo: Cárie Infantil — Parte 1

Cenário: A prevalência de cárie em crianças de 6 anos em uma creche é de 40%. Um profissional examinará uma amostra de 4 crianças.

Pergunta

Qual a probabilidade de exatamente 2 das 4 crianças terem cárie?

Exemplo: Cárie Infantil — Parte 2

Identificando os parâmetros:

Número de crianças (\(n\)): 4
Número de sucessos desejados (\(x\)): 2
Probabilidade de cárie (\(p\)): 0,4
Probabilidade de não ter cárie (\(q\)): \(1 - 0{,}4 = \mathbf{0{,}6}\)

Exemplo: Cárie Infantil — Parte 3

Substituindo na equação:

\[P(X=2) = \frac{4!}{2!\,(4-2)!} \times (0{,}4)^2 \times (0{,}6)^{2}\]

Passo combinatório: \(\dfrac{4!}{2! \cdot 2!} = \dfrac{24}{4} = 6\) arranjos possíveis.
Passo das probabilidades: \((0{,}4)^2 \times (0{,}6)^2 = 0{,}16 \times 0{,}36 = 0{,}0576\)

Exemplo: Cárie Infantil — Resolução

\[P(X=2) = 6 \times 0{,}0576 = \mathbf{0{,}3456}\]

✅ Interpretação: Em cerca de 34,5% dos grupos de 4 crianças triadas rotineiramente haverá exatamente 2 com cárie. Essa informação orienta o dimensionamento de insumos em programas de saúde bucal.

Gráfico da Distribuição Binomial (n=4, p=0,4)

Figura 4

Exemplo: Daltonismo Genético — Parte 1

Cenário: A probabilidade de um menino nascer com daltonismo é de 8%. Quatro meninos chegam ao consultório de oftalmologia no mesmo dia.

Pergunta: Qual a probabilidade de todos os quatro serem daltônicos?

Exemplo: Daltonismo Genético — Parte 2

Identificando os parâmetros:

Meninos na amostra (\(n\)): 4
Número de daltônicos desejados (\(x\)): 4
Probabilidade de daltonismo (\(p\)): 0,08
Probabilidade de visão normal (\(q\)): 0,92

Exemplo: Daltonismo Genético — Parte 3

Como \(x = n = 4\), a combinação vale 1 e \((q)^0 = 1\):

\[P(X=4) = 1 \times (0{,}08)^4 \times 1\]

\[P(X=4) = (0{,}08)^4 \approx \mathbf{0{,}004\%}\]

✅ Probabilidade praticamente nula. Se ocorrer, o profissional deve questionar a independência dos casos — provavelmente são parentes, violando a premissa do modelo.

Média da Distribuição Binomial

\[\mu = n \times p\]

Exemplo — instrumento cognitivo: 100 questões, 5 alternativas, resposta ao acaso (\(p = 0{,}20\)).

\[\mu = 100 \times 0{,}20 = \mathbf{20 \text{ acertos}}\]

✅ Pontuações sistematicamente abaixo de 20 seriam clinicamente significativas.

Variância da Distribuição Binomial

\[\sigma^2 = n \times p \times q \qquad \sigma = \sqrt{n \cdot p \cdot q}\]

Continuando o exemplo cognitivo (\(n=100\), \(p=0{,}20\), \(q=0{,}80\)):

\[\sigma^2 = 100 \times 0{,}20 \times 0{,}80 = 16 \implies \sigma = 4 \text{ pontos}\]

✅ A faixa 16 a 24 acertos é consistente com respostas puramente aleatórias. O gestor pode usar esse intervalo como referência para identificar desempenho genuinamente comprometido.

Exemplo: Mortalidade Cirúrgica — Parte 1

Cenário: A probabilidade de sobrevivência em uma cirurgia experimental de alto risco é de 25% (\(p=0{,}25\)). Planejam-se 4 cirurgias em sequência (\(n=4\)).

Pergunta: Qual a probabilidade de todas as 4 terem sucesso?

Exemplo: Mortalidade Cirúrgica — Parte 2

Como \(x = n = 4\), a combinação vale 1 e \((q)^0 = 1\):

\[P(X=4) = (0{,}25)^4\]

\[P(X=4) = 0{,}00391 \approx \mathbf{0{,}39\%}\]

Exemplo: Mortalidade Cirúrgica — Interpretação

✅ Implicação ética: O protocolo tem menos de 0,4% de chance de concluir quatro cirurgias bem-sucedidas seguidas.

🏥 Antes de iniciar o protocolo, o cálculo revela que a viabilidade em cadeia é ínfima. O comitê de ética deve ser alertado para revisar o delineamento do estudo — a estatística serve à bioética.

Aplicações na Área da Saúde

Controle de qualidade: Prever quantos lotes de insumos podem estar fora dos padrões aceitáveis.
Prognóstico assistencial: Estimar o número de pacientes com reações adversas a uma vacina.
Dimensionamento de escala: Calcular a probabilidade de \(X\) profissionais faltarem ao plantão.
Planejamento clínico: Estimar o número esperado de desfechos em ensaios piloto.

Recapitulando: O Mundo Discreto Binário

A variável deve representar eventos independentes com dois desfechos possíveis (0 ou 1).
A fórmula combina combinatória e probabilidades para mapear todos os cenários.
Parâmetros essenciais: \(n\) (amostra), \(p\) (sucesso) e \(x\) (sucessos desejados).
Quando o desfecho deixa de ser contável e passa a ser contínuo, precisamos de outro modelo.

Do Discreto ao Contínuo

O peso de um recém-nascido não é “0 ou 1” — é 3,124 kg, 3,125 kg…
Para variáveis contínuas, o número de valores possíveis é infinito.
As colunas separadas da binomial fundem-se em uma curva contínua.

Próximo Bloco: A Distribuição Normal

Bloco 3 — Distribuição Normal

A curva da vida

A Variável Aleatória Contínua

Variáveis contínuas (idade, altura, IMC, glicemia) geram histogramas com muitas classes estreitas.
À medida que o tamanho da amostra cresce, as barras ficam cada vez mais estreitas.
O contorno superior das barras passa a desenhar uma curva suave e contínua.
Essa curva é a base de toda a análise biométrica humana.

A Curva de Gauss

Figura 5

Propriedades da Distribuição Normal

O pico da curva representa simultaneamente a Média, a Mediana e a Moda.
A curva se aproxima do eixo X para o infinito, mas nunca o toca.
Toda a área sob a curva equivale a 1 (100% da população).
Dois parâmetros definem completamente a curva: \(\mu\) (posição) e \(\sigma\) (dispersão).

\[N(\mu,\, \sigma)\]

Efeito de μ e σ sobre a Curva

Figura 6

A Regra Empírica (68-95-99,7)

Figura 7

\(\mu \pm 1\sigma\) → 68% | \(\mu \pm 2\sigma\) → 95% | \(\mu \pm 3\sigma\) → 99,7%

Exemplo: QI na População — Parte 1

O Quociente de Inteligência (Escala Wechsler): \(\mu = 100\), \(\sigma = 15\).

Pergunta: Qual a faixa de QI que engloba os 68% centrais da população?

Exemplo: QI na População — Resolução

A faixa dos 68% engloba \(\mu \pm 1\sigma\):

Limite inferior: \(100 - 15 = \mathbf{85}\) pontos
Limite superior: \(100 + 15 = \mathbf{115}\) pontos

\[\mu \pm 1\sigma \Rightarrow [85;\; 115]\]

✅ 68% da população apresenta QI entre 85 e 115. Os 32% restantes distribuem-se nas caudas. Testes psicológicos hospitalares usam esses limites para classificar o que é cognitivamente típico.

A Limitação da Regra Empírica

A Regra Empírica funciona apenas para cortes exatos de 1, 2 ou 3 desvios-padrão.
Na prática clínica, os limites raramente caem em valores redondos.
Exemplo: Qual a proporção de pacientes com valor até 1,34 desvios da média?
Existem infinitas curvas normais possíveis — uma para cada variável biométrica.

A Distribuição Normal Padronizada

A Regra Empírica funciona apenas para cortes exatos de 1, 2 ou 3 desvios-padrão.
Na prática clínica, os limites raramente caem em valores redondos.

Solução: Converter todas as curvas em uma única curva universal.

Padronização: forçamos \(\mu = 0\) e \(\sigma = 1\).
Essa curva universal é a Distribuição Normal Padrão ou Curva Z.

\[N(0,\, 1)\]

O Escore Z: A Fórmula de Conversão

O escore Z transforma qualquer medida individual na sua distância relativa à média, em unidades de desvio-padrão:

\[\boxed{z = \frac{x - \mu}{\sigma}}\]

Escore Z	Significado clínico
\(Z = 0\)	Exatamente na média da população
\(Z = +1{,}5\)	1,5 desvios-padrão acima da média
\(Z = -2{,}0\)	2 desvios-padrão abaixo da média

Nas curvas de crescimento do Ministério da Saúde, \(Z < -2\) sinaliza risco nutricional; \(Z < -3\) indica desnutrição grave.

A Tabela da Distribuição Normal Padrão

Estatísticos calcularam previamente as áreas sob a curva Z para todos os valores possíveis.
A tabela fornece a proporção da população entre a média (\(Z=0\)) e qualquer valor de \(Z\).

Como Ler a Tabela Z

Na coluna da esquerda: parte inteira e primeiro decimal do escore Z (ex: 1,2).
Na linha superior: segundo decimal (ex: 0,05).
A célula na interseção fornece a área entre \(Z=0\) e o valor buscado.
Exemplo: \(Z = 1{,}25\) → tabela devolve \(0{,}3944\) (\(39{,}44\%\)).

Z	0,00	0,01	0,02	0,03	0,04	0,05
1,0	0,3413	0,3438	0,3461	0,3485	0,3508	0,3531
1,1	0,3643	0,3665	0,3686	0,3708	0,3729	0,3749
1,2	0,3849	0,3869	0,3888	0,3907	0,3925	0,3944

As Quatro Situações da Tabela Z

Figura 8

Exemplo: Glicemia Sanguínea — Parte 1

Cenário: Glicose em jejum em adultos saudáveis: \(\mu = 100\) mg/dL, \(\sigma = 6\) mg/dL.

Parâmetro	Valor
Média (\(\mu\))	100 mg/dL
Desvio-padrão (\(\sigma\))	6 mg/dL

Pergunta: Qual a probabilidade de glicemia superior a 110 mg/dL?

Exemplo: Glicemia Sanguínea — Parte 2

Convertendo em escore Z:

\[z = \frac{110 - 100}{6} = \frac{10}{6} \approx 1{,}67\]

A pergunta equivale a: Qual é a área à direita de \(Z = 1{,}67\)?

Tabela Z para \(Z = 1{,}67\): linha 1,6 — coluna 0,07 → \(0{,}4525\)

Exemplo: Glicemia Sanguínea — Resolução

\[P(Z > 1{,}67) = 0{,}5000 - 0{,}4525 = \mathbf{0{,}0475}\]

✅ Apenas 4,75% dos adultos saudáveis têm glicemia superior a 110 mg/dL pela variação biológica natural.

Exemplo: Internações Psiquiátricas — Parte 1

Cenário: Tempo de internação em hospital psiquiátrico: \(\mu = 50\) dias, \(\sigma = 10\) dias.

Pergunta: Qual a probabilidade de internação entre 30 e 50 dias?

Exemplo: Internações Psiquiátricas — Parte 2

Convertendo os limites:

Limite superior (\(X = 50\)): \(z = \dfrac{50 - 50}{10} = 0\) (coincide com a média)

Limite inferior (\(X = 30\)): \(z = \dfrac{30 - 50}{10} = -2{,}0\)

\[z_{50} = 0 \qquad z_{30} = -2{,}0\]

Pela simetria: \(P(-2{,}0 \leq Z \leq 0) = P(0 \leq Z \leq 2{,}0)\) → tabela: \(0{,}4772\)

Exemplo: Internações Psiquiátricas — Resolução

\[P(-2{,}0 \leq Z \leq 0) = \mathbf{0{,}4772} \; (47{,}72\%)\]

✅ Cerca de 48% dos pacientes têm alta entre 30 e 50 dias — informação valiosa para o giro de leitos.

Definindo um Limite Clínico — Parte 1

Cenário: Teste psicométrico: \(\mu = 58\) min, \(\sigma = 9{,}5\) min.

Pergunta inversa: O coordenador quer que 90% dos candidatos terminem a tempo. Qual o tempo limite?

Área à esquerda desejada: \(0{,}90\)
Área a buscar na tabela: \(0{,}90 - 0{,}50 = 0{,}40\)

Definindo um Limite Clínico — Parte 2

Buscando \(0{,}4000\) na tabela Z (leitura reversa):

O valor mais próximo é \(0{,}3997\) → \(Z_{\text{crit}} = 1{,}28\)

\[X = \mu + Z \cdot \sigma = 58 + (1{,}28 \times 9{,}5) = 58 + 12{,}16 = \mathbf{70{,}16} \text{ min}\]

✅ Com o limite de 70 minutos, 90% dos candidatos terminarão a tempo. O mesmo raciocínio define pontos de corte em exames laboratoriais e normas de qualidade hospitalar.

Áreas entre Dois Valores

Mesmo lado da média: \(P(Z_1 \leq Z \leq Z_2) = \text{tab}(Z_2) - \text{tab}(Z_1)\)
Lados opostos: \(P(-Z_1 \leq Z \leq Z_2) = \text{tab}(Z_1) + \text{tab}(Z_2)\)

Figura 11

O Teorema do Limite Central

Mesmo quando a variável original não tem distribuição normal, a média de amostras repetidas tende a se comportar como normal.
Para amostras com \(n \geq 30\), essa aproximação é geralmente satisfatória.
Isso permite aplicar os métodos da distribuição normal mesmo em situações onde a população original é assimétrica.

Quando a Variável NÃO é Normal

Figura 12

Aplicar os métodos da normal a dados fortemente assimétricos produz conclusões incorretas.
Nesses casos, a estatística dispõe de métodos não-paramétricos (baseados em postos/ranks).

Aplicações da Normal na Área da Saúde

Curvas de crescimento pediátrico (peso, altura, perímetro cefálico por idade).
Definição de valores de referência laboratoriais (hemoglobina, glicemia, pressão arterial).
Controle de qualidade (temperatura de refrigeradores de vacinas, concentração de soluções).
Testes de hipótese em pesquisas clínicas (base de testes como o teste t e o teste z).

Resumo do Bloco 3

Variáveis contínuas biológicas tendem a seguir o modelo de sino de Gauss.
Dois parâmetros definem completamente a curva: \(\mu\) (posição) e \(\sigma\) (dispersão).
O escore Z padroniza qualquer medida em uma escala universal adimensional.
A tabela Z permite calcular probabilidades e definir limites de referência sem integrais.

Síntese Final

Conectando os Três Blocos

Probabilidades → estabelecem as regras do acaso — incluindo o Teorema de Bayes para raciocínio diagnóstico.
Distribuição Binomial → modela contagens de eventos binários em grupos de tamanho fixo.
Distribuição Normal → descreve o comportamento contínuo das variáveis biométricas humanas.
Os três modelos compõem a base da inferência estatística em saúde.

Síntese Geral: As Fórmulas-Chave

Probabilidade Clássica: \[P(E) = \frac{\text{favoráveis}}{\text{possíveis}}\]

Probabilidade Condicional: \[P(A \mid B) = \frac{P(A\cap B)}{P(B)}\]

Teorema de Bayes: \[P(B_i \mid A) = \frac{P(A \mid B_i)\cdot P(B_i)}{\displaystyle\sum_j P(A \mid B_j)\cdot P(B_j)}\]

Distribuição Binomial: \[P(X=x) = \frac{n!}{x!(n-x)!}\, p^x\, q^{n-x}\]

Escore Z: \[z = \frac{x - \mu}{\sigma}\]

A Estatística a Serviço da Vida

Dominar a bioestatística não é um exercício matemático abstrato.
É a capacidade de ler evidências, questionar dados e tomar decisões clínicas fundamentadas.
Profissionais da área da saúde que compreendem probabilidades protegem pacientes com mais precisão e segurança.

Recursos para Continuar

Tabela da Distribuição Normal Padrão: Apêndice A do livro-texto.
Software Jamovi/Linguagem R: funções dbinom(), pbinom(), pnorm(), qnorm() para cálculos automáticos.
Calculadoras online de distribuições de probabilidade para verificação dos resultados.

Referências Bibliográficas

VIEIRA, Sonia. Introdução à Bioestatística. 6. ed. Rio de Janeiro: Guanabara Koogan, 2021.

Capítulos utilizados:

Capítulo 14 — Probabilidades
Capítulo 15 — Distribuição Binomial
Capítulo 8 — Distribuição Normal

Dúvidas e Discussão

🎲 Probabilidades: a lógica do acaso controlado.
🔢 Distribuição Binomial: a previsão de eventos discretos.
📈 Distribuição Normal: a lei que governa a variação biológica contínua.
🔬 Teorema de Bayes: a atualização de crença à luz de evidências.

O espaço é de vocês — perguntas, comentários e aplicações clínicas são bem-vindos.