Videoaula 01 – Por que a curva normal é tão importante?

Variabilidade biológica, histograma, propriedades e parâmetros da curva normal

Autor

Prof. Marcelo Ribeiro

Pergunta guia

Por que tantas variáveis biológicas parecem se organizar em torno de um valor central?

Objetivo da videoaula

Ao final desta videoaula, o aluno deverá compreender por que a distribuição normal é um modelo importante para organizar a variabilidade observada em variáveis biológicas e nutricionais.

1. Por que estudar a distribuição normal?

A variabilidade biológica aparece porque os indivíduos diferem entre si.

A curva normal ajuda a representar a regularidade existente dentro dessa variabilidade.

A primeira figura destaca que, em Bioestatística, analisamos dados de indivíduos que diferem entre si: glicemia, pressão arterial, IMC, estatura e marcadores bioquímicos variam de pessoa para pessoa. A segunda figura mostra que, apesar dessa variabilidade, muitos valores tendem a se organizar em torno de um centro, formando um padrão que pode ser representado pela distribuição normal.

Em pesquisas em Saúde e Nutrição, a primeira constatação importante é que os indivíduos não são iguais. Pessoas diferentes apresentam medidas diferentes. No entanto, quando observamos muitos indivíduos ao mesmo tempo, essas diferenças podem revelar um padrão: muitos valores se concentram próximos a um ponto central e poucos valores aparecem nos extremos.

Exemplos de variáveis que costumam variar entre indivíduos:

  • glicemia em jejum;
  • colesterol total;
  • pressão arterial;
  • IMC;
  • circunferência da cintura;
  • concentração sérica de nutrientes;
  • marcadores hematológicos;
  • estatura;
  • massa corporal;
  • indicadores bioquímicos.

É nesse ponto que a distribuição normal começa a fazer sentido. Ela não elimina a variabilidade; ela nos ajuda a representar a regularidade existente dentro da variabilidade.

A distribuição normal, também conhecida como curva de Gauss, é um modelo usado para representar esse tipo de comportamento.

Na prática, o que observamos inicialmente é um histograma. Quando a variável apresenta muitos valores próximos ao centro e poucos valores nos extremos, esse histograma pode se aproximar de uma curva em forma de sino. A curva normal pode ser entendida, portanto, como uma representação teórica, contínua e suavizada desse comportamento.

Comentário do professor

A curva normal não deve ser entendida como uma exigência cega da Estatística. Ela é um modelo. Como todo modelo, serve para simplificar uma realidade variável e permitir decisões analíticas mais organizadas.

Atenção

Em Estatística, a palavra normal se refere ao formato da distribuição dos dados, e não necessariamente a uma condição clínica de saúde. Uma variável pode apresentar distribuição normal em indivíduos saudáveis ou em indivíduos doentes. Portanto, “normalidade estatística” não é sinônimo automático de “normalidade clínica”.

A distribuição normal, ou curva de Gauss, pode ser representada pela seguinte função de densidade de probabilidade:

f(x)=1σ2πexp[12(xμσ)2],<x< f(x)=\frac{1}{\sigma\sqrt{2\pi}} \exp\left[ -\frac{1}{2} \left( \frac{x-\mu}{\sigma} \right)^2 \right], \quad -\infty < x < \infty

em que:

  • xx representa um valor qualquer da variável quantitativa;
  • μ\mu representa a média populacional;
  • σ\sigma representa o desvio-padrão populacional;
  • π\pi é a constante matemática pi;
  • exp\exp representa a função exponencial.
Interpretação da fórmula

Embora a fórmula pareça complexa, a mensagem principal é simples: a forma da curva normal depende essencialmente de dois parâmetros, a média μ\mu e o desvio-padrão σ\sigma.

2. Propriedades da curva normal

Na figura a seguir, a curva é apresentada em torno da média e do desvio-padrão, o que facilita a visualização das propriedades e da regra aproximada 68%–95%–99,7%.

A curva normal possui as seguintes propriedades:

  1. tem formato aproximado de sino;
  2. é simétrica em torno da média;
  3. média, mediana e moda coincidem quando a distribuição é perfeitamente normal;
  4. a maior parte dos valores se concentra próximo da média;
  5. valores muito baixos ou muito altos são menos frequentes;
  6. a área total sob a curva corresponde a 1, ou seja, 100% dos indivíduos;
  7. aproximadamente 68% dos valores estão entre média ±\pm 1 desvio-padrão;
  8. aproximadamente 95% dos valores estão entre média ±\pm 2 desvios-padrão;
  9. aproximadamente 99,7% dos valores estão entre média ±\pm 3 desvios-padrão;
  10. teoricamente, as caudas se aproximam do eixo horizontal, mas não o tocam;
  11. os pontos de inflexão ocorrem aproximadamente em μσ\mu-\sigma e μ+σ\mu+\sigma.
Área sob a curva

Qualquer área sob a curva normal representa uma fração do total de observações. Assim, uma área de 0,68 corresponde a aproximadamente 68% dos indivíduos; uma área de 0,95 corresponde a aproximadamente 95%; e uma área de 0,997 corresponde a aproximadamente 99,7%.

3. Parâmetros da curva normal: média e desvio-padrão

A curva normal é completamente determinada por dois parâmetros:

  • a média μ\mu;
  • o desvio-padrão σ\sigma.

A média define a posição da curva no eixo horizontal. Se duas curvas têm o mesmo desvio-padrão, mas médias diferentes, elas têm a mesma forma, porém ficam deslocadas para a esquerda ou para a direita.

O desvio-padrão define a dispersão da curva. Se duas curvas têm a mesma média, mas desvios-padrão diferentes, a curva com menor desvio-padrão será mais estreita e mais alta; a curva com maior desvio-padrão será mais larga e mais baixa.

Comentário do professor

Na prática, a média informa onde a distribuição está centralizada, enquanto o desvio-padrão informa o quanto os valores tendem a se espalhar em torno dessa média.

Demonstração interativa: efeito da média e do desvio-padrão

A curva normal é determinada por dois parâmetros principais:

  • a média populacional μ\mu, que controla a posição da curva;
  • o desvio-padrão populacional σ\sigma, que controla a dispersão dos valores.

Distribuição normal simulada

Arraste os controles para observar como μ e σ modificam a curva normal.

curva de referência μ = 90 | σ = 10
Controla a posição da curva
90

Ao alterar a média, a curva se desloca para a esquerda ou para a direita, mantendo a mesma forma quando o desvio-padrão não muda.

Controla a dispersão dos valores
10

Ao aumentar o desvio-padrão, a curva fica mais larga e mais baixa. Ao diminuir, fica mais estreita e mais alta.

Interpretação para a fala

Com μ = 90 e σ = 10, a curva está centrada em 90 e a maior concentração de valores ocorre ao redor da média.

curva atual referência região entre μ - σ e μ + σ
Ao modificar os parâmetros, observe simultaneamente o deslocamento da curva, sua largura e sua altura.
Comentário do professor

A média desloca a curva. O desvio-padrão altera a sua largura. Portanto, duas distribuições normais podem ter centros diferentes, dispersões diferentes, ou ambos.

Fechamento da videoaula

A curva normal nos ajuda a transformar a variabilidade biológica em uma estrutura interpretável.