Una de contínua i una de discreta

Com ja sabem, la distribució binomial es pot aproximar per una distribució normal de la mateixa esperança i variància quan es compleixen les condicions adients (\(n\) gran i \(p \cdot n\) i \((1-p)\cdot n\) no petits), i aquesta aproximació és molt útil per fer càlculs a mà amb la distribució binomial.

Si en aquestes condicions comparem l’histograma de la funció de probabilitat d’una binomial i la densitat de probabilitat de la normal, podem veure que s’assemblen, i això és el que ens permet aproximar una per l’altra.

Ara bé, la binomial és una distribució discreta i la normal és una distribució contínua, i això fa que les probabilitats no siguin directament comparables. Per exemple:

Tornem a comparar la funció de probabilitat de la binomial i la densitat de probabilitat de la normal:

Hem marcat amb blau la vora del rectangle que correspon a \(X=5\) a la binomial. L’àrea d’aquest rectangle és proporcional \(P(X=5)\). Fer servir la normal per aproximar aquesta probabilitat vol dir agafar una àrea sota la corba de la normal per aproximar l’àrea d’aquest rectangle, però, quina àrea hem d’agafar?

L’àrea que farem servir és la que hem ombrejat en blau, que correspon a la zona que queda més a prop de 5 de que dels nombres veïns (4 i 6). O sigui, estem aproximant \(P(X=5)\) a la binomial per \(P(4,5 < X < 5,5)\) a la normal.

Molt sovint el que ens interessarà no és la probabilitat d’un únic valor (com el cas \(P(X=5)\) que acabem de veure) sinó la probabilitat d’un intèrval. En aquest cas, haurem de veure quins nombres entren a l’intèrval i fer la mateixa aproximació que hem fet. Per exemple, \(P(5 \le X \le 6)\) en una binomial és la probabilitat que \(X\) valgui 5 o 6. Aleshores, a la normal l’aproximem per la probabilitat de quedar més a prop d’aquests nombres que dels veïns, o sigui, \(P(4,5 < X < 6,5)\). Ho podem veure a la gràfica:

Al càlcul de la probabilitat de qualsevol intèrval amb la binomial ens haurem de preguntar si els extrems de l’interval estan inclosos a la probabilitat que ens demanen, i corregir en conseqüència l’interval que calcularem amb la normal. Per exemple:

La probabilitat \(P(5 \le X \le 10)\) inclou tant la probabilitat de \(X=5\) com la de \(X=10\), a més de tots els enters entre aquests dos. Aleshores, l’aproximariem per \(P(4,5 < X < 10,5)\) en una normal.

En canvi, \(P(5 < X < 10)\) no inclou ni la probabilitat de \(X=5\) ni la de \(X=10\) sinó només els enters entre aquests dos. Aleshores, l’aproximariem per \(P(5,5 < X < 9,5)\) en una normal.

Per aquesta correcció cal que mirem per separat els dos extrems de l’interval. \(P(5 < X \le 10)\) no inclou la probabilitat de \(X=5\) però sí que inclou la de \(X=10\). Aleshores, l’aproximariem per \(P(5,5 < X < 10,5)\) en una normal.

I el mateix per \(P(5 \le X < 10)\), que aproximarem per \(P(4,5 < X < 9,5)\) a la normal.

Millor o pitjor aproximació

Als gràfics anteriors deveu haver notat que l’aproximació entre la normal i la binomial és lluny de ser perfecta i que en alguns llocs la densitat de probabilitat de la normal queda clarament per sobre o per sota de la probabiliat de la binomial. Per que es viessin millor les gràfiques, hem agafat una \(n\) relativament petita (\(n=30\)) que queda molt a prop del límit en que una binomial s’aproxima raonablement bé per una normal. Com més lluny d’aquest límit estiguem (o sigui, com més gran siguin \(n\), \(p\cdot n\) i \((1-p) \cdot n\)) millor serà l’aproximació. Veiem-ne tres exemples:

Un cas en que l’aproximació és molt bona:

Una cas amb una aproximació acceptable:

I un cas amb una aproximació molt dolenta (de fet, ja no complim les condicions per aproximar una binomial per una normal):