Como ya sabemos, la distribución binomial se puede aproximar por una distribución normal de la misma esperanza y varianza cuando se cumplen las condiciones adecuadas (\(n\) grande y \(p \cdot n\) y \((1-p)\cdot n\) no pequeños), y esta aproximación es muy útil para hacer cálculos a mano con la distribución binomial.
Si en estas condiciones comparamos el histograma de la función de probabilidad de una binomial y la densidad de probabilidad de la normal, podemos ver que se parecen, y eso es lo que nos permite aproximar una por la otra.
Ahora bien, la binomial es una distribución discreta y la normal es una distribución continua, y eso hace que las probabilidades no sean directamente comparables. Por ejemplo:
\(P(X=k)\) es diferente de cero en una binomial para \(k\) número natural entre 0 i \(n\) (esta es la probabilidad que calculamos con la fórmula de la binomial). En cambio, en una normal \(P(X=k)=0\), porque los valores individuales tienen una probabilidad de 0, en cualquier distribución continua.
En una binomial o en cualquier distribución discreta, para \(k\) entero, no es lo mismo \(P(X<k)\) que \(P(X \le k)\) (la diferencia es precisamente \(P(X=k)\)). En cambio, en una normal o en cualquier distribución continua \(P(X < k) =P(X \le k)\).
Volvamos a comparar la función de probabilidad de la binomial y la densidad de probabilidad de la normal:
Hemos marcado con azul el borde del rectángulo que corresponde a \(X=5\) a la binomial. El área de este rectángulo es proporcional \(P(X=5)\). Usar la normal para aproximar esta probabidilidad significa coger una área bajo la curva de la normal para aproximar el área de este rectángulo, pero, ¿qué área hemos de coger?
El área que usaremos es la que hemos sombreado en azul, que corresponde con la zona que queda más cerca de 5 que de los números vecinos (4 y 6). Es decir, estemos aproximando \(P(X=5)\) a la binomial por \(P(4,5 < X < 5,5)\) a la normal.
A menudo lo que nos interesará no es la probabilidad de un único valor (como el caso \(P(X=5)\) que acabamos de ver) sino la probabilidad de un intervalo. En este caso, tendremos que ver qué números entran en el intervalo y hacer la misma aproximación que hemos hecho. Por ejemplo, \(P(5 \le X \le 6)\) en una binomial es la probabilidad de que \(X\) valga 5 o 6. Ahora bien, en la normal lo aproximaremos por la probabilidad de quedar más cerca de estos números que de los valores vecinos, o sea, \(P(4,5 < X < 6,5)\). Lo podemos ver en la gráfica:
En el cálculo de la probabilidad de cualquier intervalo con la binomial nos debemos preguntar si los extremos del intervalo están incluidos en la probabilidad que nos piden, y corregir en consecuencia el intervalo que calcularemos con la normal. Por ejemplo:
La probabilidad \(P(5 \le X \le 10)\) incluye tanto la probabilidad de \(X=5\) como la de \(X=10\), además de todos los enteros entre estos dos. Entonces, lo aproximaríamos por \(P(4,5 < X < 10,5)\) en una normal.
En cambio, \(P(5 < X < 10)\) no incluye ni la probabilidad de \(X=5\) ni la de \(X=10\) sino, solamente, los enteros entre esos dos. Entonces, lo aproximaríamos por \(P(5,5 < X < 9,5)\) en una normal.
Para esta corrección debemos mirar por separado los dos extremos del intervalo. \(P(5 < X \le 10)\) no incluye la probabilidad de \(X=5\) pero sí que incluye la de \(X=10\). Entonces, lo aproximaríamos por \(P(5,5 < X < 10,5)\) en una normal.
Y lo mismo para \(P(5 \le X < 10)\), que aproximaremos por \(P(4,5 < X < 9,5)\) en la normal.
En los gráficos anteriores debemos haber notado que la aproximación entre la normal y la binomial está lejos de ser perfecta y que en algunos lugares la densidad de probabilidad de la normal queda claramente por encima o por debajo de la probabilidad de la binomial. Para que se vean mejor los gráficos, hemos cogido un \(n\) relativamente pequeño (\(n=30\)) que queda muy cerca del límite en que una binomial se aproxima razonablemente bien a una normal. Cuanto más lejos de este límite estemos (o sea, cuanto más grande sea \(n\), \(p\cdot n\) y \((1-p) \cdot n\)) mejor será la aproximación. Veamos tres ejemplos:
Un caso en que la aproximación es muy buena:
Un caso con una aproximación aceptable:
Y un caso con una aproxiamción bastante mala (de hecho, no se cumplen las condiciones para aproximar una binomial por una normal):