La distribución binomial es una distribución de probabilidad discreta que cuenta el número x de éxitos en una secuencia de n ensayos. Se caracteriza por que cada ensayo concluye en éxito o fracaso, los ensayos se consideran independientes entre sí y la probabilidad de éxito en cada ensayo es constante.
Fuente: Wikipedia.
La variable aleatoria x representa la cantidad de éxitos obtenidos y se cumple que 0 <= x <= n.
Su función de probabilidad es:
\[\LARGE P(x) = {{n}\choose{x}} \cdot p^xq^{n-x}\]
En relación a esta distribución, R tiene 4 funciones:
Se pueden generar números aleatorios que provengan de una distribución binomial con parámetros específicos.
CASO A. Calculemos 3 lotes de 10 valores aleatorios a partir de una distribución binomial con p = 0.35 (probabilidad de éxito) y n = 15 (cantidad de ensayos).
La cantidad mínima de éxitos que se puede obtener es 0 y la cantidad máxima es 15.
## [1] 6 10 4 10 4 6 8 3 5 7
## [1] 8 6 4 3 2 3 8 4 5 6
## [1] 7 7 5 6 4 4 7 3 6 6
CASO B. Calculemos 3 lotes de 10 valores aleatorios a partir de una distribución binomial con p = 0.67 (probabilidad de éxito) y n = 3 (cantidad de ensayos).
La cantidad mínima de éxitos que se puede obtener es 0 y la cantidad máxima es 3.
## [1] 3 3 2 3 3 2 3 2 1 3
## [1] 0 2 2 2 2 0 3 3 1 2
## [1] 2 3 2 2 2 3 1 3 1 2
Observemos que en cada caso se obtienen diferentes rangos de valores porque aunque ambos casos son distribuciones aleatorias binomiales, sus parámetros son diferentes.
En un fenómeno binomial, nos interesa calcular la probabilidad de obtener un cierto número de éxitos, representado por la variable aleatoria x.
Por ejemplo, si realizamos un experimento binomial con una probabilidad de éxito de 0.47 y lo repetimos 5 veces, la variable aleatoria x puede tener como posibles resultados, los valores del 0 al 5.
La función dbinom calcula la probabilidad puntual para cada resultado, es decir, P(X = x).
## [1] 0.04181955 0.18542630 0.32886929 0.29163881 0.12931155 0.02293450
## [1] 0.04181955
## [1] 0.1854263
## [1] 0.3288693
## [1] 0.2916388
## [1] 0.1293115
## [1] 0.0229345
La función pbinom calcula la probabilidad acumulada para cada resultado, es decir, P(X <= x).
## [1] 0.04181955 0.22724585 0.55611515 0.84775395 0.97706550 1.00000000
## [1] 0.04181955
## [1] 0.2272459
## [1] 0.5561151
## [1] 0.847754
## [1] 0.9770655
## [1] 1
Podemos construir un data frame para una representación tabular de estos cálculos de probabilidad.
tabla.binomial <- data.frame(x,
dbinom(x, size = 5, prob = 0.47),
pbinom(x, size = 5, prob = 0.47))
names(tabla.binomial) <- c('x', 'P(X = x)', 'P(X <= x)')
tabla.binomial| x | P(X = x) | P(X <= x) |
|---|---|---|
| 0 | 0.0418195 | 0.0418195 |
| 1 | 0.1854263 | 0.2272459 |
| 2 | 0.3288693 | 0.5561151 |
| 3 | 0.2916388 | 0.8477540 |
| 4 | 0.1293115 | 0.9770655 |
| 5 | 0.0229345 | 1.0000000 |
Un cuantil asociado a una probabilidad p, se define como el valor más pequeño posible de la variable x que cumpla que F(x) >= p, donde F(x) es la función de probabilidad acumulada.
La función qbinom calcula el cuantil a partir de una probabilidad acumulada. Esta función es inversa a pbinom.
Por ejemplo, si realizamos un experimento binomial con una probabilidad de éxito de 0.63 y lo repetimos 50 veces, podemos calcular los cuantiles que corresponden a las probabilidades 0.25, 0.50, 0.75 con la siguiente instrucción:
## [1] 29 32 34
La última novela de un autor ha tenido un gran éxito, al punto de que el 80% de todos los miembros del club de lectura local lo han leído. Usted organiza una pequeña reunión para discutir acerca de la novela y confirman asistir 5 personas.
Al ser un fenómeno binomial, el número de ensayos queda definido por los asistentes a la reunión y la probabilidad de éxito queda definida por el porcentaje de personas que han leído la novela, de manera que:
Para responder, hay que calcular la probabilidad de que x sea 2 con la función dbinom.
P(X = 2)
## [1] 0.0512
Para responder, hay que calcular la probabilidad de que 0 personas o 1 persona o 2 personas hayan leído la novela, para esto se suman las probabilidades puntuales de cada caso con la función dbinom o se calcula la probabilidad acumulada hasta 2 con la función pbinom.
P(X <= 2)
# OPCIÓN 1. Sumando las probabilidades puntuales --> P(X = 0) + P(X = 1) + P(x = 2).
dbinom(0, size = 5, prob = 0.8) +
dbinom(1, size = 5, prob = 0.8) +
dbinom(2, size = 5, prob = 0.8)## [1] 0.05792
# OPCIÓN 2. Calculando directamente la probabilidad acumulada --> P(X <= 2)
pbinom(2, size = 5, prob = 0.8)## [1] 0.05792
Para responder, hay que calcular la probabilidad de que 0 personas o 1 persona hayan leído la novela, para esto se suman las probabilidades puntuales de cada caso con la función dbinom o se calcula la probabilidad acumulada hasta 1 con la función pbinom.
P(X < 2)
[ equivalente a P(X <= 1) ]
# OPCIÓN 1. Sumando las probabilidades puntuales --> P(X = 0) + P(X = 1)
dbinom(0, size = 5, prob = 0.8) + dbinom(1, size = 5, prob = 0.8)## [1] 0.00672
# OPCIÓN 2. Calculando directamente la probabilidad acumulada --> P(X <= 1)
pbinom(1, size = 5, prob = 0.8)## [1] 0.00672
Para responder, usamos las propiedades de un evento y su complemento, por lo tanto, hay que restarle a 1 la probabilidad del caso complementario que sería que menos de 2 hayan leído la novela.
P(X >= 2)
[Equivalente a 1 - P(X < 2)]
## [1] 0.99328
Para responder, usamos las propiedades de un evento y su complemento, por lo tanto, hay que restarle a 1 la probabilidad del caso complementario que sería que máximo 2 personas hayan leído la novela.
P(X > 2)
[Equivalente a 1 - P(X <= 2)]
## [1] 0.94208
Las siguientes son las funciones que es recomendable revisar la documentación para ir entendiendo que hace cada función y que opciones tiene.
rbinomdbinompbinomqbinom
Dr. José Luis Barrera Canto
Profesor Investigador
División de Ingeniería y Ciencias Exactas
Universidad Anáhuac Mayab