1. Introducción

La distribución binomial es una distribución de probabilidad discreta que cuenta el número x de éxitos en una secuencia de n ensayos. Se caracteriza por que cada ensayo concluye en éxito o fracaso, los ensayos se consideran independientes entre sí y la probabilidad de éxito en cada ensayo es constante.

Fuente: Wikipedia.

La variable aleatoria x representa la cantidad de éxitos obtenidos y se cumple que 0 <= x <= n.

Su función de probabilidad es:

\[\LARGE P(x) = {{n}\choose{x}} \cdot p^xq^{n-x}\]

En relación a esta distribución, R tiene 4 funciones:

  • rbinom: genera valores aleatorios acorde a los parámetros indicados.
  • dbinom: calcula la probabilidad puntual para un valor específico.
  • pbinom: proporciona la probabilidad acumulada para un cuantil específico.
  • qbinom: proporciona el cuantil para una probabilidad específica.


2. Números aleatorios

Se pueden generar números aleatorios que provengan de una distribución binomial con parámetros específicos.


CASO A. Calculemos 3 lotes de 10 valores aleatorios a partir de una distribución binomial con p = 0.35 (probabilidad de éxito) y n = 15 (cantidad de ensayos).

La cantidad mínima de éxitos que se puede obtener es 0 y la cantidad máxima es 15.

rbinom(10, size = 15, prob = 0.35)
##  [1]  6 10  4 10  4  6  8  3  5  7
rbinom(10, size = 15, prob = 0.35)
##  [1] 8 6 4 3 2 3 8 4 5 6
rbinom(10, size = 15, prob = 0.35)
##  [1] 7 7 5 6 4 4 7 3 6 6


CASO B. Calculemos 3 lotes de 10 valores aleatorios a partir de una distribución binomial con p = 0.67 (probabilidad de éxito) y n = 3 (cantidad de ensayos).

La cantidad mínima de éxitos que se puede obtener es 0 y la cantidad máxima es 3.

rbinom(10, size = 3, prob = 0.67)
##  [1] 3 3 2 3 3 2 3 2 1 3
rbinom(10, size = 3, prob = 0.67)
##  [1] 0 2 2 2 2 0 3 3 1 2
rbinom(10, size = 3, prob = 0.67)
##  [1] 2 3 2 2 2 3 1 3 1 2


Observemos que en cada caso se obtienen diferentes rangos de valores porque aunque ambos casos son distribuciones aleatorias binomiales, sus parámetros son diferentes.


3. Cálculo de probabilidades

En un fenómeno binomial, nos interesa calcular la probabilidad de obtener un cierto número de éxitos, representado por la variable aleatoria x.

Por ejemplo, si realizamos un experimento binomial con una probabilidad de éxito de 0.47 y lo repetimos 5 veces, la variable aleatoria x puede tener como posibles resultados, los valores del 0 al 5.


La función dbinom calcula la probabilidad puntual para cada resultado, es decir, P(X = x).

x <- c(0, 1,2, 3, 4, 5)
dbinom(x, size = 5, prob = 0.47)
## [1] 0.04181955 0.18542630 0.32886929 0.29163881 0.12931155 0.02293450
#P(X = 0)
dbinom(0, size = 5, prob = 0.47)
## [1] 0.04181955
#P(X = 1)
dbinom(1, size = 5, prob = 0.47)
## [1] 0.1854263
#P(X = 2)
dbinom(2, size = 5, prob = 0.47)
## [1] 0.3288693
#P(X = 3)
dbinom(3, size = 5, prob = 0.47)
## [1] 0.2916388
#P(X = 4)
dbinom(4, size = 5, prob = 0.47)
## [1] 0.1293115
#P(X = 5)
dbinom(5, size = 5, prob = 0.47)
## [1] 0.0229345


La función pbinom calcula la probabilidad acumulada para cada resultado, es decir, P(X <= x).

x <- c(0, 1,2, 3, 4, 5)
pbinom(x, size = 5, prob = 0.47)
## [1] 0.04181955 0.22724585 0.55611515 0.84775395 0.97706550 1.00000000
#P(X <= 0)
pbinom(0, size = 5, prob = 0.47)
## [1] 0.04181955
#P(X <= 1)
pbinom(1, size = 5, prob = 0.47)
## [1] 0.2272459
#P(X <= 2)
pbinom(2, size = 5, prob = 0.47)
## [1] 0.5561151
#P(X <= 3)
pbinom(3, size = 5, prob = 0.47)
## [1] 0.847754
#P(X <= 4)
pbinom(4, size = 5, prob = 0.47)
## [1] 0.9770655
#P(X <= 5)
pbinom(5, size = 5, prob = 0.47)
## [1] 1


Podemos construir un data frame para una representación tabular de estos cálculos de probabilidad.

tabla.binomial <- data.frame(x, 
                             dbinom(x, size = 5, prob = 0.47), 
                             pbinom(x, size = 5, prob = 0.47))
names(tabla.binomial) <- c('x', 'P(X = x)', 'P(X <= x)')
tabla.binomial
x P(X = x) P(X <= x)
0 0.0418195 0.0418195
1 0.1854263 0.2272459
2 0.3288693 0.5561151
3 0.2916388 0.8477540
4 0.1293115 0.9770655
5 0.0229345 1.0000000


4. Cálculo de cuantiles

Un cuantil asociado a una probabilidad p, se define como el valor más pequeño posible de la variable x que cumpla que F(x) >= p, donde F(x) es la función de probabilidad acumulada.


La función qbinom calcula el cuantil a partir de una probabilidad acumulada. Esta función es inversa a pbinom.

Por ejemplo, si realizamos un experimento binomial con una probabilidad de éxito de 0.63 y lo repetimos 50 veces, podemos calcular los cuantiles que corresponden a las probabilidades 0.25, 0.50, 0.75 con la siguiente instrucción:

p <- c(0.25, 0.50, 0.75)
qbinom(p, size = 50, prob = 0.63)
## [1] 29 32 34


5. Ejemplo práctico

La última novela de un autor ha tenido un gran éxito, al punto de que el 80% de todos los miembros del club de lectura local lo han leído. Usted organiza una pequeña reunión para discutir acerca de la novela y confirman asistir 5 personas.

Al ser un fenómeno binomial, el número de ensayos queda definido por los asistentes a la reunión y la probabilidad de éxito queda definida por el porcentaje de personas que han leído la novela, de manera que:

  • n = 5
  • p = 0.8


¿Qué probabilidad hay de que entre sus invitados exactamente 2 hayan leído la novela?

Para responder, hay que calcular la probabilidad de que x sea 2 con la función dbinom.

P(X = 2)

# P(X = 2).

dbinom(2, size = 5, prob = 0.8)
## [1] 0.0512


¿Qué probabilidad hay de que entre sus invitados máximo 2 hayan leído la novela?

Para responder, hay que calcular la probabilidad de que 0 personas o 1 persona o 2 personas hayan leído la novela, para esto se suman las probabilidades puntuales de cada caso con la función dbinom o se calcula la probabilidad acumulada hasta 2 con la función pbinom.

P(X <= 2)

# OPCIÓN 1. Sumando las probabilidades puntuales --> P(X = 0) + P(X = 1) + P(x = 2).

dbinom(0, size = 5, prob = 0.8) + 
dbinom(1, size = 5, prob = 0.8) + 
dbinom(2, size = 5, prob = 0.8)
## [1] 0.05792
# OPCIÓN 2. Calculando directamente la probabilidad acumulada --> P(X <= 2)

pbinom(2, size = 5, prob = 0.8)
## [1] 0.05792


¿Qué probabilidad hay de que entre sus invitados menos de 2 hayan leído la novela?

Para responder, hay que calcular la probabilidad de que 0 personas o 1 persona hayan leído la novela, para esto se suman las probabilidades puntuales de cada caso con la función dbinom o se calcula la probabilidad acumulada hasta 1 con la función pbinom.

P(X < 2)

[ equivalente a P(X <= 1) ]

# OPCIÓN 1. Sumando las probabilidades puntuales --> P(X = 0) + P(X = 1)

dbinom(0, size = 5, prob = 0.8) + dbinom(1, size = 5, prob = 0.8)
## [1] 0.00672
# OPCIÓN 2. Calculando directamente la probabilidad acumulada --> P(X <= 1)

pbinom(1, size = 5, prob = 0.8)
## [1] 0.00672


¿Qué probabilidad hay de que entre sus invitados al menos 2 hayan leído la novela?

Para responder, usamos las propiedades de un evento y su complemento, por lo tanto, hay que restarle a 1 la probabilidad del caso complementario que sería que menos de 2 hayan leído la novela.

P(X >= 2)

[Equivalente a 1 - P(X < 2)]

1 - pbinom(1, size = 5, prob = 0.8)
## [1] 0.99328


¿Qué probabilidad hay de que entre sus invitados más de 2 hayan leído la novela?

Para responder, usamos las propiedades de un evento y su complemento, por lo tanto, hay que restarle a 1 la probabilidad del caso complementario que sería que máximo 2 personas hayan leído la novela.

P(X > 2)

[Equivalente a 1 - P(X <= 2)]

1 - pbinom(2, size = 5, prob = 0.8)
## [1] 0.94208



Anexo. Relación de funciones

Las siguientes son las funciones que es recomendable revisar la documentación para ir entendiendo que hace cada función y que opciones tiene.

  • rbinom
  • dbinom
  • pbinom
  • qbinom

     

 

Dr. José Luis Barrera Canto

Profesor Investigador

División de Ingeniería y Ciencias Exactas
Universidad Anáhuac Mayab

jose.luis.barrera.canto@gmail.com