Estadística y Probabilidad

Clase 2.7
Distribución binomial

Msc. Roberto Trespalacios

Universidad Tecnológica de Bolivar

2024-01-29

Tabla de contenido

  • Distribución de Bernoulli
    • Función de probabilidad de la distribución de Bernoulli
  • Distribución de binomial
    • Función de probabilidad de una v.a binomial
    • Función de distribución de una v.a binomial
    • Valor esperado de una v.a binomial
    • Varianza de una v.a binomial
    • Ejemplos
    • Ejercicios

Distribución de Bernoulli

Sea \(X\) una variable aleatoria, que toma solo valores 1 para el evento \(A\) (éxito) y 0 para el evento \(\bar{A}\) (fracaso); es decir, su dominio es \(\{0,1\}\), definimos la dsitribución de Bernoulli como:

\[X \sim Ber(p)\] donde el parámetro \(p\), se define como la probabilidad de éxito; es decir,

\[\begin{align*} p(X=1)& = p \text{ (Éxito: evento A)} \\ p(X=0) & = 1-p \text{ (Fracaso: evento } \bar{A} ) \end{align*}\]

Función de probabilidad de la distribución de Bernoulli

Si la probabilidad de éxito es \(p\) y la de fracaso \(1-p\), podemos construir su función de probabilidad, y esta viene dada por la siguente fórmula

\[p(X=x)=p^x(1-p)^{1-x}, \quad para \quad x=0,1\]

Ejemplos de la distribución de Bernoulli

Algunos ejemplos donde se usa la distribución de Bernoulli son:

  • Obtener cara en el lanzamiento de una moneda.
  • Encestar en un juego de baloncesto.
  • Responder de forma correcta una pregunta en un examen.
  • Tratamiento médico; puede ser efectivo o no.
  • Lograr las metas de ventas de un mes en una empresa.

Distribución Binomial

Supongamos que repetimos \(n\) veces un experimento de Bernoulli, entonces, la suma de los resultados del experimento en las \(n\) repeticiones, tiene una distribución Binomial.

Características de un experimento binomial

Se dice que un experimento es binomial si:

  • El experimento es la repetición de un experimento de Bernoulli repetido un número fijo de veces (cada repetición del experimento se llama ensayo de Bernoulli).
  • Los ensayos son independientes (significa que el resultado de uno no afecta el resultadod el otro).
  • Para cada ensayo hay sólo dos posibles resultados mutuamente excluyentes, llamados éxito y fracaso.
  • La probabilidad de éxito es la misma para cada ensayo.

Distribucíon binomial - notación

  • \(n\): número de ensayos del experimento.
  • \(p\): probabilidad de éxito, en cada intento.
  • \(1-p\): probabilidad de fracaso, en cada intento.

La distribución binomial, se representa por

\[X \sim Bin(n,p)\]

En un experimento binomial lo que interesa es el número de éxitos en \(n\) ensayos. Por tanto, la variable aleatoria binomial \(X\) se define como:

\(X\): el número de éxitos en \(n\) ensayos. Así, los valores que puede tomar \(X\), son \(x= 0,1,2,3,\dots,n\).

Función de probabilidad de una v.a binomial

La función de probabilidad (densidad) para la variable aleatoria Binomial \(X\), es:

\[f(x)=p(X=x)=C_{x}^{n}p^{x}(1-p)^{n-x}\]

donde

  • \(n\): número de ensayos.
  • \(x = 0, 1, 2,\dots,n\).
  • \(p\): probabilidad de un éxito en cualquiera de los ensayos.
  • \(\displaystyle C_{x}^{n}=\frac{n!}{x!(n-x)!}\), es el número de resultados experimentales en los que hay exactamente \(x\) éxitos en \(n\) ensayos.

Gráfico de la función de densidad binomial para tres diferentes parámetros n y p

Code
library(ggplot2)

b1 = dbinom(x = 0:60, size = 60, prob = 0.2)
b2 = dbinom(x= 0:80, size = 80, prob = 0.2)
b3 = dbinom(x= 0:100, size = 100, prob = 0.4)

data <- data.frame(x =c(0:60,0:80,0:100), 
                   p = c(b1, b2, b3), 
                   d = rep(c("b1","b2","b3"), c(61,81,101))) 

ggplot(data) +
  geom_point(aes(x=x, y=p, color=d), size = 2) + 
  geom_segment(aes(x=x, xend=x, y=0, yend=p, color=d), size = 0.5, linetype="dashed", alpha= 0.6) +
  labs(title = "Función de densidad\nDistribución Binomial", x="x", y= "f(x)") +
  scale_colour_discrete(name  ="",
                            breaks=c("b1", "b2", "b3"),
                            labels=c("Bin(60,0.2)", "Bin(80,0.2)", "Bin(100,0.4)")) +
  theme_linedraw() +
  theme(plot.title = element_text(hjust = 0.5), text = element_text(size = 18),
        axis.title.y = element_text(angle = 0, vjust = 0.5))

Función de distribución de una v.a binomial

La función de distribución de la v.a. \(X \sim Bin(n,p)\), se define de la siguiente manera:

\[p(X \leqslant x)=\sum_{i=0}^x C_{i}^{n}p^{i}(1-p)^{n-i}\] su gráfica es la de una función escalonada, continua por la derecha y monótona no decreciente.

Gráfico de la distribución binomial para n=10 y p = 0.6

Code
library(ggplot2)

p = pbinom(q = 0:10, size = 10, prob = 0.6)

data = data.frame(x=-1:11, 
                  y=c(0, p, 1.0000), 
                  xend = 0:12,
                  yend=c(0, p, 1.0000),
                  xacu = 0:12,
                  yacu = c(p, 1.0000, 1.0000))

ggplot(data, aes(x=x, y=y)) +
  geom_point(aes(x=xend, y=yend), size = 4, color= "blue", shape=1) +
  geom_point(aes(x=xacu, y=yacu), size = 2, color= "blue") +
  geom_segment(aes(x=x, xend=xend, y=y, yend=yend), size = 0.8, alpha = 0.7) +
  scale_x_continuous(breaks = -1:12) +
  labs(title = "Función de distribución binomial; Bin(n=10, p= 0.6)", x="x", y= "F(x)") +
  theme_linedraw() +
  theme(plot.title = element_text(hjust = 0.5), text = element_text(size = 18),
        axis.title.y = element_text(angle = 0, vjust = 0.5))

Valor esperado y varianza de una v.a binomial

Valor esperado

El valor esperado \(E(X)\) o la media de una variable aleatoria Binomial \(X\), se representa por \(\mu_x\) o \(\mu\) y está dada por:

\[ \begin{align*} \mu = E(X)= & \sum_{x=0}^n xp(X=x)\\ = & \sum_{x=0}^n xf(x) \\ = & np \end{align*} \] Donde: \(x\) es el valor de la variable aleatoria y \(f(x)=p(X=x)\) es la probabilidad de observar el valor \(x\).

Varianza

La varianza \(Var(X)\) de una variable aleatoria Binomial, se representa por \(\sigma^2\) y está dada por:

\[ \begin{align*} \sigma^{2} = Var(X) = & \sum_{x=0}^n (x-\mu)^{2}f(x)\\ = & np(1-p) \end{align*} \]

Desviación estándar

La desviación estándar es la raíz cuadrada de la varianza, por lo tanto, viene dada por: \[\sigma=\sqrt{\sigma^2}\].

Ejemplo 1

Considere el experimento que consiste en lanzar una moneda cinco veces y observar si la cara de la moneda que cae es cara o cruz. Suponga que se desea contar el número de caras que aparecen en los cino lanzamientos. ¿Este es un experimento binomial? ¿por qué?

Solución

  • El experimento consiste en cinco ensayos idénticos (ensayos de Bernoulli); cada ensayo consiste en lanzar una moneda.
  • En cada ensayo hay dos resultados posibles: cara o cruz. Se puede considerar cara como éxito y cruz como fracaso.
  • La probabilidad de éxito \(p=0.5\) y fracaso \(1-p=0.5\), son constantes en cada ensayo.
  • Los ensayos o lanzamientos son independientes uno del otro, porque el resultado de un lanzamiento no afecta lo que pasa en los otros lanzamientos.

Ejemplo 2

Considere a un vendedor de seguros que visita a 10 familias elegidas en forma aleatoria. El resultado correspondiente de la visista a cada familia se clasifica como éxito si la familia compra un seguro y como fracaso si no compra ningún seguro. Por experiencia, el vendedor sabe que la probabilidad de que un familia tomada aleatoriamente compre un seguro es 0.10.

  1. ¿Presenta este experimeno las características de un experimento binomial?
  2. Escriba la distribución y sus parámetros.
  3. ¿Cuál es la probabilidad de que…
    1. tres familias compren el seguro?
    2. ninguna familia compre el seguro?
    3. todas las familias compren el seguro?
    4. al menos dos familias compren el seguro?
    5. más de 9 familias compren el seguro?
  4. Encuentre el valor esperado y la desviación estandar del número de seguros vendidos.
  5. Costruya una tabla con los valores de la densidad y la distribución de probabilidad.
  6. Grafique las funciones de densidad y de distribución.

Solución

  1. Sí, ya que,
    • El experimento consiste en 10 ensayos idénticos.
    • Cada ensayo tiene dos posibles resultados: la familia compra un seguro(éxito) o no compra seguro(fracaso).
    • La probabilidad de comprar y no comprar son iguales; siendo \(p=0.1\) y \(1-p=0.9\).
    • Los ensayos son independientes porque las familias se eligen en forma aleatoria.
  2. \(X \sim Bin(n=20,p=0.1)\)
  1. ¿Cuál es la probabilidad de que…
    1. tres familias compren el seguro? \[ \begin{align*} p(X = 3) = & C_{3}^{10}(0.1)^{3}(1-0.1)^{10-3} \\ = & \frac{10!}{3!(10-3)!}(0.1)^{3}(1-0.1)^{10-3} \\ = & 0.05 \end{align*} \]

En R

Code
dbinom(x = 3, size = 10, prob = 0.1)
[1] 0.05739563

Solución - continuación

  1. ¿Cuál es la probabilidad de que…
    1. ninguna familia compre el seguro? \[ \begin{align*} p(X = 0) = & C_{0}^{10}(0.1)^{0}(1-0.1)^{10-0} \\ = & 1(0.1)^{0}1(0.9)^{10} \\ = & 0.34 \end{align*} \] En R
Code
dbinom(x = 0, size = 10, prob = 0.1)
[1] 0.3486784

Solución - continuación

  1. ¿Cuál es la probabilidad de que…
    1. todas las familias compren el seguro? \[ \begin{align*} p(X = 10) = 0.0000000001 \end{align*} \] En R
Code
dbinom(x = 10, size = 10, prob = 0.1)
[1] 1e-10

Solución - continuación

  1. ¿Cuál es la probabilidad de que…
    1. a lo más tres familias compren el seguro? \[ \begin{align*} p(X \leqslant 3) = & p(X = 0) +p(X = 1) + p(X = 2)+ p(X = 3) \\ = & 0.34+ 0.38+ 0.19 + 0.05 \\ = & 0.98 \end{align*} \]

En R

Code
sum(dbinom(x = 0:3, size = 10, prob = 0.1))
[1] 0.9872048
Code
# otra forma

pbinom(q = 3, size = 10, prob = 0.1)
[1] 0.9872048

Solución - continuación

  1. ¿Cuál es la probabilidad de que…

    1. más de 2 familias compren el seguro? \[ \begin{align*} p(X > 2) = 1 - p(X \leqslant 2) \\ = & 1 - 0.93 \\ = & 0.07 \end{align*} \]
      En R
    Code
    sum(dbinom(x = 3:10, size = 10, prob = 0.1))
    [1] 0.07019083
    Code
    # otra forma
    
    1 - pbinom(q = 2, size = 10, prob = 0.1)
    [1] 0.07019083

Solución - continuación

  1. ¿Cuál es la probabilidad de que…

    1. mínimo cuatro familias compren el seguro? \[p(X \geqslant 4) = 0.012\] En R
    Code
    sum(dbinom(x = 4:10, size = 10, prob = 0.1))
    [1] 0.0127952
    Code
    # otra forma
    
    pbinom(q = 3, size = 10, prob = 0.1, lower.tail = FALSE)
    [1] 0.0127952

Solución - continuación

  1. Encuentre el valor esperado y la desviación estandar del número de seguros vendidos.

Valor esperado

\[\mu = E(X)= np = 10\times 0.1 = 0.9\]

Code
n = 10
p = 0.1

EX = n*p

cat("El valor esperado de X es: E(X) = ",EX)
El valor esperado de X es: E(X) =  1

Desviación estandar

\[ \begin{align*} \sigma = sd(X)= & \sqrt{\sigma^2} \\ =& \sqrt{np(1-p)} \\ =& \sqrt{(10\times 0.1)(1-0.1)} \\ = & \sqrt{0.9^2} \\ = & 0.9 \end{align*} \]

Code
n = 10
p = 0.1

varX = n*p*(1-p)

cat("La varianza de X es: Var(X) = ",varX)
La varianza de X es: Var(X) =  0.9

Solución - continuación

  1. Costruya una tabla con los valores de la densidad y la distribución de probabilidad.
Code
library(magrittr)
library(knitr)
library(kableExtra)
require(plyr)
library(readr)

datos = data.frame(x = 0:10,
                   fx = round(dbinom(x = 0:10, size = 10, prob = 0.1),6), 
                   Fx = round(pbinom(q = 0:10, size = 10, prob = 0.1),6)) 

datos %>% 
    kable %>%
    kable_styling("striped", full_width = F) %>% 
   scroll_box(width = "600px", height = "600px")
x fx Fx
0 0.348678 0.348678
1 0.387420 0.736099
2 0.193710 0.929809
3 0.057396 0.987205
4 0.011160 0.998365
5 0.001488 0.999853
6 0.000138 0.999991
7 0.000009 1.000000
8 0.000000 1.000000
9 0.000000 1.000000
10 0.000000 1.000000
  1. Funciones de densidad y de distribución.
Code
library(ggplot2)

p = dbinom(x = 0:10, size = 10, prob = 0.1)
data = data.frame(x=as.factor(0:10),y=p)

ggplot(data, aes(x=x, y=y)) +
  geom_point(size = 2, color= "blue") + 
  geom_segment( aes(x=x, xend=x, y=0, yend=y), size = 1, linetype="dashed") +
  labs(title = "Función de densidad\nnúmero de seguros vendidos", x="x", y= "f(x)") +
  theme_linedraw() +
  theme(plot.title = element_text(hjust = 0.5), text = element_text(size = 18),
        axis.title.y = element_text(angle = 0, vjust = 0.5))

Code
library(ggplot2)

p = pbinom(q = 0:10, size = 10, prob = 0.1)

data = data.frame(x=-1:11, 
                  y=c(0, p, 1.0000), 
                  xend = 0:12,
                  yend=c(0, p, 1.0000),
                  xacu = 0:12,
                  yacu = c(p, 1.0000, 1.0000))


ggplot(data, aes(x=x, y=y)) +
  geom_point(aes(x=xend, y=yend), size = 4, color= "blue", shape=1) +
  geom_point(aes(x=xacu, y=yacu), size = 2, color= "blue") +
  geom_segment(aes(x=x, xend=xend, y=y, yend=yend), size = 0.8, alpha = 0.7) +
  scale_x_continuous(breaks = -1:12) +
  labs(title = "Función de distribución\nnúmero de seguros vendidos", x="x", y= "F(x)") +
  theme_linedraw() +
  theme(plot.title = element_text(hjust = 0.5), text = element_text(size = 18),
        axis.title.y = element_text(angle = 0, vjust = 0.5))

Ejemplo 3

Considere las decisiones de comprar de los próximos tres clientes que lleguen a la tienda de ropa “Gaps”. De acuerdo con la experiencia, el gerente de la tienda estima que la probabilidad de que un cliente realice un compra es 0.3. Encuentre:

  1. Todas las probabilidades de comprar de los próximos tres clientes que lleguen a la tienda. b. La probabilidad de que…
    1. 5 clientes realicen una compra.
    2. ningún cliente realice una compra.
    3. menos de 3 clientes realicen una compra.
  2. Encuentre la media y la varianza de la distribución.

Ejercicios

  1. La probabilidad de que cierto antibiótico presente una reacción negativa al administrarse a un ave rapaz en recuperación es de 0.15. Si se les ha administrado dicho antibiótico a 10 aves., calcule las probabilidades de que haya reacción negativa:
    1. en dos aves.
    2. en ningún ave.
    3. en menos de 4 aves.
    4. encuentre la media y la varianza de la distribución.
    5. Grafique las funciones de densidad y de distribución.
  2. Un estudiante que responde al azar un examen tipo selección múltiple que consiste de 10 preguntas, cada una con 5 alternativas de las cuales sólo una es correcta. Calcular la probabilidad de que el estudiante:
    1. Tenga exactamente 3 preguntas buenas.
    2. Tenga 3 ó menos preguntas buenas.
    3. Tenga por lo menos 4 buenas.
    4. Encuentre la media y la varianza de la distribución.

Ejercicios

  1. La probabilidad de que un hombre acierte en el blanco es 1/4. Si dispara 10 veces.
    1. ¿Cuál es la probabilidad de que acierte exactamente en tres ocasiones?.
    2. ¿Cuál es la probabilidad de que acierte por lo menos en una ocasión?
    3. Encuentre la media y la varianza de la distribución.