Distribución Binomial

Dentro de las distribuciones de probabilidad discretas, una de las más populares es la distribución binomial. Tipicamente es utilizada para: * Muestreo de productos defectuosos (calidad controlada). * Muestreo de preferencias del consumidor. * Muestreo de población de votantes.

Describe el resultado de n pruebas independientes, en un experimento. Cada prueba se asumo que tiene únicamente dos posibles resultados: Éxito / Fracaso. Si la probabilidad de éxito es p, la probabilidad de tener x resultados “exitosos” en un experimento de n pruebas indepentientes es: \[ f(x)= {n\choose x}p^x(1-p)^{(n-x)} \] donde \(x=0,1,2,\dots, n\).

Ejemplo Ilustrativo

Supongamos que hay 30 preguntas de opción multiple en el primer examen parcial de Estadistica. Cada pregunta tiene 4 posibles respuestas y únicamente una de ellas es correcta. Asumamos que el estudiante no tuvo tiempo de estudiar y solo necesita tener 5 preguntas correctas para ganar el curso. Encontrar la probabilidad de tener 5 o más preguntas correctas si el estudiante resolverá el examen de forma aleatoria.

total_preguntas<-30
x<- 5
p<-0.25

solución

Como únicamente existe 1 posible respuesta correcta, de 4 opciones, la probabilidad de contestar la respuesta correcta es \(\frac{1}{4} = 0.25\). Por lo tanto, la probabilidad de tener exactamente 22 correctas aleatoriamente es:

dbinom(x, size=total_preguntas, prob = p)

## [1] 0.1047285

Para saber la probabilidad de tener 5 o más respuestas correctas, calculamos primero la probabilidad acumulada hasta \(x=5\), luego hacemos \[ p(x<5)=1-p(x<5)=1-F(5) \] Esto se calcula de la siguiente forma:

1-pbinom(x, size=total_preguntas, prob = p)

## [1] 0.7974019

El estudiante tiene una alta probailidad (\(\approx 0.8\)) de obtener los puntos que necesita, si solo contesta las 5 pregutnas de forma aleatoria.

En R existen 4 formas de utilizar la función binamial:

dbinom(x,size,prob) # PDF en x
dbinom(x,size,prob) # CDF hasta x.
qbinom(p,size,prob) # Regresa el valor hasta donde la CDF tiene cierta probabilidad.
rbinom(n,size,prob) # Genera n numeros aleatorios distribuidos binomialmente.

La grafica de la PDF es:

# Creamos una secuencia de 50 numeros, ordenados, de uno en uno. 
x <- seq(0,50,by = 1)
# vector con 50 valores binomialmente distribuidos con  p=0.5
y <- dbinom(x,50,0.5)
# Plot the graph for this sample.
plot(x,y,col="blue", pch="*")

Para ver el efecto de las variaciones de \(n\) y \(p\), mostramos las siguientes graficas:

# Creamos una secuencia de 50 numeros y otra de 100 numeros, ordenados, de uno en uno. 
x <- seq(0,30,by = 1)
x <- seq(0,60,by = 1)
# vector con 50 valores binomialmente distribuidos con p = 0.5
y <- dbinom(x,30,0.5)
y2 <- dbinom(x,30,0.7)
y3 <- dbinom(x,60,0.5)

# Plot the graph for this sample.
plot( x,y ,type="p", col="green", ylim = c(0,0.16))
lines(x,y2,type="p", col="red", pch="*")
lines(x,y3,type="p", col="blue")
legend("topleft",
c("n=60, p=0.5","n=63, p=0.5","n=30, p=0.7"),
fill=c("blue","red", "green")
)

La grafica de la CDF es:

# vector con 50 valores binomialmente distribuidos
y_cdf <- pbinom(x,50,0.5)
# Plot the graph for this sample.
plot(x,y_cdf)

Notar que podemos calcular el valor en el que \(F(x)\) vale 0.5.

qbinom(0.5, 50, 0.5)

## [1] 25

Grafiquemos \(Q_{25}\), \(Q_{50}\) y \(Q_{75}\):

plot(x,y_cdf) 
abline(v=qbinom(0.25, 50, 0.5), col="red") # Q_25
abline(v=qbinom(0.5, 50, 0.5), col="green")# Q_50
abline(v=qbinom(0.75, 50, 0.5), col="blue")# Q_75