Dentro de las distribuciones de probabilidad discretas, una de las mÔs populares es la distribución binomial. Tipicamente es utilizada para: * Muestreo de productos defectuosos (calidad controlada). * Muestreo de preferencias del consumidor. * Muestreo de población de votantes.
Describe el resultado de n pruebas independientes, en un experimento. Cada prueba se asumo que tiene Ćŗnicamente dos posibles resultados: Ćxito / Fracaso. Si la probabilidad de Ć©xito es p, la probabilidad de tener x resultados āexitososā en un experimento de n pruebas indepentientes es: \[ f(x)= {n\choose x}p^x(1-p)^{(n-x)} \] donde \(x=0,1,2,\dots, n\).
Ejemplo Ilustrativo
Supongamos que hay 30 preguntas de opción multiple en el primer examen parcial de Estadistica. Cada pregunta tiene 4 posibles respuestas y únicamente una de ellas es correcta. Asumamos que el estudiante no tuvo tiempo de estudiar y solo necesita tener 5 preguntas correctas para ganar el curso. Encontrar la probabilidad de tener 5 o mÔs preguntas correctas si el estudiante resolverÔ el examen de forma aleatoria.
total_preguntas<-30
x<- 5
p<-0.25
solución
Como Ćŗnicamente existe 1 posible respuesta correcta, de 4 opciones, la probabilidad de contestar la respuesta correcta es \(\frac{1}{4} = 0.25\). Por lo tanto, la probabilidad de tener exactamente 22 correctas aleatoriamente es:
dbinom(x, size=total_preguntas, prob = p)
## [1] 0.1047285
Para saber la probabilidad de tener 5 o mƔs respuestas correctas, calculamos primero la probabilidad acumulada hasta \(x=5\), luego hacemos \[ p(x<5)=1-p(x<5)=1-F(5) \] Esto se calcula de la siguiente forma:
1-pbinom(x, size=total_preguntas, prob = p)
## [1] 0.7974019
El estudiante tiene una alta probailidad (\(\approx 0.8\)) de obtener los puntos que necesita, si solo contesta las 5 pregutnas de forma aleatoria.
En R existen 4 formas de utilizar la función binamial:
dbinom(x,size,prob) # PDF en x
dbinom(x,size,prob) # CDF hasta x.
qbinom(p,size,prob) # Regresa el valor hasta donde la CDF tiene cierta probabilidad.
rbinom(n,size,prob) # Genera n numeros aleatorios distribuidos binomialmente.
La grafica de la PDF es:
# Creamos una secuencia de 50 numeros, ordenados, de uno en uno.
x <- seq(0,50,by = 1)
# vector con 50 valores binomialmente distribuidos con p=0.5
y <- dbinom(x,50,0.5)
# Plot the graph for this sample.
plot(x,y,col="blue", pch="*")
Para ver el efecto de las variaciones de \(n\) y \(p\), mostramos las siguientes graficas:
# Creamos una secuencia de 50 numeros y otra de 100 numeros, ordenados, de uno en uno.
x <- seq(0,30,by = 1)
x <- seq(0,60,by = 1)
# vector con 50 valores binomialmente distribuidos con p = 0.5
y <- dbinom(x,30,0.5)
y2 <- dbinom(x,30,0.7)
y3 <- dbinom(x,60,0.5)
# Plot the graph for this sample.
plot( x,y ,type="p", col="green", ylim = c(0,0.16))
lines(x,y2,type="p", col="red", pch="*")
lines(x,y3,type="p", col="blue")
legend("topleft",
c("n=60, p=0.5","n=63, p=0.5","n=30, p=0.7"),
fill=c("blue","red", "green")
)
La grafica de la CDF es:
# vector con 50 valores binomialmente distribuidos
y_cdf <- pbinom(x,50,0.5)
# Plot the graph for this sample.
plot(x,y_cdf)
Notar que podemos calcular el valor en el que \(F(x)\) vale 0.5.
qbinom(0.5, 50, 0.5)
## [1] 25
Grafiquemos \(Q_{25}\), \(Q_{50}\) y \(Q_{75}\):
plot(x,y_cdf)
abline(v=qbinom(0.25, 50, 0.5), col="red") # Q_25
abline(v=qbinom(0.5, 50, 0.5), col="green")# Q_50
abline(v=qbinom(0.75, 50, 0.5), col="blue")# Q_75