El termino de la distribución binomial se utiliza para designar situaciones en las que los resultados de una variable discreta se pueden agrupar en dos categorías. Las categrías deben ser mutuamente excluyentes, por lo que no es posible obtener ningún otro resultado, es decir, las respuestas sólo deben contener dos respuestas el éxito y el fracaso.
De ello, se plantea, la probabilidad binomial, como una distribución de probabilidad discreta que cuenta el número de éxitos en una secuencia de “n” ensayos de Bernoulli independientes entre si, con una probabilidad fija “\(\theta\)” de ocurrencia del éxito entre los ensayos.
Decimos entonces que X tiene una distribución binomial con parámetros n y \(\theta\) y con ello, tenemos que X ~ bin(n,\(\theta\)).
\[ f(x,n,\theta)=\left\{ \begin{array}{ll} \frac{n¡}{x¡ (n-x)¡}.\theta^x.{(1-\theta)}^{n-x} & \text{si }x=1,2,3,...n \\ 0 & \text{Cualquier otro caso } \end{array} \right. \] Donde:
\(1-\theta\) = probabilidad de fracaso en cada ensayo
Nota: Cabe resaltar que, en este proceso, cada ensayo conduce a uno de dos resultados posibles, que la probabilidad del resultado de cualquier intento permanece fijo con respecto al tiempo, y los ensayos son estadísticamente independientes.
Ejemplo:
Para mayor, entendimiento, en este apartado se, presenta el siguiente ejemplo:
Paso 1: Definir los paramétros “\(\theta\)”, “n” y “x”
x = 2
Paso 2: Insertar esos valores en la fórmula:
\[ f(2,6,1/2)= \frac{6¡}{2¡ (6-2)¡}.1/2^2.{(1-1/2)}^{6-2}={0.234375} \]
Paso 3: Se resuelve: que la probabilidad de que suceda 2 caras exactamente es de 0.234375 ó 23.44%.
Suponiendo que, un investigador, necesite conocer la probabilidad de los sucesos X=1,2,3,…n, conociendo el tamaño de la muestra y la probabilidad de éxito, el procedimiendo a través de bucles seria el siguiente:
dist_binom<-function(n,p){
n=n
p=p
k=-1
Sumas<-0
#generar una tabla para rellenar
Prob1 <- data.frame(Proba = NA, ProbaAcum = NA)
for (i in 1:(n+1)){
k=k+1
#codigos
Fass1=n
Fact1=n
i=0
#Factorial numerador
for (i in 1:(n-1)){
Fact1=Fact1*(Fass1-1)
Fass1=Fass1-1
i=i+1
}
#Factorial denumerador
Fact2=(n-k)
Fass2=(n-k)
i=0
for (i in 1:(n-1-k)){
if((n-k)==0){
Fact2=1
} else if ((n-k)==1) {
Fact2=1
}
else {
Fact2=Fact2*(Fass2-1)
Fass2=Fass2-1
i=i+1
}
}
Fact3=k
Fass3=k
i=0
for (i in 1:(k-1)){
if(k==0){
Fact3=1
} else if (k==1) {
Fact3=Fact3
}
else {
Fact3=Fact3*(Fass3-1)
Fass3=Fass3-1
i=i+1
}
}
#Combinatoria
combina<-(Fact1)/(Fact2*Fact3)
#probabilidad bonimial
P_Binomial<-combina*(p^k)*((1-p)^(n-k))
Sumas<-Sumas+P_Binomial
Prob1[i+2,1] <- P_Binomial
Prob1[i+2,2] <- Sumas
}
#Redondear los datos a 4 decimales
BASE<-round(as.data.frame(Prob1[-3,]),4)
#Generar los datos para la columna x
BASES <- data.frame(x=c(0:(n)),BASE)
#Graficar la función
plot(BASES$Proba, type = "h", lwd = 2,
main = "Gráfico de la función de probabilidad binomial",
ylab = "P(X = x)", xlab = "Número de éxitos")
return(BASES)
}
Nota: Con estos códigos se genera la función binomial para los parámetros n y 𝜃 definidos por el usuario para mostrar luego, la tabla de probabilidad simple, acumulada y el gráfico de la función de probabilidad.
Por ejemplo, si consideramos el ejemplo anterior, con un n = 6 y \(\theta\) = 1/2 = 0.5, tendremos los siguientes resultados
#Ejecutar la función binomial
dist_binom(6,0.5)
## x Proba ProbaAcum
## 1 0 0.0156 0.0156
## 2 1 0.0938 0.1094
## 4 2 0.2344 0.3438
## 5 3 0.3125 0.6562
## 6 4 0.2344 0.8906
## 7 5 0.0938 0.9844
## 8 6 0.0156 1.0000
Nota: Como se observa, en esta última tabla, las probabilidades para los valores de “x”, cuando n = 6 y \(\theta\) = 0.5, asi mismo, la tercera columna representa la probabilidad acumulada. Y comparando con el ejercicio cuando, se necesita calcular la probabilidad de que suceda 2 caras exactamente es de 0.2344 ó 23.44%, dado que, ese valor se encuentra cuando x = 2.
\(\Rightarrow\) Entonces, podemos referir que, los códigos si ayudan a encontrar las probabilidades de distribución binomial.
También llamada Distribución de Pascal, es una distribución de probabilidad discreta para variables aleatorias en un experimento binomial negativo. Esta distribución proviene del hecho de que una faceta de la distribución binomial se invierte en un experimento binomial, donde se cuenta el número de éxitos en una cantidad fija de intentos.
Considerando las más importantes tenemos:
Decimos entonces que X tiene una distribución binomial negativa con parámetros r y \(\theta\), con ello, tenemos que X ~ BN(r,\(\theta\)).
\[ f(x,r,\theta)=\left\{ \begin{array}{ll} \frac{(x-1)¡}{(r-1)¡ (x-r)¡}.\theta^x.{(1-\theta)}^{x-r} & \text{si }x=0,1,2,3,... \\ 0 & \text{Cualquier otro caso } \end{array} \right. \] Donde:
\(1-\theta\) = probabilidad de fracaso en cada ensayo
Nota:
Cabe resaltar que, esta distribución consta con un proceso en el que se hacen tantos ensayos de Bernoulli necesarios para conseguir “r” resultados de éxito. Además, todos estos ensayos de Bernoulli son independientes y tienen una probabilidad de éxito \(\theta\) constante.
Ejemplo:
Para mayor, entendimiento, en este acapite se, presenta el siguiente ejemplo:
Paso 1: Definir los paramétros “\(\theta\)”, “r” y “x”
x = El número de fallas es: x = 15 - 5 = 10
Paso 2: Insertar esos valores en la fórmula:
\[ f(10,5,0.2)= \frac{9¡}{4¡ (5)¡}.0,2^{5}.{(0,8)}^{10}={0.0344} \]
Paso 3: Se resuelve: que la probabilidad de que tenga que pedirle a 15 personas que tengan 5 votos por independiente es de 0.0344 ó 3.44%.
Suponiendo que, un investigador, necesite conocer la probabilidad de los sucesos X=1,2,3,…, conociendo el tamaño de éxitos y la probabilidad de éxito, el procedimiendo a través de bucles seria el siguiente:
dist_binom_neg<-function(r,p){
r=r
r1=r
k=r
p=p
Sumas2<-0
#Generar una tabla
Prob2 <- data.frame(Proba = NA, ProbaAcum = NA)
#Bucle
for (i in 1:100){
Fass1=r-1
Fact1=r-1
i=0
#Factorial numerador
for (i in 1:(r-2)){
Fact1=Fact1*(Fass1-1)
Fass1=Fass1-1
i=i+1
}
#Factorial denumerador
Fact2=(r-k)
Fass2=(r-k)
i=0
for (i in 1:(r-k-1)){
if((r-k)==0){
Fact2=1
} else if ((r-k)==1) {
Fact2=1
}
else {
Fact2=Fact2*(Fass2-1)
Fass2=Fass2-1
i=i+1
}
}
Fact3=k-1
Fass3=k-1
i=0
for (i in 1:(k-2)){
if(k-1==0){
Fact3=1
} else if (k-1==1) {
Fact3=Fact3
}
else {
Fact3=Fact3*(Fass3-1)
Fass3=Fass3-1
i=i+1
}
}
#Combinatoria
combina<-(Fact1)/(Fact2*Fact3)
#probabilidad bonimial negativa
P_Binomial_neg<-combina*(p^k)*((1-p)^(r-k))
r<-r+1
Sumas2<-Sumas2+P_Binomial_neg
Prob2[r-i-1,1] <- P_Binomial_neg
Prob2[r-i-1,2] <- Sumas2
}
BASE<-round(as.data.frame(Prob2),4)
BASES <- data.frame(x=c(r1:(r1+100-1)),BASE)
#Gráfico de la distribución binomial negativa
plot(BASES$Proba, type = "h", lwd = 2,
main = "Gráfico de la función de probabilidad binomial negativa",
ylab = "P(X = x)", xlab = "Número de éxitos")
return(BASES)
}
Nota: Con estos códigos se genera la función binomial negativa para los parámetros r y 𝜃 definidos por el usuario para mostrar luego, la tabla de probabilidad simple, acumulada y el gráfico de la función de probabilidad.
Por ejemplo, si consideramos el ejemplo anterior un r = 5 y \(\theta\) = 0.2, tendremos los siguientes resultados
#Ejecutar la función binomial
dist_binom_neg(5,0.2)
## x Proba ProbaAcum
## 1 5 0.0003 0.0003
## 2 6 0.0013 0.0016
## 3 7 0.0031 0.0047
## 4 8 0.0057 0.0104
## 5 9 0.0092 0.0196
## 6 10 0.0132 0.0328
## 7 11 0.0176 0.0504
## 8 12 0.0221 0.0726
## 9 13 0.0266 0.0991
## 10 14 0.0307 0.1298
## 11 15 0.0344 0.1642
## 12 16 0.0375 0.2018
## 13 17 0.0400 0.2418
## 14 18 0.0419 0.2836
## 15 19 0.0431 0.3267
## 16 20 0.0436 0.3704
## 17 21 0.0436 0.4140
## 18 22 0.0431 0.4571
## 19 23 0.0422 0.4993
## 20 24 0.0408 0.5401
## 21 25 0.0392 0.5793
## 22 26 0.0373 0.6167
## 23 27 0.0353 0.6520
## 24 28 0.0332 0.6851
## 25 29 0.0309 0.7161
## 26 30 0.0287 0.7448
## 27 31 0.0265 0.7713
## 28 32 0.0243 0.7956
## 29 33 0.0223 0.8179
## 30 34 0.0203 0.8381
## 31 35 0.0184 0.8565
## 32 36 0.0166 0.8731
## 33 37 0.0149 0.8880
## 34 38 0.0134 0.9014
## 35 39 0.0120 0.9134
## 36 40 0.0107 0.9241
## 37 41 0.0095 0.9336
## 38 42 0.0084 0.9420
## 39 43 0.0074 0.9494
## 40 44 0.0066 0.9560
## 41 45 0.0058 0.9618
## 42 46 0.0051 0.9668
## 43 47 0.0044 0.9713
## 44 48 0.0039 0.9752
## 45 49 0.0034 0.9786
## 46 50 0.0030 0.9815
## 47 51 0.0026 0.9841
## 48 52 0.0022 0.9863
## 49 53 0.0019 0.9882
## 50 54 0.0017 0.9899
## 51 55 0.0014 0.9913
## 52 56 0.0012 0.9926
## 53 57 0.0011 0.9937
## 54 58 0.0009 0.9946
## 55 59 0.0008 0.9954
## 56 60 0.0007 0.9961
## 57 61 0.0006 0.9967
## 58 62 0.0005 0.9972
## 59 63 0.0004 0.9976
## 60 64 0.0004 0.9979
## 61 65 0.0003 0.9983
## 62 66 0.0003 0.9985
## 63 67 0.0002 0.9987
## 64 68 0.0002 0.9989
## 65 69 0.0002 0.9991
## 66 70 0.0001 0.9992
## 67 71 0.0001 0.9994
## 68 72 0.0001 0.9995
## 69 73 0.0001 0.9995
## 70 74 0.0001 0.9996
## 71 75 0.0001 0.9997
## 72 76 0.0001 0.9997
## 73 77 0.0000 0.9998
## 74 78 0.0000 0.9998
## 75 79 0.0000 0.9998
## 76 80 0.0000 0.9999
## 77 81 0.0000 0.9999
## 78 82 0.0000 0.9999
## 79 83 0.0000 0.9999
## 80 84 0.0000 0.9999
## 81 85 0.0000 0.9999
## 82 86 0.0000 1.0000
## 83 87 0.0000 1.0000
## 84 88 0.0000 1.0000
## 85 89 0.0000 1.0000
## 86 90 0.0000 1.0000
## 87 91 0.0000 1.0000
## 88 92 0.0000 1.0000
## 89 93 0.0000 1.0000
## 90 94 0.0000 1.0000
## 91 95 0.0000 1.0000
## 92 96 0.0000 1.0000
## 93 97 0.0000 1.0000
## 94 98 0.0000 1.0000
## 95 99 0.0000 1.0000
## 96 100 0.0000 1.0000
## 97 101 0.0000 1.0000
## 98 102 0.0000 1.0000
## 99 103 0.0000 1.0000
## 100 104 0.0000 1.0000
Nota: Como se observa, en esta última tabla se muestra, las probabilidades para los valores de X, cuando r = 5 y \(\theta\) = 0.2, asi mismo, la tercer columna representa la probabilidad acumulada. Además, si observamos cuando X = 15 la probabilidad es de 0.0344 ó 3.44%.
\(\Rightarrow\) Entonces, podemos referir que, los códigos si ayudan a encontrar las probabilidades de distribución binomial negativa.
Elaborador por Rojas Rojas Henry