DISTRIBUCIÓN BINOMIAL

El termino de la distribución binomial se utiliza para designar situaciones en las que los resultados de una variable discreta se pueden agrupar en dos categorías. Las categrías deben ser mutuamente excluyentes, por lo que no es posible obtener ningún otro resultado, es decir, las respuestas sólo deben contener dos respuestas el éxito y el fracaso.

De ello, se plantea, la probabilidad binomial, como una distribución de probabilidad discreta que cuenta el número de éxitos en una secuencia de “n” ensayos de Bernoulli independientes entre si, con una probabilidad fija “\(\theta\)” de ocurrencia del éxito entre los ensayos.

Propiedades

  • Repetición de “n” ensayos.
  • Cada ensayo es independiente de los demás.
  • En cada ensayo existe el “éxito” (\(\theta\)) y el “fracaso” (\(1-\theta\)) como únicos resultados.
  • En cada ensayo la probabilidad no cambia
  • El número de éxitos se identifica con la variable aleatoria x.

Decimos entonces que X tiene una distribución binomial con parámetros n y \(\theta\) y con ello, tenemos que X ~ bin(n,\(\theta\)).

Función de probabilidad

\[ f(x,n,\theta)=\left\{ \begin{array}{ll} \frac{n¡}{x¡ (n-x)¡}.\theta^x.{(1-\theta)}^{n-x} & \text{si }x=1,2,3,...n \\ 0 & \text{Cualquier otro caso } \end{array} \right. \] Donde:

 f = probabilidad
 x = número de éxitos
 n = número de ensayos
 \(\theta\) = probabilidad de éxito en cada ensayo

\(1-\theta\) = probabilidad de fracaso en cada ensayo

Nota: Cabe resaltar que, en este proceso, cada ensayo conduce a uno de dos resultados posibles, que la probabilidad del resultado de cualquier intento permanece fijo con respecto al tiempo, y los ensayos son estadísticamente independientes.

Ejemplo:

Para mayor, entendimiento, en este apartado se, presenta el siguiente ejemplo:

  • Se lanza una moneda corriente 6 veces, donde llamamos cara a un éxito. De ello podemos inferir que, n=6 y \(\theta\) = 1/2. Dado que, solo pueden ocurrir dos cosas \(\theta\) ó (1-\(\theta\)) por lo tanto, la probabilidad de que ocurra 1 de ellas es la mitad, es decir 1/2. Y se tiene como fin, encontrar la probabilidad de que suceda 2 caras exactamente.

Paso 1: Definir los paramétros “\(\theta\)”, “n” y “x”

\(\theta\) = 1/2
n = 6

x = 2

Paso 2: Insertar esos valores en la fórmula:

\[ f(2,6,1/2)= \frac{6¡}{2¡ (6-2)¡}.1/2^2.{(1-1/2)}^{6-2}={0.234375} \]

Paso 3: Se resuelve: que la probabilidad de que suceda 2 caras exactamente es de 0.234375 ó 23.44%.

Generando función para hallar la distribución

Suponiendo que, un investigador, necesite conocer la probabilidad de los sucesos X=1,2,3,…n, conociendo el tamaño de la muestra y la probabilidad de éxito, el procedimiendo a través de bucles seria el siguiente:

dist_binom<-function(n,p){
  n=n
  p=p
  
  k=-1
  Sumas<-0
  #generar una tabla para rellenar
  Prob1 <- data.frame(Proba = NA, ProbaAcum = NA)
  for (i in 1:(n+1)){
    k=k+1
    #codigos
    Fass1=n
    Fact1=n
    i=0
    #Factorial numerador
    for (i in 1:(n-1)){
      Fact1=Fact1*(Fass1-1)
      Fass1=Fass1-1
      i=i+1
    }
    #Factorial denumerador
    Fact2=(n-k)
    Fass2=(n-k)
    i=0
    for (i in 1:(n-1-k)){
      if((n-k)==0){
        Fact2=1
      } else if ((n-k)==1) {
        Fact2=1
      }
      else {
        Fact2=Fact2*(Fass2-1)
        Fass2=Fass2-1
        i=i+1
      }
    }
    Fact3=k
    Fass3=k
    i=0
    for (i in 1:(k-1)){
      if(k==0){
        Fact3=1
      } else if (k==1) {
        Fact3=Fact3
      }
      else {
        Fact3=Fact3*(Fass3-1)
        Fass3=Fass3-1
        i=i+1
      }
    }
    #Combinatoria
    combina<-(Fact1)/(Fact2*Fact3)
    
    #probabilidad bonimial
    P_Binomial<-combina*(p^k)*((1-p)^(n-k))
    Sumas<-Sumas+P_Binomial
    Prob1[i+2,1] <- P_Binomial
    Prob1[i+2,2] <- Sumas
  }
  #Redondear los datos a 4 decimales
  BASE<-round(as.data.frame(Prob1[-3,]),4)
  #Generar los datos para la columna x
  BASES <- data.frame(x=c(0:(n)),BASE)
  #Graficar la función
  plot(BASES$Proba, type = "h", lwd = 2,
       main = "Gráfico de la función de probabilidad binomial",
       ylab = "P(X = x)", xlab = "Número de éxitos")
  return(BASES)
}

Nota: Con estos códigos se genera la función binomial para los parámetros n y 𝜃 definidos por el usuario para mostrar luego, la tabla de probabilidad simple, acumulada y el gráfico de la función de probabilidad.

Por ejemplo, si consideramos el ejemplo anterior, con un n = 6 y \(\theta\) = 1/2 = 0.5, tendremos los siguientes resultados

#Ejecutar la función binomial
dist_binom(6,0.5)

##   x  Proba ProbaAcum
## 1 0 0.0156    0.0156
## 2 1 0.0938    0.1094
## 4 2 0.2344    0.3438
## 5 3 0.3125    0.6562
## 6 4 0.2344    0.8906
## 7 5 0.0938    0.9844
## 8 6 0.0156    1.0000

Nota: Como se observa, en esta última tabla, las probabilidades para los valores de “x”, cuando n = 6 y \(\theta\) = 0.5, asi mismo, la tercera columna representa la probabilidad acumulada. Y comparando con el ejercicio cuando, se necesita calcular la probabilidad de que suceda 2 caras exactamente es de 0.2344 ó 23.44%, dado que, ese valor se encuentra cuando x = 2.

\(\Rightarrow\) Entonces, podemos referir que, los códigos si ayudan a encontrar las probabilidades de distribución binomial.

DISTRIBUCIÓN BINOMIAL NEGATIVA

También llamada Distribución de Pascal, es una distribución de probabilidad discreta para variables aleatorias en un experimento binomial negativo. Esta distribución proviene del hecho de que una faceta de la distribución binomial se invierte en un experimento binomial, donde se cuenta el número de éxitos en una cantidad fija de intentos.

Características

Considerando las más importantes tenemos:

  • La distribución binomial negativa queda definida por dos parámetros característicos: r es el número de resultados con éxito deseado y \(\theta\) es la probabilidad de éxito de cada experimento de Bernoulli.
  • La principal diferencia de la distribución binomial regular con la distribución binomial negativa, es que en el primero, estás viendo el número de éxitos, mientras que en el segundo lo que cuenta es el número de fallas.

Decimos entonces que X tiene una distribución binomial negativa con parámetros r y \(\theta\), con ello, tenemos que X ~ BN(r,\(\theta\)).

Función de probabilidad

\[ f(x,r,\theta)=\left\{ \begin{array}{ll} \frac{(x-1)¡}{(r-1)¡ (x-r)¡}.\theta^x.{(1-\theta)}^{x-r} & \text{si }x=0,1,2,3,... \\ 0 & \text{Cualquier otro caso } \end{array} \right. \] Donde:

 f = probabilidad
 r = número de éxitos
 x = número de ensayos a realizar para “r” eventos
 \(\theta\) = probabilidad de éxito en cada ensayo

\(1-\theta\) = probabilidad de fracaso en cada ensayo

Nota:

Cabe resaltar que, esta distribución consta con un proceso en el que se hacen tantos ensayos de Bernoulli necesarios para conseguir “r” resultados de éxito. Además, todos estos ensayos de Bernoulli son independientes y tienen una probabilidad de éxito \(\theta\) constante.

Ejemplo:

Para mayor, entendimiento, en este acapite se, presenta el siguiente ejemplo:

  • Está encuestando a personas que salen de una cabina de votación y les pregunta si votaron de manera independiente. La probabilidad (\(\theta\)) de que una persona vote independiente es del 20%. ¿Cuál es la probabilidad de que se deba preguntar a 15 personas antes de encontrar a 5 personas que votaron por su independencia?

Paso 1: Definir los paramétros “\(\theta\)”, “r” y “x”

\(\theta\) = 0.2
r = 5

x = El número de fallas es: x = 15 - 5 = 10

Paso 2: Insertar esos valores en la fórmula:

\[ f(10,5,0.2)= \frac{9¡}{4¡ (5)¡}.0,2^{5}.{(0,8)}^{10}={0.0344} \]

Paso 3: Se resuelve: que la probabilidad de que tenga que pedirle a 15 personas que tengan 5 votos por independiente es de 0.0344 ó 3.44%.

Generando función para hallar la distribución

Suponiendo que, un investigador, necesite conocer la probabilidad de los sucesos X=1,2,3,…, conociendo el tamaño de éxitos y la probabilidad de éxito, el procedimiendo a través de bucles seria el siguiente:

dist_binom_neg<-function(r,p){
  r=r
  r1=r
  k=r
  p=p
  Sumas2<-0
  #Generar una tabla
  Prob2 <- data.frame(Proba = NA, ProbaAcum = NA)
  #Bucle
  for (i in 1:100){
    Fass1=r-1
    Fact1=r-1
    i=0
    #Factorial numerador
    for (i in 1:(r-2)){
      Fact1=Fact1*(Fass1-1)
      Fass1=Fass1-1
      i=i+1
    }
    #Factorial denumerador
    Fact2=(r-k)
    Fass2=(r-k)
    i=0
    for (i in 1:(r-k-1)){
      if((r-k)==0){
        Fact2=1
      } else if ((r-k)==1) {
        Fact2=1
      }
      else {
        Fact2=Fact2*(Fass2-1)
        Fass2=Fass2-1
        i=i+1
      }
    }
    Fact3=k-1
    Fass3=k-1
    i=0
    for (i in 1:(k-2)){
      if(k-1==0){
        Fact3=1
      } else if (k-1==1) {
        Fact3=Fact3
      }
      else {
        Fact3=Fact3*(Fass3-1)
        Fass3=Fass3-1
        i=i+1
      } 
    }
    #Combinatoria
    combina<-(Fact1)/(Fact2*Fact3)
    #probabilidad bonimial negativa
    P_Binomial_neg<-combina*(p^k)*((1-p)^(r-k))
    r<-r+1
    Sumas2<-Sumas2+P_Binomial_neg
    Prob2[r-i-1,1] <- P_Binomial_neg
    Prob2[r-i-1,2] <- Sumas2
  }
  BASE<-round(as.data.frame(Prob2),4)
  BASES <- data.frame(x=c(r1:(r1+100-1)),BASE)
  #Gráfico de la distribución binomial negativa
  plot(BASES$Proba, type = "h", lwd = 2,
       main = "Gráfico de la función de probabilidad binomial negativa",
       ylab = "P(X = x)", xlab = "Número de éxitos")
  return(BASES)
  
}

Nota: Con estos códigos se genera la función binomial negativa para los parámetros r y 𝜃 definidos por el usuario para mostrar luego, la tabla de probabilidad simple, acumulada y el gráfico de la función de probabilidad.

Por ejemplo, si consideramos el ejemplo anterior un r = 5 y \(\theta\) = 0.2, tendremos los siguientes resultados

#Ejecutar la función binomial
dist_binom_neg(5,0.2)

##       x  Proba ProbaAcum
## 1     5 0.0003    0.0003
## 2     6 0.0013    0.0016
## 3     7 0.0031    0.0047
## 4     8 0.0057    0.0104
## 5     9 0.0092    0.0196
## 6    10 0.0132    0.0328
## 7    11 0.0176    0.0504
## 8    12 0.0221    0.0726
## 9    13 0.0266    0.0991
## 10   14 0.0307    0.1298
## 11   15 0.0344    0.1642
## 12   16 0.0375    0.2018
## 13   17 0.0400    0.2418
## 14   18 0.0419    0.2836
## 15   19 0.0431    0.3267
## 16   20 0.0436    0.3704
## 17   21 0.0436    0.4140
## 18   22 0.0431    0.4571
## 19   23 0.0422    0.4993
## 20   24 0.0408    0.5401
## 21   25 0.0392    0.5793
## 22   26 0.0373    0.6167
## 23   27 0.0353    0.6520
## 24   28 0.0332    0.6851
## 25   29 0.0309    0.7161
## 26   30 0.0287    0.7448
## 27   31 0.0265    0.7713
## 28   32 0.0243    0.7956
## 29   33 0.0223    0.8179
## 30   34 0.0203    0.8381
## 31   35 0.0184    0.8565
## 32   36 0.0166    0.8731
## 33   37 0.0149    0.8880
## 34   38 0.0134    0.9014
## 35   39 0.0120    0.9134
## 36   40 0.0107    0.9241
## 37   41 0.0095    0.9336
## 38   42 0.0084    0.9420
## 39   43 0.0074    0.9494
## 40   44 0.0066    0.9560
## 41   45 0.0058    0.9618
## 42   46 0.0051    0.9668
## 43   47 0.0044    0.9713
## 44   48 0.0039    0.9752
## 45   49 0.0034    0.9786
## 46   50 0.0030    0.9815
## 47   51 0.0026    0.9841
## 48   52 0.0022    0.9863
## 49   53 0.0019    0.9882
## 50   54 0.0017    0.9899
## 51   55 0.0014    0.9913
## 52   56 0.0012    0.9926
## 53   57 0.0011    0.9937
## 54   58 0.0009    0.9946
## 55   59 0.0008    0.9954
## 56   60 0.0007    0.9961
## 57   61 0.0006    0.9967
## 58   62 0.0005    0.9972
## 59   63 0.0004    0.9976
## 60   64 0.0004    0.9979
## 61   65 0.0003    0.9983
## 62   66 0.0003    0.9985
## 63   67 0.0002    0.9987
## 64   68 0.0002    0.9989
## 65   69 0.0002    0.9991
## 66   70 0.0001    0.9992
## 67   71 0.0001    0.9994
## 68   72 0.0001    0.9995
## 69   73 0.0001    0.9995
## 70   74 0.0001    0.9996
## 71   75 0.0001    0.9997
## 72   76 0.0001    0.9997
## 73   77 0.0000    0.9998
## 74   78 0.0000    0.9998
## 75   79 0.0000    0.9998
## 76   80 0.0000    0.9999
## 77   81 0.0000    0.9999
## 78   82 0.0000    0.9999
## 79   83 0.0000    0.9999
## 80   84 0.0000    0.9999
## 81   85 0.0000    0.9999
## 82   86 0.0000    1.0000
## 83   87 0.0000    1.0000
## 84   88 0.0000    1.0000
## 85   89 0.0000    1.0000
## 86   90 0.0000    1.0000
## 87   91 0.0000    1.0000
## 88   92 0.0000    1.0000
## 89   93 0.0000    1.0000
## 90   94 0.0000    1.0000
## 91   95 0.0000    1.0000
## 92   96 0.0000    1.0000
## 93   97 0.0000    1.0000
## 94   98 0.0000    1.0000
## 95   99 0.0000    1.0000
## 96  100 0.0000    1.0000
## 97  101 0.0000    1.0000
## 98  102 0.0000    1.0000
## 99  103 0.0000    1.0000
## 100 104 0.0000    1.0000

Nota: Como se observa, en esta última tabla se muestra, las probabilidades para los valores de X, cuando r = 5 y \(\theta\) = 0.2, asi mismo, la tercer columna representa la probabilidad acumulada. Además, si observamos cuando X = 15 la probabilidad es de 0.0344 ó 3.44%.

\(\Rightarrow\) Entonces, podemos referir que, los códigos si ayudan a encontrar las probabilidades de distribución binomial negativa.

Elaborador por Rojas Rojas Henry