Probabilidad discreta

Cátedra de Bioestadística - Escuela de Ciencias Biológicas UNA

2024-02-22

PROBABILIDAD DISCRETAS

Se les denomina discretas, debido a que sus eventos no asumen valores intermedios entre dos números enteros, entre las distribuciones más comunes tenemos: Binomial: binom; Poisson: pois; Hipergeometrica: hyper; Binomial negativa: nbinom; Geometrica: geom; entre otras.

Las funciones de probabilidad pueden ser formuladas de la siguiente manera:

Masa: Necesario anteponerle el prefijo “d”, por ejemplo:

  • dbinom(x) #funcion de la distribucion binomial.

Acumuladas: Necesario anteponerle el prefijo “p”, por ejemplo:

  • pbinom(x) #funcion de la distribucion binomial.

  • “q” para la funcion cuantil (inversa de la funcion de distribucion, Ej.: “qbinom”).

  • qbinom(p, size) #siendo “p” la probabilidad y “size” el tamaño de la muestra, donde para cualquier funcion: P= es la probabilidad que de ocurra el evento; q= 1-P= probabilidad de que no ocurra el evento.

Podemos identificar estas funciones cuando la pregunta incluye las siguientes palabras claves.

Use la función en MASA

Cuando el problema contenga palabras claves como:

Use la función en ACUMULADA

Cuando usted quiere responder a lo siguiente:

Nota: Este tipo de reglas (funcion en masa y acumulada) para la distribucion continua son similares, excepto que siempre se utiliza el valor que se esta indagando (nunca se utilizan el numero más proximo). Ver ejemplos mas adelante.

PROBABILIDAD BINOMIAL

Es una de las probabilidades más utiles en los diferentes campos que se pueden aplicar, tanto en biología, medicina, economía, inspección de calidad, opiniones y otras. Se reconoce porque se clasifican los eventos como ocurrencia (éxito) y no ocurrencia de un suceso (fracasos). Las dos suposiciones de esta distribucion son:

  1. La probabilidad de éxito permanece constante

  2. Los n ensayos son independientes entre sí

    Los parametros de la distribucion binomial estan dados por n y p

donde n son los ensayos p la probabilidad de exito.

El modelo binomial tiene tres propiedades que lo definen:

  1. Los ensayos de Bernoulli se llevan a cabo n veces

  2. Los ensayos son independientes

  3. La probabilidad de éxito p no cambia entre los ensayos.

Se le conoce también como distribución de la probabilidad puntual o de Bernoulli, debido al suizo Jacques Bernoulli, quien por primera vez desarrollo el concepto de ensayos independientes.

Ejemplo 1

Se conoce que el musgo es un inhibidor de la floración en plantaciones de cacao. Se realiza un experimento con un tipo de fertilizante orgánico para eliminar el musgo en una plantación de cacao orgánico. Se encontro una efectividad del fertilizante en los primeros experimentos del 75%. Encontrar la probabilidad de que se aplique el mismo fertilizante en otras fincas de cacao orgánico en 10 parcelas del mismo tamaño y bajo las mismas condiciones.

a) Determine cual es la probabilidad de que exactamente 3 parcelas no pierdan su cosecha?

Solución. n = 10; x = 3 parcelas no pierdan su cosecha; p = 0,75; q = 0,25. Siendo p el éxito y q el fracaso.

Pr(X=3)= dbinom(3,10,0.75)

dbinom(3,10,0.75)
[1] 0.003089905

R/ la probabilidad de que exactamente 3 parcelas no pierdan su cosecha es de un 0.3% (multiplica su resultado por 100).

b) Cual es la probabilidad de que exactamente 3 parcelas pierdan su cosecha?

Solucion. n = 10; x = 3 parcelas pierdan su cosecha; p = 0,25; q = 0,75, en este caso estamos interesados en que el éxito sea la pérdida por tal si la efectividad es del 75%, entonces la pérdida es 25%, por lo que p = 0,25 y q = 0,75 asumen esos valores de manera invertida.

dbinom(3,10,0.25)
[1] 0.2502823

c) Al menos 3 parcelas tengan perdida de cosecha.

Solucion. n = 10; x = 3 parcelas pierdan su cosecha; p = 0,25; q = 0,75. Por lo menos es una función acumulada y utiliza la regla de complementación= 1-p.

1-pbinom(2,10,0.25)
[1] 0.4744072

R/ la probabilidad de que Al menos 3 parcelas pierdan su cosecha es de un 47.44%

Ejemplo 2

Un reciente estudio indica que los estudiantes de universidades de primer ingreso a carrera utilizan aproximadamente 35.4% el recurso de libros impresos para obtener su informacion de trabajos o tareas. Sea x una variable aleatoria binomial, y con base a una muestra aleatoria de n=23, utilizada como fuente para obtencion del dato.

a) Encuentre la probabilidad que de x sea igual a 5. Dicho de otra forma, de que 5 estudiantes utilicen libros impresos.

Solución. n = 23; x = 5; p = 0.354; q = 0.646

dbinom(5, size = 23, prob = 0.354)
[1] 0.07180816

b) Encuentre la probabilidad de que al menos x sea de 7. Solución. n = 23; x = 7; p = 0.354; q = 0.646

1-pbinom(6, size = 23, prob = 0.354)
[1] 0.7592035

Ejemplo 3

Calcular la probabilidad de que una variable aleatoria binomial de parametros n=15, p=0.4 tome el valor 7.

Solución.

dbinom(7,size=15,prob=0.4)
[1] 0.1770837

Ejemplo 4

Encontrar que cuantil de una variable aleatoria binomial de parametros n=15, p=0.4 tome el valor 5:

Solución. n = 15; q = 0.25; p = 0.4; q = 0.6

qbinom(.25,15,0.4)
[1] 5

Esto nos brinda los menores valores que puede asumir el cuantil 25.

Para su mejor interpretacion generaremos de forma aleatoria 100 valores con distribución binomial de parametros n=15, p=0.4 tome el valor 7.

set.seed(12345)
birandom<-rbinom(100,15,0.4); sort(birandom)
 [1] 1 2 2 2 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5
[39] 5 5 5 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7
 [ reached getOption("max.print") -- omitted 25 entries ]

Observe que de los 100 valores generados de forma aleatoria con los parametros establecidos, estamos buscando si es posible encontrar el valor de 7. Efectivamente si es posible dentro de los valores, por lo que utilizamos cuartiles para identificar la posicion de ese valor (7). Algunas veces habrá que probrar (prueba y error), que valor se aproxima al valor que estamos buscando.

Ejemplo 5

a) Encontrar el percentil 73 de una variable aleatoria binomial de parametros n=15, p=0.4:

Solución. n = 15; q = 0.73; p = 0.4; q = 0.6

qbinom(.73,15,0.4)
[1] 7

b) Encontrar el percentil (x) de una variable aleatoria binomial de parametros n=15, p=0.4, que tome el valor 4:

Solución.

n = 15; q = x; p = 0.4; q = 0.6

qbinom(.4,15,0.4)
[1] 5

Observe que si utilizamos el percentil 4 la solucion NO ES LA CORRECTA, porque toma el valor de 5.

cambiamos los valores a 0.1

qbinom(0.1,15,0.4)
[1] 4

NOS BRINDA LA RESPUESTA QUE ESTAMOS BUSCANDO.

Forma gráfica de la distribución binomial

Observemos el comportamiento en forma gráfica del caso de las parcelas experimentales que hemos venido desarrollando (ejemplo 5.1).

Caso 1

a) n = 10; x = 0:10 parcelas no pierdan su cosecha; p = 0.75; q = 0.25.

y<-dbinom(0:10,10,0.75)
cbind(x=0:10,datos=y) #crear una cuadro de resultados
       x        datos
 [1,]  0 9.536743e-07
 [2,]  1 2.861023e-05
 [3,]  2 3.862381e-04
 [4,]  3 3.089905e-03
 [5,]  4 1.622200e-02
 [6,]  5 5.839920e-02
 [7,]  6 1.459980e-01
 [8,]  7 2.502823e-01
 [9,]  8 2.815676e-01
[10,]  9 1.877117e-01
[11,] 10 5.631351e-02
plot(y, type="o", col="red")

Figura. 1. Plot de la distribucion binomial, para n = 0:10; x = 3, p = 0.75

b) n = 10; x = 0:10 parcelas pierdan su cosecha; p = 0,25; q = 0,75.

x<-0:10
z<-dbinom(0:10,10,0.25)
cbind(eventos=0:10,datos=z)
      eventos        datos
 [1,]       0 5.631351e-02
 [2,]       1 1.877117e-01
 [3,]       2 2.815676e-01
 [4,]       3 2.502823e-01
 [5,]       4 1.459980e-01
 [6,]       5 5.839920e-02
 [7,]       6 1.622200e-02
 [8,]       7 3.089905e-03
 [9,]       8 3.862381e-04
[10,]       9 2.861023e-05
[11,]      10 9.536743e-07
#o puede utilizar tambien el comando de data.frame
data.frame(x,z)  
    x            z
1   0 5.631351e-02
2   1 1.877117e-01
3   2 2.815676e-01
4   3 2.502823e-01
5   4 1.459980e-01
6   5 5.839920e-02
7   6 1.622200e-02
8   7 3.089905e-03
9   8 3.862381e-04
10  9 2.861023e-05
11 10 9.536743e-07
plot(z, type="o", col="orange")

Figura. 2. Plot de la distribucion binomial, para n = 0:10; x = 3, p = 0.25.

Nota: Ver que el plot no inicia desde “cero”, por lo que el gráfico no es el adecuado. Mas adelante explicaremos que debemos hacer.

Caso 2

Graficar resultados con funciones que involucren la regla de complementacion.

a) Se conoce que la probabilidad que ocurra el evento es de 0.35. Describa como es la probabilidad resultante de por lo menos en 0 a 10 intentos de 10 ensayos tratados.

Solución. n = 0:10; x = 0:10 ensayos; p = 0.35; q = 0.65.

1-pbinom(0:10,10,0.35)->co
cbind(eventos=0:10,datos=co)
      eventos        datos
 [1,]       0 9.865373e-01
 [2,]       1 9.140456e-01
 [3,]       2 7.383926e-01
 [4,]       3 4.861730e-01
 [5,]       4 2.485045e-01
 [6,]       5 9.493408e-02
 [7,]       6 2.602428e-02
 [8,]       7 4.821265e-03
 [9,]       8 5.398871e-04
[10,]       9 2.758547e-05
[11,]      10 0.000000e+00

Nota: observe bien sus resultados para que se familiarice que las probabilidades, inician a partir de cero. [1,] 0 =9.865373e-01., [2,] 1 9.140456e-01… etc.

Debido a que uno puede uno puede tambien escribir sus resultados de la siguiente manera.

cbind(1-pbinom(0:10,10,0.35))
              [,1]
 [1,] 9.865373e-01
 [2,] 9.140456e-01
 [3,] 7.383926e-01
 [4,] 4.861730e-01
 [5,] 2.485045e-01
 [6,] 9.493408e-02
 [7,] 2.602428e-02
 [8,] 4.821265e-03
 [9,] 5.398871e-04
[10,] 2.758547e-05
[11,] 0.000000e+00

9.865373e-01 corresponde a cero eventos, 9.140456e-01 a un evento y asi sucesivamente, hasta k eventos posibles

Para corregir ese efecto visual en R, que puede confundir al lector lo que recomiendo es generar un vector del mismo tama?o al estamos indagando, en nuestro caso es de 0 a 10.

x<-0:10 
1-pbinom(0:10,10,0.35)-> co
data.frame("Probabilidad"=co,row.names=x)
   Probabilidad
0  9.865373e-01
1  9.140456e-01
2  7.383926e-01
3  4.861730e-01
4  2.485045e-01
5  9.493408e-02
6  2.602428e-02
7  4.821265e-03
8  5.398871e-04
9  2.758547e-05
10 0.000000e+00

Ahora si es posible determinar el valor exacto de cada evento, debido a que hemos generado los valores que corresponden a cada probabilidad

Observe la diferencia si hubiera escrito en código, separado por “coma” en vez del igual.

data.frame("Probabilidad",co,row.names=x)
   X.Probabilidad.           co
0     Probabilidad 9.865373e-01
1     Probabilidad 9.140456e-01
2     Probabilidad 7.383926e-01
3     Probabilidad 4.861730e-01
4     Probabilidad 2.485045e-01
5     Probabilidad 9.493408e-02
6     Probabilidad 2.602428e-02
7     Probabilidad 4.821265e-03
8     Probabilidad 5.398871e-04
9     Probabilidad 2.758547e-05
10    Probabilidad 0.000000e+00
plot(0:10,1-pbinom(0:10,10,0.35),type='h',xlab="0:10",ylab="Prob", sub="p=0.35")

Figura. 3. Plot de la distribucion binomial, para n = 0:10; x = 10, p = 0.35.

b) Se conoce que la probabilidad que ocurra el evento es de 0.65. Describa como es la probabilidad resultante de por lo menos en 0 a 10 intentos de 10 ensayos tratados.

Solución. n = 0:10; x = 10 ensayos; p = 0.65; q = 0.35.

plot(0:10,1-pbinom(0:10,10,0.65),type='o',xlab="0:10",ylab="Prob", sub="p=0.65")

Figura. 4. Plot de la distribucion binomial, para n = 0:10; x = 10, p = 0.65.

a) Obtenga un cuadro resumen utilizando la funcion cbind(., ) de sus resultados.

b) Determine cual es la probabilidad de que exactamente 6 eventos, ocurran de los 10 ensayos tratados.

Caso 3

Graficar resultados que involucren la función en masa.

  1. Se conoce que la probabilidad que ocurra el evento es de 0.35. Describa como es la probabilidad resultante de 0 a 10 intentos de 10 ensayos tratados.

Solución.

n = 0:10; x = 10 ensayos; p = 0.35; q = 0.65.

plot(0:10, dbinom(0:10,10,0.35),type='o',xlab="0:10",ylab="Prob", sub="p=0.35")

Figura. 5. Plot de la distribucion binomial, para n = 0:10; x = 10, p = 0.35

b) Obtenga un cuadro resumen utilizando la funcion cbind(., ) de sus resultados.

Caso 4

Graficar resultados con funciones que involucren la funcion acumulada

a) Se realizan de 0:10 intentos de una variable “x” que sigue una distribucion binomial, y se tiene que la probabilidad de que ocurra el evento es 0.65. Cual seria la probabilidad de que menos de 7 eventos ocurran en los 10 ensayos tratados.

Solución.

n = 0:10; x = 10 ensayos; p = 0.65; q = 0.35.

plot(0:10, pbinom(0:10,10,0.65),type="s" ,xlab="0:10",ylab= "Prob", sub="p=0.65")

Figura. 6. Plot de la distribucion binomial, para n = 0:10; x = 6, p = 0.65

b) Se realizan de 0:10 intentos de una variable “x” que sigue una distribucion binomial, y se tiene que la probabilidad de que ocurra el evento es 0.65. Cual seria la probabilidad de que Por lo menos de 7 eventos ocurran en los 10 ensayos tratados.

Solución. n = 0:10; x = 10 ensayos; p = 0.65; q = 0.35.

plot(0:10, 1-pbinom(0:10,10,0.65),type="s" ,xlab="0:10",ylab= "Prob", sub="p=0.65")

Figura. 7. Plot de la distribucion binomial, para n = 0:10; x = 6, p = 0.65

PROBABILIDAD POISSON

La distribución Poisson se presenta en muchos contextos biológicos. Algunos ejemplos de variables aleatorias que presenta distribucion poisson son:

  • Número de crias que tiene un individuo de una especie x

  • Número de arboles producidos en una superficie de tierra

  • Accidentes en carreteras en un lugar especifico.

  • Aparición de una especie rara en un sitio dado.

  • Número de colonias de bacterias en una placa de Petri.

  • Número de sustituciones de bases de nucleotidos de un gen en un periodo de tiempo.

  • Número de temblores en un sector y tiempo dado.

Como nota, se trata de eventos raros o poco casuales, que resultan difíciles que se vuelvan a repetir en un tiempo x.

Es una distribución discreta al igual que la distribucion binomial, y solo tiene un solo parametro de la media que se le denomina Lambda \(\lambda\)

Fórmula

\(p(x)=\frac{e^\lambda \lambda}{x!}\)

donde frecuencia es \(\lambda\); número de intentos es n; probabilidad de éxito es p

Ejemplo 6

Supongamos que deseamos describir la probabilidad resultante de 0 a 10 intentos, cuando se conoce que la media es de 0.2

Solución.

x<-0:10  #numero de eventos
x
 [1]  0  1  2  3  4  5  6  7  8  9 10
y<-dpois(0:10,lambda=0.2)    #funcion en masa
data.frame("Prob"=y,row.names=x)
           Prob
0  8.187308e-01
1  1.637462e-01
2  1.637462e-02
3  1.091641e-03
4  5.458205e-05
5  2.183282e-06
6  7.277607e-08
7  2.079316e-09
8  5.198290e-11
9  1.155176e-12
10 2.310351e-14
plot(0:10, dpois(0:10,0.2), type='h', xlab="intentos",ylab="Probabilidad" )

FIGURA. 8. PLOT DE LA DISTRIBUCIÓN POISSON

Ejemplo 7

En una intersección de carreteras ocurren en promedio 3 accidentes de transito por mes. Calcule las probabilidades de que en un mes cualquiera ocurra:

  1. exactamente 6 accidentes

    Solución

dpois(6,3)
[1] 0.05040941
  1. entre 5 y 15 accidentes

    Solución

ppois(15,3)- ppois(4,3)
[1] 0.1847366

Ejemplo 8

Supongamos que el numero de plantas individuales de una especie dada que esperamos en cien metros cuadrados sigue la distribucion de Poisson con una media = 10

Determine cuál es la probabilidad de encontrar esa misma planta 12 individuos, en otra parcela del mismo tamaño

Solución

dpois(12, 10)
[1] 0.09478033
  1. Cuál es la probabilidad de encontrar al menos 15 individuos?

Solución

1-ppois(14, 10)
[1] 0.08345847
  1. Cuál es la probabilidad de encontrar 3 o mas individuos?

Solución

1-ppois(2, 10)
[1] 0.9972306