Caso 18. Distribuciones de Poisson

OBJETIVO

Identificar los valores de la función de probabilidad bajo la fórmula de distribución de Poisson.

DESCRIPCIÓN

Fundamento teórico:

Otra variable aleatoria discreta que tiene numerosas aplicaciones prácticas es la variable aleatoria de Poisson. Su distribución de probabilidad da un buen modelo para datos que representa el número de sucesos de un evento especifi cado en una unidad determinada de tiempo o espacio (Mendenhall et al., 2006). Los experimentos que dan valores numéricos de una variable aleatoria X, el número de resultados que ocurren durante un intervalo dado o en una región específi ca, se llaman experimentos de Poisson.(Walpole et al., 2012) Esta distribución,suele usarse para estimar el número de veces que sucede un hecho determinado (ocurrencias) en un intervalo de tiempo o de espacio. * Por ejemplo, la variable de interés va desde el número de automóviles que llegan (llegadas) a un lavado de coches en una hora o, * El número de reparaciones necesarias en 10 kms. de una autopista o, * el número de fugas en 100 kms.de tubería, enrte otros (Anderson et al., 2008).

PASOS A EGUIR

PASO 1. Cargar librerías

PASO 2. Ejercicios

+ Ejercicio 1: Probabilidades, Varianza, Desviación
+ Ejercicio 2: Probabilidades, Varianza, Desviación

PASO 3. Interpretación del caso

PASO 1. Cargar librerías

library(ggplot2)
source("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/funciones/funciones.distribuciones.r")
  • Cargar funciones

PASO 2. Ejercicios

Se decriben ejercicios en donde se encuentra la función de distribución

PASO 2.1. Ejercicio

Suponga que desea saber el número de llegadas, en un lapso de 15 minutos, a la rampa del cajero automático de un banco.(Anderson et al., 2008)

Si se puede suponer que la probabilidad de llegada de los automóviles es la misma en cualesquiera de dos lapsos de la misma duración y si la llegada o no–llegada de un automóvil en cualquier lapso es independiente de la llegada o no–llegada de un automóvil en cualquier otro lapso, se puede aplicar la función de probabilidad de Poisson.

Dichas condiciones se satisfacen y en un análisis de datos pasados encuentra que el número promedio de automóviles que llegan en un lapso de 15 minutos es igual a 10;

Aquí la variable aleatoria es x número de automóviles que llegan en un lapso de 15 minutos.

a) Si la administración desea saber la probabilidad de que lleguen exactamente 5 automóviles en 15 minutos,x=5,y se obtiene:

Uilizando la función creada conforme a la fórmula

prob = round(f.prob.poisson(10, 5),4)
paste("La probabilidad de que sean exactamente 5 automóviles es de : ", prob)
## [1] "La probabilidad de que sean exactamente 5 automóviles es de :  0.0378"

Utilizando la funcón dpois()

prob2 = round(dpois(x = 5, lambda = 10),4)
paste("La probabilida de que sean exactamente 5 automóviles es de : ", prob2)
## [1] "La probabilida de que sean exactamente 5 automóviles es de :  0.0378"

b) Tabla de probabilidad y gráfica de la probabilidad de Poisson

datos = data.frame(x=1:20, f.prob.x = round(dpois(x = 1:20, lambda = 10),4))
datos = cbind(datos, f.acum.x = cumsum(datos$f.prob.x))
datos
##     x f.prob.x f.acum.x
## 1   1   0.0005   0.0005
## 2   2   0.0023   0.0028
## 3   3   0.0076   0.0104
## 4   4   0.0189   0.0293
## 5   5   0.0378   0.0671
## 6   6   0.0631   0.1302
## 7   7   0.0901   0.2203
## 8   8   0.1126   0.3329
## 9   9   0.1251   0.4580
## 10 10   0.1251   0.5831
## 11 11   0.1137   0.6968
## 12 12   0.0948   0.7916
## 13 13   0.0729   0.8645
## 14 14   0.0521   0.9166
## 15 15   0.0347   0.9513
## 16 16   0.0217   0.9730
## 17 17   0.0128   0.9858
## 18 18   0.0071   0.9929
## 19 19   0.0037   0.9966
## 20 20   0.0019   0.9985
ggplot(data = datos, aes(x,f.prob.x) ) +
  geom_point(colour = "red") +
  geom_line(colour = 'blue')

c) ¿Cual es la probabilidad de que sea x menor o igual a diez?

P(x≤10)=P(x=1)+P(x=2)+P(x=3)+…+P(x=10)

datos$f.acum[10]
## [1] 0.5831
paste("La probabilidad de que el valor de x sea menor o igua a 10 es: ", datos$f.acum[10])
## [1] "La probabilidad de que el valor de x sea menor o igua a 10 es:  0.5831"

e) Media diferente

En el ejemplo anterior se usó un lapso de 15 minutos, pero también se usan otros lapsos. Suponga que desea calcular la probabilidad de una llegada en un lapso de 3 minutos.

Regla de tres:

10=15

? = 3

Entonces, la probabilidad de $x4 llegadas en un lapso de 3 minutos con μ=2 está dada por la siguiente nueva función de probabilidad de Poisson.

f(x)=e−22xx!

Entonces ….

prob = round(dpois(x = 1, lambda = 2),4)
paste("La probabilidad cuando x = 1 y media igual a 2 es del:", prob * 100, "%")
## [1] "La probabilidad cuando x = 1 y media igual a 2 es del: 27.07 %"

f) El valor de la esperanza media

La esperanza es igual a: 10

g) La varianza es 10 y la desviación estándard es: 3.1623

2.2. Ejercicio

En ciertas instalaciones industriales los accidentes ocurren con muy poca frecuencia. Se sabe que la probabilidad de un accidente en cualquier día dado es 0.005 y los accidentes son independientes entre sí (Walpole et al., 2012).

n = 400
prob = 0.005
media = n * prob

La media es 2

La variable aleatoria son los dias desde x=1…hasta x=n

a) La tabla de distribución de probablidad de Poisson con media igual a 2

datos = data.frame(x=0:10, f.prob.x = round(dpois(x = 0:10, lambda = media),4))
datos = cbind(datos, f.acum.x = cumsum(datos$f.prob.x))
datos
##     x f.prob.x f.acum.x
## 1   0   0.1353   0.1353
## 2   1   0.2707   0.4060
## 3   2   0.2707   0.6767
## 4   3   0.1804   0.8571
## 5   4   0.0902   0.9473
## 6   5   0.0361   0.9834
## 7   6   0.0120   0.9954
## 8   7   0.0034   0.9988
## 9   8   0.0009   0.9997
## 10  9   0.0002   0.9999
## 11 10   0.0000   0.9999
ggplot(data = datos, aes(x,f.prob.x) ) +
  geom_point(colour = "red") +
  geom_line(colour = 'blue')

b) ¿Cuál es la probabilidad de que en cualquier periodo dado de 400 días habrá un accidente en un día?

P(x=1)

Recorddar que el índice de la tabla empieza en el valor cero de tal forma que se necesita el siguiente valor x+1 en la tabla:

x = 1
prob = datos$f.prob.x[x+1]
paste("La probabiidad del valor de x=1 es: ", prob)
## [1] "La probabiidad del valor de x=1 es:  0.2707"

c) ¿Cuál es la probabilidad de que haya a lo más tres días con un accidente?

  • El indice en la taba comienza en cero
x = 3
prob = datos$f.acum.x[x+1]
paste("La probabiidad del valor de x<=3 es: ", prob)
## [1] "La probabiidad del valor de x<=3 es:  0.8571"

PASO 2.3. Ejercicio

Un fabricante de automóviles se preocupa por una falla en el mecanismo de freno de un modelo específico. La falla puede causar en raras ocasiones una catástrofe a alta velocidad. Suponga que la distribución del número de automóviles por año que experimentará la falla es una variable aleatoria de Poisson con λ=5 (Walpole et al., 2012).

a) La tabla de distribuci´n cuando media igual a 5

media = 5
datos = data.frame(x=0:20, f.prob.x = round(dpois(x = 0:20, lambda = media),8))
datos = cbind(datos, f.acum.x = cumsum(datos$f.prob.x))
datos
##     x   f.prob.x   f.acum.x
## 1   0 0.00673795 0.00673795
## 2   1 0.03368973 0.04042768
## 3   2 0.08422434 0.12465202
## 4   3 0.14037390 0.26502592
## 5   4 0.17546737 0.44049329
## 6   5 0.17546737 0.61596066
## 7   6 0.14622281 0.76218347
## 8   7 0.10444486 0.86662833
## 9   8 0.06527804 0.93190637
## 10  9 0.03626558 0.96817195
## 11 10 0.01813279 0.98630474
## 12 11 0.00824218 0.99454692
## 13 12 0.00343424 0.99798116
## 14 13 0.00132086 0.99930202
## 15 14 0.00047174 0.99977376
## 16 15 0.00015725 0.99993101
## 17 16 0.00004914 0.99998015
## 18 17 0.00001445 0.99999460
## 19 18 0.00000401 0.99999861
## 20 19 0.00000106 0.99999967
## 21 20 0.00000026 0.99999993
ggplot(data = datos, aes(x,f.prob.x) ) +
  geom_point(colour = "red") +
  geom_line(colour = 'blue')

b) ¿Cuál es la probabilidad de que, a lo más, 3 automóviles por año sufran una catástrofe?

P(X≤3)

P(X=0)+P(X=1)+P(X=2)+P(X=3)

x = 3
prob = datos$f.acum.x[x+1]
paste("La probabiidad del valor de x<=3 es: ", round(prob * 100,4), "%")
## [1] "La probabiidad del valor de x<=3 es:  26.5026 %"

###3 c) ¿Cuál es la probabilidad de que más de 1 automóvil por año experimente una catástrofe? #### 1−P(X≤1) #### 1−(P(X=0)+P(x=1))

x = 1
prob = 1 - datos$f.acum.x[x+1]
paste("La probabiidad del valor de x>1 es: ", round(prob * 100,4), "%")
## [1] "La probabiidad del valor de x>1 es:  95.9572 %"

INTERPRETACIÓN DEL CASO

El caso qeu acabamos de realizar consiste totalmente en la aplicación de las distribuciones de Poisson, que teóricamente en Probabilidad y Estadística, se refiere a una distribución probabilística discreta que expresa, a partir de una frecuencia de ocurrencia media, la probabilidad de que ocurra un determinado número de eventos durante cierto período de tiempo.

Dicho lo anterior, comencemos a hablar del caso: Se nos han generado 20 datos exactos.

En el ejercicio dos, evaluamos la posibilidad de que un accidente ocurra es practicamente baja, de un 0.005, sin embargo, cada uno de los accidentes son independientes entre si, por o que podemos observar que la probabilidad y/o posibilidad de que no haya accidentes aumente ligeramente hasta un 0.8571%.

Esto es muy similar (o guarda relación) con lo que vimos en el tema DISTRIBUCIÓN