Distribución hipergeométrica

Objetivo

Resolver cuestiones de casos de probabilidad en casos mediante la identificación de variables aleatorias, funciones de probabilidad, funciones acumuladas con variables discretas asociado a distribuciones de Hipergeométrica.

Descripción

Identificar casos relacionados con variables discretas para elaborar mediante programación R y markdown las variables discretas, las funciones de probabilidad de cada variable, la función acumulada, su visualización gráfica para su correcta implementación asociado a distribuciones Hipergeométrica Los casos son identificados de la literatura relacionada con variables aleatorias discretas y distribuciones Hipergeométrica Se deben elaborar dos ejercicios en este caso 19 encontrados en la literatura

1. Cargar laslibrerías

library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.0.3
source("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/funciones/funciones.distribuciones.r")

2. Identificar ejercicios de la literatura

Ejercicio 1:

Una empresa fabrica fusibles que empaca en cajas de 12 unidades cada una.

Asuma que un inspector selecciona al azar 3 de los 12 fusibles de una caja para inspeccionarlos.

Si la caja contiene exactamente 5 fusibles defectuosos,En este ejercicio:

  • n=3 Número de ensayos

  • N=12 Total de elementos

  • r=5 fusibles defectuosos en la caja, casos de éxito

  • x es la cantidad de fusible defectusoso como variable aleatoria discreta, desde 0 hasta n (Anderson et al., 2008).

a) Tabla de probabilidad desde cero hasta tres
N <- 12 
n <- 3
r <- 5
x <- 0:n
  • Distribución de la probabilidad por medio de la función creada llamada f.prob.hiper()
datos1 <- data.frame(x=x, f.prob.x = round(f.prob.hiper(x = x, N = N, n = n, r = r), 8))

datos1 <- cbind(datos1, f.acum.x = cumsum(datos1$f.prob.x))
datos1
##   x   f.prob.x  f.acum.x
## 1 0 0.15909091 0.1590909
## 2 1 0.47727273 0.6363636
## 3 2 0.31818182 0.9545455
## 4 3 0.04545455 1.0000000
  • Distribución de la probabilidad por medio de la función base de R llamada dhyper()
  • Deben generarse los mismos datos en datos1 y datos2
m <-n; N <-N; k <- r; n <- N - n

datos2 <- data.frame(x=x, f.prob.x = round(dhyper(x = x,m = m, n = n, k = k), 8))

datos2 <- cbind(datos2, f.acum.x = cumsum(datos2$f.prob.x))

datos2
##   x   f.prob.x  f.acum.x
## 1 0 0.15909091 0.1590909
## 2 1 0.47727273 0.6363636
## 3 2 0.31818182 0.9545455
## 4 3 0.04545455 1.0000000
ggplot(data = datos2, aes(x,f.prob.x) ) +
  geom_point(colour = "red") +
  geom_line(colour = 'blue')

b) ¿Cuál es la probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso?
x <- 1
prob <- datos2$f.prob.x[x+1]

paste("La probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso es: ", round(prob * 100,4), "%")
## [1] "La probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso es:  47.7273 %"
c) ¿Cuál es la probabilidad de encontrar menos de tres fusibles defectuosos

P(x≤2)=P(X=0)+P(x=1)+P(x=2)

x <- 2
prob <- datos2$f.acum.x[x+1]

paste("La probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso es: ", round(prob * 100,4), "%")
## [1] "La probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso es:  95.4545 %"
d) ¿Cuál es el valor esperado
  • Mandar llamar la función creada anticipadamente f.va.hiper()
N <- 12 
n <- 3
r <- 5
VE <- f.va.hiper(n = n, N = N, r = r)

paste("El valor esperado o media de este ejercicio es de: ", VE)
## [1] "El valor esperado o media de este ejercicio es de:  1.25"
e) ¿Cuál es la varianza y la desviación estándar?
varianza <- f.varianza.hiper(VE = VE, n = 3, N = 12, r = 5)

desvstd <- sqrt(varianza)

paste("El valor de la varianza es de: ", round(varianza,4), " y la desviación std es de: ", round(desvstd, 4))
## [1] "El valor de la varianza es de:  0.5966  y la desviación std es de:  0.7724"

Ejercicio 2:

Lotes con 40 componentes cada uno que contengan 3 o más defectuosos se consideran inaceptables.

El procedimiento para obtener muestras del lote consiste en seleccionar 5 componentes al azar y rechazar el lote si se encuentra un componente defectuoso (Camacho Avila, 2019), (Walpole et al., 2012)

  • n=5,
  • N=40,
  • k=3 y
  • x=0,1,2,3,4…n
a) Tabla de probabilidad desde cero a cinco
N <- 40
n <- 5
r <- 3
x <- 0:r

m <-n; N <-N; k <- r; n <- N - n
datos <- data.frame(x=x, f.prob.x = round(dhyper(x = x,m = m, n = n, k = k), 8))

datos <- cbind(datos, f.acum.x = cumsum(datos$f.prob.x))

datos
##   x   f.prob.x  f.acum.x
## 1 0 0.66244939 0.6624494
## 2 1 0.30111336 0.9635628
## 3 2 0.03542510 0.9989879
## 4 3 0.00101215 1.0000000
ggplot(data = datos, aes(x,f.prob.x) ) +
  geom_point(colour = "red") +
  geom_line(colour = 'blue')

b) ¿Cuál es la probabilidad de que, en la muestra, se encuentre exactamente un componente defectuoso, si en todo el lote hay 3 defectuosos?
x <- 1
prob <- datos$f.prob.x[x+1]

paste("La probabilidad de que, en la muestra, se encuentre exactamente un componente defectuoso de tres es: ", round(prob * 100,4), "%")
## [1] "La probabilidad de que, en la muestra, se encuentre exactamente un componente defectuoso de tres es:  30.1113 %"
c) ¿Cuál es la probabilidad de encontrar menos de tres componentes defectuosos?
x <- 2
prob <- datos$f.acum.x[x+1]

paste("La probabilidad de que, en la muestra, se encuentre exactamente menos de tres componentes defectuosos es: ", round(prob * 100,4), "%")
## [1] "La probabilidad de que, en la muestra, se encuentre exactamente menos de tres componentes defectuosos es:  99.8988 %"
d) ¿Cuál es el valor esperado?
N <- 40 
n <- 5
r <- 3
VE <- f.va.hiper(n = n, N = N, r = r)

paste("El valor esperado o media de este ejercicio es de: ", VE)
## [1] "El valor esperado o media de este ejercicio es de:  0.375"
e) ¿Cuál es la varianza y la desviación estándar?
varianza <- f.varianza.hiper(VE = VE, n = 5, N = 40, r = 3)

desvstd <- sqrt(varianza)

paste("El valor de la varianza es de: ", round(varianza,4), " y la desviación std es de: ", round(desvstd, 4))
## [1] "El valor de la varianza es de:  0.3113  y la desviación std es de:  0.5579"

3. INTERPRETACION DEL CASO

En este caso numero 19 se hablo sobre la distribucion hipergeometrica en la cual se vieron dos ejercicios como en los casos anteriores para una mayor profundidad al tema, la cual habla de que es una distribucion discreta que modela el numero de eventos en una muestra de tamaño fijo.

Cuando se conoce el numero total de elementos en la poblacion de la cual proviene la muestra, se podria decir que cada elemento de la muestra tiene dos resultados posibles el cual puede ser un evento o un no evento.

En el ejercicio numero 1 habla sobre una fabrica de fusibles la cual empaca en cajas de 12 unidades, se habla sobre un inspector el cual selecciona 3 fusibles de 12 de una caja para inspeccionarlos. ¿Cuál es la probabilidad de que el inspector encuentre que uno de los tres fusibles esta defectuoso? en esta da la probabilidad de 47.7% ¿Cuál es la probabilidad de encontrar menos de tres fusibles defectuosos? se llego a un resultado de el 95.5% en donde se sumo p(x=0), p(x=1) y p(x=2) para poder llegar a dicho resultado. tambien se obtuvo el valor esperado de 1.25, la varianza que dio 0.59 y la desviacion estandar de 0.77.

En el ejercicio numero 2 se habla sobre unos lotes de 40 componentes en los cuales cada uno contienen 3 o mas defectuosos, en el cual se considera que n es igual a 5.

¿Cuál es la probabilidad de que en la muestra se encuentre exactamente un componente defectuoso, si en todo el lote hay 3 defectuosos? Se dio la probabilidad de 30.11% ¿Cuál es la probabilidad de encontrar menos de tres componentes defectuosos? y aqui como son menos se tuvieron que hacer las sumas de entee 0 a 2 para que se llegara a el resultado de 99.9%. El valor esperado obtenido es de 0.375, la varianza de 0.312 y la desviacion estandar es de 0.558.+6+++