Distribución Hipergeométrica. Caso Fusibles Defectuosos


Objetivo

Determinar la probabilidad de una variable discreta bajo la distribución y hipergeométrica.
  • Se utilizará la función dhyper() para encontrar proabildiades de p(x=0,1….n)
  • Se utilizará la función phyper() para encontrar probabilidades acumuldas de f(x=0,1….n)
CASO: Una empresa fabrica fusibles que empaca en cajas de doce unidades cada una.
  • Asuma que un inspector selecciona al azar tres de los doce fusibles de una caja para inspeccionarlos.
  • Si la caja contiene exactamente cinco fusibles defectuosos,
  • ¿cuál es la probabilidad de que el inspector encuentre que uno defectuoso de los tres fusibles?

Las librerías necesarias

library(gtools)
## Warning: package 'gtools' was built under R version 3.6.3

A realizar

    1. ¿Cuál es la probabilidad de que el inspector encuentre que uno defectuoso de los tres fusibles?. Determinar la probabilidad bajo la distribución hipergeométrica cuando x=1
    • Primero: Conforme la fórmula
    • Segundo: conforme a la función dhyper()
    1. Construir la tabla de distribución Resolver preguntas
    1. ¿Cuál es la probabilidad de hallar por lo menos un fusible defectuoso? Determinar estádisticos al igual que en otras distribuciones de probabilidad
    1. Determinar la esperanza o media dada por: μ=kp
    1. Determinar la varianza dada por var(x)=kp(1−p)∗(m+n−k)(m+n−1)
    1. Determinar la desviación std dada por σ=var(x)−−−−−√

PARTE 1

1. Determinar la probabilidad bajo la distribución hipergeométrica cuando x=1

  • Primero: Determinar probabilida conforme a la fórmula
    • N equivale a total de población N=12
    • n equivale a la muestra o número de ensayos n=3
    • r equivale a total de casos exitosos de toda la población r=5
    • N-r equivale a número de elementos que son fracaso N−r=7
N <- 12 ; n <- 3; r <- 5; x <- 1
round(nrow(combinations(r,x)) * nrow(combinations(N-r, n - x)) / nrow(combinations(N,n)),4)
## [1] 0.4773
  • Segundo: Determinar probabilidad conforme a la función dhyper(). Ver la ayuda ? dhyper() en consola
  • x, representa la variable discreta {0,1,2,3,,,n}
  • m, representa el número de casos de éxito o sea a 5
  • n, representa el número de casos de fracaso 12-5
  • k, representa la muestra
x<-1     # Variable a determinar su probabilidad
m <- r   # Casos exitosos
k <- n   # La muestra
n <- N-m # Casos no Exitosos 12-5
dhyper(x = x,m = m, k = k, n = n)
## [1] 0.4772727


PARTE 2

2. Construir la tabla de distribución

  • Primero: realizar las probabilidads para cada valor de la variable discreta mediante dhyper()
prob.x <- round(dhyper(x = 0:k,m = m, k = k, n = n),4)
prob.x
## [1] 0.1591 0.4773 0.3182 0.0455
  • Segundo: Realizar las probabilidades acumuladas de cada valor de la variable discreta desde 0 hasta k mediante phyper()
prob.acum.x <- round(phyper(q = 0:k,m = m, k = k, n = n),4)
prob.acum.x
## [1] 0.1591 0.6364 0.9545 1.0000
  • Tercero. Determinar la tabla de probabildia desde x=0 hasta x=1,2…k
tabla <- data.frame(1:(k+1), 0:k, prob.x, prob.acum.x)
colnames(tabla) <- c("pos","x", "prob.x", "prob.acum.x")
tabla
##   pos x prob.x prob.acum.x
## 1   1 0 0.1591      0.1591
## 2   2 1 0.4773      0.6364
## 3   3 2 0.3182      0.9545
## 4   4 3 0.0455      1.0000


PARTE 3

3. ¿Cuál es la probabilidad de hallar por lo menos un fusible defectuoso?

  • Determinar mediante uno menos la probabiidad de p(0) o sea
x<-0     # Variable a determinar su probabilidad

1 - dhyper(x = x,m = m, k = k, n = n)
## [1] 0.8409091
  • O mediante la tabla de distribución previamente generada
1 - tabla$prob.acum.x[1]
## [1] 0.8409


PARTE 4

4. Determinar la esperanza o media dada por: μ=kp

N <- 12
M <- 5
n <- 3
e.m <- n * (M/N)
e.m
## [1] 1.25


PARTE 5

5. Determinar la varianza

N <- 12
M <- 5
n <- 3
vari <- n * (M/N) * ((N-M)/N) * ((N-M)/(N-1))
vari
## [1] 0.4640152


PARTE 6

6. Determinar la desviación standar

dsv <- sqrt(vari)
dsv
## [1] 0.6811866


Conclusion

La distribución hipergeométrica es una distribución discreta que modela el número de eventos en una muestra de tamaño fijo cuando usted conoce el número total de elementos en la población de la cual proviene la muestra. Cada elemento de la muestra tiene dos resultados posibles (es un evento o un no evento). Las muestras no tienen reemplazo, por lo que cada elemento de la muestra es diferente. Cuando se elige un elemento de la población, no se puede volver a elegir. Por lo tanto, la probabilidad de que un elemento sea seleccionado aumenta con cada ensayo, presuponiendo que aún no haya sido seleccionado. Se la distribución hipergeométrica para muestras obtenidas de poblaciones relativamente pequeñas, sin reemplazo. Por ejemplo, la distribución hipergeométrica se utiliza en la prueba exacta de Fisher para probar la diferencia entre dos proporciones y en muestreos de aceptación por atributos cuando se toman muestras de un lote aislado de tamaño finito.