Identificar los valores de la función de probabilidad bajo la fórmula de distribución de Hipergeométrica.
Realizar distribuciones de probabilidad conforme a la distribución de probabilidad de Hipergeométrica a partir de valores iniciales de los ejercicios.
Se generan las tablas de probabilidad conforme a distribución Hipergeométrica, se identifican los valores de probabilidad cuando la variable discreta \(x\) tenga algún exactamente algún valor, \(\leq\) a algún valor o \(\gt\) o \(\geq\), entre otros.
La distribución de probabilidad hipergeométricaestá estrechamente relacionada con la distribución binomial. Pero difieren en dos puntos: en la distribución hipergeométricalos ensayos no son independientes y la probabilidad de éxito varía de ensayo a ensayo (Anderson et al., 2008).
La distribución de probabilidad de la variable aleatoria hipergeométrica \(X\), el número de éxitos en una muestra aleatoria de tamaño \(n\) que se selecciona de \(N\) artículos, en los que \(k\) se denomina éxito y \(N – k\) se le llama fracaso (Camacho Avila, 2019)
\[f(x) = \frac{\binom{r}{x} \cdot \binom{N-r}{n-x}}{\binom{N}{n}} \]
Dónde:
\(f(x)\) es la lprobabildiad de x o la función de distribución
\(n\) número de ensayos o longitud de la muestra
\(N\) número de elementos de la población
\(r\) número de elementos de la población considerados como éxito, o cantidad de casos exitosos dentro de la pobción
\(x\) Valor de la variable aleatoria discreta \(0,1,2,3,,,,n\) (Anderson et al., 2008).
\({\binom{r}{x}}\) Parte izquierda del numerador, representan el número de formas en que se toman \(x\) éxitos de un total de \(r\) éxitos que hay en la población,
\(\binom{N-r}{n-x}\) parte derecha del numerador representa el número de maneras en que se puede tomar \(n - x\) fracasos de un total de \(N - r\) elementos que hay en la población.
\(\binom{N}{n}\) como denominador representan el número de maneras (cantidad de combinaciones) en que es posible tomar una muestra de tamaño \(n\) de una población de tamaño \(N\); (Anderson et al., 2008).
Recordando la fórmula para determinar el número de combinaciones en grupos de \(n\) elementos de una poblacón total de \(N\) está dada por:
\[C_{n}^{N} = \binom{N}{n} = \frac{N!}{n!\cdot(N-n)!}\]
Entonces desarrollando la fórmula con las combinaciones la función de probabilidad hipergeométrica queda de la siguiente manera:
\[f(x) = \frac{\binom{r}{x} \cdot \binom{N-r}{n-x}}{\binom{N}{n}} = \frac{ (\frac{r!}{x!\cdot(r-x)!})\cdot(\frac{(N-r)!}{(n-x)!\cdot((N-r) - (n-x))!})}{\frac{N!}{n!\cdot(N-n)!}}\]
\[E(x) = \mu = n \cdot\left(\frac{r}{N}\right)\]
\[Var(x) = \sigma^{2} = n \cdot\left(\frac{r}{N}\right)\cdot\left(1 - \frac{r}{N}\right)\cdot\left( \frac{N-n}{N-1}\right)\]
\[\sigma = \sqrt{Var(x)} = \sqrt{\sigma^{2}}\]
library(ggplot2)
#source("../funciones/funciones.distribuciones.r")
# o
source("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/funciones/funciones.distribuciones.r")
Una empresa fabrica fusibles que empaca en cajas de 12 unidades cada una.
Asuma que un inspector selecciona al azar \(3\) de los \(12\) fusibles de una caja para inspeccionarlos.
Si la caja contiene exactamente 5 fusibles defectuosos,
En este ejercicio::
\(n = 3\) Número de ensayos
\(N = 12\) Total de elementos
\(r = 5\) fusibles defectuosos en la caja, casos de éxito
\(x\) es la cantidad de fusible defectusoso como variable aleatoria discreta, desde \(0\) hasta \(n\) (Anderson et al., 2008).
N <- 12
n <- 3
r <- 5
x <- 0:n
datos1 <- data.frame(x=x, f.prob.x = round(f.prob.hiper(x = x, N = N, n = n, r = r), 8))
datos1 <- cbind(datos1, f.acum.x = cumsum(datos1$f.prob.x))
datos1
## x f.prob.x f.acum.x
## 1 0 0.15909091 0.1590909
## 2 1 0.47727273 0.6363636
## 3 2 0.31818182 0.9545455
## 4 3 0.04545455 1.0000000
m <-n; N <-N; k <- r; n <- N - n
datos2 <- data.frame(x=x, f.prob.x = round(dhyper(x = x,m = m, n = n, k = k), 8))
datos2 <- cbind(datos2, f.acum.x = cumsum(datos2$f.prob.x))
datos2
## x f.prob.x f.acum.x
## 1 0 0.15909091 0.1590909
## 2 1 0.47727273 0.6363636
## 3 2 0.31818182 0.9545455
## 4 3 0.04545455 1.0000000
ggplot(data = datos2, aes(x,f.prob.x) ) +
geom_point(colour = "red") +
geom_line(colour = 'blue')
x <- 1
prob <- datos2$f.prob.x[x+1]
paste("La probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso es: ", round(prob * 100,4), "%")
## [1] "La probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso es: 47.7273 %"
\(P(x\leq2) = P(X=0) + P(x=1) + P(x=2)\)
x <- 2
prob <- datos2$f.acum.x[x+1]
paste("La probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso es: ", round(prob * 100,4), "%")
## [1] "La probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso es: 95.4545 %"
N <- 12
n <- 3
r <- 5
VE <- f.va.hiper(n = n, N = N, r = r)
paste("El valor esperado o media de este ejercicios es de: ", VE)
## [1] "El valor esperado o media de este ejercicios es de: 1.25"
varianza <- f.varianza.hiper(VE = VE, n = 3, N = 12, r = 5)
desvstd <- sqrt(varianza)
paste("El valor de la varianza es de: ", round(varianza,4), " y la desviación std es de: ", round(desvstd, 4))
## [1] "El valor de la varianza es de: 0.5966 y la desviación std es de: 0.7724"
Existe una probabilidad de aproximadamente 47.72% de que suceda exactamente una fusible defectuoso.
Existe una probabilidad aproximada del 95% de que sucedan fusibles defectuosos menores a 3 componentes
El Valor esperado de 1.25 significa lo que en promedio se esper que suceda por cualquier valor de la varable discreta
La varianza es de 0.5966 y la desviación es de 0.7724 que siginfican el grado de dispersión de los valores de la distribución o que tanto se alejan del valor medio en la distribución de probabilidad en este caso hipergeométrica.
Lotes con \(40\) componentes cada uno que contengan \(3\) o más defectuosos se consideran inaceptables.
El procedimiento para obtener muestras del lote consiste en seleccionar \(5\) componentes al azar y rechazar el lote si se encuentra un componente defectuoso (Camacho Avila, 2019), (Walpole et al., 2012)
N <- 40
n <- 5
r <- 3
x <- 0:r
m <-n; N <-N; k <- r; n <- N - n
datos <- data.frame(x=x, f.prob.x = round(dhyper(x = x,m = m, n = n, k = k), 8))
datos <- cbind(datos, f.acum.x = cumsum(datos$f.prob.x))
datos
## x f.prob.x f.acum.x
## 1 0 0.66244939 0.6624494
## 2 1 0.30111336 0.9635628
## 3 2 0.03542510 0.9989879
## 4 3 0.00101215 1.0000000
ggplot(data = datos, aes(x,f.prob.x) ) +
geom_point(colour = "red") +
geom_line(colour = 'blue')
x <- 1
prob <- datos$f.prob.x[x+1]
paste("La probabilidad de que, en la muestra, se encuentre exactamente un componente defectuoso de tres es: ", round(prob * 100,4), "%")
## [1] "La probabilidad de que, en la muestra, se encuentre exactamente un componente defectuoso de tres es: 30.1113 %"
En este ejercicio en su contexto, sólo 30% de las veces detecta un lote malo (con 3 componentes defectuosos). (Camacho Avila, 2019).
Se tiene un lote de 100 artículos de los cuales 12 están defectuosos.
N <- 100
n <- 10
r <- 12
x <- 0:n
datos <- data.frame(x=x, f.prob.x = round(f.prob.hiper(x = x, N = N, n = n, r = r), 8))
datos <- cbind(datos, f.acum.x = cumsum(datos$f.prob.x))
datos
## x f.prob.x f.acum.x
## 1 0 0.26075027 0.2607503
## 2 1 0.39607636 0.6568266
## 3 2 0.24507225 0.9018989
## 4 3 0.08068222 0.9825811
## 5 4 0.01549689 0.9980780
## 6 5 0.00179241 0.9998704
## 7 6 0.00012447 0.9999949
## 8 7 0.00000502 0.9999999
## 9 8 0.00000011 1.0000000
## 10 9 0.00000000 1.0000000
## 11 10 0.00000000 1.0000000
x <- 3
prob <- datos$f.prob.x[x+1]
paste("La probabilidad de que haya 3 defectuosos en una muestra de 10 es de", prob)
## [1] "La probabilidad de que haya 3 defectuosos en una muestra de 10 es de 0.08068222"
c)¿Cuál es el valor esperado?
d)¿Cuál es la varianza y la desviacoón estándard?
Anderson, D. R., Sweeney, D. J., & Williams, T. A. (2008). Estadística para administración y economía (10th ed.). Cengage Learning,
Camacho Avila, M. (2019). Probabilidad y estadística. Modelos probabilísticos. http://148.215.1.182/bitstream/handle/20.500.11799/108238/secme-34236_1.pdf?sequence=1
Walpole, R. E., Myers, R. H., & Myers, S. L. (2012). Probabilidad y estadística para ingeniería y ciencias (Novena Edición). Pearson.