Objetivo Identificar los valores de la función de probabilidad bajo la fórmula de distribución de Hipergeométrica.
Descripción Realizar distribuciones de probabilidad conforme a la distribución de probabilidad de Hipergeométrica a partir de valores iniciales de los ejercicios.
Se generan las tablas de probabilidad conforme a distribución Hipergeométrica, se identifican los valores de probabilidad cuando la variable discreta x tenga algún exactamente algún valor, ≤ a algún valor o > o ≥, entre otros.
La distribución de probabilidad hipergeométricaestá estrechamente relacionada con la distribución binomial. Pero difieren en dos puntos: en la distribución hipergeométricalos ensayos no son independientes y la probabilidad de éxito varía de ensayo a ensayo (Anderson et al., 2008).
La distribución de probabilidad de la variable aleatoria hipergeométrica X, el número de éxitos en una muestra aleatoria de tamaño n que se selecciona de \(N\) artículos, en los que \(k\) se denomina éxito y \(N–k\) se le llama fracaso (Camacho Avila, 2019)
Fórmula de la distribución hipergeométrica \[f(x) = \frac{\binom{r}{x} \cdot \binom{N-r}{n-x}}{\binom{N}{n}}\]
Dónde: * \(f(x)\) es la lprobabildiad de x o la función de distribución
\(n\) número de ensayos o longitud de la muestra
\(N\) número de elementos de la población
\(r\)$ número de elementos de la población considerados como éxito, o cantidad de casos exitosos dentro de la pobción
\(x\) Valor de la variable aleatoria discreta \(0,1,2,3,,,,n\) (Anderson et al., 2008).
\({\binom{r}{x}}\) Parte izquierda del numerador, representan el número de formas en que se toman \(x\) éxitos de un total de \(r\) éxitos que hay en la población,
\(\binom{N-r}{n-x}\) parte derecha del numerador representa el número de maneras en que se puede tomar \(n−x\) fracasos de un total de \(N−r\) elementos que hay en la población.
\(\binom{N}{n}\) como denominador representan el número de maneras (cantidad de combinaciones) en que es posible tomar una muestra de tamaño n de una población de tamaño \(N\); (Anderson et al., 2008).
Recordando la fórmula para determinar el número de combinaciones en grupos de \(n\) elementos de una poblacón total de \(N\) está dada por: \[C_{n}^{N} = \binom{N}{n} = \frac{N!}{n!\cdot(N-n)!}\]
Entonces desarrollando la fórmula con las combinaciones la función de probabilidad hipergeométrica queda de la siguiente manera: \[f(x) = \frac{\binom{r}{x} \cdot \binom{N-r}{n-x}}{\binom{N}{n}} = \frac{ (\frac{r!}{x!\cdot(r-x)!})\cdot(\frac{(N-r)!}{(n-x)!\cdot((N-r) - (n-x))!})}{\frac{N!}{n!\cdot(N-n)!}}\]
Fórmula para valor esperado: \[E(x) = \mu = n \cdot\left(\frac{r}{N}\right)\]
Fórmula para varianza: \[Var(x) = \sigma^{2} = n \cdot\left(\frac{r}{N}\right)\cdot\left(1 - \frac{r}{N}\right)\cdot\left( \frac{N-n}{N-1}\right)\]
Fórmula de la desviación estándard \[\sigma = \sqrt{Var(x)} = \sqrt{\sigma^{2}}\]
library(ggplot2)
source("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/funciones/funciones.distribuciones.r")
Una empresa fabrica fusibles que empaca en cajas de 12 unidades cada una. * Asuma que un inspector selecciona al azar 3 de los 12 fusibles de una caja para inspeccionarlos. * Si la caja contiene exactamente 5 fusibles defectuosos, * En este ejercicio:: * \(n=3\) Número de ensayos * \(N=12\) Total de elementos * \(r=5\) fusibles defectuosos en la caja, casos de éxito * \(x\) es la cantidad de fusible defectusoso como variable aleatoria discreta, desde \(0\) hasta \(n\) (Anderson et al., 2008).
N <- 12
n <- 3
r <- 5
x <- 0:n
Distribución de la probabilidad por medio de la función creada llamada f.prob.hiper()
datos1 <- data.frame(x=x, f.prob.x = round(f.prob.hiper(x = x, N = N, n = n, r = r), 8))
datos1 <- cbind(datos1, f.acum.x = cumsum(datos1$f.prob.x))
datos1
## x f.prob.x f.acum.x
## 1 0 0.15909091 0.1590909
## 2 1 0.47727273 0.6363636
## 3 2 0.31818182 0.9545455
## 4 3 0.04545455 1.0000000
m <-n; N <-N; k <- r; n <- N - n
datos2 <- data.frame(x=x, f.prob.x = round(dhyper(x = x,m = m, n = n, k = k), 8))
datos2 <- cbind(datos2, f.acum.x = cumsum(datos2$f.prob.x))
datos2
## x f.prob.x f.acum.x
## 1 0 0.15909091 0.1590909
## 2 1 0.47727273 0.6363636
## 3 2 0.31818182 0.9545455
## 4 3 0.04545455 1.0000000
ggplot(data = datos2, aes(x,f.prob.x) ) +
geom_point(colour = "red") +
geom_line(colour = 'blue')
x <- 1
prob <- datos2$f.prob.x[x+1]
paste("La probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso es: ", round(prob * 100,4), "%")
## [1] "La probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso es: 47.7273 %"
x <- 2
prob <- datos2$f.acum.x[x+1]
paste("La probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso es: ", round(prob * 100,4), "%")
## [1] "La probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso es: 95.4545 %"
N <- 12
n <- 3
r <- 5
VE <- f.va.hiper(n = n, N = N, r = r)
paste("El valor esperado o media de este ejercicios es de: ", VE)
## [1] "El valor esperado o media de este ejercicios es de: 1.25"
varianza <- f.varianza.hiper(VE = VE, n = 3, N = 12, r = 5)
desvstd <- sqrt(varianza)
paste("El valor de la varianza es de: ", round(varianza,4), " y la desviación std es de: ", round(desvstd, 4))
## [1] "El valor de la varianza es de: 0.5966 y la desviación std es de: 0.7724"
Lotes con \(40\) componentes cada uno que contengan \(3\) o más defectuosos se consideran inaceptables.
El procedimiento para obtener muestras del lote consiste en seleccionar \(5\) componentes al azar y rechazar el lote si se encuentra un componente defectuoso (Camacho Avila, 2019), (Walpole et al., 2012)
N <- 40
n <- 5
r <- 3
x <- 0:r
m <-n; N <-N; k <- r; n <- N - n
datos <- data.frame(x=x, f.prob.x = round(dhyper(x = x,m = m, n = n, k = k), 8))
datos <- cbind(datos, f.acum.x = cumsum(datos$f.prob.x))
datos
## x f.prob.x f.acum.x
## 1 0 0.66244939 0.6624494
## 2 1 0.30111336 0.9635628
## 3 2 0.03542510 0.9989879
## 4 3 0.00101215 1.0000000
ggplot(data = datos, aes(x,f.prob.x) ) +
geom_point(colour = "red") +
geom_line(colour = 'blue')
x <- 1
prob <- datos$f.prob.x[x+1]
paste("La probabilidad de que, en la muestra, se encuentre exactamente un componente defectuoso de tres es: ", round(prob * 100,4), "%")
## [1] "La probabilidad de que, en la muestra, se encuentre exactamente un componente defectuoso de tres es: 30.1113 %"
x <- 2
prob <- datos$f.acum.x[x+1]
paste("La probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso es: ", round(prob * 100,4), "%")
## [1] "La probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso es: 99.8988 %"
N <- 40
n <- 5
r <- 3
VE <- f.va.hiper(n = n, N = N, r = r)
paste("El valor esperado o media de este ejercicios es de: ", VE)
## [1] "El valor esperado o media de este ejercicios es de: 0.375"
varianza <- f.varianza.hiper(VE = VE, n = 5, N = 40, r = 3)
desvstd <- sqrt(varianza)
paste("El valor de la varianza es de: ", round(varianza,4), " y la desviación std es de: ", round(desvstd, 4))
## [1] "El valor de la varianza es de: 0.3113 y la desviación std es de: 0.5579"
Interpretación En este ejercicio en su contexto, sólo 30% de las veces detecta un lote malo (con 3 componentes defectuosos). (Camacho Avila, 2019).
Se tiene un lote de 100 artículos de los cuales 12 están defectuosos.
N <- 100
n <- 10
r <- 12
x <- 0:n
datos <- data.frame(x=x, f.prob.x = round(f.prob.hiper(x = x, N = N, n = n, r = r), 8))
datos <- cbind(datos, f.acum.x = cumsum(datos$f.prob.x))
datos
## x f.prob.x f.acum.x
## 1 0 0.26075027 0.2607503
## 2 1 0.39607636 0.6568266
## 3 2 0.24507225 0.9018989
## 4 3 0.08068222 0.9825811
## 5 4 0.01549689 0.9980780
## 6 5 0.00179241 0.9998704
## 7 6 0.00012447 0.9999949
## 8 7 0.00000502 0.9999999
## 9 8 0.00000011 1.0000000
## 10 9 0.00000000 1.0000000
## 11 10 0.00000000 1.0000000
x <- 3
prob <- datos$f.prob.x[x+1]
paste("La probabilidad de que haya 3 defectuosos en una muestra de 10 es de", prob)
## [1] "La probabilidad de que haya 3 defectuosos en una muestra de 10 es de 0.08068222"
c)¿Cuál es el valor esperado?
N <- 100
n <- 10
r <- 12
VE <- f.va.hiper(n = n, N = N, r = r)
paste("El valor esperado o media de este ejercicios es de: ", VE)
## [1] "El valor esperado o media de este ejercicios es de: 1.2"
d)¿Cuál es la varianza y la desviacoón estándard?
varianza <- f.varianza.hiper(VE = VE, n = 10, N = 100, r = 12)
desvstd <- sqrt(varianza)
paste("El valor de la varianza es de: ", round(varianza,4), " y la desviación std es de: ", round(desvstd, 4))
## [1] "El valor de la varianza es de: 0.96 y la desviación std es de: 0.9798"
En este caso se muestran dos ejercicios El primero nos dice que Una empresa fabrica fusibles en cajas de 12 unidades cada una, un inspector selecciona al azar 3 de los 12 fusibles de una caja para inspeccionarlos. Si la caja contiene exactamente 5 fusibles defectuosos, en este ejercicio: n=3 Número de ensayos N=12 Total de elementos
r=5 fusibles defectuosos en la caja, casos de éxito x es la cantidad de fusible defectusoso como variable aleatoria discreta, desde 0 hasta n
Existe una probabilidad de aproximadamente 47.72% de que suceda exactamente una fusible defectuoso.
Existe una probabilidad aproximada del 95% de que sucedan fusibles defectuosos menores a 3 componentes
El Valor esperado de 1.25 significa lo que en promedio se esper que suceda por cualquier valor de la varable discreta
La varianza es de 0.5966 y la desviación es de 0.7724 que siginfican el grado de dispersión de los valores de la distribución o que tanto se alejan del valor medio en la distribución de probabilidad en este caso hipergeométrica.
Anderson, D. R., Sweeney, D. J., & Williams, T. A. (2008). Estadística para administración y economía (10th ed.). Cengage Learning,
Camacho Avila, M. (2019). Probabilidad y estadística. Modelos probabilísticos. http://148.215.1.182/bitstream/handle/20.500.11799/108238/secme-34236_1.pdf?sequence=1
Walpole, R. E., Myers, R. H., & Myers, S. L. (2012). Probabilidad y estadística para ingeniería y ciencias (Novena Edición). Pearson.