CASO 19
OBJETIVO
Identificar los valores de la función de probabilidad bajo la fórmula de distribución de Hipergeométrica.
Descripción
Realizar distribuciones de probabilidad conforme a la distribución de probabilidad de Hipergeométrica a partir de valores iniciales de los ejercicios.
Se generan las tablas de probabilidad conforme a distribución Hipergeométrica, se identifican los valores de probabilidad cuando la variable discreta x tenga algún exactamente algún valor, ≤ a algún valor o > o ≥, entre otros.
Fundamento teórico
La distribución de probabilidad hipergeométricaestá estrechamente relacionada con la distribución binomial. Pero difieren en dos puntos: en la distribución hipergeométricalos ensayos no son independientes y la probabilidad de éxito varía de ensayo a ensayo (Anderson et al., 2008).
La distribución de probabilidad de la variable aleatoria hipergeométrica X, el número de éxitos en una muestra aleatoria de tamaño n que se selecciona de N artículos, en los que k se denomina éxito y N–k se le llama fracaso (Camacho Avila, 2019)
Fórmula de función de probabilidad
Fórmula de la distribución hipergeométrica
\(f(x)=(rx)⋅(N−rn−x)(Nn)\)
Donde:
f(x) es la probabildiad de x o la función de distribución
n número de ensayos o longitud de la muestra
N número de elementos de la población
r número de elementos de la población considerados como éxito, o cantidad de casos exitosos dentro de la pobción
x Valor de la variable aleatoria discreta 0,1,2,3,,,,n (Anderson et al., 2008).
(rx) Parte izquierda del numerador, representan el número de formas en que se toman x éxitos de un total de r éxitos que hay en la población,
(N−rn−x) parte derecha del numerador representa el número de maneras en que se puede tomar n−x fracasos de un total de N−r elementos que hay en la población.
(Nn) como denominador representan el número de maneras (cantidad de combinaciones) en que es posible tomar una muestra de tamaño n de una población de tamaño N; (Anderson et al., 2008).
Recordando la fórmula para determinar el número de combinaciones en grupos de n elementos de una poblacón total de N está dada por:
\(CNn=(Nn)=N!n!⋅(N−n)!\)
Entonces desarrollando la fórmula con las combinaciones la función de probabilidad hipergeométrica queda de la siguiente manera:
\(f(x)=(rx)⋅(N−rn−x)(Nn)=(r!x!⋅(r−x)!)⋅((N−r)!(n−x)!⋅((N−r)−(n−x))!)N!n!⋅(N−n)!\)
Fórmula para valor esperado
\(E(x)=μ=n⋅(rN)\)
Fórmula para varianza
\(Var(x)=σ2=n⋅(rN)⋅(1−rN)⋅(N−nN−1)\)
Fórmula de la desviación estándard
\(σ=Var(x)−−−−−−√=σ2−−√\)
PASOS A SEGUIR
Cargar librerías
Ejercicios
Ejercicio 1: Probabilidades, Varianza, Desviación
Ejercicio 2: Probabilidades, Varianza, Desviación
Interpretación los ejercicios
PASO 1. Cargar librerías
library(ggplot2)
Cargar funciones
source("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/funciones/funciones.distribuciones.r")
PASO 2. Ejercicios
Ejercicio 1.
Una empresa fabrica fusibles que empaca en cajas de 12 unidades cada una.
Asuma que un inspector selecciona al azar 3 de los 12 fusibles de una caja para inspeccionarlos.
Si la caja contiene exactamente 5 fusibles defectuosos,
En este ejercicio::
n=3 Número de ensayos
N=12 Total de elementos
r=5 fusibles defectuosos en la caja, casos de éxito
x es la cantidad de fusible defectusoso como variable aleatoria discreta, desde 0 hasta n (Anderson et al., 2008).
a) Tabla de probabilidad desde cero a tres
Primero inicializar valores
N <- 12
n <- 3
r <- 5
x <- 0:n
Distribución de la probabilidad por medio de la función creada llamada f.prob.hiper()
datos1 <- data.frame(x=x, f.prob.x = round(f.prob.hiper(x = x, N = N, n = n, r = r), 8))
datos1 <- cbind(datos1, f.acum.x = cumsum(datos1$f.prob.x))
datos1
## x f.prob.x f.acum.x
## 1 0 0.15909091 0.1590909
## 2 1 0.47727273 0.6363636
## 3 2 0.31818182 0.9545455
## 4 3 0.04545455 1.0000000
Distribución de la probabilidad por medio de la función base de R llamada dhyper()
Deben generarse los mismos datos en datos1 y datos2
m <-n; N <-N; k <- r; n <- N - n
datos2 <- data.frame(x=x, f.prob.x = round(dhyper(x = x,m = m, n = n, k = k), 8))
datos2 <- cbind(datos2, f.acum.x = cumsum(datos2$f.prob.x))
datos2
## x f.prob.x f.acum.x
## 1 0 0.15909091 0.1590909
## 2 1 0.47727273 0.6363636
## 3 2 0.31818182 0.9545455
## 4 3 0.04545455 1.0000000
ggplot(data = datos2, aes(x,f.prob.x) ) +
geom_point(colour = "red") +
geom_line(colour = 'blue')

b) ¿Cuál es la probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso?
x <- 1
prob <- datos2$f.prob.x[x+1]
paste("La probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso es: ", round(prob * 100,4), "%")
## [1] "La probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso es: 47.7273 %"
c) ¿Cuál es la probabilidad de encontrar menos de tres fusibles defectuosos
\(P(x≤2)=P(X=0)+P(x=1)+P(x=2)\)
x <- 2
prob <- datos2$f.acum.x[x+1]
paste("La probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso es: ", round(prob * 100,4), "%")
## [1] "La probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso es: 95.4545 %"
d) ¿Cuál es el valor esperado
Mandar llamar la función creada anticipadamente f.va.hiper()
N <- 12
n <- 3
r <- 5
VE <- f.va.hiper(n = n, N = N, r = r)
paste("El valor esperado o media de este ejercicios es de: ", VE)
## [1] "El valor esperado o media de este ejercicios es de: 1.25"
e) ¿Cuál es la varianza y la desviación estándard?
varianza <- f.varianza.hiper(VE = VE, n = 3, N = 12, r = 5)
desvstd <- sqrt(varianza)
paste("El valor de la varianza es de: ", round(varianza,4), " y la desviación std es de: ", round(desvstd, 4))
## [1] "El valor de la varianza es de: 0.5966 y la desviación std es de: 0.7724"
INTERPRETACIÓN DEL EJERCICIO No. 1
De acuerdo con los datos calculados en el ejercicio uno, tenemos los siguientes resultados:
La probabilidad de que un fusible resulte defectuoso es del 47.72% aproximadamente.
Por otro lado, según los otros cálculos, la máxima probabilidad de que haya un fusil defectuoso menor a 3 componentes es del 95%
La variable discreta, en promedio, se espera ue su valor sea de 1.25
La Varianza es de 0.5966
La desviación estándar es de 0.7724
Los 2 datos anteriores significan que el grado de dispersión de los valores de la distribució, o dicho de otra manera, qué tanto se alejan del valor medio en la distribución hipergeométrica
Ejercicio 2
Lotes con 40 componentes cada uno que contengan 3 o más defectuosos se consideran inaceptables.
El procedimiento para obtener muestras del lote consiste en seleccionar 5 componentes al azar y rechazar el lote si se encuentra un componente defectuoso (Camacho Avila, 2019), (Walpole et al., 2012)
\(n=5\) \(N=40\) \(k=3\) y \(x=0,1,2,3,4...n\)
a) Tabla de probabilidad desde cero a cinco
Primero inicializar valores
N <- 40
n <- 5
r <- 3
x <- 0:r
m <-n; N <-N; k <- r; n <- N - n
datos <- data.frame(x=x, f.prob.x = round(dhyper(x = x,m = m, n = n, k = k), 8))
datos <- cbind(datos, f.acum.x = cumsum(datos$f.prob.x))
datos
## x f.prob.x f.acum.x
## 1 0 0.66244939 0.6624494
## 2 1 0.30111336 0.9635628
## 3 2 0.03542510 0.9989879
## 4 3 0.00101215 1.0000000
ggplot(data = datos, aes(x,f.prob.x) ) +
geom_point(colour = "red") +
geom_line(colour = 'blue')

b) ¿Cuál es la probabilidad de que, en la muestra, se encuentre exactamente un componente defectuoso, si en todo el lote hay 3 defectuosos?
c) ¿Cuál es la probabilidad de encontrar menos de tres componentes defectuosos
d) ¿Cuál es el valor esperado
e) ¿Cuál es la varianza y la desviación estándard?
INTERPRETACIÓN DEL EJERCICIO 2
De acuerdo con los cálculos realizados en este ejercicio, podemos ver que la probabilidad de encontrar menos de 3 componentes defectuosos es de (aproximadamente) el 30%
Ejercicio 3
Se tiene un lote de 100 artículos de los cuales 12 están defectuosos.
Tabla de distribución
Inicializar los valores
Primero inicializar valores
N <- 100
n <- 10
r <- 12
x <- 0:n
Distribución de la probabilidad por medio de la función creada llamada f.prob.hiper()
datos <- data.frame(x=x, f.prob.x = round(f.prob.hiper(x = x, N = N, n = n, r = r), 8))
datos <- cbind(datos, f.acum.x = cumsum(datos$f.prob.x))
datos
## x f.prob.x f.acum.x
## 1 0 0.26075027 0.2607503
## 2 1 0.39607636 0.6568266
## 3 2 0.24507225 0.9018989
## 4 3 0.08068222 0.9825811
## 5 4 0.01549689 0.9980780
## 6 5 0.00179241 0.9998704
## 7 6 0.00012447 0.9999949
## 8 7 0.00000502 0.9999999
## 9 8 0.00000011 1.0000000
## 10 9 0.00000000 1.0000000
## 11 10 0.00000000 1.0000000
b) ¿Cuál es la probabilidad de que haya 3 defectuosos en una muestra de 10?
x <- 3
prob <- datos$f.prob.x[x+1]
paste("La probabilidad de que haya 3 defectuosos en una muestra de 10 es de", prob)
## [1] "La probabilidad de que haya 3 defectuosos en una muestra de 10 es de 0.08068222"
c) ¿Cuál es el valor esperado?
d) ¿Cuál es la varianza y la desviacoón estándard?