CASO 19

OBJETIVO

Identificar los valores de la función de probabilidad bajo la fórmula de distribución de Hipergeométrica.

Descripción

Realizar distribuciones de probabilidad conforme a la distribución de probabilidad de Hipergeométrica a partir de valores iniciales de los ejercicios.

Se generan las tablas de probabilidad conforme a distribución Hipergeométrica, se identifican los valores de probabilidad cuando la variable discreta x tenga algún exactamente algún valor, ≤ a algún valor o > o ≥, entre otros.

Fundamento teórico

La distribución de probabilidad hipergeométricaestá estrechamente relacionada con la distribución binomial. Pero difieren en dos puntos: en la distribución hipergeométricalos ensayos no son independientes y la probabilidad de éxito varía de ensayo a ensayo (Anderson et al., 2008).

La distribución de probabilidad de la variable aleatoria hipergeométrica X, el número de éxitos en una muestra aleatoria de tamaño n que se selecciona de N artículos, en los que k se denomina éxito y N–k se le llama fracaso (Camacho Avila, 2019)

Fórmula de función de probabilidad

Fórmula de la distribución hipergeométrica

\(f(x)=(rx)⋅(N−rn−x)(Nn)\)

Donde:

f(x) es la probabildiad de x o la función de distribución

n número de ensayos o longitud de la muestra

N número de elementos de la población

r número de elementos de la población considerados como éxito, o cantidad de casos exitosos dentro de la pobción

x Valor de la variable aleatoria discreta 0,1,2,3,,,,n (Anderson et al., 2008).

(rx) Parte izquierda del numerador, representan el número de formas en que se toman x éxitos de un total de r éxitos que hay en la población,

(N−rn−x) parte derecha del numerador representa el número de maneras en que se puede tomar n−x fracasos de un total de N−r elementos que hay en la población.

(Nn) como denominador representan el número de maneras (cantidad de combinaciones) en que es posible tomar una muestra de tamaño n de una población de tamaño N; (Anderson et al., 2008).

Recordando la fórmula para determinar el número de combinaciones en grupos de n elementos de una poblacón total de N está dada por:

\(CNn=(Nn)=N!n!⋅(N−n)!\)

Entonces desarrollando la fórmula con las combinaciones la función de probabilidad hipergeométrica queda de la siguiente manera:

\(f(x)=(rx)⋅(N−rn−x)(Nn)=(r!x!⋅(r−x)!)⋅((N−r)!(n−x)!⋅((N−r)−(n−x))!)N!n!⋅(N−n)!\)

Fórmula para valor esperado

\(E(x)=μ=n⋅(rN)\)

Fórmula para varianza

\(Var(x)=σ2=n⋅(rN)⋅(1−rN)⋅(N−nN−1)\)

Fórmula de la desviación estándard

\(σ=Var(x)−−−−−−√=σ2−−√\)

PASOS A SEGUIR

Cargar librerías

Ejercicios

Ejercicio 1: Probabilidades, Varianza, Desviación

Ejercicio 2: Probabilidades, Varianza, Desviación

Interpretación los ejercicios

PASO 1. Cargar librerías

library(ggplot2)

Cargar funciones

source("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/funciones/funciones.distribuciones.r")

PASO 2. Ejercicios

Ejercicio 1.

Una empresa fabrica fusibles que empaca en cajas de 12 unidades cada una.

Asuma que un inspector selecciona al azar 3 de los 12 fusibles de una caja para inspeccionarlos.

Si la caja contiene exactamente 5 fusibles defectuosos,

En este ejercicio::

n=3 Número de ensayos

N=12 Total de elementos

r=5 fusibles defectuosos en la caja, casos de éxito

x es la cantidad de fusible defectusoso como variable aleatoria discreta, desde 0 hasta n (Anderson et al., 2008).

a) Tabla de probabilidad desde cero a tres

Primero inicializar valores

N <- 12 
n <- 3
r <- 5
x <- 0:n

Distribución de la probabilidad por medio de la función creada llamada f.prob.hiper()

datos1 <- data.frame(x=x, f.prob.x = round(f.prob.hiper(x = x, N = N, n = n, r = r), 8))

datos1 <- cbind(datos1, f.acum.x = cumsum(datos1$f.prob.x))
datos1
##   x   f.prob.x  f.acum.x
## 1 0 0.15909091 0.1590909
## 2 1 0.47727273 0.6363636
## 3 2 0.31818182 0.9545455
## 4 3 0.04545455 1.0000000

Distribución de la probabilidad por medio de la función base de R llamada dhyper()

Deben generarse los mismos datos en datos1 y datos2

m <-n; N <-N; k <- r; n <- N - n

datos2 <- data.frame(x=x, f.prob.x = round(dhyper(x = x,m = m, n = n, k = k), 8))

datos2 <- cbind(datos2, f.acum.x = cumsum(datos2$f.prob.x))

datos2
##   x   f.prob.x  f.acum.x
## 1 0 0.15909091 0.1590909
## 2 1 0.47727273 0.6363636
## 3 2 0.31818182 0.9545455
## 4 3 0.04545455 1.0000000
ggplot(data = datos2, aes(x,f.prob.x) ) +
  geom_point(colour = "red") +
  geom_line(colour = 'blue')

b) ¿Cuál es la probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso?

x <- 1
prob <- datos2$f.prob.x[x+1]

paste("La probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso es: ", round(prob * 100,4), "%")
## [1] "La probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso es:  47.7273 %"

c) ¿Cuál es la probabilidad de encontrar menos de tres fusibles defectuosos

\(P(x≤2)=P(X=0)+P(x=1)+P(x=2)\)

x <- 2
prob <- datos2$f.acum.x[x+1]

paste("La probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso es: ", round(prob * 100,4), "%")
## [1] "La probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso es:  95.4545 %"

d) ¿Cuál es el valor esperado

Mandar llamar la función creada anticipadamente f.va.hiper()
N <- 12 
n <- 3
r <- 5
VE <- f.va.hiper(n = n, N = N, r = r)

paste("El valor esperado o media de este ejercicios es de: ", VE)
## [1] "El valor esperado o media de este ejercicios es de:  1.25"

e) ¿Cuál es la varianza y la desviación estándard?

varianza <- f.varianza.hiper(VE = VE, n = 3, N = 12, r = 5)

desvstd <- sqrt(varianza)

paste("El valor de la varianza es de: ", round(varianza,4), " y la desviación std es de: ", round(desvstd, 4))
## [1] "El valor de la varianza es de:  0.5966  y la desviación std es de:  0.7724"

INTERPRETACIÓN DEL EJERCICIO No. 1

De acuerdo con los datos calculados en el ejercicio uno, tenemos los siguientes resultados:

La probabilidad de que un fusible resulte defectuoso es del 47.72% aproximadamente.

Por otro lado, según los otros cálculos, la máxima probabilidad de que haya un fusil defectuoso menor a 3 componentes es del 95%

La variable discreta, en promedio, se espera ue su valor sea de 1.25

La Varianza es de 0.5966

La desviación estándar es de 0.7724

Los 2 datos anteriores significan que el grado de dispersión de los valores de la distribució, o dicho de otra manera, qué tanto se alejan del valor medio en la distribución hipergeométrica

Ejercicio 2

Lotes con 40 componentes cada uno que contengan 3 o más defectuosos se consideran inaceptables.

El procedimiento para obtener muestras del lote consiste en seleccionar 5 componentes al azar y rechazar el lote si se encuentra un componente defectuoso (Camacho Avila, 2019), (Walpole et al., 2012)

\(n=5\) \(N=40\) \(k=3\) y \(x=0,1,2,3,4...n\)

a) Tabla de probabilidad desde cero a cinco

Primero inicializar valores

N <- 40
n <- 5
r <- 3
x <- 0:r

m <-n; N <-N; k <- r; n <- N - n
datos <- data.frame(x=x, f.prob.x = round(dhyper(x = x,m = m, n = n, k = k), 8))

datos <- cbind(datos, f.acum.x = cumsum(datos$f.prob.x))

datos
##   x   f.prob.x  f.acum.x
## 1 0 0.66244939 0.6624494
## 2 1 0.30111336 0.9635628
## 3 2 0.03542510 0.9989879
## 4 3 0.00101215 1.0000000
ggplot(data = datos, aes(x,f.prob.x) ) +
  geom_point(colour = "red") +
  geom_line(colour = 'blue')

b) ¿Cuál es la probabilidad de que, en la muestra, se encuentre exactamente un componente defectuoso, si en todo el lote hay 3 defectuosos?

c) ¿Cuál es la probabilidad de encontrar menos de tres componentes defectuosos

d) ¿Cuál es el valor esperado

e) ¿Cuál es la varianza y la desviación estándard?

INTERPRETACIÓN DEL EJERCICIO 2

De acuerdo con los cálculos realizados en este ejercicio, podemos ver que la probabilidad de encontrar menos de 3 componentes defectuosos es de (aproximadamente) el 30%

Ejercicio 3

Se tiene un lote de 100 artículos de los cuales 12 están defectuosos.

Tabla de distribución

Inicializar los valores

Primero inicializar valores

N <- 100
n <- 10
r <- 12
x <- 0:n

Distribución de la probabilidad por medio de la función creada llamada f.prob.hiper()

datos <- data.frame(x=x, f.prob.x = round(f.prob.hiper(x = x, N = N, n = n, r = r), 8))

datos <- cbind(datos, f.acum.x = cumsum(datos$f.prob.x))
datos
##     x   f.prob.x  f.acum.x
## 1   0 0.26075027 0.2607503
## 2   1 0.39607636 0.6568266
## 3   2 0.24507225 0.9018989
## 4   3 0.08068222 0.9825811
## 5   4 0.01549689 0.9980780
## 6   5 0.00179241 0.9998704
## 7   6 0.00012447 0.9999949
## 8   7 0.00000502 0.9999999
## 9   8 0.00000011 1.0000000
## 10  9 0.00000000 1.0000000
## 11 10 0.00000000 1.0000000

b) ¿Cuál es la probabilidad de que haya 3 defectuosos en una muestra de 10?

x <- 3

prob <- datos$f.prob.x[x+1]

paste("La probabilidad de que haya 3 defectuosos en una muestra de 10 es de", prob)
## [1] "La probabilidad de que haya 3 defectuosos en una muestra de 10 es de 0.08068222"

c) ¿Cuál es el valor esperado?

d) ¿Cuál es la varianza y la desviacoón estándard?