Objetivo

Identificar los valores de la función de probabilidad bajo la fórmula de distribución de Hipergeométrica.

Descripción

Realizar distribuciones de probabilidad conforme a la distribución de probabilidad de Hipergeométrica a partir de valores iniciales de los ejercicios.
Se generan las tablas de probabilidad conforme a distribución Hipergeométrica, se identifican los valores de probabilidad cuando la variable discreta x tenga algún exactamente algún valor, ≤ a algún valor o > o ≥, entre otros.

1. Cargar librerías

library(ggplot2)
source("/cloud/project/distribuciones.r")

2. Ejercicios

Ejercicio 1.
Una empresa fabrica fusibles que empaca en cajas de 12 unidades cada una.
  • Asuma que un inspector selecciona al azar 3 de los 12 fusibles de una caja para inspeccionarlos.

  • Si la caja contiene exactamente 5 fusibles defectuosos,

  • En este ejercicio::

  • n=3 Número de ensayos

  • N=12 Total de elementos

  • r=5 fusibles defectuosos en la caja, casos de éxito

  • x es la cantidad de fusible defectusoso como variable aleatoria discreta, desde 0 hasta n (Anderson et al., 2008).

a) Tabla de probabilidad desde cero a tres
  • Primero inicializar valores
N <- 12 
n <- 3
r <- 5
x <- 0:n
  • Distribución de la probabilidad por medio de la función creada llamada f.prob.hiper()
datos1 <- data.frame(x=x, f.prob.x = round(f.prob.hiper(x = x, N = N, n = n, r = r), 8))

datos1 <- cbind(datos1, f.acum.x = cumsum(datos1$f.prob.x))
datos1
##   x   f.prob.x  f.acum.x
## 1 0 0.15909091 0.1590909
## 2 1 0.47727273 0.6363636
## 3 2 0.31818182 0.9545455
## 4 3 0.04545455 1.0000000
  • Distribución de la probabilidad por medio de la función base de R llamada dhyper()

  • Deben generarse los mismos datos en datos1 y datos2

m <-n; N <-N; k <- r; n <- N - n

datos2 <- data.frame(x=x, f.prob.x = round(dhyper(x = x,m = m, n = n, k = k), 8))

datos2 <- cbind(datos2, f.acum.x = cumsum(datos2$f.prob.x))

datos2
##   x   f.prob.x  f.acum.x
## 1 0 0.15909091 0.1590909
## 2 1 0.47727273 0.6363636
## 3 2 0.31818182 0.9545455
## 4 3 0.04545455 1.0000000
ggplot(data = datos2, aes(x,f.prob.x) ) +
  geom_point(colour = "red") +
  geom_line(colour = 'blue')

b) ¿Cuál es la probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso?
x <- 1
prob <- datos2$f.prob.x[x+1]

paste("La probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso es: ", round(prob * 100,4), "%")
## [1] "La probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso es:  47.7273 %"
c) ¿Cuál es la probabilidad de encontrar menos de tres fusibles defectuosos
  • P(x≤2)=P(X=0)+P(x=1)+P(x=2)
x <- 2
prob <- datos2$f.acum.x[x+1]

paste("La probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso es: ", round(prob * 100,4), "%")
## [1] "La probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso es:  95.4545 %"
d) ¿Cuál es el valor esperado
  • Mandar llamar la función creada anticipadamente f.va.hiper()
N <- 12 
n <- 3
r <- 5
VE <- f.va.hiper(n = n, N = N, r = r)

paste("El valor esperado o media de este ejercicios es de: ", VE)
## [1] "El valor esperado o media de este ejercicios es de:  1.25"
e) ¿Cuál es la varianza y la desviación estándard?
varianza <- f.varianza.hiper(VE = VE, n = 3, N = 12, r = 5)

desvstd <- sqrt(varianza)

paste("El valor de la varianza es de: ", round(varianza,4), " y la desviación std es de: ", round(desvstd, 4))
## [1] "El valor de la varianza es de:  0.5966  y la desviación std es de:  0.7724"

Interpretación

Existe una probabilidad de aproximadamente 47.72% de que suceda exactamente una fusible defectuoso.
Existe una probabilidad aproximada del 95% de que sucedan fusibles defectuosos menores a 3 componentes
El Valor esperado de 1.25 significa lo que en promedio se esper que suceda por cualquier valor de la varable discreta
La varianza es de 0.5966 y la desviación es de 0.7724 que siginfican el grado de dispersión de los valores de la distribución o que tanto se alejan del valor medio en la distribución de probabilidad en este caso hipergeométrica.

Ejercicio 2

Lotes con 40 componentes cada uno que contengan 3 o más defectuosos se consideran inaceptables.
El procedimiento para obtener muestras del lote consiste en seleccionar 5 componentes al azar y rechazar el lote si se encuentra un componente defectuoso (Camacho Avila, 2019), (Walpole et al., 2012)
  • n=5,
  • N=40,
  • k=3 y
  • x=0,1,2,3,4…n
a) Tabla de probabilidad desde cero a cinco
  • Primero inicializar valores
N <- 40
n <- 5
r <- 3
x <- 0:r

m <-n; N <-N; k <- r; n <- N - n

datos <- data.frame(x=x, f.prob.x = round(dhyper(x = x,m = m, n = n, k = k), 8))

datos <- cbind(datos, f.acum.x = cumsum(datos$f.prob.x))

datos
##   x   f.prob.x  f.acum.x
## 1 0 0.66244939 0.6624494
## 2 1 0.30111336 0.9635628
## 3 2 0.03542510 0.9989879
## 4 3 0.00101215 1.0000000
b) ¿Cuál es la probabilidad de que, en la muestra, se encuentre exactamente un componente defectuoso, si en todo el lote hay 3 defectuosos?
x <- 1
prob <- datos$f.prob.x[x+1]

paste("La probabilidad de que, en la muestra, se encuentre exactamente un componente defectuoso de tres es: ", round(prob * 100,4), "%")
## [1] "La probabilidad de que, en la muestra, se encuentre exactamente un componente defectuoso de tres es:  30.1113 %"
c) ¿Cuál es la probabilidad de encontrar menos de tres componentes defectuosos
x <- 0
prob <- datos$f.prob.x[x+1]

x <- 1
prob <- prob + datos$f.prob.x[x+1]

x <- 2
prob <- prob + datos$f.prob.x[x+1]

paste("La probabilidad de que, en la muestra, se encuentre menos de tres componentes defectuosos es: ", round(prob * 100,4), "%")
## [1] "La probabilidad de que, en la muestra, se encuentre menos de tres componentes defectuosos es:  99.8988 %"
d) ¿Cuál es el valor esperado
N <- 40
n <- 5
r <- 3
VE <- f.va.hiper(n = n, N = N, r = r)

paste("El valor esperado o media de este ejercicios es de: ", VE)
## [1] "El valor esperado o media de este ejercicios es de:  0.375"
e) ¿Cuál es la varianza y la desviación estándard?
varianza <- f.varianza.hiper(VE = VE, n = 5, N = 40, r = 3)

desvstd <- sqrt(varianza)

paste("El valor de la varianza es de: ", round(varianza,4), " y la desviación std es de: ", round(desvstd, 4))
## [1] "El valor de la varianza es de:  0.3113  y la desviación std es de:  0.5579"

Interpretacion

la probabilidad de encontrar 1 defecto es de 30.11%, en cambio la probabilidad de encontrar menos de 3 defectos es de 99.89%.
Hay mas probabilidad de no encontrar ningun defecto, pues la probabilidad de este suceso es de 66.24%, mas de la mitad.
Se espera encontrar uno o ningun defecto, pues el valor esperado es inferior a 1.

Ejercicio 3

Se tiene un lote de 100 artículos de los cuales 12 están defectuosos.
a)Tabla de distribución
  • Inicializar los valores
N <- 100
n <- 10
r <- 12
x <- 0:n
  • Distribución de la probabilidad por medio de la función creada llamada f.prob.hiper()
datos <- data.frame(x=x, f.prob.x = round(f.prob.hiper(x = x, N = N, n = n, r = r), 8))

datos <- cbind(datos, f.acum.x = cumsum(datos$f.prob.x))
datos
##     x   f.prob.x  f.acum.x
## 1   0 0.26075027 0.2607503
## 2   1 0.39607636 0.6568266
## 3   2 0.24507225 0.9018989
## 4   3 0.08068222 0.9825811
## 5   4 0.01549689 0.9980780
## 6   5 0.00179241 0.9998704
## 7   6 0.00012447 0.9999949
## 8   7 0.00000502 0.9999999
## 9   8 0.00000011 1.0000000
## 10  9 0.00000000 1.0000000
## 11 10 0.00000000 1.0000000
¿Cuál es la probabilidad de que haya 3 defectuosos en una muestra de 10?
x <- 3

prob <- datos$f.prob.x[x+1]

paste("La probabilidad de que haya 3 defectuosos en una muestra de 10 es de", prob)
## [1] "La probabilidad de que haya 3 defectuosos en una muestra de 10 es de 0.08068222"
c)¿Cuál es el valor esperado?
N <- 100
n <- 10
r <- 12
VE <- f.va.hiper(n = n, N = N, r = r)

paste("El valor esperado o media de este ejercicios es de: ", VE)
## [1] "El valor esperado o media de este ejercicios es de:  1.2"
d)¿Cuál es la varianza y la desviacoón estándard?
varianza <- f.varianza.hiper(VE = VE, n = 10, N = 100, r = 12)

desvstd <- sqrt(varianza)

paste("El valor de la varianza es de: ", round(varianza,11), " y la desviación std es de: ", round(desvstd, 11))
## [1] "El valor de la varianza es de:  0.96  y la desviación std es de:  0.97979589711"

Interpretacion;

La probabilidad de que haya 3 artículos defectuosos en una muestra de 10 es de 8.06%.
Hay mas probabilidad de encontrar un articulo defectuoso con el 39.6%, o de encontrar dos articulos defectuosos con el 24.5%.
El valor esperado es de 1.2, por lo que se espera encontrar al menos 1 articulo defectoso en cada lote de 10.