Resolver cuestiones de casos de probabilidad en casos mediante la identificación de variables aleatorias, funciones de probabilidad, funciones acumuladas con variables discretas asociado a distribuciones de Hipergeométrica.
Identificar casos relacionados con variables discretas para elaborar mediante programación R y markdown las variables discretas, las funciones de probabilidad de cada variable, la función acumulada, su visualización gráfica para su correcta implementación asociado a distribuciones Hipergeométrica Los casos son identificados de la literatura relacionada con variables aleatorias discretas y distribuciones Hipergeométrica Se deben elaborar dos ejercicios en este caso 19 encontrados en la literatura
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.0.3
source("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/funciones/funciones.distribuciones.r")
Una empresa fabrica fusibles que empaca en cajas de 12 unidades cada una.
Asuma que un inspector selecciona al azar 3 de los 12 fusibles de una caja para inspeccionarlos.
Si la caja contiene exactamente 5 fusibles defectuosos,En este ejercicio:
n=3 Número de ensayos
N=12 Total de elementos
r=5 fusibles defectuosos en la caja, casos de éxito
x es la cantidad de fusible defectusoso como variable aleatoria discreta, desde 0 hasta n (Anderson et al., 2008).
N <- 12
n <- 3
r <- 5
x <- 0:n
datos1 <- data.frame(x=x, f.prob.x = round(f.prob.hiper(x = x, N = N, n = n, r = r), 8))
datos1 <- cbind(datos1, f.acum.x = cumsum(datos1$f.prob.x))
datos1
## x f.prob.x f.acum.x
## 1 0 0.15909091 0.1590909
## 2 1 0.47727273 0.6363636
## 3 2 0.31818182 0.9545455
## 4 3 0.04545455 1.0000000
m <-n; N <-N; k <- r; n <- N - n
datos2 <- data.frame(x=x, f.prob.x = round(dhyper(x = x,m = m, n = n, k = k), 8))
datos2 <- cbind(datos2, f.acum.x = cumsum(datos2$f.prob.x))
datos2
## x f.prob.x f.acum.x
## 1 0 0.15909091 0.1590909
## 2 1 0.47727273 0.6363636
## 3 2 0.31818182 0.9545455
## 4 3 0.04545455 1.0000000
ggplot(data = datos2, aes(x,f.prob.x) ) +
geom_point(colour = "red") +
geom_line(colour = 'blue')
x <- 1
prob <- datos2$f.prob.x[x+1]
paste("La probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso es: ", round(prob * 100,4), "%")
## [1] "La probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso es: 47.7273 %"
P(x≤2)=P(X=0)+P(x=1)+P(x=2)
x <- 2
prob <- datos2$f.acum.x[x+1]
paste("La probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso es: ", round(prob * 100,4), "%")
## [1] "La probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso es: 95.4545 %"
N <- 12
n <- 3
r <- 5
VE <- f.va.hiper(n = n, N = N, r = r)
paste("El valor esperado o media de este ejercicio es de: ", VE)
## [1] "El valor esperado o media de este ejercicio es de: 1.25"
varianza <- f.varianza.hiper(VE = VE, n = 3, N = 12, r = 5)
desvstd <- sqrt(varianza)
paste("El valor de la varianza es de: ", round(varianza,4), " y la desviación std es de: ", round(desvstd, 4))
## [1] "El valor de la varianza es de: 0.5966 y la desviación std es de: 0.7724"
Lotes con 40 componentes cada uno que contengan 3 o más defectuosos se consideran inaceptables.
El procedimiento para obtener muestras del lote consiste en seleccionar 5 componentes al azar y rechazar el lote si se encuentra un componente defectuoso (Camacho Avila, 2019), (Walpole et al., 2012)
N <- 40
n <- 5
r <- 3
x <- 0:r
m <-n; N <-N; k <- r; n <- N - n
datos <- data.frame(x=x, f.prob.x = round(dhyper(x = x,m = m, n = n, k = k), 8))
datos <- cbind(datos, f.acum.x = cumsum(datos$f.prob.x))
datos
## x f.prob.x f.acum.x
## 1 0 0.66244939 0.6624494
## 2 1 0.30111336 0.9635628
## 3 2 0.03542510 0.9989879
## 4 3 0.00101215 1.0000000
ggplot(data = datos, aes(x,f.prob.x) ) +
geom_point(colour = "red") +
geom_line(colour = 'blue')
x <- 1
prob <- datos$f.prob.x[x+1]
paste("La probabilidad de que, en la muestra, se encuentre exactamente un componente defectuoso de tres es: ", round(prob * 100,4), "%")
## [1] "La probabilidad de que, en la muestra, se encuentre exactamente un componente defectuoso de tres es: 30.1113 %"
x <- 2
prob <- datos$f.acum.x[x+1]
paste("La probabilidad de que, en la muestra, se encuentre exactamente menos de tres componentes defectuosos es: ", round(prob * 100,4), "%")
## [1] "La probabilidad de que, en la muestra, se encuentre exactamente menos de tres componentes defectuosos es: 99.8988 %"
N <- 40
n <- 5
r <- 3
VE <- f.va.hiper(n = n, N = N, r = r)
paste("El valor esperado o media de este ejercicio es de: ", VE)
## [1] "El valor esperado o media de este ejercicio es de: 0.375"
varianza <- f.varianza.hiper(VE = VE, n = 5, N = 40, r = 3)
desvstd <- sqrt(varianza)
paste("El valor de la varianza es de: ", round(varianza,4), " y la desviación std es de: ", round(desvstd, 4))
## [1] "El valor de la varianza es de: 0.3113 y la desviación std es de: 0.5579"
En este caso numero 19 se hablo sobre la distribucion hipergeometrica en la cual se vieron dos ejercicios como en los casos anteriores para una mayor profundidad al tema, la cual habla de que es una distribucion discreta que modela el numero de eventos en una muestra de tamaño fijo.
Cuando se conoce el numero total de elementos en la poblacion de la cual proviene la muestra, se podria decir que cada elemento de la muestra tiene dos resultados posibles el cual puede ser un evento o un no evento.
En el ejercicio numero 1 habla sobre una fabrica de fusibles la cual empaca en cajas de 12 unidades, se habla sobre un inspector el cual selecciona 3 fusibles de 12 de una caja para inspeccionarlos. ¿Cuál es la probabilidad de que el inspector encuentre que uno de los tres fusibles esta defectuoso? en esta da la probabilidad de 47.7% ¿Cuál es la probabilidad de encontrar menos de tres fusibles defectuosos? se llego a un resultado de el 95.5% en donde se sumo p(x=0), p(x=1) y p(x=2) para poder llegar a dicho resultado. tambien se obtuvo el valor esperado de 1.25, la varianza que dio 0.59 y la desviacion estandar de 0.77.
En el ejercicio numero 2 se habla sobre unos lotes de 40 componentes en los cuales cada uno contienen 3 o mas defectuosos, en el cual se considera que n es igual a 5.
¿Cuál es la probabilidad de que en la muestra se encuentre exactamente un componente defectuoso, si en todo el lote hay 3 defectuosos? Se dio la probabilidad de 30.11% ¿Cuál es la probabilidad de encontrar menos de tres componentes defectuosos? y aqui como son menos se tuvieron que hacer las sumas de entee 0 a 2 para que se llegara a el resultado de 99.9%. El valor esperado obtenido es de 0.375, la varianza de 0.312 y la desviacion estandar es de 0.558.+6+++