Resolver cuestiones de casos de probabilidad en casos mediante la identificación de variables aleatorias, funciones de probabilidad, funciones acumuladas con variables discretas asociado a distribuciones de Hipergeométrica.
Identificar casos relacionados con variables discretas para elaborar mediante programación R y markdown las variables discretas, las funciones de probabilidad de cada variable, la función acumulada, su visualización gráfica para su correcta implementación asociado a distribuciones Hipergeométrica. Los casos son identificados de la literatura relacionada con variables aleatorias discretas y distribuciones Hipergeométrica. Se deben elaborar dos ejercicios en este caso 19 encontrados en la literatura.
library(ggplot2)
source("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/funciones/funciones.distribuciones.r")
Ejercicio sacado de: (https://probafacil.com/ejercicios-resueltos-distribucion-hipergeometrica/)
Diez refrigeradores de cierto tipo han sido devueltos a un distribuidor debido al a presencia de un ruido oscilante agudo cuando el refrigerador está funcionando. Supongamos que 4 de estos 10 refrigeradores tienen compresores defectuosos y los otros 6 tienen problemas más leves, entonces:
n = 4 tienen compresores defectuosos
N = 10 refrigeradores
r = 6 tienen problemas más leves
x = x es la cantidad de refrigeradores que tienen compresores defectuosos como variable aleatoria discreta, desde 0 hasta n.
N <- 10
n <- 4
r <- 6
x <- 0:n
datos <- data.frame(x=x, f.prob.x = round(f.prob.hiper(x = x, N = N, n = n, r = r), 8))
datos <- cbind(datos, f.acum.x = cumsum(datos$f.prob.x))
datos
## x f.prob.x f.acum.x
## 1 0 0.00476190 0.0047619
## 2 1 0.11428571 0.1190476
## 3 2 0.42857143 0.5476190
## 4 3 0.38095238 0.9285714
## 5 4 0.07142857 1.0000000
ggplot(data = datos, aes(x,f.prob.x) ) +
geom_point(colour = "red") +
geom_line(colour = "black")
x <- 1
prob <- datos$f.prob.x[x+1]
paste("La probabilidad de que se encuentre que uno de los 4 refrigeradores tenga el compresor defectuoso es de: ", round(prob * 100,4),"%")
## [1] "La probabilidad de que se encuentre que uno de los 4 refrigeradores tenga el compresor defectuoso es de: 11.4286 %"
x <- 2
prob <- datos$f.acum.x[x+1]
paste("La probabilidad de encontrar menos de 4 refrigeradores que tenga el compresor defectuoso es de: ", round(prob * 100,4),"%")
## [1] "La probabilidad de encontrar menos de 4 refrigeradores que tenga el compresor defectuoso es de: 54.7619 %"
N <- 10
n <- 4
r <- 6
VE <- f.va.hiper(n = n, N = N, r = r)
paste("El valor esperado o media de este ejercicios es de: ", VE)
## [1] "El valor esperado o media de este ejercicios es de: 2.4"
VA <- f.varianza.hiper(VE = VE, n = 4, N = 10, r = 6)
DE <- sqrt(VA)
paste("La varianza es de: ", round(VA,4), " y la desviación estandar es de: ", round(DE, 4))
## [1] "La varianza es de: 0.64 y la desviación estandar es de: 0.8"
Ejercicio sacado de: (http://www.itchihuahua.edu.mx/academic/industrial/sabaticorita/_private/03Ddistr%20Hipergeometrica.htm) * Para evitar que lo descubran en la aduana, un viajero ha colocado 6 tabletas de narcótico en una botella que contiene 9 píldoras de vitamina que son similares en apariencia. Si el oficial de la aduana selecciona 3 tabletas aleatoriamente para analizarlas. * n = 3 tabletas seleccionadas * N = 15 total de tabletas * r = 6 tabletas de narcótico * x = x es la cantidad de se encuentren las tabletas de narcotico
n <- 3
N <- 15 #9 son de las vitaminas + 6 de narcotico = 15 total de tabletas
r <- 6
x <- 0:n
m <-n; N <-N; k <- r; n <- N - n
datos1 <- data.frame(x=x, f.prob.x = round(dhyper(x = x,m = m, n = n, k = k), 8))
datos1 <- cbind(datos1, f.acum.x = cumsum(datos1$f.prob.x))
datos1
## x f.prob.x f.acum.x
## 1 0 0.18461538 0.1846154
## 2 1 0.47472527 0.6593406
## 3 2 0.29670330 0.9560439
## 4 3 0.04395604 1.0000000
ggplot(data = datos1, aes(x,f.prob.x) ) +
geom_point(colour = "blue") +
geom_line(colour = "black")
x <- 1
prob <- datos1$f.prob.x[x+1]
paste("La probabilidad de que el viajero sea arrestado por posesión de narcóticos es de: ", round(prob * 100,4),"%")
## [1] "La probabilidad de que el viajero sea arrestado por posesión de narcóticos es de: 47.4725 %"
x <- 2
prob <- datos1$f.acum.x[x+1]
paste("La probabilidad de que no sea arrestado por posesión de narcóticos es de: ", round(prob * 100,4),"%")
## [1] "La probabilidad de que no sea arrestado por posesión de narcóticos es de: 95.6044 %"
N <- 15
n <- 3
r <- 6
VE <- f.va.hiper(n = n, N = N, r = r)
paste("El valor esperado o media de este ejercicios es de: ", VE)
## [1] "El valor esperado o media de este ejercicios es de: 1.2"
VA <- f.varianza.hiper(VE = VE, n = 3, N = 12, r = 5)
DE <- sqrt(VA)
paste("El valor de la varianza es de: ", round(VA,4), " y la desviación estandar es de: ", round(DE, 4))
## [1] "El valor de la varianza es de: 0.5727 y la desviación estandar es de: 0.7568"
En este caso se utilizo lo que son las variables aleatorias con la distribucion Hipergeométrica, la cual se esperan dos resultados.
De los anteriores ejercicios de este caso se obtuvieron los siguientes resultados:
En el ejercicio 2.1, se buscaba la probabilidad de que se encuentre que uno de los 4 refrigeradores tenga el compresor defectuoso, lo que dio como resultado que el 11.42%, y la probabilidad de encontrar menos de 4 refrigeradores que tenga el compresor defectuoso es de 54.76%, lo que quiere decir, que es mas probable de encontrar menos refrigeradores que tenga el compresor defectuoso. En su valor esperado es de 2.4, lo que significa que es el promedio que se espera. La varianza, su valor es de 0.64 y desviacion estandar es de 0.8, lo que quiere decir que en este caso, los valores se distorsionan un poco, separandose del valor esperado, como se muestra en la grafica de lineas, en estas se puede ver mejor la diferencia de los puntos de acuerdo a cuanto se separan por esa distorsion y de como aumentan o disminuyen las probabilidades.
En el ejercicio 2.2, se buscaba la probabilidad de que el viajero sea arrestado por posesión de narcóticos es de 47.47%, y la probabilidad de que no sea arrestado por posesión de narcóticos es de 95.60%, lo que quiere decir que las probabilidades de ser arrestado son bajas comparadas con las de no ser arrestado, el cual es mejor para el viajero. En su valor esperado es de 1.2, su varianza es de 0.5727 y la desviacion estandar es de 0.7568, lo que quiere decir es que su promedio es el esperado, pero a comparacion del ejercicio 2.1, es la mitad, por lo que su distorsion es un poco baja y esto se puede ver en la grafica lineal, se puede observar que sus puntos da una linea recta, pero esta despues desciende, lo que hace que las probabilidades disminuyan.