Objetivo:

Resolver cuestiones de casos de probabilidad en casos mediante la identificación de variables aleatorias, funciones de probabilidad, funciones acumuladas con variables discretas asociado a distribuciones de Hipergeométrica.

Descripción:

Identificar casos relacionados con variables discretas para elaborar mediante programación R y markdown las variables discretas, las funciones de probabilidad de cada variable, la función acumulada, su visualización gráfica para su correcta implementación asociado a distribuciones Hipergeométrica. Los casos son identificados de la literatura relacionada con variables aleatorias discretas y distribuciones Hipergeométrica. Se deben elaborar dos ejercicios en este caso 19 encontrados en la literatura.

Proceso:

Paso 1: Cargar libreria

library(ggplot2)
source("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/funciones/funciones.distribuciones.r")

Paso 2: Ejercicios:

Ejercicio 2.1:

Ejercicio sacado de: (https://probafacil.com/ejercicios-resueltos-distribucion-hipergeometrica/)

  • Diez refrigeradores de cierto tipo han sido devueltos a un distribuidor debido al a presencia de un ruido oscilante agudo cuando el refrigerador está funcionando. Supongamos que 4 de estos 10 refrigeradores tienen compresores defectuosos y los otros 6 tienen problemas más leves, entonces:

  • n = 4 tienen compresores defectuosos

  • N = 10 refrigeradores

  • r = 6 tienen problemas más leves

  • x = x es la cantidad de refrigeradores que tienen compresores defectuosos como variable aleatoria discreta, desde 0 hasta n.

Tabla de probabilidad desde cero a cuatro:

N <- 10
n <- 4
r <- 6
x <- 0:n

Distribución de la probabilidad por medio de la función creada llamada f.prob.hiper()

datos <- data.frame(x=x, f.prob.x = round(f.prob.hiper(x = x, N = N, n = n, r = r), 8))

datos <- cbind(datos, f.acum.x = cumsum(datos$f.prob.x))
datos
##   x   f.prob.x  f.acum.x
## 1 0 0.00476190 0.0047619
## 2 1 0.11428571 0.1190476
## 3 2 0.42857143 0.5476190
## 4 3 0.38095238 0.9285714
## 5 4 0.07142857 1.0000000
ggplot(data = datos, aes(x,f.prob.x) ) +
  geom_point(colour = "red") +
  geom_line(colour = "black")

¿Cual es la probabilidad de que se encuentre que uno de los 4 refrigeradores tenga el compresor defectuoso?

x <- 1
prob <- datos$f.prob.x[x+1]

paste("La probabilidad de que se encuentre que uno de los 4 refrigeradores tenga el compresor defectuoso es de: ", round(prob * 100,4),"%")
## [1] "La probabilidad de que se encuentre que uno de los 4 refrigeradores tenga el compresor defectuoso es de:  11.4286 %"

¿Cuál es la probabilidad de encontrar menos de 4 refrigeradores que tenga el compresor defectuoso?

x <- 2
prob <- datos$f.acum.x[x+1]

paste("La probabilidad de encontrar menos de 4 refrigeradores que tenga el compresor defectuoso es de: ", round(prob * 100,4),"%")
## [1] "La probabilidad de encontrar menos de 4 refrigeradores que tenga el compresor defectuoso es de:  54.7619 %"

Valor esperado

N <- 10 
n <- 4
r <- 6
VE <- f.va.hiper(n = n, N = N, r = r)

paste("El valor esperado o media de este ejercicios es de: ", VE)
## [1] "El valor esperado o media de este ejercicios es de:  2.4"

Varianza y la Desviacion Estandar

VA <- f.varianza.hiper(VE = VE, n = 4, N = 10, r = 6)

DE <- sqrt(VA)

paste("La varianza es de: ", round(VA,4), " y la desviación estandar es de: ", round(DE, 4))
## [1] "La varianza es de:  0.64  y la desviación estandar es de:  0.8"

Ejercicio 2.2:

Ejercicio sacado de: (http://www.itchihuahua.edu.mx/academic/industrial/sabaticorita/_private/03Ddistr%20Hipergeometrica.htm) * Para evitar que lo descubran en la aduana, un viajero ha colocado 6 tabletas de narcótico en una botella que contiene 9 píldoras de vitamina que son similares en apariencia. Si el oficial de la aduana selecciona 3 tabletas aleatoriamente para analizarlas. * n = 3 tabletas seleccionadas * N = 15 total de tabletas * r = 6 tabletas de narcótico * x = x es la cantidad de se encuentren las tabletas de narcotico

Tabla de probabilidad desde cero a tres

n <- 3
N <- 15 #9 son de las vitaminas + 6 de narcotico = 15 total de tabletas
r <- 6
x <- 0:n

Distribución de la probabilidad por medio de la función base de R llamada dhyper()

m <-n; N <-N; k <- r; n <- N - n

datos1 <- data.frame(x=x, f.prob.x = round(dhyper(x = x,m = m, n = n, k = k), 8))

datos1 <- cbind(datos1, f.acum.x = cumsum(datos1$f.prob.x))

datos1
##   x   f.prob.x  f.acum.x
## 1 0 0.18461538 0.1846154
## 2 1 0.47472527 0.6593406
## 3 2 0.29670330 0.9560439
## 4 3 0.04395604 1.0000000
ggplot(data = datos1, aes(x,f.prob.x) ) +
  geom_point(colour = "blue") +
  geom_line(colour = "black")

¿Cuál es la probabilidad de que el viajero sea arrestado por posesión de narcóticos?

x <- 1
prob <- datos1$f.prob.x[x+1]

paste("La probabilidad de que el viajero sea arrestado por posesión de narcóticos es de: ", round(prob * 100,4),"%")
## [1] "La probabilidad de que el viajero sea arrestado por posesión de narcóticos es de:  47.4725 %"

¿Cuál es la probabilidad de que no sea arrestado por posesión de narcóticos?

x <- 2
prob <- datos1$f.acum.x[x+1]

paste("La probabilidad de que no sea arrestado por posesión de narcóticos es de: ", round(prob * 100,4),"%")
## [1] "La probabilidad de que no sea arrestado por posesión de narcóticos es de:  95.6044 %"

Valor esperado

N <- 15
n <- 3
r <- 6
VE <- f.va.hiper(n = n, N = N, r = r)

paste("El valor esperado o media de este ejercicios es de: ", VE)
## [1] "El valor esperado o media de este ejercicios es de:  1.2"

Varianza y Desviacion Estandar

VA <- f.varianza.hiper(VE = VE, n = 3, N = 12, r = 5)

DE <- sqrt(VA)

paste("El valor de la varianza es de: ", round(VA,4), " y la desviación estandar es de: ", round(DE, 4))
## [1] "El valor de la varianza es de:  0.5727  y la desviación estandar es de:  0.7568"

Paso 3: Interpretacion del caso

En este caso se utilizo lo que son las variables aleatorias con la distribucion Hipergeométrica, la cual se esperan dos resultados.

De los anteriores ejercicios de este caso se obtuvieron los siguientes resultados:

  • En el ejercicio 2.1, se buscaba la probabilidad de que se encuentre que uno de los 4 refrigeradores tenga el compresor defectuoso, lo que dio como resultado que el 11.42%, y la probabilidad de encontrar menos de 4 refrigeradores que tenga el compresor defectuoso es de 54.76%, lo que quiere decir, que es mas probable de encontrar menos refrigeradores que tenga el compresor defectuoso. En su valor esperado es de 2.4, lo que significa que es el promedio que se espera. La varianza, su valor es de 0.64 y desviacion estandar es de 0.8, lo que quiere decir que en este caso, los valores se distorsionan un poco, separandose del valor esperado, como se muestra en la grafica de lineas, en estas se puede ver mejor la diferencia de los puntos de acuerdo a cuanto se separan por esa distorsion y de como aumentan o disminuyen las probabilidades.

  • En el ejercicio 2.2, se buscaba la probabilidad de que el viajero sea arrestado por posesión de narcóticos es de 47.47%, y la probabilidad de que no sea arrestado por posesión de narcóticos es de 95.60%, lo que quiere decir que las probabilidades de ser arrestado son bajas comparadas con las de no ser arrestado, el cual es mejor para el viajero. En su valor esperado es de 1.2, su varianza es de 0.5727 y la desviacion estandar es de 0.7568, lo que quiere decir es que su promedio es el esperado, pero a comparacion del ejercicio 2.1, es la mitad, por lo que su distorsion es un poco baja y esto se puede ver en la grafica lineal, se puede observar que sus puntos da una linea recta, pero esta despues desciende, lo que hace que las probabilidades disminuyan.