Objetivo

Identificar los valores de la función de probabilidad bajo la fórmula de distribución de Hipergeométrica.

Descripción

Realizar distribuciones de probabilidad conforme a la distribución de probabilidad de Hipergeométrica a partir de valores iniciales de los ejercicios.

Se generan las tablas de probabilidad conforme a distribución Hipergeométrica, se identifican los valores de probabilidad cuando la variable discreta x tenga algún exactamente algún valor, ≤ a algún valor o > o ≥, entre otros.

Fundamento teórico

La distribución de probabilidad hipergeométricaestá estrechamente relacionada con la distribución binomial. Pero difieren en dos puntos: en la distribución hipergeométricalos ensayos no son independientes y la probabilidad de éxito varía de ensayo a ensayo (Anderson et al., 2008).

La distribución de probabilidad de la variable aleatoria hipergeométrica X, el número de éxitos en una muestra aleatoria de tamaño n que se selecciona de N artículos, en los que k se denomina éxito y N–k se le llama fracaso (Camacho Avila, 2019)

1. Cargar librerías

library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.0.3

Cargar funciones

#source("../funciones/funciones.distribuciones.r")

# o

source("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/funciones/funciones.distribuciones.r")

2. Ejercicios

Ejercicio 1.

Una empresa fabrica fusibles que empaca en cajas de 12 unidades cada una. * Asuma que un inspector selecciona al azar 3 de los 12 fusibles de una caja para inspeccionarlos. * Si la caja contiene exactamente 5 fusibles defectuosos,

En este ejercicio:: n=3 Número de ensayos N=12 Total de elementos r=5 fusibles defectuosos en la caja, casos de éxito x es la cantidad de fusible defectusoso como variable aleatoria discreta, desde 0 hasta n (Anderson et al., 2008).

  1. Tabla de probabilidad desde cero a tres

Primero inicializar valores

N <- 12 
n <- 3
r <- 5
x <- 0:n

Distribución de la probabilidad por medio de la función creada llamada f.prob.hiper()

datos1 <- data.frame(x=x, f.prob.x = round(f.prob.hiper(x = x, N = N, n = n, r = r), 8))

datos1 <- cbind(datos1, f.acum.x = cumsum(datos1$f.prob.x))
datos1
##   x   f.prob.x  f.acum.x
## 1 0 0.15909091 0.1590909
## 2 1 0.47727273 0.6363636
## 3 2 0.31818182 0.9545455
## 4 3 0.04545455 1.0000000

Distribución de la probabilidad por medio de la función base de R llamada dhyper() Deben generarse los mismos datos en datos1 y datos2

m <-n; N <-N; k <- r; n <- N - n

datos2 <- data.frame(x=x, f.prob.x = round(dhyper(x = x,m = m, n = n, k = k), 8))

datos2 <- cbind(datos2, f.acum.x = cumsum(datos2$f.prob.x))

datos2
##   x   f.prob.x  f.acum.x
## 1 0 0.15909091 0.1590909
## 2 1 0.47727273 0.6363636
## 3 2 0.31818182 0.9545455
## 4 3 0.04545455 1.0000000
ggplot(data = datos2, aes(x,f.prob.x) ) +
  geom_point(colour = "red") +
  geom_line(colour = 'blue')

  1. ¿Cuál es la probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso?
x <- 1
prob <- datos2$f.prob.x[x+1]

paste("La probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso es: ", round(prob * 100,4), "%")
## [1] "La probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso es:  47.7273 %"
  1. ¿Cuál es la probabilidad de encontrar menos de tres fusibles defectuosos P(x≤2)=P(X=0)+P(x=1)+P(x=2)
x <- 2
prob <- datos2$f.acum.x[x+1]

paste("La probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso es: ", round(prob * 100,4), "%")
## [1] "La probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso es:  95.4545 %"
  1. ¿Cuál es el valor esperado?
VE <- n 
paste ("El valor esperado es: ", VE)
## [1] "El valor esperado es:  9"
  1. ¿Cuál es la varianza y la desviación estándard?
varianza <- n  *( 1 )
paste ("La varianza es: ", round(varianza,2))
## [1] "La varianza es:  9"

Desviacion

desviacion.std <- sqrt(varianza)
paste("La desviación std es: ", round(desviacion.std, 2))
## [1] "La desviación std es:  3"

Ejercicio 2

Lotes con 40 componentes cada uno que contengan 3 o más defectuosos se consideran inaceptables.

El procedimiento para obtener muestras del lote consiste en seleccionar 5 componentes al azar y rechazar el lote si se encuentra un componente defectuoso (Camacho Avila, 2019).

n=5, N=40, k=3 y x=0,1,2,3,4…n

  1. Tabla de probabilidad desde cero a cinco

Primero inicializar valores

N <- 40
n <- 5
r <- 3
x <- 0:r

m <-n; N <-N; k <- r; n <- N - n
datos <- data.frame(x=x, f.prob.x = round(dhyper(x = x,m = m, n = n, k = k), 8))

datos <- cbind(datos, f.acum.x = cumsum(datos$f.prob.x))

datos
##   x   f.prob.x  f.acum.x
## 1 0 0.66244939 0.6624494
## 2 1 0.30111336 0.9635628
## 3 2 0.03542510 0.9989879
## 4 3 0.00101215 1.0000000
ggplot(data = datos, aes(x,f.prob.x) ) +
  geom_point(colour = "red") +
  geom_line(colour = 'blue')

  1. ¿Cuál es la probabilidad de que, en la muestra, se encuentre exactamente un componente defectuoso, si en todo el lote hay 3 defectuosos?
x <- 1
prob <- datos$f.prob.x[x+1]

paste("La probabilidad de que, en la muestra, se encuentre exactamente un componente defectuoso de tres es: ", round(prob * 100,4), "%")
## [1] "La probabilidad de que, en la muestra, se encuentre exactamente un componente defectuoso de tres es:  30.1113 %"
  1. ¿Cuál es la probabilidad de encontrar menos de tres componentes defectuosos
x <- 2
prob <- datos2$f.acum.x[x+1]

paste("La probabilidad de que el inspector encuentre que uno de los tres componentes está defectuoso es: ", round(prob * 100,4), "%")
## [1] "La probabilidad de que el inspector encuentre que uno de los tres componentes está defectuoso es:  95.4545 %"
  1. ¿Cuál es el valor esperado?
VE <- n 
paste ("El valor esperado es: ", VE)
## [1] "El valor esperado es:  35"
  1. ¿Cuál es la varianza y la desviación estándard?
varianza <- n  *( 1)
paste ("La varianza es: ", round(varianza,2))
## [1] "La varianza es:  35"

Desviacion

desviacion.std <- sqrt(varianza)
paste("La desviación std es: ", round(desviacion.std, 2))
## [1] "La desviación std es:  5.92"

3. Interpretación de los dos ejercicios identificando al menos los siguientes puntos: 180 a 200 palabras. Distribución Hipergeométrica.

3.1. ¿Cuál es la variable aleatoria y su significado en el contexto?

la variable aleatoria en el ejercicio 1 es 12,3,5 ya que son las cantidades que nos esta dando a conocer estos valores se representan como las cantidades de fusibles el 12 es el total de ellos que son los que van en una caja de los cuales un ispector inspecciona 3 y 5 de ellos son defectuosos.

la variable aleatoria que se ve representada en el ejercicio 2 es 40,5,3 estas son las variables aleatorias ya que son todos los datos que nos da a conocer este segundo ejercicio el 40 representa el total de componentes , el 3 nos quiere decir que es la cantidad de lotes defectuosos y el 5 son el numero de componentes que se escogieron al azar para saber si estos son o no defectuosos.

3.2. ¿Qué valores puede tomar la variable aleatoria?

la variable aleatoria del ejericio 1 son:12,3,5

la variable aleatoria del ejericio 2 son:40,5,3

3.3. ¿Cuál es el espacio muestral?, todos los elementos

en el ejercicio 1 el espacio muestral es que ahi cierta cantidad de fusibles de los cuales se determinaran cuales estan en funcionamiento y cuales no, en el ejercicio 2 el espacio muestral esque ahi lotes de componentes de los cuales se determinan por una cierta cantidad y tambien de ellos es saber o obtener cual es el porcentaje de los componentes que si estan funcionando y cuales no.

3.4. ¿Cuántos elementos hay en espacio muestral (S)?

en el ejercicio 1 los elementos son:(0.15909091, 0.47727273, 0.31818182, 0.04545455)

en el ejercicio 2 los elementos son:(0.66244939, 0.30111336, 0.03542510, 0.00101215)

3.5. ¿Cuántos casos hay de cada valor de cada variable aleatoria?

en el ejercicio 1 los casos que se ven reflejados son 0,1,2,3 en el ejericio 2 los casos con los que se trabajan son 0,1,2,3.

3.6. ¿Cuáles son las probabilidades más altas de cada variable aleatoria?

en el ejercicio 1 la probabilidad mas alta que se obtuvo fue:0.47727273.

en el ejercicio 2 la probabilidad mas alta que se obtuvo fue:0.66244939.

3.8. ¿Qué significado tiene el gráfico de barra?

tanto como la grafica del ejercicio 1 y el ejercicio 2 representa las probabilidades obtenidas de los casos con los que se trabajaron que fueron 4 casos tanto como en el primer y segundo ejercicio, de una parte de las graficas representa los casos que fueron 0,1,2,3 y otra parte de la grafica representa las probabilidades que se obtuvieron de los mismos ubicando de esta manera los resultados obtenidos y de estos se origina una recta que se desvia en diferentes puntos de la grafica.

El gráfico de barras es una de las formas de graficar la cotización de un activo más famosas. La mayoría de los gráficos de series económicas se hacen en forma de línea. No es este el caso en las cotizaciones bursátiles. Los gráficos básicos de líneas tan solo marcan unen puntos.

3.9. ¿Qué significado tiene el gráfico lineal acumulado?

El gráfico lineal (gráfico de líneas o diagrama lineal) se compone de una serie de datos representados por puntos, unidos por segmentos lineales. Mediante este gráfico se puede comprobar rápidamente el cambio de tendencia de los datos.

El diagrama lineal se suele utilizar con variables cuantitativas, para ver su comportamiento en el transcurso del tiempo. Por ejemplo, en las series temporales mensuales, anuales, trimestrales, etc.

Referencias Bibliográficas

Anderson, D. R., Sweeney, D. J., & Williams, T. A. (2008). Estadística para administración y economía (10th ed.). Cengage Learning,

Camacho Avila, M. (2019). Probabilidad y estadística. Modelos probabilísticos. http://148.215.1.182/bitstream/handle/20.500.11799/108238/secme-34236_1.pdf?sequence=1