CASO 19

OBJETIVO

Identificar los valores de la función de probabilidad bajo la fórmula de distribución de Hipergeométrica.

Descripción

Realizar distribuciones de probabilidad conforme a la distribución de probabilidad de Hipergeométrica a partir de valores iniciales de los ejercicios.

Se generan las tablas de probabilidad conforme a distribución Hipergeométrica, se identifican los valores de probabilidad cuando la variable discreta x tenga algún exactamente algún valor, ≤ a algún valor o > o ≥, entre otros.

Fundamento teórico

La distribución de probabilidad hipergeométricaestá estrechamente relacionada con la distribución binomial. Pero difieren en dos puntos: en la distribución hipergeométricalos ensayos no son independientes y la probabilidad de éxito varía de ensayo a ensayo (Anderson et al., 2008).

La distribución de probabilidad de la variable aleatoria hipergeométrica X, el número de éxitos en una muestra aleatoria de tamaño n que se selecciona de N artículos, en los que k se denomina éxito y N–k se le llama fracaso (Camacho Avila, 2019)

Fórmula de función de probabilidad

Fórmula de la distribución hipergeométrica

\(f(x)=(rx)⋅(N−rn−x)(Nn)\)

Donde:

f(x) es la probabildiad de x o la función de distribución

n número de ensayos o longitud de la muestra

N número de elementos de la población

r número de elementos de la población considerados como éxito, o cantidad de casos exitosos dentro de la pobción

x Valor de la variable aleatoria discreta 0,1,2,3,,,,n (Anderson et al., 2008).

(rx) Parte izquierda del numerador, representan el número de formas en que se toman x éxitos de un total de r éxitos que hay en la población,

(N−rn−x) parte derecha del numerador representa el número de maneras en que se puede tomar n−x fracasos de un total de N−r elementos que hay en la población.

(Nn) como denominador representan el número de maneras (cantidad de combinaciones) en que es posible tomar una muestra de tamaño n de una población de tamaño N; (Anderson et al., 2008).

Recordando la fórmula para determinar el número de combinaciones en grupos de n elementos de una poblacón total de N está dada por:

\(CNn=(Nn)=N!n!⋅(N−n)!\)

Entonces desarrollando la fórmula con las combinaciones la función de probabilidad hipergeométrica queda de la siguiente manera:

\(f(x)=(rx)⋅(N−rn−x)(Nn)=(r!x!⋅(r−x)!)⋅((N−r)!(n−x)!⋅((N−r)−(n−x))!)N!n!⋅(N−n)!\)

Fórmula para valor esperado

\(E(x)=μ=n⋅(rN)\)

Fórmula para varianza

\(Var(x)=σ2=n⋅(rN)⋅(1−rN)⋅(N−nN−1)\)

Fórmula de la desviación estándard

\(σ=Var(x)−−−−−−√=σ2−−√\)

PASOS A SEGUIR

Cargar librerías

Ejercicios

Ejercicio 1: Probabilidades, Varianza, Desviación

Ejercicio 2: Probabilidades, Varianza, Desviación

Interpretación los ejercicios

PASO 1. Cargar librerías

library(ggplot2)

Cargar funciones

source("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/funciones/funciones.distribuciones.r")

PASO 2. Ejercicios

Ejercicio 1.

Una empresa fabrica fusibles que empaca en cajas de 12 unidades cada una.

Asuma que un inspector selecciona al azar 3 de los 12 fusibles de una caja para inspeccionarlos.

Si la caja contiene exactamente 5 fusibles defectuosos,

En este ejercicio::

n=3 Número de ensayos

N=12 Total de elementos

r=5 fusibles defectuosos en la caja, casos de éxito

x es la cantidad de fusible defectusoso como variable aleatoria discreta, desde 0 hasta n (Anderson et al., 2008).

a) Tabla de probabilidad desde cero a tres

Primero inicializar valores

N <- 12 
n <- 3
r <- 5
x <- 0:n

Distribución de la probabilidad por medio de la función creada llamada f.prob.hiper()

datos1 <- data.frame(x=x, f.prob.x = round(f.prob.hiper(x = x, N = N, n = n, r = r), 8))

datos1 <- cbind(datos1, f.acum.x = cumsum(datos1$f.prob.x))
datos1

##   x   f.prob.x  f.acum.x
## 1 0 0.15909091 0.1590909
## 2 1 0.47727273 0.6363636
## 3 2 0.31818182 0.9545455
## 4 3 0.04545455 1.0000000

Distribución de la probabilidad por medio de la función base de R llamada dhyper()

Deben generarse los mismos datos en datos1 y datos2

m <-n; N <-N; k <- r; n <- N - n

datos2 <- data.frame(x=x, f.prob.x = round(dhyper(x = x,m = m, n = n, k = k), 8))

datos2 <- cbind(datos2, f.acum.x = cumsum(datos2$f.prob.x))

datos2

##   x   f.prob.x  f.acum.x
## 1 0 0.15909091 0.1590909
## 2 1 0.47727273 0.6363636
## 3 2 0.31818182 0.9545455
## 4 3 0.04545455 1.0000000

ggplot(data = datos2, aes(x,f.prob.x) ) +
  geom_point(colour = "red") +
  geom_line(colour = 'blue')

b) ¿Cuál es la probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso?

x <- 1
prob <- datos2$f.prob.x[x+1]

paste("La probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso es: ", round(prob * 100,4), "%")

## [1] "La probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso es:  47.7273 %"

c) ¿Cuál es la probabilidad de encontrar menos de tres fusibles defectuosos

\(P(x≤2)=P(X=0)+P(x=1)+P(x=2)\)

x <- 2
prob <- datos2$f.acum.x[x+1]

paste("La probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso es: ", round(prob * 100,4), "%")

## [1] "La probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso es:  95.4545 %"

d) ¿Cuál es el valor esperado

Mandar llamar la función creada anticipadamente f.va.hiper()

N <- 12 
n <- 3
r <- 5
VE <- f.va.hiper(n = n, N = N, r = r)

paste("El valor esperado o media de este ejercicios es de: ", VE)

## [1] "El valor esperado o media de este ejercicios es de:  1.25"

e) ¿Cuál es la varianza y la desviación estándard?

varianza <- f.varianza.hiper(VE = VE, n = 3, N = 12, r = 5)

desvstd <- sqrt(varianza)

paste("El valor de la varianza es de: ", round(varianza,4), " y la desviación std es de: ", round(desvstd, 4))

## [1] "El valor de la varianza es de:  0.5966  y la desviación std es de:  0.7724"

INTERPRETACIÓN DEL EJERCICIO No. 1

De acuerdo con los datos calculados en el ejercicio uno, tenemos los siguientes resultados:

La probabilidad de que un fusible resulte defectuoso es del 47.72% aproximadamente.

Por otro lado, según los otros cálculos, la máxima probabilidad de que haya un fusil defectuoso menor a 3 componentes es del 95%

La variable discreta, en promedio, se espera ue su valor sea de 1.25

La Varianza es de 0.5966

La desviación estándar es de 0.7724

Los 2 datos anteriores significan que el grado de dispersión de los valores de la distribució, o dicho de otra manera, qué tanto se alejan del valor medio en la distribución hipergeométrica

Ejercicio 2

Lotes con 40 componentes cada uno que contengan 3 o más defectuosos se consideran inaceptables.

El procedimiento para obtener muestras del lote consiste en seleccionar 5 componentes al azar y rechazar el lote si se encuentra un componente defectuoso (Camacho Avila, 2019), (Walpole et al., 2012)

\(n=5\) \(N=40\) \(k=3\) y \(x=0,1,2,3,4...n\)

a) Tabla de probabilidad desde cero a cinco

Primero inicializar valores

N <- 40
n <- 5
r <- 3
x <- 0:r

m <-n; N <-N; k <- r; n <- N - n

datos <- data.frame(x=x, f.prob.x = round(dhyper(x = x,m = m, n = n, k = k), 8))

datos <- cbind(datos, f.acum.x = cumsum(datos$f.prob.x))

datos

##   x   f.prob.x  f.acum.x
## 1 0 0.66244939 0.6624494
## 2 1 0.30111336 0.9635628
## 3 2 0.03542510 0.9989879
## 4 3 0.00101215 1.0000000

ggplot(data = datos, aes(x,f.prob.x) ) +
  geom_point(colour = "red") +
  geom_line(colour = 'blue')

b) ¿Cuál es la probabilidad de que, en la muestra, se encuentre exactamente un componente defectuoso, si en todo el lote hay 3 defectuosos?

c) ¿Cuál es la probabilidad de encontrar menos de tres componentes defectuosos

d) ¿Cuál es el valor esperado

e) ¿Cuál es la varianza y la desviación estándard?

INTERPRETACIÓN DEL EJERCICIO 2

De acuerdo con los cálculos realizados en este ejercicio, podemos ver que la probabilidad de encontrar menos de 3 componentes defectuosos es de (aproximadamente) el 30%

Ejercicio 3

Se tiene un lote de 100 artículos de los cuales 12 están defectuosos.

Tabla de distribución

Inicializar los valores

Primero inicializar valores

N <- 100
n <- 10
r <- 12
x <- 0:n

Distribución de la probabilidad por medio de la función creada llamada f.prob.hiper()

datos <- data.frame(x=x, f.prob.x = round(f.prob.hiper(x = x, N = N, n = n, r = r), 8))

datos <- cbind(datos, f.acum.x = cumsum(datos$f.prob.x))
datos

##     x   f.prob.x  f.acum.x
## 1   0 0.26075027 0.2607503
## 2   1 0.39607636 0.6568266
## 3   2 0.24507225 0.9018989
## 4   3 0.08068222 0.9825811
## 5   4 0.01549689 0.9980780
## 6   5 0.00179241 0.9998704
## 7   6 0.00012447 0.9999949
## 8   7 0.00000502 0.9999999
## 9   8 0.00000011 1.0000000
## 10  9 0.00000000 1.0000000
## 11 10 0.00000000 1.0000000

b) ¿Cuál es la probabilidad de que haya 3 defectuosos en una muestra de 10?

x <- 3

prob <- datos$f.prob.x[x+1]

paste("La probabilidad de que haya 3 defectuosos en una muestra de 10 es de", prob)

## [1] "La probabilidad de que haya 3 defectuosos en una muestra de 10 es de 0.08068222"

CASO 19

Myriam Velazquez Franco

14/12/2020

CASO 19

OBJETIVO

Identificar los valores de la función de probabilidad bajo la fórmula de distribución de Hipergeométrica.

Descripción

Realizar distribuciones de probabilidad conforme a la distribución de probabilidad de Hipergeométrica a partir de valores iniciales de los ejercicios.

Se generan las tablas de probabilidad conforme a distribución Hipergeométrica, se identifican los valores de probabilidad cuando la variable discreta x tenga algún exactamente algún valor, ≤ a algún valor o > o ≥, entre otros.

Fundamento teórico

La distribución de probabilidad hipergeométricaestá estrechamente relacionada con la distribución binomial. Pero difieren en dos puntos: en la distribución hipergeométricalos ensayos no son independientes y la probabilidad de éxito varía de ensayo a ensayo (Anderson et al., 2008).

La distribución de probabilidad de la variable aleatoria hipergeométrica X, el número de éxitos en una muestra aleatoria de tamaño n que se selecciona de N artículos, en los que k se denomina éxito y N–k se le llama fracaso (Camacho Avila, 2019)

Fórmula de función de probabilidad

Fórmula de la distribución hipergeométrica

Donde:

f(x) es la probabildiad de x o la función de distribución

n número de ensayos o longitud de la muestra

N número de elementos de la población

r número de elementos de la población considerados como éxito, o cantidad de casos exitosos dentro de la pobción

x Valor de la variable aleatoria discreta 0,1,2,3,,,,n (Anderson et al., 2008).

(rx) Parte izquierda del numerador, representan el número de formas en que se toman x éxitos de un total de r éxitos que hay en la población,

(N−rn−x) parte derecha del numerador representa el número de maneras en que se puede tomar n−x fracasos de un total de N−r elementos que hay en la población.

(Nn) como denominador representan el número de maneras (cantidad de combinaciones) en que es posible tomar una muestra de tamaño n de una población de tamaño N; (Anderson et al., 2008).

Recordando la fórmula para determinar el número de combinaciones en grupos de n elementos de una poblacón total de N está dada por:

Entonces desarrollando la fórmula con las combinaciones la función de probabilidad hipergeométrica queda de la siguiente manera:

Fórmula para valor esperado

Fórmula para varianza

Fórmula de la desviación estándard

PASOS A SEGUIR

Cargar librerías

Ejercicios

Ejercicio 1: Probabilidades, Varianza, Desviación

Ejercicio 2: Probabilidades, Varianza, Desviación

Interpretación los ejercicios

PASO 1. Cargar librerías

Cargar funciones

PASO 2. Ejercicios

Ejercicio 1.

Una empresa fabrica fusibles que empaca en cajas de 12 unidades cada una.

Asuma que un inspector selecciona al azar 3 de los 12 fusibles de una caja para inspeccionarlos.

Si la caja contiene exactamente 5 fusibles defectuosos,

En este ejercicio::

n=3 Número de ensayos

N=12 Total de elementos

r=5 fusibles defectuosos en la caja, casos de éxito

x es la cantidad de fusible defectusoso como variable aleatoria discreta, desde 0 hasta n (Anderson et al., 2008).

a) Tabla de probabilidad desde cero a tres

Primero inicializar valores

Distribución de la probabilidad por medio de la función creada llamada f.prob.hiper()

Distribución de la probabilidad por medio de la función base de R llamada dhyper()

Deben generarse los mismos datos en datos1 y datos2

b) ¿Cuál es la probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso?

c) ¿Cuál es la probabilidad de encontrar menos de tres fusibles defectuosos

d) ¿Cuál es el valor esperado

Mandar llamar la función creada anticipadamente f.va.hiper()

e) ¿Cuál es la varianza y la desviación estándard?

INTERPRETACIÓN DEL EJERCICIO No. 1

De acuerdo con los datos calculados en el ejercicio uno, tenemos los siguientes resultados:

La probabilidad de que un fusible resulte defectuoso es del 47.72% aproximadamente.

Por otro lado, según los otros cálculos, la máxima probabilidad de que haya un fusil defectuoso menor a 3 componentes es del 95%

La variable discreta, en promedio, se espera ue su valor sea de 1.25

La Varianza es de 0.5966

La desviación estándar es de 0.7724

Los 2 datos anteriores significan que el grado de dispersión de los valores de la distribució, o dicho de otra manera, qué tanto se alejan del valor medio en la distribución hipergeométrica

Ejercicio 2

Lotes con 40 componentes cada uno que contengan 3 o más defectuosos se consideran inaceptables.

El procedimiento para obtener muestras del lote consiste en seleccionar 5 componentes al azar y rechazar el lote si se encuentra un componente defectuoso (Camacho Avila, 2019), (Walpole et al., 2012)

a) Tabla de probabilidad desde cero a cinco

Primero inicializar valores

b) ¿Cuál es la probabilidad de que, en la muestra, se encuentre exactamente un componente defectuoso, si en todo el lote hay 3 defectuosos?

c) ¿Cuál es la probabilidad de encontrar menos de tres componentes defectuosos

d) ¿Cuál es el valor esperado

e) ¿Cuál es la varianza y la desviación estándard?

INTERPRETACIÓN DEL EJERCICIO 2

De acuerdo con los cálculos realizados en este ejercicio, podemos ver que la probabilidad de encontrar menos de 3 componentes defectuosos es de (aproximadamente) el 30%

Ejercicio 3

Se tiene un lote de 100 artículos de los cuales 12 están defectuosos.

Tabla de distribución

Inicializar los valores

Primero inicializar valores