Los Objetivos De La Práctica

* El Objetivo General De La Práctica

A continuación se presenta el objetivo general de la práctica:

Calcular La Función De Densidad Y La Función De Probabilidad Acumulada Bajo La Fórmula De Distribución De Tipo Hipergeométrica.

* Los Objetivos Específicos De La Práctica

A continuación, se presenta los objetivos específicos que tiene la siguiente práctica:

Calcular La Función De Densidad Y La Función De Probabilidad Acumulada Bajo La Fórmula De Distribución De Tipo Hipergeométrica.
Realizar Cálculos De Probabilidad Conforme A La Distribución De Probabilidad Hipergeométrica A Generar Las Tablas De Probabilidad Conforme A Distribución Hipergeométrica.
Identificar Los Valores De Probabilidad Cuando La Variable Discreta \(X\) Tenga Algún Exactamente Algún Valor, \(\Leq\) A Algún Valor O \(\Gt\) O \(\Geq\), Entre Otros.
Implementar Las Funciones Predeterminadas De Lenguaje R Dhyper() Y Phyper() Para La Probabilidad Y Función Acumulada De La Distribución Hipergeométrica.
Hacer Uso De Las Funciones Rhyper() Para Generación De Valores Aleatorios Y Qhyper() Para Encontrar Valores De X A Partir De Probabilidades Acumuladas.
Implementar También De Manera Alternativa La Función Del Enlace F.Prob.Hiper() Y F.Prob.Hiper.All(), Que Permite Calcular La Probabilidad De Una Variable Aleatoria Discreta Bajo La Distribución Hipergeométrica Y Conforme A La Fórmula.

* Investigaciones Pertinentes

* La Probabilidad

La probabilidad y la estadística están relacionadas en una forma importante. La probabilidad se emplea como herramienta; permite que se evalúe la confiabilidad de las conclusiones acerca de la población cuando tenga sólo información muestral.

Por otra parte, la probabilidad indica el grado de certidumbre o certeza de un suceso o fenómeno estudiado, en la investigación científica existen muchos fenómenos en los cuales es necesario determinar la probabilidad de que un evento ocurra o dejen de ocurrir, para lo cual el estudio de este campo, es necesario.

Además tiene aplicaciones muy importantes en investigación; dado que es base para la inferencia estadística que permite el estudio de muestras con el objetivo de inferir o extrapolar características de estas a una población.

* Las Variables Estadísticas

La definición propia de una variables estadísticas es la siguiente, de acuerdo con los estipulado por Enciclopedia en su sitio web (2022):

Una variable estadística es una característica de una muestra o población de datos que puede adoptar diferentes valores.

Cuando hablamos de variable estadística estamos hablando de una cualidad que, generalmente adopta forma numérica. Por ejemplo, la altura de Juan es de 180 centímetros. La variable estadística es la altura y está medida en centímetros.

También podríamos, por ejemplo, decir que el beneficio de una empresa ha sido de 22.300 dólares el último año. En este caso, la variable sería el beneficio y estaría medido en dólares. Las variables son del tipo cuantitativo (se expresan con un número)

Claro que no todas las variables estadísticas son iguales y, por supuesto, no todas se pueden (en principio) expresar en forma de número.

Así, otra variable que podríamos encontrarnos es el color de ojos de una persona. Por ejemplo, Juan tiene los ojos verdes y Andrés los tiene azules. La variable sería el color de ojos y sería una variable cualitativa. Es decir, no se expresa con número.

Los Tipos De Variables Estadísticas

Aunque hay decenas de tipos de variables estadísticas, por norma general podemos encontrarnos dos tipos de variables:

Variable Cuantitativa: Son variables que se expresan numéricamente.
- Variable Continua: Toman un valor infinito de valores entre un intervalo de datos. El tiempo que tarda un corredor en completar los 100 metros lisos.
- Variable Discreta: Toman un valor finito de valores entre un intervalo de datos. Número de helados vendidos.
Variable Cualitativa: Son variables que se expresan, por norma general, en palabras.
- Variable Ordinal: Expresa diferentes niveles y orden.
- Variable Nominal: Expresa un nombre claramente diferenciado. Por ejemplo el color de ojos puede ser azul, negro, castaño, verde, etc.

* Las Variables Aleatorias

La definición propia de una variable aleatoria continua es la siguiente, de acuerdo con los estipulado por Enciclopedia en su sitio web (2019):

Una variable aleatoria es la función matemática de un experimento aleatorio.

Cómo podemos comprobar la frase se compone básicamente de dos conceptos: función matemática y experimento aleatorio. Es decir, debemos entender primero qué es una función matemática y, posteriormente, definir qué entendemos por experimento aleatorio.

Función matemática: Dicho de manera sencilla, es una ecuación que asigna valores a una variable (variable dependiente) en función de otras variables (variables independientes).
Experimento aleatorio: Es un fenómeno de la vida real cuyos resultados se deben completamente al azar. Es decir, bajo las mismas condiciones iniciales arroja resultados diferentes.

Por la tanto una variable aleatoria, es una ecuación que describe o intenta describir los resultados (con un número) de un evento cuyos resultados se deben al azar.

En otras palabras, pensemos en una variable aleatoria que tome valores enteros.

Por ejemplo, 1, 2 o 3. En este caso, la variable aleatoria no sería continua. Solo puede tomar el valor 1, el valor 2 o el valor 3. No puede, por ejemplo, tomar el valor 2,5 o 2,53. Si se tratara de una variable aleatoria continua, podría tomar cualquier valor en el intervalo de datos [1,3]. Por ejemplo, 1,02 o 2,067.

Cabe ser preciso, así como recalcar que una variable continua es un tipo de variable cuantitativa, o lo que es lo mismo, que se puede expresar mediante cifras. De esta forma, a parte de estos datos se pueden realizar análisis estadísticos y operaciones matemáticas.

Sea X una variable aleatoria continua. Entonces, una distribución de probabilidad o función de densidad de probabilidad (pdf) de X es una función \(f(x)\) de modo tal que para dos números cualesquiera a y b con \(a \le b\)

* Las Distribuciones De Probabilidad

En teoría de la probabilidad y estadística, la distribución de probabilidad de una variable aleatoria es una función que asigna a cada suceso definido sobre la variable, la probabilidad de que dicho suceso ocurra.

La distribución de probabilidad está definida sobre el conjunto de todos los sucesos y cada uno de los sucesos es el rango de valores de la variable aleatoria. También puede decirse que tiene una relación estrecha con las distribuciones de frecuencia.

La distribución de probabilidad está completamente especificada por la función de distribución, cuyo valor en cada x real es la probabilidad de que la variable aleatoria sea menor o igual que x.

* Los Diferentes Tipos De Distribuciones De Probabilidad

Esta división se realiza dependiendo del tipo de variable a estudiar. Las cuatro principales (de las que nacen todas las demás) son:

A) Si la variable es una variable discreta (números enteros), corresponderá una distribución discreta, de las cuales existen:

Distribución Binomial (eventos independientes).
Distribución De Poisson (eventos independientes).
Distribución Hipergeométrica (eventos dependientes).

B) Si la variable es continua (números reales), la distribución que se generará será una distribución continua. Ejemplos de ellas son:

Distribución Normal.
Distribución Exponencial

* La Distribución De Probabilidad Hipergeométrica

Está Distribución, esta estrechamente relacionada con la distribución binomial. Pero difieren en dos puntos: en la distribución hipergeométrica, los ensayos no son independientes y la probabilidad de éxito varía de ensayo a ensayo.

La distribución de probabilidad de la variable aleatoria hipergeométrica \(x\), el número de éxitos en una muestra aleatoria de tamaño \(n\) que se selecciona de \(N\) artículos, en los que \(k\) se denomina éxito y \(N – k\) se le llama fracaso.

La distribución hipergeométrica es especialmente útil en todos aquellos casos en los que se extraigan muestras o se realicen experiencias repetidas sin devolución del elemento extraído o sin retornar a la situación experimental inicial.

Es una distribución fundamental en el estudio de muestras pequeñas de poblaciones pequeñas y en el cálculo de probabilidades de juegos de azar. Tiene grandes aplicaciones en el control de calidad, para procesos experimentales en los que no es posible retornar a la situación de partida.

Como en el caso de la distribución binomial, la distribución hipergeométrica se aplica en el muestreo de aceptación, donde se toman muestras del material o las partes de los lotes con el fin de determinar si se acepta o no el lote completo.

* La Fórmula De Función De Probabilidad

La fórmula de la distribución hipergeométrica

\[f(x) = \frac{\binom{r}{x} \cdot \binom{N-r}{n-x}}{\binom{N}{n}} \]

Dónde:

\(f(x)\) es la probabilidad de \(x\) o la función de distribución
\(n\) número de ensayos o longitud de la muestra casos que se extraen
\(N\) número de elementos de la población
\(r\) número de elementos exitosos en relación a la población
\(x\) Valor de la variable aleatoria discreta \(0,1,2,3, ... ...,n.muestra\) hasta el valor \(n\) de la muestra [@anderson_estadistica_2008].
\({\binom{r}{x}}\) Parte izquierda del numerador, representan el número de formas (combinaciones) en que se toman \(x\) éxitos de un total de \(r\) éxitos que hay en la población,
\(\binom{N-r}{n-x}\) parte derecha del numerador representa el número de maneras en que se puede tomar \(n - x\) fracasos de un total de \(N - r\) elementos que hay en la población.
\(\binom{N}{n}\) como denominador representan el número de maneras (cantidad de combinaciones) en que es posible tomar una muestra de tamaño \(n\) de una población de tamaño \(N\).

Recordando la fórmula para determinar el número de combinaciones en grupos de \(n\) elementos de una población total de \(N\) está dada por:
\[C_{n}^{N} = \binom{N}{n} = \frac{N!}{n!\cdot(N-n)!}\]

Entonces desarrollando la fórmula con las combinaciones la función de probabilidad hipergeométrica queda de la siguiente manera:

\[ f(x) = \frac{\binom{r}{x} \cdot \binom{N-r}{n-x}}{\binom{N}{n}} = \frac{ (\frac{r!}{x!\cdot(r-x)!})\cdot(\frac{(N-r)!}{(n-x)!\cdot((N-r) - (n-x))!})}{\frac{N!}{n!\cdot(N-n)!}} \]

\(N\) es el tamaño de población,
\(n\) es el tamaño de la muestra extraída,
\(r\) es el número de elementos en la población original que pertenecen a la categoría deseada (exitosos) y
\(x\) es la variable aleatoria o el número de elementos en la muestra que pertenecen a dicha categoría.

La Fórmula Para Determinar La Función Acumulada Es:

\[ F(x) = \sum_{0}^{n}f.x_i \]

La Fórmula Para Determinar El Valor Esperado Está Dado Por:

\[\mu = n \cdot p\]

La Fórmula Para Determinar La Varianza Está Dada Por:

\[ \sigma^{2} = n \cdot p \cdot(1-p) \]

La Fórmula Para Determinar La Desviación Estándar Está Dada Por:

\[\sigma = \sqrt{\sigma^{2}} \]

Dentro del entorno de programación en R, para calcular la función de probabilidad binomial para un conjunto de valores discretos, \(x\), un número de ensayos \(n\) y una probabilidad de éxito \(p\) se puede hacer uso de la función dbinom().

De manera semejante, para calcular la probabilidad acumulada de una distribución binomial se puede utilizar la función pbinom() o para calcular la probabilidad de que una variable aleatoria \(x\) que sigue una distribución binomial tome valores menores o iguales a \(x\) puedes hacer uso de la función pbinom()

* Algunos Ejemplos De Distribución Hipergeométrica

* Actividad No. 1 - Ejercicio De Canicas

Extraer canicas blancas

\(N=15\) Total de canicas de la Población
\(r = 9\) Canicas blancas. Casos exitosos
\(n =\) Cantidad que se extrae \(5\). Tamaño de la muestra
\(x=3\) Variable aleatoria que puede tener valores desde \(0\) hasta tamaño de la muestra \(n\)

En alguna literatura o referencias bibliográficas de la fórmula de hipergeométrica, la variable \(r\) es lo mismo que la literal \(k\).

¿Cuál es la probabilidad de extraer tres canicas si se sacan 5 canicas?.

\[ N = 15; r = 9; n = 5; (N-r) = 6; x = 3 \]

\[ f(x) = \frac{\binom{r}{x} \cdot \binom{N-r}{n-x}}{\binom{N}{n}} = \frac{ (\frac{r!}{x!\cdot(r-x)!})\cdot(\frac{(N-r)!}{(n-x)!\cdot((N-r) - (n-x))!})}{\frac{N!}{n!\cdot(N-n)!}} \]

Entonces, sustituyendo valores de literales:

\[ P(x=3) = \frac{\binom{9}{3} \cdot \binom{15-9}{5-3}}{\binom{15}{5}} = \frac{ (\frac{9!}{3!\cdot(9-3)!})\cdot(\frac{(15-9)!}{(5-3)!\cdot((15-9) - (5-3))!})}{\frac{15!}{5!\cdot(15-5)!}}=\frac{84\times15}{3003}=0.4195 \]

Existe un 41.95% de probabilidades de encontrar 3 canicas blancas de un experimento de extraer 5 de una bolsa que contiene 15 canicas de las cuales 9 son blancas y 6 de color negro.

Haciendo operaciones sería:

# Inicialización De Las Variables 
N <- 15  # Población
r <- k <- 9 # Canicas blancas Casos exitos
# negras <- (N-k) # Canicas negras # 6
n <- 5 # Extracción de canicas
x <- 3

# Operaciones Realizadas 
numerador <- (factorial(r) / (factorial(x) * (factorial(r-x)))) * (factorial(N-r) / (factorial(n-x) * (factorial((N-r)-(n-x)))))
denominador<- factorial(N) / (factorial(n) * factorial(N-n))
prob <- numerador / denominador
prob

## [1] 0.4195804

Directamente con la función dhyper()

La función dhyper() como parte de los paquetes base recibe como m el tamaño de casos exitosos, como n los casos no exitosos o sea N - r y como k el tamaño de la muestra.

# Se inicializaron los valores en el bloque de código anterior.
prob <- dhyper(x=x, m = r, n = N - r, k = n)
prob

## [1] 0.4195804

Cargar script que contiene la función f.prob.hiper() que genera el mismo resultado que dhyper()

source("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/2023/funciones/funciones%20para%20disribuciones%20de%20probabilidad.R")

Ejecutando la función

N <- 15  # Población
r <- k <- 9 # Canicas rojas. Casos exitos
# negras <- (N-k) # Canicas negras # 6
n <- 5 # Extracción de canicas
x <- 3
f.prob.hiper(x = x, poblacion = N, muestra = n, exitosos = r)

## [1] 0.4195804

* Actividad No. 2 - Barajas Españolas

Suponga la extracción aleatoria de 8 elementos de un conjunto formado por 40 elementos totales (cartas baraja española) de los cuales 10 son del tipo A (salir oro) y 30 son del tipo complementario (no salir oro).

Si se realizan las extracciones sin devolver los elementos extraídos y se identifica a \(x\) al número de elementos del tipo A (oros obtenidos) que se extraen en las 8 cartas; \(x\) seguirá una distribución hipergeométrica de parámetros

\(N = 40\) - Total de barajas
\(r = 10\) - Cantidad de oros \(10\)
\(n=8\) - Cuantas cartas se extraen \(8\)

¿Cuál es la probabilidad de obtener 4 oros?. Para calcular la probabilidad de obtener \(4\) oros:

\(x = 4\)

Calculando con la función dhyper()

N <- 40 # Total de casos
r <- 10  # Cantidad de oros
n <- 8 # Cantidad de extracción o muestra
x <- 4  # Variable aleatoria
dhyper(x = x, m = r, n = (N-r), k = n)

## [1] 0.07483354

Ejecutar función f.prob.hiper() del script previamente cargado

N <- 40 # Total de casos
r <- 10  # Cantidad de casos exitosos a evaluar. Cantidad de cartas que sea oros
n <- 8 # Cantidad de extracción
x <- 4  # Variable aleatoria
f.prob.hiper(x = x, poblacion = N, muestra = n, exitosos = r)

## [1] 0.07483354

Ejemplo 3: Lotes de componentes

Lotes con 40 componentes, históricamente hay 3 defectuosos en todo el lote .Si se encuentra más de 3 es inaceptable el lote o es falta de calidad. El procedimiento para obtener muestras del lote consiste en seleccionar 5 componentes al azar y rechazar el lote si se encuentra un componente defectuoso.

¿Cuál es la probabilidad de que, en la muestra, se encuentre exactamente un componente defectuoso, si en todo el lote hay 3 defectuosos?

Si se utiliza la distribución hipergeométrica con \(n = 5, N = 40, r = 3\) y \(x = 1\), se encuentra que la probabilidad de obtener un componente defectuoso es:

Solución con dhyper()

N <- 40 # Tamaño de lote
r <- 3  # Casos de Exito
n <- 5  # Extracción muestra
x <- 1  # Variable aleatoria
dhyper(x = x, m = r, n = (N - r), k = n)

## [1] 0.3011134

N <- 40 # Total de casos
r <- 3  # Cantidad de casos exitosos a evaluar. Cantidad de componentes defectuosos
n <- 5 # Cantidad de extracción muestra
x <- 1  # Variable aleatoria
f.prob.hiper(x = x, poblacion = N, muestra = n, exitosos = r)

## [1] 0.3011134

* Desarrollo Metodológico De La Práctica

Se presentan ejercicios de distribuciones hipergeométricas, mostrando tablas de distribución y gráfica de la misma, se calculan probabilidades, valores esperados, varianza y desviaciones. Al final se busca la interpretación de cada ejercicio.

* Actividad No. 1 - Importar E Implementar Las Librerías

# Importación De Los Paquetes Y Librerías Necesarias Para La Realización De La Práctica 
library(dplyr)
library(ggplot2)
library(mosaic) # Gráficos de distribuciones
library(cowplot) # Imágenes en el mismo renglón
library(plotly)

# Acomodo Del Tipo De Notación Para El Muestro De Los Valores Obtenidos 
options(scipen=999) # Notación normal
# options(scipen=1) # Notación científica

* Actividad No. 2 - Importar E Implementar Las Funciones Previamente Codificadas

# La Importación Y La Implementación De Funciones Previamente Codificadas 
source("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/2023/funciones/funciones%20para%20disribuciones%20de%20probabilidad.R")

* Actividad No. 3 - Ejercicio De La Fabrica De Fusibles

Una empresa fabrica fusibles que empaca en cajas de 12 unidades cada una. Por otro lado, se debe asumir que un inspector selecciona al azar \(3\) de los \(12\) fusibles de una caja para inspeccionarlos, a su vez si la caja contiene exactamente 5 fusibles defectuosos.

En este ejercicio::

\(N = 12\) Total de elementos
\(n = 3\) Extracción de la muestra
\(r = 5\) Número de casos exitosos
\(x\) es la cantidad de fusible defectuosos como variable aleatoria discreta, desde \(0\) hasta \(n\) o hasta un valor específico[@anderson_estadistica_2008].

A partir de este ejercicio se utiliza la función f.hiper.all() del script cargado con anticipación a través de la función source().

Esta función devuelve la tabla de distribución, los estadísticos de valor esperado o esperanza matemática (media de la distribución); la varianza y la desviación estándar como medidas para identificar que tanto varía con respecto al valor esperado; los gráficos histograma, densidad y acumulado con respecto a la distribución hipergeométrica.

* La Tabla De Probabilidad Desde 0 hasta 3

Antes que nada, se deben inicializar valores correspondientes del ejercicio

# Se Inicializan Las Variables 
N <- 12 # Población
n <- 3  # Muestra
r <- 5  # Casos exitosos
x <- 0:r

Se manda llamar la función y dejar todo en la variable resultado

# Se Le Asigna El Valor A La Variable "resultado", Que Recibe Todo Lo Que Retorna La Función f.hiper.all
resultado <- f.hiper.all(poblacion = N, muestra = n, exitosos = r)

La Distribución De La Probabilidad por medio de la función creada llamada f.prob.hiper() y con cumsum()

tabla <- resultado$tabla
tabla

##   x        f.x       F.x
## 1 0 0.15909091 0.1590909
## 2 1 0.47727273 0.6363636
## 3 2 0.31818182 0.9545455
## 4 3 0.04545455 1.0000000

* La Gráfica De La Probabilidad

Se presentan la gráfica de probabilidad con histograma y la densidad respectivamente. Se utiliza la llamada de la variable resultado.

# Se Gráfica La Densidad, Mediante El Uso De La Función "plot_grid"
plot_grid(resultado$g.dens, resultado$g_all$acum)

Histograma y acumulado

# Se Gráfica La Densidad, Mediante El Uso De La Función "plot_grid", Un Histograma Y Acumulado 
plot_grid(resultado$g_barra, resultado$g_all$acum)

Usando plotly para visualizaciones dinámicas

# Se Gráfica La Densidad, Mediante El Uso De La Función "plotly" Para Visualizaciones Dinámicas
plot_grid(resultado$g_barra, resultado$g_all$acum)

resultado$g.hist.plotly

resultado$g.acum.plotly

* La Probabilidad Desde 1 Hasta 3 Fusibles

¿Cuál es la probabilidad de que el inspector encuentre que uno de los tres fusibles esté defectuoso?

* Utilizando Una Tabla De Distribución

x <- 1
prob <- tabla$f.x[x+1]
paste("La probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso es: ", round(prob * 100,4), "%")

## [1] "La probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso es:  47.7273 %"

* Utilizando La Función dhyper()

prob <- dhyper(x = 1, m = r, n = N - r, k = n)
paste("La probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso es: ", round(prob * 100,4), "%")

## [1] "La probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso es:  47.7273 %"

* La Probabilidad De Al Menos 3 Fusibles

¿Cuál es la probabilidad de encontrar menos de tres fusibles defectuosos

\(P(x\leq2) = P(X=0) + P(x=1) + P(x=2)\) o la función acumulada hasta tres \(F(x=3)\)

* Utilizando La Tabla De Distribución

x <- 2
prob <- tabla$F.x[x+1]
paste("La probabilidad de menos de tres fusibles: ", round(prob * 100,4), "%")

## [1] "La probabilidad de menos de tres fusibles:  95.4545 %"

* Utilizando La Función sum(dhyper())

prob <- sum(dhyper(x = 0:x, m = r, n = N - r, k = n))
paste("La probabilidad de menos de tres fusibles: ", round(prob * 100,4), "%")

## [1] "La probabilidad de menos de tres fusibles:  95.4545 %"

* Utilizando La Función phyper()

prob <- phyper(q = x,  m = r, n = N - r, k = n)
paste("La probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso es: ", round(prob * 100,4), "%")

## [1] "La probabilidad de que el inspector encuentre que uno de los tres fusibles está defectuoso es:  95.4545 %"

* El Valor Esperado

¿Cuál es el valor esperado?

Mandar llamar la función creada anticipadamente f.va.hiper().

VE <- resultado$VE
paste("El valor esperado o media de este ejercicios es de: ", VE)

## [1] "El valor esperado o media de este ejercicios es de:  1.25"

* La Varianza

Determinar La Varianza El Ejercicio Propuesto Por El Docente.

varianza <- resultado$varianza
paste ("La varianza es: ", round(varianza,2))

## [1] "La varianza es:  0.6"

* La Desviación Estándar

Determinar La Desviación Estándar Del Ejercicio Propuesto Por El Docente

desvstd <- resultado$desv.std
paste("La desviación std es: ", round(desvstd, 2))

## [1] "La desviación std es:  0.77"

* Análisis E Interpretación Del Ejercicio

Existe una probabilidad de aproximadamente 47.72% de que suceda exactamente un fusible defectuoso.

Existe una probabilidad aproximada del 95% de que sucedan fusibles defectuosos menores a 3 componentes

El Valor esperado de 1.25 significa lo que en promedio se espera que suceda por cualquier valor de la variable discreta

La varianza es de 0.5966 y la desviación es de 0.7724 significan el grado de dispersión de los valores de la distribución o que tanto se alejan del valor medio en la distribución de probabilidad en este caso hipergeométrica.

* Actividad No. 4 - Ejercicio De Los Lotes De Componentes

El Planteamiento Del Problema:

Existen Lotes con \(100\) componentes cada uno que contengan 6 o más defectuosos se consideran inaceptables. El procedimiento para obtener muestras del lote consiste en seleccionar \(10\) componentes al azar y rechazar el lote si se encuentra un componente defectuoso. En todo el lote hay \(6\) defectuosos.
\(N = 100\),
\(n = 10\),
\(r = 6\) y
\(x = 0,1,2,3,4...n\)

* La Tabla De Probabilidad

Antes Que Nada, Debemos Inicializar Los Valores Para La Actividad

# Inicializando Los Valores Para La Actividad
N <- 100  # Población
n <- 10   # Muestra
r <- 6   # Casos Exitosos
x <- 0:n # variable aleatoria discreta x

resultado <- f.hiper.all(poblacion = N, muestra = n, exitosos = r)

Ahora Ya Con Los Valores Inicializados, Construir La Tabla De Distribución

tabla <- resultado$tabla
tabla

##     x        f.x       F.x
## 1   0 0.52230475 0.5223047
## 2   1 0.36868571 0.8909904
## 3   2 0.09645847 0.9874489
## 4   3 0.01182633 0.9992752
## 5   4 0.00070555 0.9999808
## 6   5 0.00001903 0.9999998
## 7   6 0.00000018 1.0000000
## 8   7 0.00000000 1.0000000
## 9   8 0.00000000 1.0000000
## 10  9 0.00000000 1.0000000
## 11 10 0.00000000 1.0000000

* La Gráfica De La Probabilidad

Se presentan la gráfica de probabilidad con histograma y la densidad respectivamente. Se utiliza la llamada de la variable resultado.

plot_grid(resultado$g.dens, resultado$g_all$dens)

Histograma y acumulado

plot_grid(resultado$g_barra, resultado$g_all$acum)

Usando plotly para visualizaciones dinámicas

resultado$g.hist.plotly

resultado$g.acum.plotly

* La Probabilidad De Exactamente Un Componente Defectuoso

¿Cuál es la probabilidad de que, en la muestra, se encuentre exactamente un componente defectuoso, si en todo el lote hay 3 defectuosos?. \(f(x=1)\)

# La Probabilidad De Exactamente Un Componente
x <- 1
prob <- tabla$f.x[x+1]
paste("La probabilidad de que, en la muestra, se encuentre exactamente un componente defectuoso de tres es: ", round(prob * 100,4), "%")

## [1] "La probabilidad de que, en la muestra, se encuentre exactamente un componente defectuoso de tres es:  36.8686 %"

* # La Probabilidad De Al Menmos 3 Componentes Defectuoso

¿Cuál es la probabilidad de encontrar menos de tres componentes defectuosos \(P(x \leq3) = P(x=0)+P(x=1)+P(x=2)+P(x=3)\) o la función acumulada \(F(x=3)\)

x <- 3
prob <- phyper(q = x,m = r, n = N - r, k = n)
paste ("La probabilidad de encontrar menos de tres componentes", round(prob, 4))

## [1] "La probabilidad de encontrar menos de tres componentes 0.9993"

* El Valor Esperado

VE <- resultado$VE
paste("El valor esperado o media de este ejercicios es de: ", VE)

## [1] "El valor esperado o media de este ejercicios es de:  0.6"

* ¿Cuál Es La Varianza y la Desviación Estándar?

varianza <- resultado$varianza
desvstd <- resultado$desv.std
paste("El valor de la varianza es de: ", round(varianza,4), " y la desviación std es de: ", round(desvstd, 4))

## [1] "El valor de la varianza es de:  0.5127  y la desviación std es de:  0.716"

* La Interpretación Del Ejercicio Correspondiente

En este ejercicio en su contexto, hay un 89% de probabilidades de detectar 1 componente malo de una muestra de 10 de entre 100. Por lo que el lote se rechaza [@camacho_avila_probabilidad_2019].

* Actividad No. 5 - Ejercicio Los Articulos Defectuosos

Se tiene un lote de \(100\) artículos de los cuales \(12\) están defectuosos. Se extraen lotes de \(10\).

* La Tabla De Distribución

Primero inicializar valores

# Inicializando Valores
N <- 100
n <- 10
r <- 12
x <- 0:n

Distribución de la probabilidad por medio de la función creada llamada f.hiper.all() en la variable resultado

resultado <- f.hiper.all(poblacion = N, muestra = n, exitosos = r)

tabla <- resultado$tabla
tabla

##     x        f.x       F.x
## 1   0 0.26075027 0.2607503
## 2   1 0.39607636 0.6568266
## 3   2 0.24507225 0.9018989
## 4   3 0.08068222 0.9825811
## 5   4 0.01549689 0.9980780
## 6   5 0.00179241 0.9998704
## 7   6 0.00012447 0.9999949
## 8   7 0.00000502 0.9999999
## 9   8 0.00000011 1.0000000
## 10  9 0.00000000 1.0000000
## 11 10 0.00000000 1.0000000

* La Gráfica De Probabilidad

Se presentan la gráfica de probabilidad con histograma y la densidad respectivamente. Se utiliza la llamada de la variable resultado.

plot_grid(resultado$g.dens, resultado$g_all$acum)

Histograma y acumulado

plot_grid(resultado$g_barra, resultado$g_all$acum)

Usando plotly para visualizaciones interactivas

resultado$g.hist.plotly

resultado$g.acum.plotly

* La Probabilidad de tres defectuosos

¿Cuál es la probabilidad de que haya 3 defectuosos en una muestra de 10? \(P(x=3)\)

x <- 3
prob <- tabla$f.x[x+1]
paste("La probabilidad de que haya 3 defectuosos en una muestra de 10 es de", prob)

## [1] "La probabilidad de que haya 3 defectuosos en una muestra de 10 es de 0.08068222"

Con la función dhyper()

x <- 3
dhyper(x = x, m = r, n = N - r, k = n)

## [1] 0.08068222

paste("La probabilidad de que haya 3 defectuosos en una muestra de 10 es de", prob)

## [1] "La probabilidad de que haya 3 defectuosos en una muestra de 10 es de 0.08068222"

* El Valor esperado

¿Cuál es el valor esperado?

VE <- resultado$VE
paste("El valor esperado o media de este ejercicios es de: ", VE)

## [1] "El valor esperado o media de este ejercicios es de:  1.2"

* La Varianza y Desviación Estándar

¿Cuál es la varianza y la desviación estándar?

varianza <- resultado$varianza
desvstd <- resultado$desv.std
paste("El valor de la varianza es de: ", round(varianza,4), " y la desviación std es de: ", round(desvstd, 4))

## [1] "El valor de la varianza es de:  0.96  y la desviación std es de:  0.9798"

* La Interpretación Del Ejercicio Correspondiente

Se realiza el ejercicio sobre artículos defectuosos de los cuales mediante el uso de métodos especificos para determinar la función de densidad construir datos para mostrar una distribución hipergeometrica.

* Actividad No. 6 - Estudiantes De Leyes

Un estudiante tiene que preparar cien temas. En el examen se sacan tres a sorteo, de los cuales deberá exponer uno y aprobar al menos uno. El estudiante decide estudiar o preparar solamente la mitad y probar suerte.

\(N=100\) La población

\(n=3\) La muestra

\(r = 50\). Los que estudia, son los casos de éxito

\(x = 0,1,2,3\)

* La Tabla de distribución

Valores iniciales

# Inicializando Variables 
N <- 100
n <- 3
r <- 50 
x <- 0:n

Se construye la tabla de distribución de la probabilidad por medio de la función creada llamada f.hiper.all() en la variable resultado.

resultado <- f.hiper.all(poblacion = N, muestra = n, exitosos = r)

tabla <- resultado$tabla
tabla

##   x       f.x       F.x
## 1 0 0.1212121 0.1212121
## 2 1 0.3787879 0.5000000
## 3 2 0.3787879 0.8787879
## 4 3 0.1212121 1.0000000

* La Gráfica de probabilidad

Se presentan la gráfica de probabilidad con histograma y la densidad respectivamente. Se utiliza la llamada de la variable resultado.

plot_grid(resultado$g.dens, resultado$g_all$acum)

Histograma y acumulado

plot_grid(resultado$g_barra, resultado$g_all$acum)

Usando plotly para visualizaciones dinámicas

resultado$g.hist.plotly

resultado$g.acum.plotly

* La Probabilidad de que no apruebe

La probabilidad de que no sepa ninguna de entre la muestra extraída.

Se calcula la probabilidad cuando \(f(x=0)\)

prob <- dhyper(x = 0, m = r, n = N - r, k = n)
paste ("La probabilidad de que no apruebe es de: ", prob, " o sea ", round(prob*100, 4), "%")

## [1] "La probabilidad de que no apruebe es de:  0.121212121212121  o sea  12.1212 %"

* La Probabilidad de que apruebe

Se requiere que sepa un tema \(f(x=1)\) y con eso pasa

prob <- dhyper(x = 1, m = r, n = N - r, k = n)
paste ("La probabilidad de que apruebe es de: ", prob, " o sea ", round(prob*100, 4), "%")

## [1] "La probabilidad de que apruebe es de:  0.378787878787879  o sea  37.8788 %"

* La Interpretación Del Ejercicio Correspondiente

Hay un \(37\%\) de probabilidades de que sepa una respuesta de entre las tres de la muestra, para aumentar esa probabilidad seguramente tendrá que estudiar más temas.

Existe una probabilidad aproximada del \(12\%\) de que no sepa ningún tema, es decir de que repruebe.

¿Cuál es la probabilidad de que sepa más de 0 preguntas?, que es la condición de aprobar.\(F(x >0) = f(x=1) + f(x=2) + f(x=3) = 1 - F(x=0) = 1 - 0.1212\) es decir, tiene un \(88\%\) de probabilidades de aprobar habiendo estudiado solo \(50%\) de los cien reactivos. ¡Está bien !

* Actividad No. 7 - Los Números Aleatorios

Se utiliza rhyper() de los paquetes estadísticos de R

Con el último ejercicio se generan números aleatorios

# Inicializando Valores
paste("Valor de N: ", N)

## [1] "Valor de N:  100"

paste("Valor de n: ", n)

## [1] "Valor de n:  3"

paste("Valor de r: ", r)

## [1] "Valor de r:  50"

paste("Variable x: desde 0:",n)

## [1] "Variable x: desde 0: 3"

Se generan números aleatorios:

aleatorios <- rhyper(nn = N, m = r, n = N-r, k = n)
aleatorios

##   [1] 1 3 1 3 2 2 0 2 0 3 2 2 1 2 2 1 2 1 2 1 2 2 2 2 1 3 2 2 0 0 1 2 1 2 2 1 2
##  [38] 1 0 1 1 2 0 0 2 2 0 2 2 0 1 0 1 1 1 3 1 1 1 2 1 2 1 3 2 3 1 3 1 2 1 1 2 2
##  [75] 1 2 1 2 0 1 1 2 1 2 3 1 2 0 2 2 2 1 1 2 0 3 1 1 1 2

La media aritmética es similar al valor esperado

mean(aleatorios)

## [1] 1.47

resultado$VE

## [1] 1.5

* Determinar x a partir de F(x)

Se utiliza qhyper() de los paquetes estadísticos de R

¿Cual es el valor de x a una probabilidad acumulada del 50%

qhyper(p = 0.50, m = r, n = N-r, k = n)

## [1] 1

Con la funció plotly()

  g.plotly <- plot_ly(
    x = c(0:n),
    y = c(phyper(q = 0:n, m = r, n = N-r, k = n)),
    type = "scatter" ,
    mode = "lines") %>%
    layout(title = "Distribución binomial",
           xaxis = list(title = "x's"), 
           yaxis = list(title = "Función de Prob. f(X)")
    )
  g.plotly

* Análisis Crítico De Los Datos Obtenidos

* Interpretación De La Práctica

En este caso se representó un histograma para una serie de datos simulados que representan una dsitribución hipergeométrica.

La distribución hipergeométrica es un modelo de probabilidad utilizado para calcular la probabilidad de obtener un determinado número de aciertos en una muestra de tamaño fijo extraída de un conjunto mayor, también de tamaño fijo, formado por elementos acertados y no acertados.

Esta distribución es particularmente importante en las estadísticas, donde se utiliza para analizar una amplia gama de problemas, incluida la calidad de los controles de fábrica y el cálculo de las tasas de mutación en las poblaciones.

Una de las aplicaciones más importantes de la distribución hipergeométrica es el control de calidad en las fábricas. Los fabricantes usan esta distribución para estimar cuántas piezas defectuosas esperar en una muestra de un tamaño determinado para determinar la calidad de ese producto. Por ejemplo, un fabricante de televisores puede medir la calidad de sus componentes seleccionando muestras de televisores de un lote determinado y comprobando el número de piezas defectuosas.

En conclusión, la distribución hipergeométrica es un modelo de probabilidad importante que tiene una amplia gama de aplicaciones en la vida cotidiana. Desde el control de calidad en las fábricas hasta la evaluación de la efectividad de los tratamientos médicos y genéticos, las distribuciones hipergeométricas ayudan a los investigadores y profesionales de todo el mundo a comprender mejor las probabilidades inherentes de las situaciones que enfrentan todos los días.

* Referencias Bibliográficas

Levine, D. M. (2010) Estadística para administración y economía. (7ª. ed.) México : Pearson Educación.
Mendenhall, W. (2010). Introducción a la Probabilidad y Estadística. (13ª. ed.) México: Cengage Learning.
Montgomery, D. C. (2011). Probabilidad y estadística aplicadas a la ingeniería. (2ª. ed.) México : Limusa: Wiley.
Quezada, L. (2010). Estadística para ingenieros. México : Empresa Editora Macro.

U4C18 - La Distribución Hipergeométrica

Cristopher Joshua Reyes Gutiérrez

2023-05-07

Los Objetivos De La Práctica

* El Objetivo General De La Práctica

* Los Objetivos Específicos De La Práctica

* Investigaciones Pertinentes

* La Probabilidad

* Las Variables Estadísticas

Los Tipos De Variables Estadísticas

* Las Variables Aleatorias

* Las Distribuciones De Probabilidad

* Los Diferentes Tipos De Distribuciones De Probabilidad

* La Distribución De Probabilidad Hipergeométrica

* La Fórmula De Función De Probabilidad

* Algunos Ejemplos De Distribución Hipergeométrica

* Actividad No. 1 - Ejercicio De Canicas

* Actividad No. 2 - Barajas Españolas

Ejemplo 3: Lotes de componentes

* Desarrollo Metodológico De La Práctica

* Actividad No. 1 - Importar E Implementar Las Librerías

* Actividad No. 2 - Importar E Implementar Las Funciones Previamente Codificadas

* Actividad No. 3 - Ejercicio De La Fabrica De Fusibles

* La Tabla De Probabilidad Desde 0 hasta 3

* La Gráfica De La Probabilidad

* La Probabilidad Desde 1 Hasta 3 Fusibles

* Utilizando Una Tabla De Distribución

* Utilizando La Función dhyper()

* La Probabilidad De Al Menos 3 Fusibles

* Utilizando La Tabla De Distribución

* Utilizando La Función sum(dhyper())

* Utilizando La Función phyper()

* El Valor Esperado

* La Varianza

* La Desviación Estándar

* Análisis E Interpretación Del Ejercicio

* Actividad No. 4 - Ejercicio De Los Lotes De Componentes

* La Tabla De Probabilidad

* La Gráfica De La Probabilidad

* La Probabilidad De Exactamente Un Componente Defectuoso

* # La Probabilidad De Al Menmos 3 Componentes Defectuoso

* El Valor Esperado

* ¿Cuál Es La Varianza y la Desviación Estándar?

* La Interpretación Del Ejercicio Correspondiente

* Actividad No. 5 - Ejercicio Los Articulos Defectuosos

* La Tabla De Distribución

* La Gráfica De Probabilidad

* La Probabilidad de tres defectuosos

* El Valor esperado

* La Varianza y Desviación Estándar

* La Interpretación Del Ejercicio Correspondiente

* Actividad No. 6 - Estudiantes De Leyes

* La Tabla de distribución

* La Gráfica de probabilidad

* La Probabilidad de que no apruebe

* La Probabilidad de que apruebe

* La Interpretación Del Ejercicio Correspondiente

* Actividad No. 7 - Los Números Aleatorios

* Determinar x a partir de F(x)

* Análisis Crítico De Los Datos Obtenidos

* Interpretación De La Práctica

* Referencias Bibliográficas