# Verificar, instalar y activar el paquete "tidyverse"if (!require(tidyverse)) {install.packages("tidyverse")}library(tidyverse)# Verificar, instalar y activar el paquete "kableExtra"if (!require(kableExtra)) {install.packages("kableExtra")}library(kableExtra)# Verificar, instalar y activar el paquete "readxl"if (!require(dplyr)) {install.packages("dplyr")}library(dplyr)
La distribución binomial es una herramienta fundamental en estadística que nos permite modelar y comprender eventos que siguen un patrón de resultados binarios, como éxito o fracaso, sí o no. En un contexto donde se realizan múltiples ensayos independientes con resultados dicotómicos, la distribución binomial emerge como una herramienta esencial para calcular probabilidades precisas.
Como mencionan (Johnson & Kuby, 2022) en su libro “Elementary Statistics”, la distribución binomial se caracteriza por dos parámetros clave: el número total de ensayos “n” y la probabilidad de éxito en cada ensayo “p”. A partir de estos parámetros, podemos determinar la probabilidad de obtener un número específico de éxitos en los ensayos utilizando la fórmula de probabilidad binomial.
Esperamos que al finalizar este trabajo, los lectores tengan una comprensión sólida del concepto básico de la distribución binomial, así como una idea clara de cómo se aplican en la práctica
3Distribucion Binomial
Esta distribución es útil para modelar situaciones donde se repite un experimento un número fijo de veces, y nos interesa saber cuántas veces ocurre un resultado específico (éxito). Por ejemplo, lanzar una moneda. norteveces y contar cuantas veces sale cara.
Casi siempre que un investigador se pregunta por la proporción de individuos que verifican una cierta característica dicotómica (estar enfermo o no, ser varón o no, etc.) subyace en el problema una distribución Binomial. Si de una población se toma una muestra de tamaño n y se anota el número X de individuos de ella que sí verifican la característica, entonces la variable aleatoria X sigue distribución Binomial. Asociada a si cada individuo sigue o no la característica de interés, aparece el término probabilidad/proporción (p) que denota la probabilidad de que el individuo presente la característica o la proporción de individuos que presentan la característica en la población. En consecuencia, esta distribución que se representa como B(n, p), puede verse como el número de éxitos en n repeticiones del experimento con probabilidad p, donde el éxito sería sí se verifica la condición y el experimento sería el hecho de comprobar si el individuo cumple la característica en cuestión. Con respecto al cálculo de probabilidades de una variable aleatoria con distribución Binomial, en R se distinguen cuatro funciones:
dbinom(x, size=n, prob=p) Devuelve el valor (valores) x de la función masa de probabilidad de una variable con distribución Binomial de parámetros n y p. La función masa de probabilidad es una función que caracteriza a las variables aleatorias discretas y que asigna una determinada probabilidad a cada uno de los valores de la variable.
pbinom(x, size=n, prob=p, lower.tail = TRUE) Calcula el valor (valores) x de la función de distribución de una distribución Binomial de parámetros n y p. Se define la función de distribución de la variable aleatoria X como la probabilidad de que X tome un valor menor o igual que x, es decir, Calcula el valor (valores) x de la función de distribución de una distribución Binomial de parámetros n y p. Se define la función de distribución de la variable aleatoria X como la probabilidad de que X tome un valor menor o igual que x, es decir, P\left[ X \leq x \right] R calcula P\left[ X > x \right] lo cual ya no sería la función de distribución.
qbinom(a, size=n, prob=p, lower.tail = TRUE) Determina el cuantil (cuantiles) de una variable con distribución Binomial de parámetros n y p. Por definición, un cuantil es aquel que deja a su izquierda una proporción de valores a, es decir, es aquel valor q tal que ( P(X \leq q) = a .
qbinom(a, size=n, prob=p, lower.tail = TRUE) Determina el cuantil (cuantiles) de una variable con distribución Binomial de parámetros n y p. Por definición, un cuantil es aquel que deja a su izquierda una proporción de valores a, es decir, es aquel valor q tal que P\left( X \leq q \right) = a.
rbinom(r, size=n, prob=p) Genera r Valores aleatorios de unaa distribución Binomial, B(n,p).
La Distribucion Binominal
Esta conformada por n repeticiones independientes de un experimento de Bernoulli.
Se dice que una V.A.D. X que asume valores 0, 1, \ldots, n tiene una distribución binomial con parámetros n y \pi, lo que se escribe:
X Bin(n,), si la f.m.p. de X está dada por:
f(x; n, \pi) =\begin{cases}\binom{n}{x} \pi^{x} (1 - \pi)^{\,n-x}, & \text{si } x = 0, 1, \ldots, n; \\0, & \text{en otro caso}.\end{cases}
donde n es un entero positivo y \pi es un número real tal que 0 < \pi < 1
Cuando n = 1, la coincide con la de parámetro \pi, lo que se escribe:
Si X sigue una distribución binomial B(n,\pi), entonces:
P(X = k) =dbinom(k,n,p)
P(X \leq k) =pbinom(k,n,p)
q_a = \min \left\{ x : P(X \leq x) \geq a \right\} =qbinom(a,n,p)
rbinom(m, n, p) genera m valores aleatorios con esta distribución.
La distribución normal es una distribución de probabilidad continua que es fundamental en estadística. También se conoce como distribución de Gauss o distribución gaussiana. Tiene una forma simétrica en forma de campana, donde la mayoría de los datos se agrupan alrededor de un valor central, llamado media. La distribución normal está completamente definida por dos parámetros: la media micras micrasy la desviación estándar σ.
Características principales de la distribución normal:
La media, mediana y moda coinciden y están en el centro de la distribución.
Es simétrica respecto a la media.
El área total bajo la curva es 1, representando la probabilidad total.
Aproximadamente el 68% de los valores están dentro de una desviación estándar de los medios, el 95% dentro de dos desviaciones estándar y el 99,7% dentro de tres desviaciones estándar.
La fórmula de la función de densidad de la distribución Normal,
Además, la notación para decir que una variable aleatoria X sigue una distribución normal con media \mu y varianza \sigma^{2} es X \sim N(\mu, \sigma^{2})
6 .Ejercicios
Un investigador científico informa que unos ratones vivirán un promedio de 40 meses cuando sus dietas se restringen drásticamente y después se enriquecen con vitaminas y proteínas. Suponiendo que la vida de tales ratones se distribuye normalmente con una desviación estándar de 6.3 meses, encuentre la probabilidad de que un ratón dado vivirá:
Una máquina expendedora de bebidas gaseosas se regula para que sirva un promedio de 200 mililitros por vaso. Si la cantidad de bebida se distribuye normalmente con una desviación estándar igual a 15 mililitros:
¿qué fracción de los vasos contendrá más de 224 mililitros?
Un abogado viaja todos los días de su casa en los suburbios a su oficina en el centro de la ciudad. El tiempo promedio para un viaje sólo de ida es 24 minutos, con una desviación estándar de 3.8 minutos. Suponga que la distribución de los tiempos de viaje está distribuida normalmente.
¿Cuál es la probabilidad de que un viaje tome al menos 1/2 hora?
Ver código
pnorm(30, 24, 3.8, lower.tail =FALSE)
[1] 0.05717406
Si la oficina abre a las 9:00 A.M. y él sale diario de su casa a las 8:45 A.M., ¿qué porcentaje de las veces llegará tarde al trabajo?
Ver código
media <-24desviacion <-3.8tiempo_disponible <-15prob_tarde <-1-pnorm(15, mean =24, sd =3.8)prob_tarde
[1] 0.9910679
Si sale de su casa a las 8:35 A.M. y el café se sirve en la oficina de 8:50 A.M. a 9:00 A.M., ¿cuál es la probabilidad de que se pierda el café?
Ver código
valor3 <-25pnorm(25, 24, 3.8, lower.tail =FALSE)
[1] 0.3962144
Encuentre la longitud de tiempo por arriba de la cual encontramos el 15% de los viajes más lentos.
Ver código
a <-0.15qnorm( a, 24, 3.8)
[1] 20.06155
Encuentre la probabilidad de que 2 de los siguientes 3 viajes tomen al menos 1/2 hora.
Probabilidad de que un viaje dure AL MENOS 30 min (X >= 30)
Ver código
media <-24desviacion <-3.8tiempo <-30p <-1-pnorm(30, mean =24, sd =3.8)p
[1] 0.05717406
Probabilidad de que EXACTAMENTE 2 de 3 viajes duren >= 30 min
La vida promedio de cierto tipo de motor pequeño es de 10 años con una desviación estándar de 2 años. El fabricante reemplaza gratis todos los moores que fallen dentro del periodo de garantía. Si él está dispuesto a reemplazar sólo 3% de los motores que fallan, ¿cuánto tiempo de garantía debería ofrecer? Suponga que la duración de un motor sigue una distribución normal.
Una compañía paga a sus empleados un salario promedio de $15.90 por hora con una desviación están- dar de $1.50. Si los salarios se distribuyen aproximadamente de forma normal y se pagan al centavo más cercano:
a)¿qué porcentaje de los trabajadores reciben salarios entre $13.75 y $16.22 inclusive por hora?
Ver código
media <-15.90desv <-1.50valor1 <-16.22valor2 <-13.75
``r} nables you to weave together content and executable code into a finished document. To learn more about Quarto see <https://quarto.org>.
6.5 Running Code
When you click the Render button a document will be generated that includes both content and the output of embedded code. You can embed code like this:
You can add options to executable code like this
[1] 4
The echo: false option disables the printing of code (only output is displayed).
Referencias
Wickham, Hadley, Mara Averick, Jennifer Bryan, Winston Chang, Lucy D’Agostino McGowan, Romain François, Garrett Grolemund, et al. 2019. «Welcome to the tidyverse» 4: 1686. https://doi.org/10.21105/joss.01686.