Distribuciones de probabilidad para variables discretas
La distribución de probabilidad de una variable aleatoria es una función que asigna a cada suceso definido sobre la variable, la probabilidad de que dicho suceso ocurra. Está definida sobre el conjunto de todos los sucesos y cada uno de los sucesos es el rango de valores de la variable aleatoria.
Es aquella cuyo valor es el resultado de un evento aleatorio.
Es aquella que solo toma ciertos valores de manera discontinua (números enteros).
Es aquella que generalmente depende de una medición y puede tomar cualquier valor. Generalmente se evalúa en un intervalo.
Función de probabilidad solo toma valores positivos en un conjunto de valores de X, que es finito o numerable.
A esta función se le denomina Función de Masa de Probabilidad, que corresponde a una función matemática que describe la probabilidad de todos los valores de una variable aleatoria.
\[f(x)=P(X=x)\]
\[f(x) ≥ 0\] para todo los valores de la variable x.
\[\sum f(x)=1\]
Distribución de probabilidad para variables aleatorias discretas donde cada resultado es igualmente probable.
Una variable aleatoria sigue una distribución uniforme discreta si toma un número finito de valores igualmente espaciados con igual probabilidad.
Sea X una variable aleatoria que toma valores en \(\{x_1, x_2, ..., x_N\}\) con igual probabilidad, entonces:
\[X \sim U(N)\]
La función de masa de probabilidad (FMP) está dada por:
\[P(X = x) = \begin{cases} \frac{1}{N} & \text{si } x = 1, 2, ..., N \\ 0 & \text{en otro caso} \end{cases}\]
La función de distribución acumulada (FDA) está dada por:
\[\begin{equation} F(x)= \begin{cases} 0 & \text{si } x<1 \\[6pt] \dfrac{\lfloor x \rfloor}{N} & \text{si } 1 \le x < N \\[8pt] 1 & \text{si } x \ge N \end{cases} \end{equation}\]
donde \(\lfloor x \rfloor\) es la parte entera de x
Propiedades:
\[0 \leq F(x) \leq 1\]
\[F(x_j) \geq F(x_i)\] si \[x_j \geq x_i\]
Se lanza un dado justo de 6 caras. ¿Cuál es la probabilidad de obtener un número menor o igual a 4?
X: Resultado del lanzamiento del dado
R(X) = {1,2,3,4,5,6}
X ~ U(6)
\[P(X \leq 4) = \frac{4}{6} = \frac{2}{3} = 0.6667\]
\[E[X] = \frac{N+1}{2}\]
Para el dado:
\[E[X] = \frac{6+1}{2} = 3.5\]
\[V[X] = \frac{N^2 - 1}{12}\]
Para el dado:
\[V[X] = \frac{6^2 - 1}{12} = \frac{35}{12} \approx 2.92\]
Distribución de probabilidad para variables aleatorias discretas que toman solo dos valores: éxito (1) o fracaso (0).
Una variable aleatoria sigue una distribución de Bernoulli si toma los valores 1 con probabilidad p y 0 con probabilidad (q = 1 - p).
Sea X una variable aleatoria que toma valores en \(\{0,1\}\) con probabilidades dadas por:
\[X \sim Bernoulli(p)\]
La función de masa de probabilidad (FMP) está dada por:
\[f(x) = \begin{cases} p & \text{si } x = 1 \\ q = 1 - p & \text{si } x = 0 \\ 0 & \text {en otro caso} \end{cases}\]
La función de distribución acumulada (FDA) está dada por:
\[F(x) = P(X \leq x) = \begin{cases} 0 & \text{si } x < 0 \\ 1 - p & \text{si } 0 \leq x < 1 \\ 1 & \text{si } x \geq 1 \end{cases}\]
Se lanza una moneda con probabilidad de cara igual a 0.7. ¿Cuál es la probabilidad de obtener cara?
X: Resultado del lanzamiento (1 si es cara, 0 si es cruz)
R(X) = {0,1}
X ~ Bernoulli(0.7)
\[P(X = 1) = 0.7\]
dbern <- function(x, p) ifelse(x == 1, p, 1 - p)
dbern(1, 0.7)
[1] 0.7
\[E[X] = p\]
Para la moneda:
\[E[X] = 0.7\]
\[V[X] = p(1 - p)\]
Para la moneda:
\[V[X] = 0.7 \times 0.3 = 0.21\]
Distribución de probabilidad para variables aleatorias discretas que satisfacen las condiciones de un experimento Binomial
Un experimento binomial tiene las siguientes características:
Una variable aleatoria Binomial cuenta el número de éxitos obtenidos en un experimento Binomial
X: Número de éxitos obtenidos en una secuencia de n ensayos
El rango (espacio muestral) de X es entonces: {0,1,2,…,n}
\[X \sim Binomial(n;p)\]
\[f(x)=\begin{cases}{\displaystyle\binom{n}{x}{p^x}{(1-p)^{n-x}}}&{\text{si } x\in{\left\{{0,1,2,...,n}\right\}}}\\0 & \text{en otro caso}& \end{cases}\]
donde \[\binom{n}{x} = \frac{n!}{(n-x)!x!}\]
y
\[n! = 1*2*3*4*...*n\]
Función matemática que describe la probabilidad acumulada de todos los valores de una variable.
\[F(x) = P(X \le x) = \sum_{x=0}^k{\binom{n}{x}{p^x}{(1-p)^{n-x}}}\]
Propiedades:
\[0 ≤ F(x) ≤ 1\]
\[F(x_i) ≥ F(x_j)\]
si
\[x_i ≥ x_j\]
\[P (x > x_i) = 1 - F(x_i)\]
El 20% de las personas de una población fuman. Si se seleccionan aleatoriamente 10 personas de esta población,
X: Número de personas que fuman en la muestra
R(X):{0,1,2,3,4,5,6,7,8,9,10}
X~Binomial(10 , 0.2)
Se cumplen todas características de un experimento binomial
\[P(X=2) = \displaystyle\binom{10}{2}{(0.2)^2(1-0.2)^{10-2}}\]
\[\binom{10}{2} = \frac{10!}{(10-2)!2!} = \frac{1*2*3*4*5*6*7*8*9*10}{1*2*3*4*5*6*7*8*1*2} = \frac{9*10}{2}=45\]
\[P(X=2) = \displaystyle 45*0.04*0.167772 = 0.30199\]
En R:
dbinom(2 , 10 , 0.2)
[1] 0.3019899
\[ P(X \leq 2) = P(X = 0) + P(X = 1) + P(X = 2) \]
\[ P(X = 0) = \binom{10}{0} (0.2)^0 (0.8)^{10} = 1 \times 1 \times 0.1074 = 0.1074 \]
\[ P(X = 1) = \binom{10}{1} (0.2)^1 (0.8)^9 = 10 \times 0.2 \times 0.1342 = 0.2684 \]
\[ P(X \leq 2) = 0.1074 + 0.2684 + 0.3020 = 0.6778 \]
pbinom(2 , 10 , 0.2)
[1] 0.6777995
\[ P(X \geq 4) = 1 - P(X \leq 3) \]
\[ P(X = 3) = \binom{10}{3} (0.2)^3 (0.8)^7 = 120 \times 0.008 \times 0.2097 = 0.2013 \]
\[ P(X \leq 3) = 0.6778 + 0.2013 = 0.8791 \]
\[ P(X \geq 4) = 1 - 0.8791 = 0.1209 \]
1-pbinom(3, 10 , 0.2)
[1] 0.1208739
\[ P(2 \leq X \leq 4) = P(X = 2) + P(X = 3) + P(X = 4) \]
\[ P(X = 4) = \binom{10}{4} (0.2)^4 (0.8)^6 = 210 \times 0.0016 \times 0.2621 = 0.08807 \]
\[ P(2 \leq X \leq 4) = 0.3020 + 0.2013 + 0.0881 = 0.5914 \]
\[E[X]=np\]
\[E[X]=10*0.2 = 2\]
\[V[X]=np(1−p)\]
\[V[X]=10*0.2*0.8 = 1.6\]
Una institución hospitalaria de tercer nivel afirma que con una nueva técnica quirúrgica realizada en sus salas de cirugía se produce una mejora del 60 en los pacientes a quienes se les realiza cirugía de corazón abierto Si se aplica esta técnica a 15 pacientes enfermos
Se tiene una distribución binomial con:
- \(n = 15\)
- \(p = 0.6\)
- \(q = 1 - p = 0.4\)
\[ P(X = 5) = \binom{15}{5} (0.6)^5 (0.4)^{10} = 3003 \times 0.07776 \times 0.00010486 = 0.0244 \]
dbinom(5, size = 15, prob = 0.6)
[1] 0.02448564
Significa que máximo dos pacientes mejoren, por lo que debemos calcular la probabilidad de que 0, 1 o 2 pacientes mejoren.
\[ P(X \leq 2) = P(X = 0) + P(X = 1) + P(X = 2) \]
\[ P(X = 0) = \binom{15}{0} (0.6)^0 (0.4)^{15} = 1 \times 1 \times 0.000107 = 0.0000011 \]
\[ P(X = 1) = \binom{15}{1} (0.6)^1 (0.4)^{14} = 15 \times 0.6 \times 0.000267 = 0.0000242 \]
\[ P(X = 2) = \binom{15}{2} (0.6)^2 (0.4)^{13} = 105 \times 0.36 \times 0.000668 = 0.0002537 \]
\[ P(X \leq 2) = 0.0000011 + 0.0000242 + 0.0002537 = 0.000279 \]
pbinom(2, size = 15, prob = 0.6)
[1] 0.0002789044
Es el complemento de la probabilidad de que a lo sumo dos mejoren:
\[ P(X \geq 3) = 1 - P(X \leq 2) = 1 - 0.000279 = 0.999721 \]
1 - pbinom(2, size = 15, prob = 0.6)
[1] 0.9997211
En un centro de salud se encuentra que las citologías tienen una probabilidad del 3% de tener resultado insatisfactorio Si se realiza el tamizaje a un grupo de 7 mujeres
Se tiene:
\(n = 7\) (número de mujeres)
\(p = 0.03\) (probabilidad de citología insatisfactoria)
\[ P(X = 0) = \binom{7}{0} (0.03)^0 (0.97)^7 = 0.807983 \]
dbinom(0, size = 7, prob = 0.03)
[1] 0.8079828
\[ P(X \geq 2) = 1 - P(X = 0) - P(X = 1) \]
\[ P(X = 1) = \binom{7}{1} (0.03)^1 (0.97)^6 = 7 \times 0.03 \times 0.8387 = 0.17492 \]
\[ P(X \geq 2) = 1 - 0.807983 - 0.17492 = 0.017097 \]
1 - pbinom(1, size = 7, prob = 0.03)
[1] 0.01709303
\[ P(X \leq 3) = P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) \]
\[ P(X = 2) = \binom{7}{2} (0.03)^2 (0.97)^5 = 21 \times 0.0009 \times 0.8573 = 0.01623 \]
\[ P(X = 3) = \binom{7}{3} (0.03)^3 (0.97)^4 = 35 \times 0.000027 \times 0.8823 = 0.00084 \]
\[ P(X \leq 3) = 0.807983 - 0.17492 + 0.01623 + 0.00084 = 0.999973 \]
pbinom(3, size = 7, prob = 0.03)
[1] 0.9999736
Un laboratorio afirma que una droga causa efectos secundarios en 1 de cada 100 pacientes Para contrastar esta afirmación, otro laboratorio elige al azar a 20 pacientes a los que aplica la droga ¿Cuál es la probabilidad de que por lo menos 5 pacientes presenten efectos secundarios?
\[ P(X \geq 5) = 1 - P(X \leq 4) = 1 - \left[ P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) + P(X = 4) \right] \]
\[ P(X = 0) = \binom{20}{0} (0.01)^0 (0.99)^{20} = 1 \times 1 \times (0.99)^{20} = 0.8179 \]
\[ P(X = 1) = \binom{20}{1} (0.01)^1 (0.99)^{19} = 20 \times 0.01 \times (0.99)^{19} = 20 \times 0.01 \times 0.8264 = 0.16523 \]
[ P(X = 2) = (0.01)^2 (0.99)^{18} = (0.01)^2 (0.99)^{18} = 190 = 0.015856
]
\[ P(X = 3) = \binom{20}{3} (0.01)^3 (0.99)^{17} = \frac{20!}{3!(17!)} \times (0.01)^3 \times (0.99)^{17} = 1140 \times 0.000001 \times 0.8431 = 0.000961 \]
\[ P(X = 4) = \binom{20}{4} (0.01)^4 (0.99)^{16} = \frac{20!}{4!(16!)} \times (0.01)^4 \times (0.99)^{16} = 4845 \times 0.00000001 \times 0.8523 = 0.0000413 \]
\[ P(X \leq 4) = 0.8179 + 0.16523+ 0.015856 + 0.00096 + 0.000041 = 0.999987 \]
Finalmente,
\[ P(X \geq 5) = 1 - 0.999987 \]
\[ P(X \geq 5) = 0.0000014 \]
Dada la siguiente función de densidad:
| x | -2 | -1 | 0 | 1 | 2 |
|---|---|---|---|---|---|
| f(x) | 0.1 | 0.2 | 0.3 | 0.2 | 0.2 |
Calcular la esperanza matemática \(E(X)\) y la media \(\mu\).
La esperanza matemática se define como:
\[ E(X) = \sum x_i f(x_i) \]
Sustituyendo los valores:
\[ E(X) = (-2 \times 0.1) + (-1 \times 0.2) + (0 \times 0.3) + (1 \times 0.2) + (2 \times 0.2) \]
\[ E(X) = -0.2 - 0.2 + 0 + 0.2 + 0.4 = 0.2 \]
Por lo tanto, \(E(X) = 0.2\) y \(\mu = 0.2\).
datos <- data.frame(
x = c(-2, -1, 0, 1, 2),
fx = c(0.1, 0.2, 0.3, 0.2, 0.2)
)
E_X <- sum(datos$x * datos$fx)
E_X
[1] 0.2
El valor esperado \(E(X)\) representa la media de la variable aleatoria \(X\), que en este caso es también \(\mu = 0.2\).
Dada la densidad:
| x | 1 | 2 | 3 | 4 | 5 |
|---|---|---|---|---|---|
| f(x) | 0.1 | 0.15 | 0.5 | 0.15 | 0.1 |
Se desea calcular el número promedio de hembras adultas y su desviación estándar.
La esperanza matemática se calcula como:
\[ E(X) = \sum x_i f(x_i) \]
\[ E(X) = (1 \times 0.1) + (2 \times 0.15) + (3 \times 0.5) + (4 \times 0.15) + (5 \times 0.1) \]
\[ E(X) = 0.1 + 0.3 + 1.5 + 0.6 + 0.5 = 3 \]
La varianza se calcula como:
\[ Var(X) = \sigma^2 = E[(X−\mu^2)] =𝐸[X^2]−𝐸[X]^2 \]
\[ E(X^2)= \sum x_i^2 f(x_i) = (1^2 \times 0.1) + (2^2 \times 0.15) + (3^2 \times 0.5) + (4^2 \times 0.15) + (5^2 \times 0.1) = 0.1 + 0.6 + 4.5 + 2.4 + 2.5 = 10.1 \]
\[ Var(X) = 10.1 - 3^2 = 10.1 - 9 = 1.1 \]
Desviación estándar:
\[ \sigma = \sqrt{1.1} \approx 1.05 \]
datos <- data.frame(
x = c(1, 2, 3, 4, 5),
fx = c(0.1, 0.15, 0.5, 0.15, 0.1)
)
E_X <- sum(datos$x * datos$fx)
E_X
[1] 3
Var(X) = E(X^2) - E(X)^2
VarX <- sum(datos$x^2 * datos$fx) - E_X^2
VarX
[1] 1.1
Sd(X)
SDX <- sqrt(VarX)
SDX
[1] 1.048809
Se lanza un par de dados y se registra la suma de las puntuaciones obtenidas. Hallar la función de probabilidad, la esperanza y la varianza.
Las sumas posibles y sus probabilidades son:
| Suma | Probabilidad |
|---|---|
| 2 | 1/36 |
| 3 | 2/36 |
| 4 | 3/36 |
| 5 | 4/36 |
| 6 | 5/36 |
| 7 | 6/36 |
| 8 | 5/36 |
| 9 | 4/36 |
| 10 | 3/36 |
| 11 | 2/36 |
| 12 | 1/36 |
La esperanza matemática es:
\[ E(X) = \sum x_i f(x_i) \]
Sustituyendo valores:
\[ E(X) = \frac{2}{36} + \frac{6}{36} + \frac{12}{36} + \frac{20}{36} + \frac{30}{36} + \frac{42}{36} + \frac{40}{36} + \frac{36}{36} + \frac{30}{36} + \frac{22}{36} + \frac{12}{36} = \frac{252}{36} = 7 \]
\[ E(X) = 7 \]
La varianza se calcula como:
\[ Var(X) = \sum x_i^2 f(x_i) - [E(X)]^2 \]
\[ E(X^2) = \frac{2*2}{36} + \frac{6*3}{36} + \frac{12*4}{36} + \frac{20*5}{36} + \frac{30*6}{36} + \frac{42*7}{36} + \frac{40*8}{36} + \frac{36*9}{36} + \frac{30*10}{36} + \frac{22*11}{36} + \frac{12*12}{36} \]
\[ E(X^2) = \frac{4}{36} + \frac{18}{36} + \frac{48}{36} + \frac{100}{36} + \frac{180}{36} + \frac{294}{36} + \frac{320}{36} + \frac{324*9}{36} + \frac{300}{36} + \frac{242}{36} + \frac{144}{36} = \frac{1974}{36} = 54.833 \]
\[ Var(X) = 54.833 - 49 = 5.833 \]
\(Var(X) \approx 5.833\)
\(\sigma \approx 2.415\)
# Valores de la suma de los dados y sus probabilidades
dados <- data.frame(
suma = 2:12,
prob = c(1,2,3,4,5,6,5,4,3,2,1) / 36
)
# Cálculo de la esperanza y la varianza
E_dados <- sum(dados$suma * dados$prob)
Var_dados <- sum(dados$suma^2 * dados$prob) - E_dados^2
SD_dados <- sqrt(Var_dados)
# Resultados
list(E_dados = E_dados, Var_dados = Var_dados, SD_dados = SD_dados)
$E_dados
[1] 7
$Var_dados
[1] 5.833333
$SD_dados
[1] 2.415229
Se puede observar que la esperanza es 7 y la desviación estándar es aproximadamente 2.42.
A la consulta del programa de paciente crónico (diagnóstico de diabetes o hipertensión arterial) llegan en total 30 pacientes, de los cuales 16 son diabéticos. Si se seleccionan 13 al azar:
La probabilidad de que un paciente seleccionado sea diabético es:
\[ p = \frac{k}{n} = \frac{16}{30} \approx 0.5333 \]
Si X representa el número de diabéticos seleccionados en la muestra de n = 13, entonces:
\[ X \sim \text{Binomial}(n=13, p=0.5333) \]
(a) Probabilidad de que máximo 7 sean diabéticos
Esto es \(P(X \leq 7)\), que se obtiene sumando:
\[ P(X \leq 7) = \sum_{k=0}^{7} P(X = k) = P(X = 0) + P(X = 1) + P(X = 2) + \ldots + P(X = 7) \]
\[ P(X=0) = 0.000005 \]
\[ P(X=1) = 0.00074 \]
\[ P(X=2) = 0.005075 \]
\[ P(X=3) = 0.021265 \]
\[ P(X=4) = 0.060748 \]
\[ P(X=5) = 0.12495 \]
\[ P(X=6) = 0.19038 \]
\[ P(X=7) = 0.217543 \]
\[ P(X \leq 7) = 0.000005 + 0.00074 + 0.005075 + 0.021265 + 0.060748 + 0.12495 + 0.19038 + 0.217543 = 0.6207 \]
pbinom(7, 13, 0.5333)
[1] 0.6207475
(b) Probabilidad de que al menos 10 sean diabéticos
\[ P(X \geq 10) = 1 - P(X \leq 9) \]
1 - pbinom(9, 13, 0.5333)
[1] 0.074453
Un estudio realizado en Estados Unidos informó que el 25,7% de personas adultas tienen sobrepeso. Si se extrae una muestra aleatoria de 20 adultos:
\(X \sim \text{Bin}(n=20, p=0.257)\)
\[ P(X = 4) = \binom{20}{4} (0.257)^4 (1 - 0.257)^{16} = 4845 \times 0.257^4 \times 0.743^{16} = 0.1823 \]
dbinom(4, size = 20, prob =0.257)
[1] 0.1823255
\[ P(X \geq 3) = 1 - P(X \leq 2) \]
\[ P(X = 0) = \binom{20}{0} (0.257)^0 (1 - 0.257)^{20} = 1 \times 1 \times 0.2057 = 0.002629 \]
\[ P(X = 1) = \binom{20}{1} (0.257)^1 (1 - 0.257)^{19} = 20 \times 0.257 \times 0.7943 = 0.01819 \]
\[ P(X = 2) = \binom{20}{2} (0.257)^2 (1 - 0.257)^{18} = 190 \times 0.06605 \times 0.733 = 0.05976 \]
\[ P(X = 0) + P(X = 1) + P(X = 2) = 0.002629 + 0.01819 + 0.05976 = 0.08058 \]
\[ P(X \geq 3) = 1 - 0.0858 = 0.91942 \]
1 - pbinom(2, size = 20, prob = 0.257)
[1] 0.9194234
La probabilidad de que un visitador médico realice una venta en una visita es de 0,3. Determine la media y la varianza de esta variable, así como la probabilidad de que el visitador no realice ninguna venta
\(X \sim \text{Bin}(n=1, p=0.3)\)
Probabilidad de que el visitador no realice ninguna venta
dbinom(0, size = 1, prob = 0.3)
[1] 0.7
Valor Esperado (E(X))
10 * 0.3
[1] 3
Varianza (Var(X)
10 * 0.3 * 0.7
[1] 2.1
Un catador de vinos afirma que el 90% de las veces puede distinguir entre un vino fino y uno corriente con sólo degustar un sorbo. Para comprobar su afirmación, se le aplicará una pequeña prueba: degustar 9 muestras de vino y decidir en cada caso si se trata de vino fino o corriente. El criterio para aceptar su afirmación es que si acierta por lo menos en 6 muestras se aceptará su afirmación, y en caso contrario se rechazará como falsa. Determine la probabilidad de aun suponiendo que es cierto lo que afirma (que es capaz de acertar el 90% de las veces), no logre pasar la prueba.
P(X<6)
pbinom(5, size = 9, prob = 0.9)
[1] 0.008331094
Un examen de estadística consta de 5 preguntas cada una de ellas con cuatro respuestas de las cuales una sola es correcta. Un alumno responde al azar (es decir, sin tener la menor idea sobre las preguntas). ¿Cuál es la probabilidad de que resuelva bien a 3 o más preguntas?
1 - pbinom(2, size = 5, prob = 0.25)
[1] 0.1035156
Un jugador de baloncesto lanza un tiro libre a una canasta. Si del historial deportivo del jugador se sabe que encesta el 80% de las veces, determine la probabilidad de que no enceste el tiro. Además, calcule la media y la varianza.
dbinom(0, size = 1, prob = 0.8)
[1] 0.2
Valor Esperado (E(X))
1 * 0.8
[1] 0.8
Variante (Var(X))
1 * 0.8 * 0.2
[1] 0.16
Los pacientes que se someten a una cirugía de reemplazo de cadera tienen una probabilidad de morir del 0,18. Si se toma una muestra aleatoria de 10 pacientes:
1 - pbinom(6, size = 10, prob = 0.18)
[1] 0.0004400767
pbinom(4, size = 10, prob = 0.18)
[1] 0.9786771
dbinom(2, size = 10, prob = 0.18)
[1] 0.2980357
La distribución Hipergeométrica modela el número de éxitos en una muestra de tamaño fijo extraída sin reemplazo de una población finita.
Función de Masa de Probabilidad (PMF): \[ P(X = x) = \frac{\binom{k}{x} \binom{N-k}{n-x}}{\binom{N}{n}} \]
Función de Distribución Acumulada (CDF): \[ F(X = x) = \sum_{i=0}^{x} P(X = i) \]
Ejemplo 1:
En una empresa farmacéutica diariamente se producen 90 unidades de cierto medicamento, de las cuales generalmente 6 no cumplen con los requerimientos de cierto tratamiento. Se examina en un día cualquiera una muestra de 7 unidades. Hallar la probabilidad de:
Sea X el número de unidades que cumplen los requerimientos:
\[P(X = 5) = \frac{\binom{6}{2} \binom{84}{5}}{\binom{90}{7}} = \frac{15 \times 30872016}{7471375560} = 0.06198\]
-¿Cuál es la probabilidad de obtener a lo más 4 unidades defectuosas?
Sea Y el número de unidades defectuosas, entonces:
\[P(Y \leq 4) = P(Y = 0) + P(Y = 1) + P(Y = 2) + P(Y = 3) + P(Y = 4)\] \[P(Y \leq 4) = \frac{\binom{6}{0} \binom{84}{7}}{\binom{90}{7}} + \frac{\binom{6}{1} \binom{84}{6}}{\binom{90}{7}} + \frac{\binom{6}{2} \binom{84}{5}}{\binom{90}{7}} + \frac{\binom{6}{3} \binom{84}{4}}{\binom{90}{7}} + \frac{\binom{6}{4} \binom{84}{3}}{\binom{90}{7}}\] \[P(Y \leq 4) = 0.60623 + 0.32643 + 0.06198 + 0.005165 + 0.0001913 + 0.0000028 + 0.000000011 = 0.99999\]
Cálculo en R:
Sea Y el número de unidades defectuosas, entonces:
\[P(Y \geq 2) = 1 - P(Y < 2) = 1 - P(Y = 0) - P(Y = 1) = 1 - 0.60623 + 0.32643 = 0.06734\]
Cálculo en R:
Ejemplo 2:
A una consulta de medicina interna asisten 50 pacientes, 30 de ellos con HTA de novo y 20 con HTA secundaria (compromiso renal por nefropatía diabética) Si se seleccionan 4 pacientes al azar ¿Cuál es la probabilidad de que por lo menos 2 pacientes tengan HTA secundaria?
La distribución hipergeométrica se define como:
Sea X el número de pacientes con HTA secundaria en la muestra de 4 pacientes, entonces:
\[P(X \geq 2) = 1 - P(X \le 1) = 1 - \frac{\binom{20}{0} \binom{30}{4}}{\binom{50}{4}} - \frac{\binom{20}{1} \binom{30}{3}}{\binom{50}{4}} = 1 - 0.119 - 0.3526 = 0.5284\]
Cálculo en R:
Equivalente a:
En una sala de urgencia se encuentran 20 personas: 14 hombres y 6 mujeres. Si se eligen 3 personas al azar, ¿Cuál es la probabilidad de que las 3 sean mujeres?
Sea X el número de mujeres en la muestra de 3 personas, entonces:
\[P(X = 3) = \frac{\binom{14}{0} \binom{6}{3}}{\binom{20}{3}} = \frac{1 \times 20}{1140} = 0.017544\]
dhyper(3, 6, 14, 3)
[1] 0.01754386
Valor Esperado y Varianza: \[ E(X) = n \frac{k}{N}, \quad \text{Var}(X) = np(1-p)(\frac{N-n}{N-1}), \text{ donde } p = \frac{k}{N} \]
Dado \(N = 50\), \(K = 10\), \(n = 5\), calculemos la probabilidad de obtener exactamente 2 éxitos: \[ P(X = 2) = \frac{\binom{10}{2} \binom{40}{3}}{\binom{50}{5}} = \frac{45 \times 9880}{2118760} = 0.211 \]
dhyper(2, 10, 40, 5)
[1] 0.2098397
En general
N <- 50 # Tamaño de la población
K <- 10 # Número de éxitos en la población
n <- 5 # Tamaño de la muestra
x <- 0:n
prob <- dhyper(x, K, N-K, n)
cdf <- phyper(x, K, N-K, n)
plot(prob, names.arg = x, type="h", main = "Distribución Hipergeométrica")
Es una distribución de probabilidad para variables aleatorias discretas que involucran la observación de un conjunto discreto de sucesos en un intervalo continuo de espacio o tiempo.
Cuando la tasa promedio de ocurrencia de un evento es λ, la variable aleatoria Poisson cuenta el número de sucesos ocurridos durante un cierto “intervalo de observación”, el cual va a depender de una fracción de tiempo, una longitud o un espacio.
X = “Número de sucesos ocurridos en el intervalo de observación, dada una tasa promedio de ocurrencia de eventos en el intervalo de observación λ”.
El rango de la variable aleatoria X es {0,1,2,…,∞}
\[X \sim Poisson(\lambda)\]
\[f(x)=\begin{cases}{\displaystyle\frac{e^{-\lambda}{\lambda^x}}{x!}}&{\text{si } x\in{\left\{{0,1,2,...,\infty}\right\}}}\\0 & \text{en otro caso}& \end{cases}\]
\[F(x) = P(X \le x) = \sum_{x=0}^k{\frac{e^{-\lambda}{\lambda^x}}{x!}}\]
En una población se ha observado un número promedio anual de 12 muertes por cáncer de pulmón?
X=“Número de muertes por cáncer de pulmón en un año” R(X):{0,1,2,…} λ=12 número promedio de muertes por año X∼Poisson(12)
¿Cuál es la probabilidad de que en el presente año hayan exactamente 10 muertes por cáncer de pulmón?
\[P(x=10) = {\displaystyle\frac{e^{-12}{12^{10}}}{10!}} = 0.1048\]
dpois(10 , 12)
[1] 0.1048373
¿Cuál es la probabilidad que no más de 6 personas mueran durante el presente año por cáncer de pulmón?
ppois(6,12)
[1] 0.04582231
¿Cuál es la probabilidad que al menos 8 personas mueran durante el presente año por cáncer de pulmón?
1 - ppois(7,12)
[1] 0.9104955
¿Cuál es el número de muertes por debajo del cual se encuentra el 95% de las muertes por cáncer de pulmón en el presente año?
qpois(0,95,12)
[1] 0
Modela el número de fracasos antes de alcanzar un número fijo de éxitos en ensayos de Bernoulli.
Asumiendo que k corresponde al k-ésimo éxito y x es el valor de una variable aleatoria que representa el número de fracasos hasta observa exactamente k éxitos.
PMF: \[ P(X = x) = P(x; k,p) = \binom{k+x-1}{k-1} p^k (1 - p)^x \]
pero recordemos que n = x + k
Por lo tanto, se puede reescribir como:
PMF: \[ P(X = x) = P(x; k,p) = \binom{n-1}{k-1} p^k (1 - p)^{n-k} \]
Ejemplo
Se está encuestando a personas que salen de un puesto de votación y se les pregunta si votaron de manera independiente. La probabilidad de que una persona vote independiente es del 20% ¿Cuál es la probabilidad de que la persona número 15 a la que se le pregunte, sea la quinta que haya votado de manera independiente?
\[ P(X = 15) = \binom{15-1}{5-1} (0.2)^5 (0.8)^{15-5} \]
\[ P(X = 15) = \binom{14}{4} (0.2)^5 (0.8)^{10} \]
\[ P(X = 15) = 1001 \times 0.00032 \times 0.10737 \]
\[ P(X = 15) = 1001 \times 0.0000343584 \]
\[ P(X = 15) \approx 0.0344 \]
dnbinom(15 - 5, size = 5, prob = 0.2)
[1] 0.0343941
Función de Distribución Acumulada (CDF): \[ F(X = k) = \sum_{i=0}^{x} P(X = i) \]
Valor Esperado y Varianza: \[ E(X) = k \frac{1 - p}{p}, \quad \text{Var}(X) = k \frac{1 - p}{p^2} \]
Ejemplo a Mano: Si \(r = 3\), \(p = 0.4\), calculemos la probabilidad de que \(X = 2\): \[ P(X = 2) = \binom{2+3-1}{2} (0.4)^3 (0.6)^2 \]
Ejemplo en R:r <- 3 # Número de éxitos requeridos
p <- 0.4 # Probabilidad de éxito
datos <- 0:15
prob <- dnbinom(datos, r, p)
cdf <- pnbinom(datos, r, p)
plot(prob, names.arg = datos,type="h", main = "Distribución Binomial Negativa")
Se sabe que en promedio 1 de cada 8 mujeres embarazadas que asisten a control tiene niveles elevados de azúcar en la sangre, ¿Cuál es la probabilidad que la quinta mujer examinada por el médico sea la primera en tener niveles elevados de azúcar?
Al evaluar el problema, identificamos que la distribución binomial negativa es la más adecuada.
La probabilidad de éxito (mujer con azúcar elevado) es \(p = \frac{1}{8}\), y buscamos la probabilidad de que la primera mujer con niveles elevados sea la quinta examinada.
Esto sigue una distribución binomial negativa con \(n=5\), \(r = 1\) y \(p = \frac{1}{8}\):
\[P(X = 5) = \binom{n-1}{k-1} p^k (1 - p)^{n-k} = \binom{5-1}{1-1} *\left(\frac{1}{8}\right)^1*\left(\frac{7}{8}\right)^{(5-1)} = \binom{4}{0} \left(\frac{1}{8}\right) \left(\frac{7}{8}\right)^4 = \frac{2401}{32768} \approx 0.0733\]
p <- 1/8
n <- 5
dnbinom(n - 1, size = 1, prob = p)
[1] 0.07327271
Un lote de medicamentos que serán distribuidos a una importante clínica contiene 50 cajas de un proveedor de medicamentos locales y 70 unidades de un proveedor de medicamentos de un país vecino. Si se seleccionan 12 piezas al azar:
Al evaluar el problema, identificamos que la distribución hipergeométrica es la más adecuada.
Tenemos un lote de 50 cajas del proveedor local y 70 del proveedor extranjero (total = 120). Se seleccionan 12 piezas al azar.
Sea X el número de cajas del proveedor local en la muestra de 12 cajas, entonces:
\[P(X = 12) = \frac{\binom{50}{12} \binom{70}{0}}{\binom{120}{12}} = \frac{1}{\binom{120}{12}} = \frac{121399651100}{10542859559688800} = 0.0000115\]
\[P(X = 12) = \frac{\binom{50}{0} \binom{70}{12}}{\binom{120}{12}} = \frac{1}{\binom{120}{12}} = \frac{10638894058520}{10542859559688800} = 0.001009\]
dhyper(12, 70, 50, 12)
[1] 0.001009109
\[P(X \geq 5) = 1 - P(X \leq 4) = 1 - \sum_{i=0}^{4} P(X = i)\]
\[P(X \geq 5) = 1 - \left(\frac{\binom{50}{0} \binom{70}{12}}{\binom{120}{12}} + \frac{\binom{50}{1} \binom{70}{11}}{\binom{120}{12}} + \frac{\binom{50}{2} \binom{70}{10}}{\binom{120}{12}} + \frac{\binom{50}{3} \binom{70}{9}}{\binom{120}{12}} + \frac{\binom{50}{4} \binom{70}{8}}{\binom{120}{12}}\right)\]
\[(P(X \geq 5) = 1 - \binom{50}{0} \binom{70}{12} - \binom{50}{1} \binom{70}{11} - \binom{50}{2} \binom{70}{10} - \binom{50}{3} \binom{70}{9} - \binom{50}{4} \binom{70}{8}\]
\[(P(X \geq 5) = 1 - \frac{10638894058520 + 108192142968000 + 485963042164600 + 1274657159776000 + 2174112816876000}{10542859559688800}\]
\[(P(X \geq 5)= 1 - \frac{4053564000000000 }{10542859559688800} = 1 - 0.3841 = 0.616\]
\[P(X \leq 3) = \frac{\binom{70}{0} \binom{50}{12}}{\binom{70}{12}} + \frac{\binom{70}{1} \binom{50}{11}}{\binom{70}{12}} + \frac{\binom{70}{2} \binom{50}{10}}{\binom{70}{12}} + \frac{\binom{70}{3} \binom{50}{9}}{\binom{70}{12}}\]
Una empresa electrónica observa que el número de componentes que fallan antes de cumplir 100 horas de funcionamiento es una variable aleatoria de Poisson. Si el número promedio de estos fallos es ocho,
Al evaluar el problema, identificamos que la distribución de Poisson es la más adecuada.
El número de fallos sigue una distribución de Poisson con \(\lambda = 8\) fallos en 100 horas, por lo que la tasa es \(\lambda = 8/100 = 0.08\) por hora.
\(\lambda = 25 \times 0.08 = 2\), queremos \(P(X = 1)\):
\[P(X = 1) = \frac{e^{-2} 2^1}{1!} = 0.2707\]
dpois(1, lambda = 2)
[1] 0.2706706
\(\lambda = 50 \times 0.08 = 4\), queremos \(P(X \leq 2)\):
\[P(X \leq 2) = P(X = 0) + P(X = 1) + P(X = 2) = 0.0183 + 0.0733 + 0.1465 = 0.2381\]
ppois(2, lambda = 4)
[1] 0.2381033
\(\lambda = 125 \times 0.08 = 10\), queremos \(P(X \geq 5)\):
\[P(X \geq 5) = 1 - P(X \leq 4) = 1 - \sum_{i=0}^{4} P(X = i) = 1 - (P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) + P(X = 4))\]
\[P(X \geq 5) = 1 - \frac{e^{-10} 10^0}{0!} - \frac{e^{-10} 10^1}{1!} - \frac{e^{-10} 10^2}{2!} - \frac{e^{-10} 10^3}{3!} - \frac{e^{-10} 10^4}{4!}\] \[P(X \geq 5) = 1 - 0.0000454 - 0.0004539993 - 0.002269996 - 0.007566655 - 0.01891664 = 0.9707\]
1 - ppois(4, lambda = 10)
[1] 0.9707473
La policía sospecha que en un camión cargado con 40 bultos de arroz se han camuflado paquetes de cocaína. Para confirmar su sospecha, la policía escoge al azar 5 bultos para inspeccionarlos. Si en efecto, de los 40 bultos de arroz, que contiene el camión, 10 tienen camufladas cocaína, ¿Cuál es la probabilidad de que por lo menos uno de los bultos de la muestra contenga cocaína?
Al evaluar el problema, identificamos que la distribución hipergeométrica es la más adecuada.
Sea X el número de bultos con cocaína en la muestra de 5 bultos, entonces:
\[P(X \geq 1) = 1 - P(X = 0)\]
\[P(X = 0) = \frac{\binom{10}{0} \binom{30}{5}}{\binom{40}{5}} = \frac{142506}{658008} = 0.2167\]
\[P(X \geq 1) = 1 - 0.21657 = 0.7834\]
1 - dhyper(0, 10, 30, 5)
[1] 0.7834282
De acuerdo con un estudio geológico, en un pozo de exploración petrolera hay 0.2 de probabilidad de encontrar petróleo. Encuentre la probabilidad de:
Al evaluar el problema, identificamos que la distribución binomial negativa es la más adecuada.
\(p = 0.2\) es la probabilidad de encontrar petróleo.
Sea X el número de pozos perforados antes de encontrar petróleo por primera vez, entonces:
\[P(X = 3) = \binom{3-1}{1-1} (0.2)^1 (0.8)^2 = 0.128\]
dnbinom(3 - 1, size = 1, prob = 0.2)
[1] 0.128
-b. Encontrar el segundo pozo en el séptimo pozo perforado
\[P(X = 7) = \binom{7-1}{2-1} (0.2)^2 (0.8)^5 = 0.0786432\]
dnbinom(7-2, size = 2, prob = 0.2)
[1] 0.0786432
\[E(X) = k \frac{1 - p}{p} = 3 \frac{1 - 0.2}{0.2} = 12\]
\[Var(X) = k \frac{1 - p}{p^2} = 3 \frac{1 - 0.2}{0.2^2} = 60\]
k <- 3
p <- 0.2
E <- k * (1 - p) / p
Var <- k * (1 - p) / p^2
E
[1] 12
Var
[1] 60
El call center de un hospital para citas de consulta externa recibe en promedio dos llamadas por minuto.
Al evaluar el problema, identificamos que la distribución de Poisson es la más adecuada.
Sea X el número de llamadas recibidas en el tiempo t, entonces:
El call center recibe 2 llamadas por minuto, es decir, \(\lambda = 2t\).
\[P(X = 5) = \frac{e^{-4} 4^5}{5!} = 0.1563\]
dpois(5, lambda = 4)
[1] 0.1562935
Dados \(\lambda = 10\), queremos \(P(X \leq 8)\):
\[P(X \leq 8) = P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) + P(X = 4) + P(X = 5) + P(X = 6) + P(X = 7) + P(X = 8)\] \[P(X \leq 8) = \frac{e^{-10} 10^0}{0!} + \frac{e^{-10} 10^1}{1!} + \frac{e^{-10} 10^2}{2!} + \frac{e^{-10} 10^3}{3!} + \frac{e^{-10} 10^4}{4!} + \frac{e^{-10} 10^5}{5!} + \frac{e^{-10} 10^6}{6!} + \frac{e^{-10} 10^7}{7!} + \frac{e^{-10} 10^8}{8!}\] \[P(X \leq 8) = 0.0000454 + 0.000454 + 0.00227 + 0.007567 + 0.01892 + 0.0378333 + 0.06305546 + 0.09008 + 0.112599 = 0.33282\]
ppois(8, lambda = 10)
[1] 0.3328197
Dados \(\lambda = 120\), queremos \(P(X \geq 100)\):
1 - ppois(99, lambda = 120)
[1] 0.9721363
Cinco individuos de una población animal se creen está cerca de la extinción en cierta región, fueron capturados, marcados y liberados para mezclarse con la población. Después que tuvieron la oportunidad de mezclarse, se seleccionó una muestra aleatoria de 10 de estos animales. Si en realidad hay 25 animales de este tipo en la región, ¿Cuál es la probabilidad de que se encuentren más de 2 animales marcados?
Al evaluar el problema, identificamos que la distribución hipergeométrica es la más adecuada.
Sea X el número de animales marcados en la muestra de 10 animales, entonces:
\[P(X > 2) = 1 - P(X \leq 2)\]
\[P(X \leq 2) = P(X = 0) + P(X = 1) + P(X = 2)\]
\[P(X = 0) = \frac{\binom{5}{0} \binom{20}{10}}{\binom{25}{10}} = \frac{184756}{3268760} = 0.0565\]
dhyper(0, 5, 20, 10)
[1] 0.05652174
En un hospital el número medio de ingresos en la unidad coronaria por día es 2.
Al evaluar el problema, identificamos que la distribución de Poisson es la más adecuada.
Sea X el número de ingresos en la unidad coronaria por día, entonces:
El número medio de ingresos en la unidad coronaria por día es \(\lambda = 2\).
\[P(X = 0) = \frac{e^{-2} 2^0}{0!} = 0.1353\]
dpois(0, lambda = 2)
[1] 0.1353353
\[P(X \leq 2) = P(X = 0) + P(X = 1) + P(X = 2) = 0.1353 + 0.2707 + 0.2707 = 0.6767\]
ppois(2, lambda = 2)
[1] 0.6766764
Como están preguntando por al menos 3 ingresos en dos días, entonces el valor de lambda es \(\lambda = 4\).
\[P(X \geq 3) = 1 - P(X \leq 2) = 1 - (P(X = 0) + P(X = 1) + P(X = 2))\]
\[P(X \geq 3) = 1 - \left(\frac{e^{-4} 4^0}{0!} + \frac{e^{-4} 4^1}{1!} + \frac{e^{-4} 4^2}{2!}\right)\]
\[P(X \geq 3) = 1 - (0.0183 + 0.0733 + 0.1465) = 0.7619\]
1 - ppois(2, lambda = 4)
[1] 0.7618967
Como están preguntando por más de 5 ingresos en tres días, entonces el valor de lambda es \(\lambda = 6\).
\[P(X > 5) = 1 - P(X \leq 5) = 1 - (P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) + P(X = 4) + P(X = 5))\]
\[P(X=0) = \frac{e^{-6} 6^0}{0!} = 0.0025\] \[P(X=1) = \frac{e^{-6} 6^1}{1!} = 0.0149\] \[P(X=2) = \frac{e^{-6} 6^2}{2!} = 0.0447\] \[P(X=3) = \frac{e^{-6} 6^3}{3!} = 0.0895\] \[P(X=4) = \frac{e^{-6} 6^4}{4!} = 0.1343\] \[P(X=5) = \frac{e^{-6} 6^5}{5!} = 0.1602\]
\[P(X > 5) = 1 - (0.0025 + 0.0149 + 0.0447 + 0.0895 + 0.1343 + 0.1602) = 0.554\]
1 - ppois(5, lambda = 6)
[1] 0.5543204
De un lote de 210 medicamentos, 150 están próximos a vencerse. Si selecciono 40 medicamentos al azar:
¿Cuál es la probabilidad de que por lo menos 20 medicamentos estén próximos a vencerse?
¿Cuál es la probabilidad de que a lo sumo 30 estén próximos a vencerse?
¿Cuál es la probabilidad de que al menos 10 no estén próximos a vencerse?
Al evaluar el problema, identificamos que la distribución hipergeométrica es la más adecuada.
Sea X el número de medicamentos próximos a vencerse en la muestra de 40 medicamentos, entonces:
\[P(X \geq 20) = 1 - P(X \leq 19)\]
\[P(X \leq 19) = P(X = 0) + P(X = 1) + P(X = 2) + ... + P(X = 19)\]
\[P(X \leq 30) = P(X = 0) + P(X = 1) + P(X = 2) + ... + P(X = 30)\]
Como están preguntando por al menos 10 medicamentos que no estén próximos a vencerse, entonces se puede reescribir como al menos 10 medicamentos no estén próximos a vencerse.
\[P(X \geq 10) = 1 - P(X \leq 9)\]
Debo considerar los que no están próximos a vencerse, es decir: 60 medicamentos.
En una población se ha observado que el número medio anual de muertes por cáncer de útero es de 8.
Al evaluar el problema, identificamos que la distribución de Poisson es la más adecuada.
Sea X el número de muertes por cáncer de útero en un año, entonces:
El número medio anual de muertes por cáncer de útero es \(\lambda = 8\).
\[P(X = 10) = \frac{e^{-8} 8^{10}}{10!} = 0.09926\]
dpois(10, lambda = 8)
[1] 0.09926153
En este caso, se debe considerar el número de muertes en dos años, es decir, \(\lambda = 16\).
\[P(X \geq 15) = 1 - P(X \leq 14)\]
\[P(X \leq 14) = P(X = 0) + P(X = 1) + P(X = 2) + ... + P(X = 14)\]
En este caso, se debe considerar el número de muertes en cinco años, es decir, \(\lambda = 40\).
\[P(X < 36) = P(X = 0) + P(X = 1) + P(X = 2) + ... + P(X = 35)\]