Variables Aleatorias Discretas

La distribución de probabilidad de una variable aleatoria es una función que asigna a cada suceso definido sobre la variable, la probabilidad de que dicho suceso ocurra. Está definida sobre el conjunto de todos los sucesos y cada uno de los sucesos es el rango de valores de la variable aleatoria.

Variables aleatorias

Es aquella cuyo valor es el resultado de un evento aleatorio.

Variables aleatorias discretas

Es aquella que solo toma ciertos valores de manera discontinua (números enteros).

Variable aleatoria continuas

Es aquella que generalmente depende de una medición y puede tomar cualquier valor. Generalmente se evalúa en un intervalo.

Distribuciones de probabilidad para variables discretas

Función de probabilidad solo toma valores positivos en un conjunto de valores de X, que es finito o numerable.

A esta función se le denomina Función de Masa de Probabilidad, que corresponde a una función matemática que describe la probabilidad de todos los valores de una variable aleatoria.

Función de Masa de Probabilidad

\[f(x)=P(X=x)\]

Propiedades

\[f(x) ≥ 0\] para todo los valores de la variable x.

\[\sum f(x)=1\]

1. Distribución Uniforme Discreta

Distribución de probabilidad para variables aleatorias discretas donde cada resultado es igualmente probable.

Definición

Una variable aleatoria sigue una distribución uniforme discreta si toma un número finito de valores igualmente espaciados con igual probabilidad.

Sea X una variable aleatoria que toma valores en \(\{x_1, x_2, ..., x_N\}\) con igual probabilidad, entonces:

\[X \sim U(N)\]

Función de Masa de Probabilidad

La función de masa de probabilidad (FMP) está dada por:

\[P(X = x) = \begin{cases} \frac{1}{N} & \text{si } x = 1, 2, ..., N \\ 0 & \text{en otro caso} \end{cases}\]

Gráfico de la distribución de masa de probabilidad

Función de Distribución Acumulada

La función de distribución acumulada (FDA) está dada por:

\[\begin{equation} F(x)= \begin{cases} 0 & \text{si } x<1 \\[6pt] \dfrac{\lfloor x \rfloor}{N} & \text{si } 1 \le x < N \\[8pt] 1 & \text{si } x \ge N \end{cases} \end{equation}\]

donde \(\lfloor x \rfloor\) es la parte entera de x

Propiedades:

\[0 \leq F(x) \leq 1\]

\[F(x_j) \geq F(x_i)\] si \[x_j \geq x_i\]

Gráfico de la función de distribución acumulada

Ejemplo:

Se lanza un dado justo de 6 caras. ¿Cuál es la probabilidad de obtener un número menor o igual a 4?

X: Resultado del lanzamiento del dado

R(X) = {1,2,3,4,5,6}

X ~ U(6)

\[P(X \leq 4) = \frac{4}{6} = \frac{2}{3} = 0.6667\]

Valor Esperado - Promedio

\[E[X] = \frac{N+1}{2}\]

Para el dado:

\[E[X] = \frac{6+1}{2} = 3.5\]

Varianza

\[V[X] = \frac{N^2 - 1}{12}\]

Para el dado:

\[V[X] = \frac{6^2 - 1}{12} = \frac{35}{12} \approx 2.92\]

2. Distribución de Bernoulli

Distribución de probabilidad para variables aleatorias discretas que toman solo dos valores: éxito (1) o fracaso (0).

Definición

Una variable aleatoria sigue una distribución de Bernoulli si toma los valores 1 con probabilidad p y 0 con probabilidad (q = 1 - p).

Sea X una variable aleatoria que toma valores en \(\{0,1\}\) con probabilidades dadas por:

\[X \sim Bernoulli(p)\]

Función de Masa de Probabilidad

La función de masa de probabilidad (FMP) está dada por:

\[f(x) = \begin{cases} p & \text{si } x = 1 \\ q = 1 - p & \text{si } x = 0 \\ 0 & \text {en otro caso} \end{cases}\]

Gráfico de la distribución de masa de probabilidad

Función de Distribución Acumulada

La función de distribución acumulada (FDA) está dada por:

\[F(x) = P(X \leq x) = \begin{cases} 0 & \text{si } x < 0 \\ 1 - p & \text{si } 0 \leq x < 1 \\ 1 & \text{si } x \geq 1 \end{cases}\]

Gráfico de la función de distribución acumulada

Ejemplo:

Se lanza una moneda con probabilidad de cara igual a 0.7. ¿Cuál es la probabilidad de obtener cara?

X: Resultado del lanzamiento (1 si es cara, 0 si es cruz)

R(X) = {0,1}

X ~ Bernoulli(0.7)

\[P(X = 1) = 0.7\]

dbern <- function(x, p) ifelse(x == 1, p, 1 - p)
dbern(1, 0.7)

[1] 0.7

Valor Esperado - Promedio

\[E[X] = p\]

Para la moneda:

\[E[X] = 0.7\]

Varianza

\[V[X] = p(1 - p)\]

Para la moneda:

\[V[X] = 0.7 \times 0.3 = 0.21\]

3. Distribución Binomial

Distribución de probabilidad para variables aleatorias discretas que satisfacen las condiciones de un experimento Binomial

Experimento Binomial

Un experimento binomial tiene las siguientes características:

El experimento consiste en “n” repeticiones de un ensayo

Las repeticiones de cada ensayo son independientes de los demás

El resultado de cada ensayo es dicótomo: uno de dos posibles resultados excluyentes, éxito o fracaso

La probabilidad de obtener éxito ”p” es la misma en cada ensayo

Variable aleatoria Binomial

Una variable aleatoria Binomial cuenta el número de éxitos obtenidos en un experimento Binomial

X: Número de éxitos obtenidos en una secuencia de n ensayos

El rango (espacio muestral) de X es entonces: {0,1,2,…,n}

\[X \sim Binomial(n;p)\]

Función de Masa de Probabilidad de la distribución Binomial

\[f(x)=\begin{cases}{\displaystyle\binom{n}{x}{p^x}{(1-p)^{n-x}}}&{\text{si } x\in{\left\{{0,1,2,...,n}\right\}}}\\0 & \text{en otro caso}& \end{cases}\]

donde \[\binom{n}{x} = \frac{n!}{(n-x)!x!}\]

\[n! = 1*2*3*4*...*n\]

Gráfico de la distribución de masa de la binomial

x<-0:20
plot(x, dbinom(x, 20, 0.5), type="h",  main="X~Binomial(20, 0.5)",   xlab="X",    ylab="f(X)")

Función de distribución acumulada

Función matemática que describe la probabilidad acumulada de todos los valores de una variable.

\[F(x) = P(X \le x) = \sum_{x=0}^k{\binom{n}{x}{p^x}{(1-p)^{n-x}}}\]

Propiedades:

\[0 ≤ F(x) ≤ 1\]

\[F(x_i) ≥ F(x_j)\]
si

\[x_i ≥ x_j\]

\[P (x > x_i) = 1 - F(x_i)\]

Gráfico de la función de distribución acumulada

x<-0:20
plot(x, pbinom(x, 20, 0.5), type="s",  main="X~Binomial(20, 0.5)", xlab="X", ylab="F(X)")

Ejemplo:

El 20% de las personas de una población fuman. Si se seleccionan aleatoriamente 10 personas de esta población,

¿Cuál es la probabilidad de que exactamente 2 fumen?

X: Número de personas que fuman en la muestra

R(X):{0,1,2,3,4,5,6,7,8,9,10}

X~Binomial(10 , 0.2)

Se cumplen todas características de un experimento binomial

\[P(X=2) = \displaystyle\binom{10}{2}{(0.2)^2(1-0.2)^{10-2}}\]

\[\binom{10}{2} = \frac{10!}{(10-2)!2!} = \frac{1*2*3*4*5*6*7*8*9*10}{1*2*3*4*5*6*7*8*1*2} = \frac{9*10}{2}=45\]

\[P(X=2) = \displaystyle 45*0.04*0.167772 = 0.30199\]

En R:

  dbinom(2 , 10 , 0.2)

[1] 0.3019899

¿Cuál es la probabilidad de que se presenten máximo 2 fumadores?

\[ P(X \leq 2) = P(X = 0) + P(X = 1) + P(X = 2) \]

\[ P(X = 0) = \binom{10}{0} (0.2)^0 (0.8)^{10} = 1 \times 1 \times 0.1074 = 0.1074 \]

\[ P(X = 1) = \binom{10}{1} (0.2)^1 (0.8)^9 = 10 \times 0.2 \times 0.1342 = 0.2684 \]

\[ P(X \leq 2) = 0.1074 + 0.2684 + 0.3020 = 0.6778 \]

pbinom(2 , 10 , 0.2)

[1] 0.6777995

¿Cuál es la probabilidad de que se presenten mínimo 4 fumadores?

\[ P(X \geq 4) = 1 - P(X \leq 3) \]

\[ P(X = 3) = \binom{10}{3} (0.2)^3 (0.8)^7 = 120 \times 0.008 \times 0.2097 = 0.2013 \]

\[ P(X \leq 3) = 0.6778 + 0.2013 = 0.8791 \]

\[ P(X \geq 4) = 1 - 0.8791 = 0.1209 \]

1-pbinom(3, 10 , 0.2)

[1] 0.1208739

¿Cuál es la probabilidad de que se presenten entre 2 y 4 fumadores?

\[ P(2 \leq X \leq 4) = P(X = 2) + P(X = 3) + P(X = 4) \]

\[ P(X = 4) = \binom{10}{4} (0.2)^4 (0.8)^6 = 210 \times 0.0016 \times 0.2621 = 0.08807 \]

\[ P(2 \leq X \leq 4) = 0.3020 + 0.2013 + 0.0881 = 0.5914 \]

dbinom(2 , 10 , 0.2)+dbinom(3 , 10 , 0.2)+dbinom(4 , 10 , 0.2)

[1] 0.5913969

Gráfico de la distribución de masa de la binomial

x<-0:10
plot(x, dbinom(x, 10, 0.2), type="h",  main="X~Binomial(10, 0.2)",   xlab="X",    ylab="f(X)")

Gráfico de la función de distribución acumulada

x<-0:10
plot(x, pbinom(x, 10, 0.2), type="s",  main="X~Binomial(10, 0.2)",     xlab="X",     ylab="F(X)")

valor esperado - promedio

\[E[X]=np\]

\[E[X]=10*0.2 = 2\]

Varianza

\[V[X]=np(1−p)\]

\[V[X]=10*0.2*0.8 = 1.6\]

Nuevo Ejemplo:

Una institución hospitalaria de tercer nivel afirma que con una nueva técnica quirúrgica realizada en sus salas de cirugía se produce una mejora del 60 en los pacientes a quienes se les realiza cirugía de corazón abierto Si se aplica esta técnica a 15 pacientes enfermos

Se tiene una distribución binomial con:
- \(n = 15\) - \(p = 0.6\) - \(q = 1 - p = 0.4\)

1. ¿Cuál es la probabilidad de que solo cinco de ellos mejoren?

\[ P(X = 5) = \binom{15}{5} (0.6)^5 (0.4)^{10} = 3003 \times 0.07776 \times 0.00010486 = 0.0244 \]

dbinom(5, size = 15, prob = 0.6)

[1] 0.02448564

2. ¿Y de que a lo sumo dos mejoren?

Significa que máximo dos pacientes mejoren, por lo que debemos calcular la probabilidad de que 0, 1 o 2 pacientes mejoren.

\[ P(X \leq 2) = P(X = 0) + P(X = 1) + P(X = 2) \]

\[ P(X = 0) = \binom{15}{0} (0.6)^0 (0.4)^{15} = 1 \times 1 \times 0.000107 = 0.0000011 \]

\[ P(X = 1) = \binom{15}{1} (0.6)^1 (0.4)^{14} = 15 \times 0.6 \times 0.000267 = 0.0000242 \]

\[ P(X = 2) = \binom{15}{2} (0.6)^2 (0.4)^{13} = 105 \times 0.36 \times 0.000668 = 0.0002537 \]

\[ P(X \leq 2) = 0.0000011 + 0.0000242 + 0.0002537 = 0.000279 \]

pbinom(2, size = 15, prob = 0.6)

[1] 0.0002789044

3. ¿Cuál es la probabilidad de que por lo menos tres mejoren?

Es el complemento de la probabilidad de que a lo sumo dos mejoren:

\[ P(X \geq 3) = 1 - P(X \leq 2) = 1 - 0.000279 = 0.999721 \]

1 - pbinom(2, size = 15, prob = 0.6)

[1] 0.9997211

En un centro de salud se encuentra que las citologías tienen una probabilidad del 3% de tener resultado insatisfactorio Si se realiza el tamizaje a un grupo de 7 mujeres

Se tiene:

\(n = 7\) (número de mujeres)
\(p = 0.03\) (probabilidad de citología insatisfactoria)

A. Probabilidad de que ninguna citología sea insatisfactoria

\[ P(X = 0) = \binom{7}{0} (0.03)^0 (0.97)^7 = 0.807983 \]

dbinom(0, size = 7, prob = 0.03)

[1] 0.8079828

B. Probabilidad de que al menos 2 sean insatisfactorias

\[ P(X \geq 2) = 1 - P(X = 0) - P(X = 1) \]

\[ P(X = 1) = \binom{7}{1} (0.03)^1 (0.97)^6 = 7 \times 0.03 \times 0.8387 = 0.17492 \]

\[ P(X \geq 2) = 1 - 0.807983 - 0.17492 = 0.017097 \]

1 - pbinom(1, size = 7, prob = 0.03)

[1] 0.01709303

C. Probabilidad de que máximo 3 sean insatisfactorias

\[ P(X \leq 3) = P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) \]

\[ P(X = 2) = \binom{7}{2} (0.03)^2 (0.97)^5 = 21 \times 0.0009 \times 0.8573 = 0.01623 \]

\[ P(X = 3) = \binom{7}{3} (0.03)^3 (0.97)^4 = 35 \times 0.000027 \times 0.8823 = 0.00084 \]

\[ P(X \leq 3) = 0.807983 - 0.17492 + 0.01623 + 0.00084 = 0.999973 \]

 pbinom(3, size = 7, prob = 0.03)

[1] 0.9999736

Un laboratorio afirma que una droga causa efectos secundarios en 1 de cada 100 pacientes Para contrastar esta afirmación, otro laboratorio elige al azar a 20 pacientes a los que aplica la droga ¿Cuál es la probabilidad de que por lo menos 5 pacientes presenten efectos secundarios?

\(n = 20\) (número de pacientes)
\(p = 0.01\) (probabilidad de efectos secundarios por paciente)
\(q = 1 - p = 0.99\) (probabilidad de no tener efectos secundarios)

\[ P(X \geq 5) = 1 - P(X \leq 4) = 1 - \left[ P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) + P(X = 4) \right] \]

\[ P(X = 0) = \binom{20}{0} (0.01)^0 (0.99)^{20} = 1 \times 1 \times (0.99)^{20} = 0.8179 \]

\[ P(X = 1) = \binom{20}{1} (0.01)^1 (0.99)^{19} = 20 \times 0.01 \times (0.99)^{19} = 20 \times 0.01 \times 0.8264 = 0.16523 \]

[ P(X = 2) = (0.01)^2 (0.99)^{18} = (0.01)^2 (0.99)^{18} = 190 = 0.015856

]

\[ P(X = 3) = \binom{20}{3} (0.01)^3 (0.99)^{17} = \frac{20!}{3!(17!)} \times (0.01)^3 \times (0.99)^{17} = 1140 \times 0.000001 \times 0.8431 = 0.000961 \]

\[ P(X = 4) = \binom{20}{4} (0.01)^4 (0.99)^{16} = \frac{20!}{4!(16!)} \times (0.01)^4 \times (0.99)^{16} = 4845 \times 0.00000001 \times 0.8523 = 0.0000413 \]

Sumamos las probabilidades acumuladas:

\[ P(X \leq 4) = 0.8179 + 0.16523+ 0.015856 + 0.00096 + 0.000041 = 0.999987 \]

Finalmente,

\[ P(X \geq 5) = 1 - 0.999987 \]

\[ P(X \geq 5) = 0.0000014 \]

sprintf("%.8f", 1 - pbinom(4, size = 20, prob = 0.01))

[1] "0.00000137"

Ejercicios Sesión 1

Ejercicio 1

Dada la siguiente función de densidad:

x	-2	-1	0	1	2
f(x)	0.1	0.2	0.3	0.2	0.2

Calcular la esperanza matemática \(E(X)\) y la media \(\mu\).

La esperanza matemática se define como:

\[ E(X) = \sum x_i f(x_i) \]

Sustituyendo los valores:

\[ E(X) = (-2 \times 0.1) + (-1 \times 0.2) + (0 \times 0.3) + (1 \times 0.2) + (2 \times 0.2) \]

\[ E(X) = -0.2 - 0.2 + 0 + 0.2 + 0.4 = 0.2 \]

Por lo tanto, \(E(X) = 0.2\) y \(\mu = 0.2\).

datos <- data.frame(
  x = c(-2, -1, 0, 1, 2),
  fx = c(0.1, 0.2, 0.3, 0.2, 0.2)
)

E_X <- sum(datos$x * datos$fx)
E_X

[1] 0.2

El valor esperado \(E(X)\) representa la media de la variable aleatoria \(X\), que en este caso es también \(\mu = 0.2\).

Ejercicio 2

Dada la densidad:

x	1	2	3	4	5
f(x)	0.1	0.15	0.5	0.15	0.1

Se desea calcular el número promedio de hembras adultas y su desviación estándar.

La esperanza matemática se calcula como:

\[ E(X) = \sum x_i f(x_i) \]

\[ E(X) = (1 \times 0.1) + (2 \times 0.15) + (3 \times 0.5) + (4 \times 0.15) + (5 \times 0.1) \]

\[ E(X) = 0.1 + 0.3 + 1.5 + 0.6 + 0.5 = 3 \]

La varianza se calcula como:

\[ Var(X) = \sigma^2 = E[(X−\mu^2)] =𝐸[X^2]−𝐸[X]^2 \]

\[ E(X^2)= \sum x_i^2 f(x_i) = (1^2 \times 0.1) + (2^2 \times 0.15) + (3^2 \times 0.5) + (4^2 \times 0.15) + (5^2 \times 0.1) = 0.1 + 0.6 + 4.5 + 2.4 + 2.5 = 10.1 \]

\[ Var(X) = 10.1 - 3^2 = 10.1 - 9 = 1.1 \]

Desviación estándar:

\[ \sigma = \sqrt{1.1} \approx 1.05 \]

datos <- data.frame(
  x = c(1, 2, 3, 4, 5),
  fx = c(0.1, 0.15, 0.5, 0.15, 0.1)
)

E_X <- sum(datos$x * datos$fx)
E_X

[1] 3

Var(X) = E(X^2) - E(X)^2

VarX <- sum(datos$x^2 * datos$fx) - E_X^2
VarX

[1] 1.1

Sd(X)

SDX <- sqrt(VarX)
SDX

[1] 1.048809

Ejercicio 3

Se lanza un par de dados y se registra la suma de las puntuaciones obtenidas. Hallar la función de probabilidad, la esperanza y la varianza.

Las sumas posibles y sus probabilidades son:

Suma	Probabilidad
2	1/36
3	2/36
4	3/36
5	4/36
6	5/36
7	6/36
8	5/36
9	4/36
10	3/36
11	2/36
12	1/36

La esperanza matemática es:

\[ E(X) = \sum x_i f(x_i) \]

Sustituyendo valores:

\[ E(X) = \frac{2}{36} + \frac{6}{36} + \frac{12}{36} + \frac{20}{36} + \frac{30}{36} + \frac{42}{36} + \frac{40}{36} + \frac{36}{36} + \frac{30}{36} + \frac{22}{36} + \frac{12}{36} = \frac{252}{36} = 7 \]

\[ E(X) = 7 \]

La varianza se calcula como:

\[ Var(X) = \sum x_i^2 f(x_i) - [E(X)]^2 \]

\[ E(X^2) = \frac{2*2}{36} + \frac{6*3}{36} + \frac{12*4}{36} + \frac{20*5}{36} + \frac{30*6}{36} + \frac{42*7}{36} + \frac{40*8}{36} + \frac{36*9}{36} + \frac{30*10}{36} + \frac{22*11}{36} + \frac{12*12}{36} \]

\[ E(X^2) = \frac{4}{36} + \frac{18}{36} + \frac{48}{36} + \frac{100}{36} + \frac{180}{36} + \frac{294}{36} + \frac{320}{36} + \frac{324*9}{36} + \frac{300}{36} + \frac{242}{36} + \frac{144}{36} = \frac{1974}{36} = 54.833 \]

\[ Var(X) = 54.833 - 49 = 5.833 \]

\(Var(X) \approx 5.833\)

\(\sigma \approx 2.415\)

# Valores de la suma de los dados y sus probabilidades
dados <- data.frame(
  suma = 2:12,
  prob = c(1,2,3,4,5,6,5,4,3,2,1) / 36
)

# Cálculo de la esperanza y la varianza
E_dados <- sum(dados$suma * dados$prob)
Var_dados <- sum(dados$suma^2 * dados$prob) - E_dados^2
SD_dados <- sqrt(Var_dados)

# Resultados
list(E_dados = E_dados, Var_dados = Var_dados, SD_dados = SD_dados)

$E_dados
[1] 7

$Var_dados
[1] 5.833333

$SD_dados
[1] 2.415229

Se puede observar que la esperanza es 7 y la desviación estándar es aproximadamente 2.42.

Ejercicio 4

A la consulta del programa de paciente crónico (diagnóstico de diabetes o hipertensión arterial) llegan en total 30 pacientes, de los cuales 16 son diabéticos. Si se seleccionan 13 al azar:

¿Cuál es la probabilidad de que máximo 7 sean diabéticos?
¿Cuál es la probabilidad de que a lo menos 10 sean diabéticos?

La probabilidad de que un paciente seleccionado sea diabético es:

\[ p = \frac{k}{n} = \frac{16}{30} \approx 0.5333 \]

Si X representa el número de diabéticos seleccionados en la muestra de n = 13, entonces:

\[ X \sim \text{Binomial}(n=13, p=0.5333) \]

(a) Probabilidad de que máximo 7 sean diabéticos

Esto es \(P(X \leq 7)\), que se obtiene sumando:

\[ P(X \leq 7) = \sum_{k=0}^{7} P(X = k) = P(X = 0) + P(X = 1) + P(X = 2) + \ldots + P(X = 7) \]

\[ P(X=0) = 0.000005 \]

\[ P(X=1) = 0.00074 \]

\[ P(X=2) = 0.005075 \]

\[ P(X=3) = 0.021265 \]

\[ P(X=4) = 0.060748 \]

\[ P(X=5) = 0.12495 \]

\[ P(X=6) = 0.19038 \]

\[ P(X=7) = 0.217543 \]

\[ P(X \leq 7) = 0.000005 + 0.00074 + 0.005075 + 0.021265 + 0.060748 + 0.12495 + 0.19038 + 0.217543 = 0.6207 \]

pbinom(7, 13, 0.5333)

[1] 0.6207475

(b) Probabilidad de que al menos 10 sean diabéticos

\[ P(X \geq 10) = 1 - P(X \leq 9) \]

1 - pbinom(9, 13, 0.5333)

[1] 0.074453

Ejercicio 5:

Un estudio realizado en Estados Unidos informó que el 25,7% de personas adultas tienen sobrepeso. Si se extrae una muestra aleatoria de 20 adultos:

\(X \sim \text{Bin}(n=20, p=0.257)\)

Probabilidad de que exactamente 4 personas tengan sobrepeso:

\[ P(X = 4) = \binom{20}{4} (0.257)^4 (1 - 0.257)^{16} = 4845 \times 0.257^4 \times 0.743^{16} = 0.1823 \]

dbinom(4, size = 20, prob =0.257)

[1] 0.1823255

Probabilidad de que al menos 3 personas tengan sobrepeso:

\[ P(X \geq 3) = 1 - P(X \leq 2) \]

\[ P(X = 0) = \binom{20}{0} (0.257)^0 (1 - 0.257)^{20} = 1 \times 1 \times 0.2057 = 0.002629 \]

\[ P(X = 1) = \binom{20}{1} (0.257)^1 (1 - 0.257)^{19} = 20 \times 0.257 \times 0.7943 = 0.01819 \]

\[ P(X = 2) = \binom{20}{2} (0.257)^2 (1 - 0.257)^{18} = 190 \times 0.06605 \times 0.733 = 0.05976 \]

\[ P(X = 0) + P(X = 1) + P(X = 2) = 0.002629 + 0.01819 + 0.05976 = 0.08058 \]

\[ P(X \geq 3) = 1 - 0.0858 = 0.91942 \]

1 - pbinom(2, size = 20, prob = 0.257)

[1] 0.9194234

Ejercicio 6:

La probabilidad de que un visitador médico realice una venta en una visita es de 0,3. Determine la media y la varianza de esta variable, así como la probabilidad de que el visitador no realice ninguna venta

\(X \sim \text{Bin}(n=1, p=0.3)\)

Probabilidad de que el visitador no realice ninguna venta

dbinom(0, size = 1, prob = 0.3)

[1] 0.7

Valor Esperado (E(X))

10 * 0.3

[1] 3

Varianza (Var(X)

10 * 0.3 * 0.7

[1] 2.1

Ejercicio 7:

Un catador de vinos afirma que el 90% de las veces puede distinguir entre un vino fino y uno corriente con sólo degustar un sorbo. Para comprobar su afirmación, se le aplicará una pequeña prueba: degustar 9 muestras de vino y decidir en cada caso si se trata de vino fino o corriente. El criterio para aceptar su afirmación es que si acierta por lo menos en 6 muestras se aceptará su afirmación, y en caso contrario se rechazará como falsa. Determine la probabilidad de aun suponiendo que es cierto lo que afirma (que es capaz de acertar el 90% de las veces), no logre pasar la prueba.

P(X<6)

pbinom(5, size = 9, prob = 0.9)

[1] 0.008331094

Ejercicio 8:

Un examen de estadística consta de 5 preguntas cada una de ellas con cuatro respuestas de las cuales una sola es correcta. Un alumno responde al azar (es decir, sin tener la menor idea sobre las preguntas). ¿Cuál es la probabilidad de que resuelva bien a 3 o más preguntas?

1 - pbinom(2, size = 5, prob = 0.25)

[1] 0.1035156

Ejercicio 9:

Un jugador de baloncesto lanza un tiro libre a una canasta. Si del historial deportivo del jugador se sabe que encesta el 80% de las veces, determine la probabilidad de que no enceste el tiro. Además, calcule la media y la varianza.

dbinom(0, size = 1, prob = 0.8)

[1] 0.2

Valor Esperado (E(X))

1 * 0.8

[1] 0.8

Variante (Var(X))

1 * 0.8 * 0.2

[1] 0.16

Ejercicio 10:

Los pacientes que se someten a una cirugía de reemplazo de cadera tienen una probabilidad de morir del 0,18. Si se toma una muestra aleatoria de 10 pacientes:

¿Cuál es la probabilidad de que más de 6 mueran?

1 - pbinom(6, size = 10, prob = 0.18)

[1] 0.0004400767

¿Cuál es la probabilidad de que a lo sumo 4 mueran?

pbinom(4, size = 10, prob = 0.18)

[1] 0.9786771

¿Cuál es la probabilidad de que 2 pacientes mueran?

dbinom(2, size = 10, prob = 0.18)

[1] 0.2980357

4. Distribución Hipergeométrica

La distribución Hipergeométrica modela el número de éxitos en una muestra de tamaño fijo extraída sin reemplazo de una población finita.

Función de Masa de Probabilidad (PMF): \[ P(X = x) = \frac{\binom{k}{x} \binom{N-k}{n-x}}{\binom{N}{n}} \]

Función de Distribución Acumulada (CDF): \[ F(X = x) = \sum_{i=0}^{x} P(X = i) \]

Ejemplo 1:

En una empresa farmacéutica diariamente se producen 90 unidades de cierto medicamento, de las cuales generalmente 6 no cumplen con los requerimientos de cierto tratamiento. Se examina en un día cualquiera una muestra de 7 unidades. Hallar la probabilidad de:

Encontrar que 5 de las unidades cumplan con los requerimientos.

Sea X el número de unidades que cumplen los requerimientos:

\[P(X = 5) = \frac{\binom{6}{2} \binom{84}{5}}{\binom{90}{7}} = \frac{15 \times 30872016}{7471375560} = 0.06198\]

-¿Cuál es la probabilidad de obtener a lo más 4 unidades defectuosas?

Sea Y el número de unidades defectuosas, entonces:

\[P(Y \leq 4) = P(Y = 0) + P(Y = 1) + P(Y = 2) + P(Y = 3) + P(Y = 4)\] \[P(Y \leq 4) = \frac{\binom{6}{0} \binom{84}{7}}{\binom{90}{7}} + \frac{\binom{6}{1} \binom{84}{6}}{\binom{90}{7}} + \frac{\binom{6}{2} \binom{84}{5}}{\binom{90}{7}} + \frac{\binom{6}{3} \binom{84}{4}}{\binom{90}{7}} + \frac{\binom{6}{4} \binom{84}{3}}{\binom{90}{7}}\] \[P(Y \leq 4) = 0.60623 + 0.32643 + 0.06198 + 0.005165 + 0.0001913 + 0.0000028 + 0.000000011 = 0.99999\]

Cálculo en R:

sum(dhyper(0:4, 6, 84, 7))

[1] 0.9999972

¿Cuál es la probabilidad de obtener por lo menos 2 unidades defectuosas?

Sea Y el número de unidades defectuosas, entonces:

\[P(Y \geq 2) = 1 - P(Y < 2) = 1 - P(Y = 0) - P(Y = 1) = 1 - 0.60623 + 0.32643 = 0.06734\]

Cálculo en R:

sum(dhyper(2:6, 6, 84, 7))

[1] 0.06733974

Ejemplo 2:

A una consulta de medicina interna asisten 50 pacientes, 30 de ellos con HTA de novo y 20 con HTA secundaria (compromiso renal por nefropatía diabética) Si se seleccionan 4 pacientes al azar ¿Cuál es la probabilidad de que por lo menos 2 pacientes tengan HTA secundaria?

La distribución hipergeométrica se define como:

Sea X el número de pacientes con HTA secundaria en la muestra de 4 pacientes, entonces:

\[P(X \geq 2) = 1 - P(X \le 1) = 1 - \frac{\binom{20}{0} \binom{30}{4}}{\binom{50}{4}} - \frac{\binom{20}{1} \binom{30}{3}}{\binom{50}{4}} = 1 - 0.119 - 0.3526 = 0.5284\]

Cálculo en R:

sum(dhyper(2:4, 20, 30, 4))

[1] 0.5284195

Equivalente a:

1-sum(dhyper(0:1, 20, 30, 4))

[1] 0.5284195

En una sala de urgencia se encuentran 20 personas: 14 hombres y 6 mujeres. Si se eligen 3 personas al azar, ¿Cuál es la probabilidad de que las 3 sean mujeres?

Sea X el número de mujeres en la muestra de 3 personas, entonces:

\[P(X = 3) = \frac{\binom{14}{0} \binom{6}{3}}{\binom{20}{3}} = \frac{1 \times 20}{1140} = 0.017544\]

dhyper(3, 6, 14, 3)

[1] 0.01754386

Valor Esperado y Varianza: \[ E(X) = n \frac{k}{N}, \quad \text{Var}(X) = np(1-p)(\frac{N-n}{N-1}), \text{ donde } p = \frac{k}{N} \]

Dado \(N = 50\), \(K = 10\), \(n = 5\), calculemos la probabilidad de obtener exactamente 2 éxitos: \[ P(X = 2) = \frac{\binom{10}{2} \binom{40}{3}}{\binom{50}{5}} = \frac{45 \times 9880}{2118760} = 0.211 \]

dhyper(2, 10, 40, 5)

[1] 0.2098397

En general

N <- 50  # Tamaño de la población
K <- 10  # Número de éxitos en la población
n <- 5   # Tamaño de la muestra
x <- 0:n
prob <- dhyper(x, K, N-K, n)
cdf <- phyper(x, K, N-K, n)
plot(prob, names.arg = x, type="h", main = "Distribución Hipergeométrica")

5. Distribución Poisson

Es una distribución de probabilidad para variables aleatorias discretas que involucran la observación de un conjunto discreto de sucesos en un intervalo continuo de espacio o tiempo.

Variable aleatoria Poisson

Cuando la tasa promedio de ocurrencia de un evento es λ, la variable aleatoria Poisson cuenta el número de sucesos ocurridos durante un cierto “intervalo de observación”, el cual va a depender de una fracción de tiempo, una longitud o un espacio.

X = “Número de sucesos ocurridos en el intervalo de observación, dada una tasa promedio de ocurrencia de eventos en el intervalo de observación λ”.

El rango de la variable aleatoria X es {0,1,2,…,∞}

\[X \sim Poisson(\lambda)\]

Función de masa de probabilidad

\[f(x)=\begin{cases}{\displaystyle\frac{e^{-\lambda}{\lambda^x}}{x!}}&{\text{si } x\in{\left\{{0,1,2,...,\infty}\right\}}}\\0 & \text{en otro caso}& \end{cases}\]

Gráfico de la distribución de masa de la poisson

x<-0:20
plot(x, dpois(x, 5), type="h", 
     main="X~Poisson(5)",
     xlab="X",
     ylab="f(X)")

Función de distribución acumulada

\[F(x) = P(X \le x) = \sum_{x=0}^k{\frac{e^{-\lambda}{\lambda^x}}{x!}}\]

Gráfico de la función de distribución acumulada

x<-0:20
plot(x, ppois(x, 5), type="s", 
     main="X~Poisson(5)",
     xlab="X",
     ylab="F(X)")

Ejemplo:

En una población se ha observado un número promedio anual de 12 muertes por cáncer de pulmón?

X=“Número de muertes por cáncer de pulmón en un año” R(X):{0,1,2,…} λ=12 número promedio de muertes por año X∼Poisson(12)

¿Cuál es la probabilidad de que en el presente año hayan exactamente 10 muertes por cáncer de pulmón?

\[P(x=10) = {\displaystyle\frac{e^{-12}{12^{10}}}{10!}} = 0.1048\]

dpois(10 , 12)

[1] 0.1048373

Ejercicios:

¿Cuál es la probabilidad que no más de 6 personas mueran durante el presente año por cáncer de pulmón?

ppois(6,12)

[1] 0.04582231

¿Cuál es la probabilidad que al menos 8 personas mueran durante el presente año por cáncer de pulmón?

1 - ppois(7,12)

[1] 0.9104955

¿Cuál es el número de muertes por debajo del cual se encuentra el 95% de las muertes por cáncer de pulmón en el presente año?

qpois(0,95,12)

[1] 0

Gráfico de la distribución de masa de la poisson

x<-0:50
plot(x, dpois(x, 12), type="h", 
     main="X~Poisson(12)",
     xlab="X",
     ylab="f(X)")

Gráfico de la función de distribución acumulada

x<-0:50
plot(x, ppois(x, 12), type="s", 
     main="X~Poisson(12)",
     xlab="X",
     ylab="F(X)")

6. Distribución Binomial Negativa

Modela el número de fracasos antes de alcanzar un número fijo de éxitos en ensayos de Bernoulli.

Asumiendo que k corresponde al k-ésimo éxito y x es el valor de una variable aleatoria que representa el número de fracasos hasta observa exactamente k éxitos.

PMF: \[ P(X = x) = P(x; k,p) = \binom{k+x-1}{k-1} p^k (1 - p)^x \]

pero recordemos que n = x + k

Por lo tanto, se puede reescribir como:

PMF: \[ P(X = x) = P(x; k,p) = \binom{n-1}{k-1} p^k (1 - p)^{n-k} \]

Ejemplo

Se está encuestando a personas que salen de un puesto de votación y se les pregunta si votaron de manera independiente. La probabilidad de que una persona vote independiente es del 20% ¿Cuál es la probabilidad de que la persona número 15 a la que se le pregunte, sea la quinta que haya votado de manera independiente?

\(r = 5\) es el número de éxitos requeridos (personas que votaron independiente).
\(p = 0.2\) es la probabilidad de éxito en cada intento.
\(k = 15\) es el número total de intentos hasta obtener el quinto éxito.

\[ P(X = 15) = \binom{15-1}{5-1} (0.2)^5 (0.8)^{15-5} \]

\[ P(X = 15) = \binom{14}{4} (0.2)^5 (0.8)^{10} \]

\[ P(X = 15) = 1001 \times 0.00032 \times 0.10737 \]

\[ P(X = 15) = 1001 \times 0.0000343584 \]

\[ P(X = 15) \approx 0.0344 \]

dnbinom(15 - 5, size = 5, prob = 0.2)

[1] 0.0343941

Función de Distribución Acumulada (CDF): \[ F(X = k) = \sum_{i=0}^{x} P(X = i) \]

Valor Esperado y Varianza: \[ E(X) = k \frac{1 - p}{p}, \quad \text{Var}(X) = k \frac{1 - p}{p^2} \]

Ejemplo a Mano: Si \(r = 3\), \(p = 0.4\), calculemos la probabilidad de que \(X = 2\): \[ P(X = 2) = \binom{2+3-1}{2} (0.4)^3 (0.6)^2 \]

Ejemplo en R:

r <- 3  # Número de éxitos requeridos
p <- 0.4  # Probabilidad de éxito
datos <- 0:15
prob <- dnbinom(datos, r, p)
cdf <- pnbinom(datos, r, p)
plot(prob, names.arg = datos,type="h", main = "Distribución Binomial Negativa")

Ejercicios Sesión 2

Ejercicio 1

Se sabe que en promedio 1 de cada 8 mujeres embarazadas que asisten a control tiene niveles elevados de azúcar en la sangre, ¿Cuál es la probabilidad que la quinta mujer examinada por el médico sea la primera en tener niveles elevados de azúcar?

Al evaluar el problema, identificamos que la distribución binomial negativa es la más adecuada.

La probabilidad de éxito (mujer con azúcar elevado) es \(p = \frac{1}{8}\), y buscamos la probabilidad de que la primera mujer con niveles elevados sea la quinta examinada.

Esto sigue una distribución binomial negativa con \(n=5\), \(r = 1\) y \(p = \frac{1}{8}\):

\[P(X = 5) = \binom{n-1}{k-1} p^k (1 - p)^{n-k} = \binom{5-1}{1-1} *\left(\frac{1}{8}\right)^1*\left(\frac{7}{8}\right)^{(5-1)} = \binom{4}{0} \left(\frac{1}{8}\right) \left(\frac{7}{8}\right)^4 = \frac{2401}{32768} \approx 0.0733\]

p <- 1/8
n <- 5
dnbinom(n - 1, size = 1, prob = p)

[1] 0.07327271

Ejercicio 2

Un lote de medicamentos que serán distribuidos a una importante clínica contiene 50 cajas de un proveedor de medicamentos locales y 70 unidades de un proveedor de medicamentos de un país vecino. Si se seleccionan 12 piezas al azar:

¿Cuál es la probabilidad de que todas sean del proveedor local?
¿Cuál es la probabilidad de que todas sean del proveedor del país vecino?
¿Cuál es la probabilidad de por lo menos 5 sean del proveedor local?
¿Cuál es la probabilidad de que a lo sumo 3 sean del proveedor del país vecino?

Al evaluar el problema, identificamos que la distribución hipergeométrica es la más adecuada.

Tenemos un lote de 50 cajas del proveedor local y 70 del proveedor extranjero (total = 120). Se seleccionan 12 piezas al azar.

1. ¿Cuál es la probabilidad de que todas sean del proveedor local?

Sea X el número de cajas del proveedor local en la muestra de 12 cajas, entonces:

\[P(X = 12) = \frac{\binom{50}{12} \binom{70}{0}}{\binom{120}{12}} = \frac{1}{\binom{120}{12}} = \frac{121399651100}{10542859559688800} = 0.0000115\]

sprintf("%.8f", dhyper(12, 50, 70, 12))

[1] "0.00001151"

1. ¿Cuál es la probabilidad de que todas sean del proveedor del país vecino?

\[P(X = 12) = \frac{\binom{50}{0} \binom{70}{12}}{\binom{120}{12}} = \frac{1}{\binom{120}{12}} = \frac{10638894058520}{10542859559688800} = 0.001009\]

dhyper(12, 70, 50, 12)

[1] 0.001009109

1. ¿Cuál es la probabilidad de por lo menos 5 sean del proveedor local?

\[P(X \geq 5) = 1 - P(X \leq 4) = 1 - \sum_{i=0}^{4} P(X = i)\]

\[P(X \geq 5) = 1 - \left(\frac{\binom{50}{0} \binom{70}{12}}{\binom{120}{12}} + \frac{\binom{50}{1} \binom{70}{11}}{\binom{120}{12}} + \frac{\binom{50}{2} \binom{70}{10}}{\binom{120}{12}} + \frac{\binom{50}{3} \binom{70}{9}}{\binom{120}{12}} + \frac{\binom{50}{4} \binom{70}{8}}{\binom{120}{12}}\right)\]

\[(P(X \geq 5) = 1 - \binom{50}{0} \binom{70}{12} - \binom{50}{1} \binom{70}{11} - \binom{50}{2} \binom{70}{10} - \binom{50}{3} \binom{70}{9} - \binom{50}{4} \binom{70}{8}\]

\[(P(X \geq 5) = 1 - \frac{10638894058520 + 108192142968000 + 485963042164600 + 1274657159776000 + 2174112816876000}{10542859559688800}\]

\[(P(X \geq 5)= 1 - \frac{4053564000000000 }{10542859559688800} = 1 - 0.3841 = 0.616\]

sum(dhyper(5:12, 50, 70, 12))

[1] 0.6155157

1. ¿Cuál es la probabilidad de que a lo sumo 3 sean del proveedor del país vecino?

\[P(X \leq 3) = \frac{\binom{70}{0} \binom{50}{12}}{\binom{70}{12}} + \frac{\binom{70}{1} \binom{50}{11}}{\binom{70}{12}} + \frac{\binom{70}{2} \binom{50}{10}}{\binom{70}{12}} + \frac{\binom{70}{3} \binom{50}{9}}{\binom{70}{12}}\]

sum(dhyper(9:12, 50, 70, 12))

[1] 0.01562111

Ejercicio 3

Una empresa electrónica observa que el número de componentes que fallan antes de cumplir 100 horas de funcionamiento es una variable aleatoria de Poisson. Si el número promedio de estos fallos es ocho,

¿Cuál es la probabilidad de que falle un componente en 25 horas?
¿Y de que fallen no más de dos componentes en 50 horas?
¿Cuál es la probabilidad de que fallen por lo menos cinco en 125 horas?

Al evaluar el problema, identificamos que la distribución de Poisson es la más adecuada.

El número de fallos sigue una distribución de Poisson con \(\lambda = 8\) fallos en 100 horas, por lo que la tasa es \(\lambda = 8/100 = 0.08\) por hora.

¿Cuál es la probabilidad de que falle un componente en 25 horas?

\(\lambda = 25 \times 0.08 = 2\), queremos \(P(X = 1)\):

\[P(X = 1) = \frac{e^{-2} 2^1}{1!} = 0.2707\]

dpois(1, lambda = 2)

[1] 0.2706706

1. ¿Y de que fallen no más de dos componentes en 50 horas?

\(\lambda = 50 \times 0.08 = 4\), queremos \(P(X \leq 2)\):

\[P(X \leq 2) = P(X = 0) + P(X = 1) + P(X = 2) = 0.0183 + 0.0733 + 0.1465 = 0.2381\]

ppois(2, lambda = 4)

[1] 0.2381033

¿Cuál es la probabilidad de que fallen por lo menos cinco en 125 horas?

\(\lambda = 125 \times 0.08 = 10\), queremos \(P(X \geq 5)\):

\[P(X \geq 5) = 1 - P(X \leq 4) = 1 - \sum_{i=0}^{4} P(X = i) = 1 - (P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) + P(X = 4))\]

\[P(X \geq 5) = 1 - \frac{e^{-10} 10^0}{0!} - \frac{e^{-10} 10^1}{1!} - \frac{e^{-10} 10^2}{2!} - \frac{e^{-10} 10^3}{3!} - \frac{e^{-10} 10^4}{4!}\] \[P(X \geq 5) = 1 - 0.0000454 - 0.0004539993 - 0.002269996 - 0.007566655 - 0.01891664 = 0.9707\]

1 - ppois(4, lambda = 10)

[1] 0.9707473

Ejercicio 4

La policía sospecha que en un camión cargado con 40 bultos de arroz se han camuflado paquetes de cocaína. Para confirmar su sospecha, la policía escoge al azar 5 bultos para inspeccionarlos. Si en efecto, de los 40 bultos de arroz, que contiene el camión, 10 tienen camufladas cocaína, ¿Cuál es la probabilidad de que por lo menos uno de los bultos de la muestra contenga cocaína?

Al evaluar el problema, identificamos que la distribución hipergeométrica es la más adecuada.

Sea X el número de bultos con cocaína en la muestra de 5 bultos, entonces:

\[P(X \geq 1) = 1 - P(X = 0)\]

\[P(X = 0) = \frac{\binom{10}{0} \binom{30}{5}}{\binom{40}{5}} = \frac{142506}{658008} = 0.2167\]

\[P(X \geq 1) = 1 - 0.21657 = 0.7834\]

1 - dhyper(0, 10, 30, 5)

[1] 0.7834282

Ejercicio 5

De acuerdo con un estudio geológico, en un pozo de exploración petrolera hay 0.2 de probabilidad de encontrar petróleo. Encuentre la probabilidad de:

Localizar petróleo por primera vez en el tercer pozo que se perfore
Encontrar el segundo pozo en el séptimo pozo perforado
La compañía desea abrir tres pozos de producción. Halle la media y varianza de la cantidad de pozos que hay que perforar

Al evaluar el problema, identificamos que la distribución binomial negativa es la más adecuada.

\(p = 0.2\) es la probabilidad de encontrar petróleo.

Localizar petróleo por primera vez en el tercer pozo que se perfore

Sea X el número de pozos perforados antes de encontrar petróleo por primera vez, entonces:

\[P(X = 3) = \binom{3-1}{1-1} (0.2)^1 (0.8)^2 = 0.128\]

  dnbinom(3 - 1, size = 1, prob = 0.2)

[1] 0.128

-b. Encontrar el segundo pozo en el séptimo pozo perforado

\[P(X = 7) = \binom{7-1}{2-1} (0.2)^2 (0.8)^5 = 0.0786432\]

  dnbinom(7-2, size = 2, prob = 0.2)

[1] 0.0786432

c) La media y varianza del número de pozos perforados antes de encontrar 3 con petróleo:

\[E(X) = k \frac{1 - p}{p} = 3 \frac{1 - 0.2}{0.2} = 12\]

\[Var(X) = k \frac{1 - p}{p^2} = 3 \frac{1 - 0.2}{0.2^2} = 60\]

  k <- 3
  p <- 0.2
  E <- k * (1 - p) / p
  Var <- k * (1 - p) / p^2
  E

[1] 12

Var

[1] 60

Ejercicio 6

El call center de un hospital para citas de consulta externa recibe en promedio dos llamadas por minuto.

¿Cuál es la probabilidad de que se reciban 5 llamadas en dos minutos?
¿Y de que se reciban no más de ocho llamadas en cinco minutos?
¿Cuál es la probabilidad de que se reciban por lo menos 100 llamadas en una hora?

Al evaluar el problema, identificamos que la distribución de Poisson es la más adecuada.

Sea X el número de llamadas recibidas en el tiempo t, entonces:

El call center recibe 2 llamadas por minuto, es decir, \(\lambda = 2t\).

¿Cuál es la probabilidad de que se reciban 5 llamadas en dos minutos?

\[P(X = 5) = \frac{e^{-4} 4^5}{5!} = 0.1563\]

  dpois(5, lambda = 4)

[1] 0.1562935

¿Y de que se reciban no más de ocho llamadas en cinco minutos?

Dados \(\lambda = 10\), queremos \(P(X \leq 8)\):

\[P(X \leq 8) = P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) + P(X = 4) + P(X = 5) + P(X = 6) + P(X = 7) + P(X = 8)\] \[P(X \leq 8) = \frac{e^{-10} 10^0}{0!} + \frac{e^{-10} 10^1}{1!} + \frac{e^{-10} 10^2}{2!} + \frac{e^{-10} 10^3}{3!} + \frac{e^{-10} 10^4}{4!} + \frac{e^{-10} 10^5}{5!} + \frac{e^{-10} 10^6}{6!} + \frac{e^{-10} 10^7}{7!} + \frac{e^{-10} 10^8}{8!}\] \[P(X \leq 8) = 0.0000454 + 0.000454 + 0.00227 + 0.007567 + 0.01892 + 0.0378333 + 0.06305546 + 0.09008 + 0.112599 = 0.33282\]

  ppois(8, lambda = 10)

[1] 0.3328197

¿Cuál es la probabilidad de que se reciban por lo menos 100 llamadas en una hora?

Dados \(\lambda = 120\), queremos \(P(X \geq 100)\):

  1 - ppois(99, lambda = 120)

[1] 0.9721363

Ejercicio 7

Cinco individuos de una población animal se creen está cerca de la extinción en cierta región, fueron capturados, marcados y liberados para mezclarse con la población. Después que tuvieron la oportunidad de mezclarse, se seleccionó una muestra aleatoria de 10 de estos animales. Si en realidad hay 25 animales de este tipo en la región, ¿Cuál es la probabilidad de que se encuentren más de 2 animales marcados?

Al evaluar el problema, identificamos que la distribución hipergeométrica es la más adecuada.

Sea X el número de animales marcados en la muestra de 10 animales, entonces:

\[P(X > 2) = 1 - P(X \leq 2)\]

\[P(X \leq 2) = P(X = 0) + P(X = 1) + P(X = 2)\]

\[P(X = 0) = \frac{\binom{5}{0} \binom{20}{10}}{\binom{25}{10}} = \frac{184756}{3268760} = 0.0565\]

  dhyper(0, 5, 20, 10)

[1] 0.05652174

Ejercicio 8

En un hospital el número medio de ingresos en la unidad coronaria por día es 2.

¿Cuál es la probabilidad de que no haya ningún ingreso en un día?
¿Cuál es la probabilidad de que se presenten a lo más 2 ingresos en un día?
¿Cuál es la probabilidad de que en dos se presenten mínimo 3 ingresos?
¿Cuál es la probabilidad de que en tres días hayan más de 5 ingresos?

Al evaluar el problema, identificamos que la distribución de Poisson es la más adecuada.

Sea X el número de ingresos en la unidad coronaria por día, entonces:

El número medio de ingresos en la unidad coronaria por día es \(\lambda = 2\).

¿Cuál es la probabilidad de que no haya ningún ingreso en un día?

\[P(X = 0) = \frac{e^{-2} 2^0}{0!} = 0.1353\]

  dpois(0, lambda = 2)

[1] 0.1353353

¿Cuál es la probabilidad de que se presenten a lo más 2 ingresos en un día?

\[P(X \leq 2) = P(X = 0) + P(X = 1) + P(X = 2) = 0.1353 + 0.2707 + 0.2707 = 0.6767\]

  ppois(2, lambda = 2)

[1] 0.6766764

¿Cuál es la probabilidad de que en dos días se presenten mínimo 3 ingresos?

Como están preguntando por al menos 3 ingresos en dos días, entonces el valor de lambda es \(\lambda = 4\).

\[P(X \geq 3) = 1 - P(X \leq 2) = 1 - (P(X = 0) + P(X = 1) + P(X = 2))\]

\[P(X \geq 3) = 1 - \left(\frac{e^{-4} 4^0}{0!} + \frac{e^{-4} 4^1}{1!} + \frac{e^{-4} 4^2}{2!}\right)\]

\[P(X \geq 3) = 1 - (0.0183 + 0.0733 + 0.1465) = 0.7619\]

  1 - ppois(2, lambda = 4)

[1] 0.7618967

¿Cuál es la probabilidad de que en tres días hayan más de 5 ingresos?

Como están preguntando por más de 5 ingresos en tres días, entonces el valor de lambda es \(\lambda = 6\).

\[P(X > 5) = 1 - P(X \leq 5) = 1 - (P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) + P(X = 4) + P(X = 5))\]

\[P(X=0) = \frac{e^{-6} 6^0}{0!} = 0.0025\] \[P(X=1) = \frac{e^{-6} 6^1}{1!} = 0.0149\] \[P(X=2) = \frac{e^{-6} 6^2}{2!} = 0.0447\] \[P(X=3) = \frac{e^{-6} 6^3}{3!} = 0.0895\] \[P(X=4) = \frac{e^{-6} 6^4}{4!} = 0.1343\] \[P(X=5) = \frac{e^{-6} 6^5}{5!} = 0.1602\]

\[P(X > 5) = 1 - (0.0025 + 0.0149 + 0.0447 + 0.0895 + 0.1343 + 0.1602) = 0.554\]

  1 - ppois(5, lambda = 6)

[1] 0.5543204

Ejercicio 9

De un lote de 210 medicamentos, 150 están próximos a vencerse. Si selecciono 40 medicamentos al azar:

¿Cuál es la probabilidad de que por lo menos 20 medicamentos estén próximos a vencerse?
¿Cuál es la probabilidad de que a lo sumo 30 estén próximos a vencerse?
¿Cuál es la probabilidad de que al menos 10 no estén próximos a vencerse?

Al evaluar el problema, identificamos que la distribución hipergeométrica es la más adecuada.

Sea X el número de medicamentos próximos a vencerse en la muestra de 40 medicamentos, entonces:

\[P(X \geq 20) = 1 - P(X \leq 19)\]

\[P(X \leq 19) = P(X = 0) + P(X = 1) + P(X = 2) + ... + P(X = 19)\]

  1 - sum(dhyper(0:19, 150, 60, 40))

[1] 0.9996716

¿Cuál es la probabilidad de que a lo sumo 30 estén próximos a vencerse?

\[P(X \leq 30) = P(X = 0) + P(X = 1) + P(X = 2) + ... + P(X = 30)\]

  sum(dhyper(0:30, 150, 60, 40))

[1] 0.7709022

¿Cuál es la probabilidad de que al menos 10 no estén próximos a vencerse?

Como están preguntando por al menos 10 medicamentos que no estén próximos a vencerse, entonces se puede reescribir como al menos 10 medicamentos no estén próximos a vencerse.

\[P(X \geq 10) = 1 - P(X \leq 9)\]

Debo considerar los que no están próximos a vencerse, es decir: 60 medicamentos.

  1 - sum(dhyper(0:9, 60, 150, 40))

[1] 0.7709022

Ejercicio 10

En una población se ha observado que el número medio anual de muertes por cáncer de útero es de 8.

¿Cuál es la probabilidad de que durante el año haya exactamente 10 muertes por cáncer de útero?
¿Cuál es la probabilidad de que en dos años se presenten por lo menos 15 muertes por cáncer de útero?
¿Cuál es la probabilidad de que en 5 años hayan menos de 36 muertes por cáncer de útero?

Al evaluar el problema, identificamos que la distribución de Poisson es la más adecuada.

Sea X el número de muertes por cáncer de útero en un año, entonces:

El número medio anual de muertes por cáncer de útero es \(\lambda = 8\).

¿Cuál es la probabilidad de que durante el año haya exactamente 10 muertes por cáncer de útero?

\[P(X = 10) = \frac{e^{-8} 8^{10}}{10!} = 0.09926\]

  dpois(10, lambda = 8)

[1] 0.09926153

¿Cuál es la probabilidad de que en dos años se presenten por lo menos 15 muertes por cáncer de útero?

En este caso, se debe considerar el número de muertes en dos años, es decir, \(\lambda = 16\).

\[P(X \geq 15) = 1 - P(X \leq 14)\]

\[P(X \leq 14) = P(X = 0) + P(X = 1) + P(X = 2) + ... + P(X = 14)\]

  1 - sum(dpois(0:14, lambda = 16))

[1] 0.6324726

¿Cuál es la probabilidad de que en 5 años hayan menos de 36 muertes por cáncer de útero?

En este caso, se debe considerar el número de muertes en cinco años, es decir, \(\lambda = 40\).

\[P(X < 36) = P(X = 0) + P(X = 1) + P(X = 2) + ... + P(X = 35)\]

  sum(dpois(0:35, lambda = 40))

[1] 0.2424142