En una urna hay tres bolas rojas y dos bolas verdes. Se extraen dos bolas al azar, sin reemplazo.
La probabilidad de extraer dos bolas rojas es \(P(RR) = P(R) · P(R|\)no se reemplaza\()\) = \(\frac{3}{5} * \frac{2}{4} = \frac{3}{10} = 0.3\)
La probabilidad condicionada de que la segunda bola sea verde, dado que la primera bola extraída es verde, es \(P(V|V1) = \frac{P(VV)}{P(V1)} = \frac {(1/10)}{(2/5)} = 0.25\), donde V1 es el evento de que la primera bola extraída sea verde.
Para calcular la probabilidad de extraer al menos una bola verde, podemos usar la regla de la probabilidad total. Es decir, \(P(V) = 1 - P(V^c) = 1 - P(RR) = 1 - \frac{3}{10} = \frac{7}{10} = 0.7\)
Primero, calculamos la probabilidad de extraer una bola roja en el primer intento: \(P(R) = \frac{3}{5}\)
Ahora, calculamos la probabilidad de extraer una bola verde en el segundo intento, dado que ya hemos extraído una bola roja en el primer intento: \(P(V) = \frac{2}{4}\)
Por lo tanto, \(P(RV) = \frac{3}{5} * \frac{2}{4} = \frac{3}{10} = 0.3\)
Se sabe que en un primer parcial de estadística, la variable aleatoria X representa el número de preguntas contestadas correctamente por un estudiante, con una distribución de probabilidad dada por:
| \(X\) | \(P(X=x)\) |
|---|---|
| 0 | 0.10 |
| 1 | 0.25 |
| 2 | 0.35 |
| 3 | 0.20 |
| 4 | 0.10 |
La probabilidad de que el estudiante conteste correctamente exactamente 2 preguntas es \(P(X=2) = 0.35\)
La probabilidad de que el estudiante conteste correctamente al menos 3 preguntas es la suma de las probabilidades de que conteste correctamente 3 o 4 preguntas: \(P(X\ge3) = P(X=3) + P(X=4) = 0.20 + 0.10 = 0.30\)
La función de distribución acumulada \(F(x)\) de la variable aleatoria X viene dada por \(F(x) = P(X \le x)\)
Para cada valor de x, se suman las probabilidades de los valores de X menores o iguales a x:
| \(X\) | \(P(X\le x)\) |
|---|---|
| 0 | 0.10 |
| 1 | 0.35 |
| 2 | 0.70 |
| 3 | 0.90 |
| 4 | 1.00 |
Para ello, tenemos que calcular previamente la media, usando la fórmula \(\sum_{i}^{} xi * P(X=xi)\) y, con r, se puede hacer directamente así:
x <- 0:4
p <- c(0.10, 0.25, 0.35, 0.20, 0.10)
mu <- sum(x * p)
mu
## [1] 1.95
La varianza:
var <- sum(p * (x - mu)^2)
var
## [1] 1.2475
Y la desviación típica:
sqrt(var)
## [1] 1.116915
Se sabe que en una tienda de martabak manis, el número promedio de clientes que llegan en un intervalo de 10 minutos es de parámetro 3. La variable aleatoria X representa el número de clientes que llegan en dicho intervalo, con una distribución de probabilidad Poisson.
1.- ¿Cuál es la probabilidad de que lleguen exactamente 2 clientes en un intervalo de 10 minutos?
2.- ¿Cuál es la probabilidad de que lleguen al menos 4 clientes en un intervalo de 10 minutos?
3.- ¿Cuál es el número esperado de clientes que llegan en un intervalo de 30 minutos?
4.- ¿Cuál es la desviación estándar del número de clientes que llegan en un intervalo de 10 minutos?
Definimos lambda:
lambda <- 3
dpois(2, lambda)
## [1] 0.2240418
1 - ppois(3, 3)
## [1] 0.3527681
lambda * 3
## [1] 9
4.La desviación típica es la raíz cuadrada de lambda.
sqrt(lambda)
## [1] 1.732051
Martabak manis
En un parque natural, se observa que el tiempo que tarda un visitante en avistar un ejemplar de un ave rara sigue una distribución exponencial de media 20 (minutos).
1.- Calcular la probabilidad de que un visitante aviste un ave rara en menos de 10 minutos.
La función de densidad de la exponencial es: f(x) = λ * \(e^{(-λ*x)}\).
lambda <- 1/20
pexp(10,lambda)
## [1] 0.3934693
2.- Si un visitante ha estado esperando ya 30 minutos sin éxito, ¿cuál es la probabilidad de que tenga que esperar más de 15 minutos adicionales para avistar un ave rara?
\(P(X>45|X>30) = \frac{P(X>45)}{P(X>30)} = \frac{1-P(X\le45)}{1-P(X\le30)}\)
(1-pexp(45,lambda))/(1-pexp(30,lambda))
## [1] 0.4723666
3.- ¿Cuál es la probabilidad de que el tiempo de espera de un visitante para avistar un ave rara sea mayor que la media más la desviación típica?
La desviación típica (\(\sigma\)) es \(\frac{1}{\lambda}\), luego: E(X) + \(\sigma = \frac{1}{\lambda} + \frac{1}{\lambda} =
\frac{2}{\lambda}\)
Entonces, lo que se nos pregunta es: \(P(X>\frac{2}{\lambda}) = 1 -
P(X\le\frac{2}{\lambda})\)
1-pexp(2/lambda,lambda)
## [1] 0.1353353
4.- ¿Qué tiempo necesita estar un visitante para que la probabilidad de avistar un ave rara sea del 90%?
El enunciado nos pide el tiempo, t, para que la probabilidad sea 0.9. Es decir, P(X<t) = 0.9
qexp(0.9,lambda)
## [1] 46.0517
Supongamos que se tiene una fábrica de galletas que produce en promedio 15 paquetes por hora. Sabiendo que la producción de paquetes sigue una distribución de Poisson.
1.- Si tomamos 10 horas al azar, cual es la probabilidad de que la media muestral sea menor de 14 paquetes por hora?
sigma= sqrt(15)
n=10
media= 15
pnorm(14, 15, sigma/sqrt(n))
## [1] 0.2071081
2.- El valor de la media muestral tal que la probabilidad de que sea menor o igual a ese valor sea del 20%.
qnorm(0.2, 15, sigma/sqrt(n))
## [1] 13.96923
3.- Si tomamos 80 horas al azar, la probabilidad de que la media muestral esté entre 13.5 y 16 paquetes por hora.
Sigma sigue siendo \(\sqrt{15}\), que ya hemos definido previamente en el apartado 1.
n=80
media= 15
pnorm(16, 15, sigma/sqrt(n))- pnorm(13.5, 15, sigma/sqrt(n))
## [1] 0.9892733
4.- Si sabemos que en una hora determinada se han producido menos de 20 paquetes, ¿cuál es la probabilidad de que hayan producido menos de 10?
\(P(X<10 | X<20) = \frac{P(X<10)}{P(X<20)}\)
(ppois(10,15))/(ppois(20,15))
## [1] 0.1291828
Tenemos los siguientes datos del tiempo que el detective privado José Luis Torrente pasa en el estadio Vicente Calderón en un año (8.4, 9.5, 9.15, 8.5, 6.5, 7.2, 8, 7.7, 10.6, 7.55, 6.3, 6.63). Sabemos que el tiempo sigue una distribución normal.
Añadiremos los datos del enunciado en la variable “tiempo” y además las operaciones que usaremos en varios apartados. Es decir, length(tiempo) y la desviación típica. Así, nos ahorramos tiempo y es más ordenado.
tiempo <- c(8.4, 9.5, 9.15, 8.5, 6.5, 7.2, 8, 7.7, 10.6, 7.55, 6.3, 6.63)
n = length(tiempo)
s = sd(tiempo)
1.- Intervalo de confianza al 95% para la media del tiempo.
alpha = 1 - 0.95
t_alpha = qt(1-alpha/2,n-1)
cat("(",mean(tiempo)-t_alpha*s/sqrt(n),",",mean(tiempo)+t_alpha*s/sqrt(n),")")
## ( 7.17426 , 8.83074 )
2.- Intervalo de confianza al 95% para la varianza del tiempo.
alpha = 1 - 0.95
cat("(",((n-1)*s^2)/qchisq(1-alpha/2,n-1),",",((n-1)*s^2)/qchisq(alpha/2,n-1),")")
## ( 0.8527273 , 4.8986 )
3.- ¿La media del tiempo puede ser 9 con una probabilidad del 97%?
alpha_ej3 = 1 - 0.97
t_alpha_ej3 = qt(1-alpha_ej3/2,n-1)
cat("(",mean(tiempo)-t_alpha_ej3*s/sqrt(n),",",mean(tiempo)+t_alpha_ej3*s/sqrt(n),")")
## ( 7.065253 , 8.939747 )
No, la media del tiempo no puede ser 9 porque está fuera del intervalo.
4.- ¿La varianza puede ser de 0.8 con probabilidad del 95%?
Sí puede ser. Sabiendo que el intervalo de confianza del apartado 2 es (0.8527273, 4.8986), y que \(\sqrt{0.8} = 0.8944\), podemos ver que está dentro de este intervalo.
José Luis Torrente