Enlace al video: Link
En un estudio realizado en la universidad de Massachusetts sobre el
uso de las redes sociales en un grupo de jóvenes, se observa que una
persona elegida al azar ha utilizado Instagram o TikTok con una
probabilidad del 85%. Además, se sabe que la probabilidad de que haya
utilizado TikTok sabiendo que utiliza Instagram es del 30%. Por último,
la probabilidad de que no haya utilizado instagram es del 20%.
Tenemos: \(P(I
\cup T)=0.85\), \(P(T / I)=0.3\)
y \(P(I^c)=0.2\).
\(P(I \cap
T)\), sabiendo que \(P(T / I) = \frac
{P(T \cap I)} {P(I)}\), \(P(I \cap T) =
P(T / I) * P(I)\)
\(P(I) = 1 -
P(I^c) = 1 - 0.2 = 0.8\)
\(P(I
\cap T) = 0.3 * 0.8 = 0.24\)
\(P(T)\),
sabiendo que \(P(I \cup T) = P(I) + P(T) - P(I
\cap T)\)
\(P(T) = P(I \cup T) -
P(I) + P(I \cap T) = 0.85 - 0.8 + 0.24 = 0.29\)
\(P(T \cap
I^c)\), sabiendo que \(P(T) = P(T \cap
I) + P(T \cap I^c)\)
\(P(T \cap
I^c) = P(T) - P(T \cap I) = 0.29 - 0.24 = 0.05\)
\(P(T^c / I) = \frac {P(T^c \cap I)} {P(I)}\), o aplicando la regla del complementario: \(P(T^c / I) = 1 - P(T / I) = 1 - 0.3 = 0.7\)
Sea \(X\) la duración de la batería de un teléfono móvil en condiciones óptimas, la cual sigue una distribución modificada. Se sabe que la duración está entre 20 y 30 horas. La función de densidad de probabilidad \(f(x)\) viene dada por:
\[ f(x) = \begin{cases} \frac{x - 20}{52} & \text{para } 20 < x < 30 \\ 0 & \text{en otro caso} \end{cases} \]
La esperanza matemática (media) de la duración de las baterías se calcula mediante la integración de la función de densidad de probabilidad multiplicada por la variable sobre la cual se integra. Para la función dada \(f(x) = \frac{x - 20}{52}\) en el intervalo \(20 < x < 30\), procedemos de la siguiente manera:
Primero, establecemos la integral de la esperanza matemática:
\[ E[X] = \int_{20}^{30} x f(x) \, dx \]
-Para calcular esta integral directamente en R, podemos usar el siguiente comando:
# Guardamos el valor de la media en una variable para más adelante
mean_duration <- integrate(function(x) x * ((x - 20) / 52), lower = 20, upper = 30)$value
mean_duration
## [1] 25.64103
Si queremos seguir con el desarrollo, sustituimos \(f(x)\) por su función y multiplicamos por x:
\[ E[X] = \int_{20}^{30} \frac{x(x - 20)}{52} \, dx \]
\[ E[X] = \int_{20}^{30} \frac{x^2 - 20x}{52} \, dx \]
La integral se nos queda de esta forma con sus respectivas cotas.
\[ E[X] = \left[ \frac{x^3}{156} - \frac{10x^2}{52} \right]_{20}^{30} = \left( \frac{30^3}{156} - \frac{10*30^2}{52} \right) - \left( \frac{20^3}{156} - \frac{10*20^2}{52} \right) = 0 - (-25.64103) = 25.64103\]
La varianza mide cuánto se dispersan los valores alrededor de la media. Para una variable aleatoria continua con función de densidad \(f(x)\), la varianza se calcula como:
\[ \text{Var}(X) = E\left[(X - E[X])^2\right] = \int_{-\infty}^{\infty} (x - \mu)^2 f(x) \, dx \]
Donde \(\mu\) es la esperanza matemática que calculamos previamente.
En nuestro caso con \(f(x) = \frac{x - 20}{52}\), la varianza se calcula integrando \((x - \mu)^2\) multiplicado por \(f(x)\) en el intervalo \(20 < x < 30\):
\[ \text{Var}(X) = \int_{20}^{30} (x - \mu)^2 \frac{x - 20}{52} \, dx = \int_{20}^{30} x^2 \frac{x - 20}{52} \, dx - \mu^2 \]
Para calcular esta integral en R, primero necesitamos el valor de la media \(\mu\) que calculamos en el primer apartado.
# Usamos la media que calculamos previamente
mu <- mean_duration
# Definimos la función para la varianza
var_func <- function(x) { (x - mu)^2 * ((x - 20) / 52) }
# Realizamos la integral para la varianza
varianza <- integrate(var_func, lower = 20, upper = 30)$value
varianza
## [1] 6.353361
Para un valor x en el intervalo [20, 30], la función de distribución acumulada se obtiene integrando la función de densidad de probabilidad desde el punto más bajo del intervalo hasta x:
\[ F(x) = \int_{20}^{x} \frac{t - 20}{52} \, dt \] El proceso para realizar la integración es el siguiente:
· Encontrar la función antiderivada de f(t): \[ F(t) = \int \frac{t - 20}{52} \, dt \] · Aplicar el Teorema Fundamental del Cálculo para evaluar la integral definida: \[ F(x) = \left[ \frac{t^2}{104} - \frac{20t}{52} \right]_{20}^{x} \] · Sustituir el límite superior x y el límite inferior 20 en la antiderivada y restar: \[ F(x) = \left( \frac{x^2}{104} - \frac{20x}{52} \right) - \left( \frac{20^2}{104} - \frac{20 \cdot 20}{52} \right) = \left( \frac{x^2}{104} - \frac{20x}{52} \right) - \left( -\frac {50} {13} \right) \Rightarrow \] \[ \Rightarrow F(x) = \begin{cases} 0 & \text{si x $\leq$ 20} \\ \frac{x^2-40x+400}{104} & \text{para } 20 < x < 30 \\ 1 & \text{si x $\geq$ 30} \end{cases} \]
La función de distribución acumulativa \(F(x)\) se obtiene integrando la función de densidad de probabilidad \(f(x)\) desde el límite inferior de la distribución hasta \(x\). Para encontrar el valor correspondiente al 75% de la distribución, buscamos \(x\) tal que \(F(x) = 0.75\).
Primero, calculamos la función de distribución (la calculamos en el apartado anterior): \[ F(x) = \int_{20}^{x} f(t) \, dt \]
Luego, resolvemos para \(x\): \[ F(x) = 0.75 \Rightarrow \frac {x^2-40x+400} {104} = 0.75 \]
Lo calculamos en R:
# Definimos la función de densidad de probabilidad
f_x <- function(x) { ifelse(x > 20 & x < 30, (x - 20)/52, 0) }
# Calculamos la función de distribución acumulativa para un rango de valores
F_x <- Vectorize(function(t) {
integrate(f_x, 20, t)$value
})
# Buscamos el valor que corresponde al 75% de la distribución
percentil_75 <- uniroot(function(x) F_x(x) - 0.75, c(20, 30))$root
percentil_75
## [1] 28.83176
En la reconocida marca de automóviles de lujo McLaren, los fallos mecánicos producidos en sus coches siguen una distribución de Poisson con un promedio de 1.28 fallos por año. Planteemos un escenario en el que se desee determinar la probabilidad de que durante un año determinado, un vehículo McLaren experimente un cierto número de fallos mecánicos, lo que nos permitirá comprender mejor la variabilidad en la calidad de sus productos y su impacto en la satisfacción del cliente.
Por seguir una distribución de Poisson sabemos que: Media = Varianza = \(\lambda\) = 1.28, X ~ PP(1.28)
Utilizando la distribución de Poisson y la fórmula proporcionada:
\[ p(x) = \frac{e^{-\lambda} \lambda^x}{x!} \]
donde \(x\) es el número de fallos, y \(\lambda\) es la tasa promedio de fallos por intervalo, calcularemos la probabilidad de que un vehículo haya sufrido exactamente dos fallos en tres años. La tasa \(\lambda\) se ajusta a los tres años multiplicándola por 3.
La probabilidad buscada es entonces:
\[ p(2) = \frac{e^{-\lambda_{trienio}} \lambda_{trienio}^2}{2!} \]
Y para realizar el cálculo en R, usarías los siguientes comandos:
lambda_anual <- 1.28
lambda_trienio <- lambda_anual * 3
x <- 2
probabilidad_dos_fallos <- dpois(x, lambda_trienio)
probabilidad_dos_fallos
## [1] 0.158468
Para calcular la probabilidad de que un vehículo de McLaren sufra más de tres fallos mecánicos en un año, aplicaremos la distribución de Poisson. Dado que la función de masa de probabilidad de Poisson para un número de fallos \(x\) es \(P(X=x) = \frac{e^{-\lambda} \lambda^x}{x!}\), la probabilidad de tener más de tres fallos es el complemento de la suma de las probabilidades de tener 0, 1, 2, o 3 fallos.
\[ P(X > 3) = 1 - (P(X=0) + P(X=1) + P(X=2) + P(X=3)) \]
\[ P(X > 3) = 1 - \sum_{x=0}^{3} \frac{e^{-\lambda} \lambda^x}{x!} \]
Y para realizar el cálculo en R, usaríamos los siguientes comandos:
lambda_anual <- 1.28
k <- 3
probabilidad_mas_tres_fallos <- 1 - ppois(k, lambda_anual)
probabilidad_mas_tres_fallos
## [1] 0.04112572
El percentil 80 representa el valor por debajo del cual caen el 80% de las observaciones.
Para evaluar el percentil 80 del número de
fallos por año con una distribución de Poisson, buscamos el valor \(x\) tal que un 80% de las observaciones
sean iguales o menores que \(x\).
Utilizamos la función qpois para calcular el cuantil
deseado.
\[ P(X \leq x) = F(x) \geq 0.8 \]
El valor \(x\) que cumple con esta condición es el percentil 80 y se calcula como sigue:
lambda_anual <- 1.28
octavo_percentil <- qpois(0.8, lambda_anual)
octavo_percentil
## [1] 2
Para calcular la probabilidad condicional de que un vehículo haya sufrido menos de 4 fallos en un año dado que ya ha sufrido al menos 2 fallos, necesitamos considerar la suma de las probabilidades individuales de tener exactamente 2 y 3 fallos y la probabilidad de tener al menos 2 fallos.
\[ P(2 \leq X < 4) = P(X=2) + P(X=3) \]
\[ P(X \geq 2) = 1 - P(X < 2) = 1 - (P(X=0) + P(X=1)) \]
La probabilidad condicional se calcula entonces como:
\[ P(X < 4|X \geq 2) = \frac{P(2 \leq X < 4)}{P(X \geq 2)} \]
En R, podemos calcular esto con los siguientes comandos:
lambda_anual <- 1.28
probabilidad_X_menos_4 <- ppois(3, lambda_anual)
probabilidad_X_al_menos_2 <- 1 - ppois(1, lambda_anual)
probabilidad_condicional <- (probabilidad_X_menos_4 - probabilidad_X_al_menos_2) / (1 - probabilidad_X_al_menos_2)
probabilidad_condicional
## [1] 0.9351253