Índice


Enlace al video: Link

Probabilidad

En un estudio realizado en la universidad de Massachusetts sobre el uso de las redes sociales en un grupo de jóvenes, se observa que una persona elegida al azar ha utilizado Instagram o TikTok con una probabilidad del 85%. Además, se sabe que la probabilidad de que haya utilizado TikTok sabiendo que utiliza Instagram es del 30%. Por último, la probabilidad de que no haya utilizado instagram es del 20%.

Tenemos: \(P(I \cup T)=0.85\), \(P(T / I)=0.3\) y \(P(I^c)=0.2\).

  1. Calcula la probabilidad de que una persona haya utilizado ambas aplicaciones.

\(P(I \cap T)\), sabiendo que \(P(T / I) = \frac {P(T \cap I)} {P(I)}\), \(P(I \cap T) = P(T / I) * P(I)\)
\(P(I) = 1 - P(I^c) = 1 - 0.2 = 0.8\)
\(P(I \cap T) = 0.3 * 0.8 = 0.24\)

  1. ¿Cuál es la probabilidad de que una persona haya utilizado TikTok?

\(P(T)\), sabiendo que \(P(I \cup T) = P(I) + P(T) - P(I \cap T)\)
\(P(T) = P(I \cup T) - P(I) + P(I \cap T) = 0.85 - 0.8 + 0.24 = 0.29\)

  1. ¿Cuál es la probabilidad de que alguien haya utilizado TikTok pero no Instagram?

\(P(T \cap I^c)\), sabiendo que \(P(T) = P(T \cap I) + P(T \cap I^c)\)
\(P(T \cap I^c) = P(T) - P(T \cap I) = 0.29 - 0.24 = 0.05\)

  1. Probabilidad de que alguien no utilice TikTok sabiendo que utiliza Instagram.

\(P(T^c / I) = \frac {P(T^c \cap I)} {P(I)}\), o aplicando la regla del complementario: \(P(T^c / I) = 1 - P(T / I) = 1 - 0.3 = 0.7\)


Variable aleatoria (continua)

Sea \(X\) la duración de la batería de un teléfono móvil en condiciones óptimas, la cual sigue una distribución modificada. Se sabe que la duración está entre 20 y 30 horas. La función de densidad de probabilidad \(f(x)\) viene dada por:

\[ f(x) = \begin{cases} \frac{x - 20}{52} & \text{para } 20 < x < 30 \\ 0 & \text{en otro caso} \end{cases} \]

  1. Calcula la esperanza matemática de la duración de las baterías.

La esperanza matemática (media) de la duración de las baterías se calcula mediante la integración de la función de densidad de probabilidad multiplicada por la variable sobre la cual se integra. Para la función dada \(f(x) = \frac{x - 20}{52}\) en el intervalo \(20 < x < 30\), procedemos de la siguiente manera:

Primero, establecemos la integral de la esperanza matemática:

\[ E[X] = \int_{20}^{30} x f(x) \, dx \]

-Para calcular esta integral directamente en R, podemos usar el siguiente comando:

# Guardamos el valor de la media en una variable para más adelante
mean_duration <- integrate(function(x) x * ((x - 20) / 52), lower = 20, upper = 30)$value
mean_duration
## [1] 25.64103

Si queremos seguir con el desarrollo, sustituimos \(f(x)\) por su función y multiplicamos por x:

\[ E[X] = \int_{20}^{30} \frac{x(x - 20)}{52} \, dx \]

\[ E[X] = \int_{20}^{30} \frac{x^2 - 20x}{52} \, dx \]

La integral se nos queda de esta forma con sus respectivas cotas.

\[ E[X] = \left[ \frac{x^3}{156} - \frac{10x^2}{52} \right]_{20}^{30} = \left( \frac{30^3}{156} - \frac{10*30^2}{52} \right) - \left( \frac{20^3}{156} - \frac{10*20^2}{52} \right) = 0 - (-25.64103) = 25.64103\]

  1. Encuentra la varianza de la duración de las baterías.

La varianza mide cuánto se dispersan los valores alrededor de la media. Para una variable aleatoria continua con función de densidad \(f(x)\), la varianza se calcula como:

\[ \text{Var}(X) = E\left[(X - E[X])^2\right] = \int_{-\infty}^{\infty} (x - \mu)^2 f(x) \, dx \]

Donde \(\mu\) es la esperanza matemática que calculamos previamente.

En nuestro caso con \(f(x) = \frac{x - 20}{52}\), la varianza se calcula integrando \((x - \mu)^2\) multiplicado por \(f(x)\) en el intervalo \(20 < x < 30\):

\[ \text{Var}(X) = \int_{20}^{30} (x - \mu)^2 \frac{x - 20}{52} \, dx = \int_{20}^{30} x^2 \frac{x - 20}{52} \, dx - \mu^2 \]

Para calcular esta integral en R, primero necesitamos el valor de la media \(\mu\) que calculamos en el primer apartado.

# Usamos la media que calculamos previamente
mu <- mean_duration

# Definimos la función para la varianza
var_func <- function(x) { (x - mu)^2 * ((x - 20) / 52) }

# Realizamos la integral para la varianza
varianza <- integrate(var_func, lower = 20, upper = 30)$value
varianza
## [1] 6.353361
  1. Determina la función de distribución \(F(x)\).

Para un valor x en el intervalo [20, 30], la función de distribución acumulada se obtiene integrando la función de densidad de probabilidad desde el punto más bajo del intervalo hasta x:

\[ F(x) = \int_{20}^{x} \frac{t - 20}{52} \, dt \] El proceso para realizar la integración es el siguiente:

· Encontrar la función antiderivada de f(t): \[ F(t) = \int \frac{t - 20}{52} \, dt \] · Aplicar el Teorema Fundamental del Cálculo para evaluar la integral definida: \[ F(x) = \left[ \frac{t^2}{104} - \frac{20t}{52} \right]_{20}^{x} \] · Sustituir el límite superior x y el límite inferior 20 en la antiderivada y restar: \[ F(x) = \left( \frac{x^2}{104} - \frac{20x}{52} \right) - \left( \frac{20^2}{104} - \frac{20 \cdot 20}{52} \right) = \left( \frac{x^2}{104} - \frac{20x}{52} \right) - \left( -\frac {50} {13} \right) \Rightarrow \] \[ \Rightarrow F(x) = \begin{cases} 0 & \text{si x $\leq$ 20} \\ \frac{x^2-40x+400}{104} & \text{para } 20 < x < 30 \\ 1 & \text{si x $\geq$ 30} \end{cases} \]

  1. Halla el tiempo de duración que se supera con una probabilidad del 75%.

La función de distribución acumulativa \(F(x)\) se obtiene integrando la función de densidad de probabilidad \(f(x)\) desde el límite inferior de la distribución hasta \(x\). Para encontrar el valor correspondiente al 75% de la distribución, buscamos \(x\) tal que \(F(x) = 0.75\).

Primero, calculamos la función de distribución (la calculamos en el apartado anterior): \[ F(x) = \int_{20}^{x} f(t) \, dt \]

Luego, resolvemos para \(x\): \[ F(x) = 0.75 \Rightarrow \frac {x^2-40x+400} {104} = 0.75 \]

Lo calculamos en R:

# Definimos la función de densidad de probabilidad
f_x <- function(x) { ifelse(x > 20 & x < 30, (x - 20)/52, 0) }

# Calculamos la función de distribución acumulativa para un rango de valores
F_x <- Vectorize(function(t) {
  integrate(f_x, 20, t)$value
})

# Buscamos el valor que corresponde al 75% de la distribución
percentil_75 <- uniroot(function(x) F_x(x) - 0.75, c(20, 30))$root
percentil_75
## [1] 28.83176

Distribuciones de probabilidad (de Poisson)

En la reconocida marca de automóviles de lujo McLaren, los fallos mecánicos producidos en sus coches siguen una distribución de Poisson con un promedio de 1.28 fallos por año. Planteemos un escenario en el que se desee determinar la probabilidad de que durante un año determinado, un vehículo McLaren experimente un cierto número de fallos mecánicos, lo que nos permitirá comprender mejor la variabilidad en la calidad de sus productos y su impacto en la satisfacción del cliente.

Por seguir una distribución de Poisson sabemos que: Media = Varianza = \(\lambda\) = 1.28, X ~ PP(1.28)

  1. Calcula la probabilidad de que un vehículo haya sufrido dos fallos en tres años.

Utilizando la distribución de Poisson y la fórmula proporcionada:

\[ p(x) = \frac{e^{-\lambda} \lambda^x}{x!} \]

donde \(x\) es el número de fallos, y \(\lambda\) es la tasa promedio de fallos por intervalo, calcularemos la probabilidad de que un vehículo haya sufrido exactamente dos fallos en tres años. La tasa \(\lambda\) se ajusta a los tres años multiplicándola por 3.

La probabilidad buscada es entonces:

\[ p(2) = \frac{e^{-\lambda_{trienio}} \lambda_{trienio}^2}{2!} \]

Y para realizar el cálculo en R, usarías los siguientes comandos:

lambda_anual <- 1.28
lambda_trienio <- lambda_anual * 3
x <- 2
probabilidad_dos_fallos <- dpois(x, lambda_trienio)
probabilidad_dos_fallos
## [1] 0.158468
  1. Obtén la probabilidad de que haya sufrido más de tres fallos en un año.

Para calcular la probabilidad de que un vehículo de McLaren sufra más de tres fallos mecánicos en un año, aplicaremos la distribución de Poisson. Dado que la función de masa de probabilidad de Poisson para un número de fallos \(x\) es \(P(X=x) = \frac{e^{-\lambda} \lambda^x}{x!}\), la probabilidad de tener más de tres fallos es el complemento de la suma de las probabilidades de tener 0, 1, 2, o 3 fallos.

\[ P(X > 3) = 1 - (P(X=0) + P(X=1) + P(X=2) + P(X=3)) \]

\[ P(X > 3) = 1 - \sum_{x=0}^{3} \frac{e^{-\lambda} \lambda^x}{x!} \]

Y para realizar el cálculo en R, usaríamos los siguientes comandos:

lambda_anual <- 1.28
k <- 3
probabilidad_mas_tres_fallos <- 1 - ppois(k, lambda_anual)
probabilidad_mas_tres_fallos
## [1] 0.04112572
  1. Evalúa el percentil 80 del número de fallos por año.

El percentil 80 representa el valor por debajo del cual caen el 80% de las observaciones.

Para evaluar el percentil 80 del número de fallos por año con una distribución de Poisson, buscamos el valor \(x\) tal que un 80% de las observaciones sean iguales o menores que \(x\). Utilizamos la función qpois para calcular el cuantil deseado.

\[ P(X \leq x) = F(x) \geq 0.8 \]

El valor \(x\) que cumple con esta condición es el percentil 80 y se calcula como sigue:

lambda_anual <- 1.28
octavo_percentil <- qpois(0.8, lambda_anual)
octavo_percentil
## [1] 2
  1. Si sabemos que un vehículo de McLaren ha sufrido al menos 2 fallos, ¿cuál es la probabilidad de que haya sufrido menos de 4?

Para calcular la probabilidad condicional de que un vehículo haya sufrido menos de 4 fallos en un año dado que ya ha sufrido al menos 2 fallos, necesitamos considerar la suma de las probabilidades individuales de tener exactamente 2 y 3 fallos y la probabilidad de tener al menos 2 fallos.

\[ P(2 \leq X < 4) = P(X=2) + P(X=3) \]

\[ P(X \geq 2) = 1 - P(X < 2) = 1 - (P(X=0) + P(X=1)) \]

La probabilidad condicional se calcula entonces como:

\[ P(X < 4|X \geq 2) = \frac{P(2 \leq X < 4)}{P(X \geq 2)} \]

En R, podemos calcular esto con los siguientes comandos:

lambda_anual <- 1.28
probabilidad_X_menos_4 <- ppois(3, lambda_anual)
probabilidad_X_al_menos_2 <- 1 - ppois(1, lambda_anual)
probabilidad_condicional <- (probabilidad_X_menos_4 - probabilidad_X_al_menos_2) / (1 - probabilidad_X_al_menos_2)
probabilidad_condicional
## [1] 0.9351253


Volver arriba