Introducción

El análisis de problemas probabilísticos y estadísticos es fundamental para entender cómo se comportan ciertos fenómenos y tomar decisiones informadas basadas en datos. Los ejercicios presentados abarcan una variedad de contextos y aplicaciones de diferentes modelos probabilísticos y distribuciones estadísticas. A través de la resolución de estos problemas, se busca ilustrar cómo se aplican conceptos clave de la teoría de probabilidad y estadísticas en situaciones prácticas y reales.

Objetivo General

Resolver una serie de problemas que demuestran la aplicación práctica de diferentes conceptos y distribuciones estadísticas en situaciones concretas. Esto incluye calcular probabilidades, evaluar procedimientos de control de calidad y realizar predicciones basadas en modelos estadísticos adecuados.

Objetivos Específicos

Aplicar la distribución geométrica para determinar esta probabilidad en un contexto de selección aleatoria.

Utilizar la teoría de probabilidad para calcular la probabilidad acumulada en experimentos repetidos con monedas.

Usar la distribución binomial para calcular qué porcentaje de embarques con un 20% de defectuosos será aceptado bajo un criterio de inspección.

Aplicar la distribución de Poisson para modelar la frecuencia de errores en el proceso de escritura.

Aplicar la teoría de probabilidad para calcular la probabilidad de selección de un tema estudiado versus no estudiado.

Utilizar la distribución exponencial para modelar los tiempos de espera y calcular probabilidades acumuladas en un contexto de múltiples observaciones.

Aplicar la distribución gamma para modelar el tiempo hasta la falla de componentes y calcular las probabilidades asociadas.

Usar la distribución normal para determinar la fracción de vasos que exceden ciertos volúmenes, calcular probabilidades de rangos específicos y estimar el número de vasos que podrían derramarse.

DISTRIBUCIONES DE PROBABILIDAD

1. La probabilidad de que una persona que vive en cierta ciudad tenga un perro es de 0.3. Calcule la probabilidad de que la décima persona entrevistada al azar en esa ciudad sea la quinta que tiene un perro.

a. Definición de Variables

x = “Número total de personas entrevistadas”.

k = “Número de éxitos deseados (personas con un perro)”.

p = “Probabilidad de éxito en una prueba (probabilidad de que una persona tenga un perro)”.

\(x\) es el número total de ensayos.

\(k\) es el número de éxitos deseados.

\(p\) es la probabilidad de éxito en cada ensayo.

\(q = 1 - p = 0.7\) es la probabilidad de fracaso.

b. Elección de la Distribución

Para resolver este problema, utilizamos la distribución binomial negativa.

c. Datos

\(x = 10\) es el número total de ensayos.

\(k = 5\) es el número de éxitos deseados.

\(p = 0.3\) es la probabilidad de éxito en cada ensayo.

\(q = 1 - p = 0.7\) es la probabilidad de fracaso.

Calcular \[b^*(x; k, p)\]

La fórmula para la distribución binomial negativa es:

\[ b^*(x; k, p) = \binom{x - 1}{k - 1} \cdot p^k \cdot q^{x - k} \]

Sustituyendo los valores en la fórmula, tenemos:

\[ b^*(10; 5, 0.3) = \binom{10 - 1}{5 - 1} \cdot 0.3^5 \cdot 0.7^{10 - 5} \]

Calculamos el coeficiente binomial:

\[ \binom{9}{4} = \frac{9!}{4!(9-4)!} = \frac{9!}{4!5!} = \frac{9 \times 8 \times 7 \times 6}{4 \times 3 \times 2 \times 1} = 126 \]

Calculamos las probabilidades elevadas a las potencias correspondientes:

\[ 0.3^5 = 0.00243 \]

\[ 0.7^5 = 0.16807 \]

Multiplicamos estos valores juntos:

\[ b^*(10; 5, 0.3) = 126 \cdot 0.00243 \cdot 0.16807 \]

Finalmente, hacemos la multiplicación:

\[ 126 \cdot 0.00243 = 0.30618 \]

\[ 0.30618 \cdot 0.16807 \approx 0.0514 \]

Por lo tanto, la probabilidad de que la décima persona entrevistada al azar en esa ciudad sea la quinta que tiene un perro es aproximadamente 0.0514 o 5.14%.

Código en R

# Definir las variables
k <- 10  # Número de pruebas
r <- 5   # Número de éxitos deseados
p <- 0.3 # Probabilidad de éxito

# Calcular la probabilidad
probabilidad <- dnbinom(k - r, r, p)
print(probabilidad)
[1] 0.05145967

Grafico

# Cargar librería para gráficos
library(ggplot2)
Warning: package 'ggplot2' was built under R version 4.4.1
# Definir las variables
k <- 10  # Número total de pruebas
r <- 5   # Número de éxitos deseados
p <- 0.3 # Probabilidad de éxito

# Crear un rango de valores para el número de fracasos
x <- 0:(k - r)

# Calcular las probabilidades correspondientes
probabilidades <- dnbinom(x, r, p)

# Crear un dataframe para la gráfica
data <- data.frame(
  Fracasos = x,
  Probabilidad = probabilidades
)

# Graficar la función de masa de probabilidad
ggplot(data, aes(x = Fracasos, y = Probabilidad)) +
  geom_bar(stat = "identity", fill = "blue") +
  labs(
    title = "Distribución Binomial Negativa",
    x = "Número de Fracasos",
    y = "Probabilidad"
  ) +
  theme_minimal()

3. Una empresa está interesada en evaluar su procedimiento de inspección actual para embarques de 50 artículos idénticos. El procedimiento consiste en tomar una muestra de 5 artículos y aceptar el embarque si no se encuentran más de 2 defectuosos. ¿Qué proporción de embarques con 20% de artículos defectuosos se aceptará?

Fórmula de la Distribución Hipergeométrica

La fórmula para la probabilidad de obtener exactamente \(x\) defectuosos en una muestra de tamaño \(n\) es:

\[ h(x; N, k, n) = \frac{\binom{k}{x} \binom{N - k}{n - x}}{\binom{N}{n}} \]

donde: \(\binom{k}{x}\) es el número de formas de elegir \(x\) defectuosos de \(k\) defectuosos.

\(\binom{N - k}{n - x}\) es el número de formas de elegir \(n - x\) no defectuosos de \(N - k\) no defectuosos.

\(\binom{N}{n}\) es el número total de formas de elegir \(n\) artículos de \(N\) artículos.

a. Definición de Variables

N = 50 (Número total de artículos en el embarque)

k = 10 (Número total de defectuosos en el embarque, ya que el 20% de 50 es 10)

n = 5 (Tamaño de la muestra)

x = 0, 1, 2 (Número máximo de defectuosos permitidos en la muestra)

b. Cálculo para Cada Caso

b.1. Probabilidad de encontrar exactamente 0 defectuosos (\(x = 0\)):

\[ h(0; 50, 10, 5) = \frac{\binom{10}{0} \binom{40}{5}}{\binom{50}{5}} \]

Entonces:

\[ h(0; 50, 10, 5) = \frac{1 \times 658,008}{2,118,760} \approx 0.310 \]

b.2. Probabilidad de encontrar exactamente 1 defectuoso (\(x = 1\)):

\[ h(1; 50, 10, 5) = \frac{\binom{10}{1} \binom{40}{4}}{\binom{50}{5}} \]

Entonces:

\[ h(1; 50, 10, 5) = \frac{10 \times 91,390}{2,118,760} \approx 0.430 \]

b.3. Probabilidad de encontrar exactamente 2 defectuosos (\(x = 2\)):

\[ h(2; 50, 10, 5) = \frac{\binom{10}{2} \binom{40}{3}}{\binom{50}{5}} \]

Entonces:

\[ h(2; 50, 10, 5) = \frac{45 \times 9,880}{2,118,760} \approx 0.210 \]

Proporción de Embarques Aceptados

Sumamos las probabilidades de encontrar hasta 2 defectuosos en la muestra:

\[ P(X \leq 2) = h(0; 50, 10, 5) + h(1; 50, 10, 5) + h(2; 50, 10, 5) \]

\[ P(X \leq 2) \approx 0.310 + 0.430 + 0.210 = 0.950 \]

La proporción de embarques aceptados es aproximadamente 0.950, o 95.0%.

Código en R

# Parámetros
n <- 5
p <- 0.2

# Probabilidad de 0, 1 y 2 artículos defectuosos
prob_0 <- choose(10, 0) * choose(40, 5) / choose(50, 5)
prob_1 <- choose(10, 1) * choose(40, 4) / choose(50, 5)
prob_2 <- choose(10, 2) * choose(40, 3) / choose(50, 5)

# Suma de probabilidades
prob_aceptacion <- prob_0 + prob_1 + prob_2

aceptacion <-prob_aceptacion*100

# Resultado
cat("La proporción de embarques con 20% de artículos defectuosos que se aceptarán es aproximadamente",aceptacion,"%\n") 
La proporción de embarques con 20% de artículos defectuosos que se aceptarán es aproximadamente 95.17397 %

Grafico

library(ggplot2)

# Parámetros
n <- 5
p <- 0.2

# Calcular las probabilidades para 0, 1 y 2 artículos defectuosos
prob_0 <- choose(10, 0) * choose(40, 5) / choose(50, 5)
prob_1 <- choose(10, 1) * choose(40, 4) / choose(50, 5)
prob_2 <- choose(10, 2) * choose(40, 3) / choose(50, 5)

# Crear un data frame para las probabilidades
df_prob <- data.frame(
  ArticulosDefectuosos = c(0, 1, 2),
  Probabilidad = c(prob_0, prob_1, prob_2)
)

# Crear el gráfico de barras
ggplot(df_prob, aes(x = factor(ArticulosDefectuosos), y = Probabilidad)) +
  geom_bar(stat = "identity", fill = "skyblue", color = "black") +
  labs(title = "Probabilidad de Aceptación según Número de Artículos Defectuosos",
       x = "Número de Artículos Defectuosos",
       y = "Probabilidad") +
  theme_minimal() +
  scale_y_continuous(labels = scales::percent) +
  geom_text(aes(label = scales::percent(Probabilidad)), vjust = -0.5)

4. Un escritor de libros comete, en promedio, dos errores de procesamiento de texto por página en el primer borrador de su libro. ¿Cuál es la probabilidad de que en la siguiente página cometa 4 o más errores? (Distribución de Poisson)

Fórmula de la Distribución de Poisson

\[ p(x; \lambda \cdot t) = \frac{(\lambda \cdot t)^x e^{-(\lambda \cdot t)}}{x!} \]

a. Definición de Variables

λ (lambda): Tasa promedio de eventos por intervalo. En este caso, la tasa promedio de errores por página es 2.

x: Número de eventos específicos para los cuales queremos calcular la probabilidad. En este caso, \(x = 4\).

t: Factor de tiempo o ajuste. Si no se proporciona un ajuste de tiempo, se asume \(t = 1\).

b. Datos

Tasa promedio de errores (\(\lambda\)): 2 errores por página.

Número de eventos deseados (\(x\)): 4 errores.

Factor de ajuste (\(t\)): 1 (ya que no se proporciona ajuste adicional).

c. Cálculo

Para calcular la probabilidad de que ocurran exactamente 4 errores en una página, utilizamos la fórmula de la distribución de Poisson:

\[ p(x = 4; \lambda = 2) = \frac{(2 \cdot 1)^4 e^{-(2 \cdot 1)}}{4!} \]

Sustituyendo los valores:

  1. Calcular \((2 \cdot 1)^4\):

    \[ (2 \cdot 1)^4 = 2^4 = 16 \]

  2. Calcular \(e^{-(2 \cdot 1)}\):

    \[ e^{-2} \approx 0.1353 \]

  3. Calcular \(4!\) (factorial de 4):

    \[ 4! = 24 \]

  4. Sustituir en la fórmula:

    \[ p(x = 4; 2) = \frac{16 \times 0.1353}{24} \approx 0.0902 \]

Código en R

# Parámetro lambda
lambda <- 2

# Número exacto de eventos
x <- 4

# Calcular la probabilidad de exactamente 4 errores
prob_exacto_4 <- dpois(x, lambda)
cat("Probabilidad de exactamente 4 errores:", prob_exacto_4, "\n")
Probabilidad de exactamente 4 errores: 0.09022352 
# Número máximo de eventos para el cálculo acumulado
q <- 3

# Calcular la probabilidad acumulada de hasta 3 errores
prob_menor_o_igual_3 <- ppois(q, lambda)

# Calcular la probabilidad de 4 o más errores
prob_mayor_o_igual_4 <- 1 - prob_menor_o_igual_3
cat("Probabilidad de 4 o más errores:", prob_mayor_o_igual_4, "\n")
Probabilidad de 4 o más errores: 0.1428765 

Grafico

# Parámetro lambda
lambda <- 2

# Crear una secuencia de valores para el número de eventos
x <- 0:10

# Calcular las probabilidades de cada número de eventos usando la distribución de Poisson
probabilidades <- dpois(x, lambda)

# Crear el gráfico
plot(x, probabilidades, type = "h", lwd = 2, col = "blue", 
     main = "Distribución de Poisson con lambda = 2",
     xlab = "Número de Eventos", ylab = "Probabilidad",
     ylim = c(0, max(probabilidades) * 1.1))

# Añadir puntos para cada probabilidad
points(x, probabilidades, pch = 19, col = "red")

# Añadir líneas verticales para los eventos exactos
abline(v = 4, col = "green", lty = 2)
legend("topright", legend = c("Probabilidad Exacta", "Probabilidad Acumulada hasta 3", "4 o más errores"),
       col = c("red", "blue", "green"), lty = c(0, 1, 2), pch = c(19, NA, NA))

# Añadir anotaciones
text(4, probabilidades[which(x == 4)], labels = "4", pos = 3, col = "green")

5. El temario de un examen para un proceso selectivo contiene 50 temas, de los cuales se elegirá uno por sorteo. Si una persona no ha estudiado los 15 últimos temas ¿Cuál es la probabilidad de que salga un tema que haya estudiado?

Fórmula de probabilidad básica:

  1. Número total de temas (N): 50
  2. Número de temas estudiados (E): \(50 - 15 = 35\)

La probabilidad \(P\) de que el tema sorteado sea uno de los temas estudiados se calcula como:

\[ P(\text{Tema estudiado}) = \frac{\text{Número de temas estudiados}}{\text{Número total de temas}} \]

Reemplazando los valores:

\[ P(\text{Tema estudiado}) = \frac{35}{50} = 0.7 \]

Por lo tanto, la probabilidad de que el tema sorteado sea uno que haya estudiado es 0.7 o 70%.

Codigo en R

# Definir variables
total_temas <- 50
temas_no_estudiados <- 15
temas_estudiados <- total_temas - temas_no_estudiados

# Calcular la probabilidad de que el tema sorteado sea uno de los temas estudiados
probabilidad <- temas_estudiados / total_temas
print(paste("La probabilidad de que el tema sorteado sea uno que haya estudiado es:", probabilidad))
[1] "La probabilidad de que el tema sorteado sea uno que haya estudiado es: 0.7"
# Para ilustrar el uso de funciones relacionadas con la distribución uniforme:

# 1. Calcular la probabilidad acumulada hasta x = 0.7 en una distribución uniforme entre 0 y 1
# En este contexto, x = 0.7 es un ejemplo de cómo podríamos aplicar `punif` si estuviéramos trabajando con una variable uniforme
probabilidad_acumulada <- punif(0.7, min = 0, max = 1)
print(paste("Probabilidad acumulada hasta x = 0.7 en una distribución uniforme entre 0 y 1:", probabilidad_acumulada))
[1] "Probabilidad acumulada hasta x = 0.7 en una distribución uniforme entre 0 y 1: 0.7"
# 2. Calcular la densidad de probabilidad en x = 0.7 en una distribución uniforme entre 0 y 1
densidad_probabilidad <- dunif(0.7, min = 0, max = 1)
print(paste("Densidad de probabilidad en x = 0.7 en una distribución uniforme entre 0 y 1:", densidad_probabilidad))
[1] "Densidad de probabilidad en x = 0.7 en una distribución uniforme entre 0 y 1: 1"
# 3. Encontrar el valor del cuantil 0.7 en una distribución uniforme entre 0 y 1
cuantil <- qunif(0.7, min = 0, max = 1)
print(paste("Valor del cuantil 0.7 en una distribución uniforme entre 0 y 1:", cuantil))
[1] "Valor del cuantil 0.7 en una distribución uniforme entre 0 y 1: 0.7"

Grafico

  1. Proporción de Temas Estudiados y No Estudiados Vamos a usar un gráfico de pastel para representar la proporción de temas estudiados y no estudiados.
# Instalar y cargar el paquete plotly si no está instalado
if (!require(plotly)) {
  install.packages("plotly")
}
Cargando paquete requerido: plotly
Warning: package 'plotly' was built under R version 4.4.1

Adjuntando el paquete: 'plotly'
The following object is masked from 'package:ggplot2':

    last_plot
The following object is masked from 'package:stats':

    filter
The following object is masked from 'package:graphics':

    layout
library(plotly)

# Definir los datos
temas <- c("Estudiados", "No Estudiados")
valores <- c(60, 40)  # Ejemplo de datos; reemplázalos con tus valores

# Crear un data frame
df_temas <- data.frame(Temas = temas, Valores = valores)

# Crear gráfico de pastel en 3D usando plotly
fig <- plot_ly(df_temas, labels = ~Temas, values = ~Valores, type = 'pie', hole = 0.4, 
               textinfo = 'label+percent', insidetextorientation = 'radial') %>%
  layout(title = 'Proporción de Temas Estudiados y No Estudiados',
         annotations = list(list(text = 'Temas', x = 0.5, y = 0.5, font = list(size = 20), showarrow = FALSE)),
         showlegend = TRUE)

# Mostrar el gráfico
fig
  1. Distribución Uniforme Para la distribución uniforme, vamos a mostrar dos gráficos:

Función de densidad: Muestra la densidad de probabilidad en diferentes valores. Función de distribución acumulada: Muestra la probabilidad acumulada hasta diferentes valores.

# Crear un rango de valores para la distribución uniforme
x <- seq(0, 1, length.out = 100)

# Función de densidad de probabilidad
densidad <- dunif(x, min = 0, max = 1)

# Función de distribución acumulada
acumulada <- punif(x, min = 0, max = 1)

# Crear data frame para graficar
df_densidad <- data.frame(x = x, Densidad = densidad)
df_acumulada <- data.frame(x = x, Acumulada = acumulada)

# Crear gráficos
ggplot() +
  geom_line(data = df_densidad, aes(x = x, y = Densidad), color = "blue") +
  labs(title = "Función de Densidad de Probabilidad",
       x = "x",
       y = "Densidad") +
  theme_minimal()

ggplot() +
  geom_line(data = df_acumulada, aes(x = x, y = Acumulada), color = "red") +
  labs(title = "Función de Distribución Acumulada",
       x = "x",
       y = "Probabilidad Acumulada") +
  theme_minimal()

6. El tiempo necesario para que un individuo sea atendido en una cafetería es una variable aleatoria que tiene una distribución exponencial con una media de 4 minutos. ¿Cuál es la probabilidad de que una persona sea atendida en menos de 3 minutos en al menos 4 de los siguientes 6 días?

Definiciones de las Variables

Términos a Calcular

a. Calcular la Probabilidad de Ser Atendido en Menos de 3 Minutos

\[ f(x; \lambda) = \lambda e^{-\lambda x} \]

donde \(\lambda\) es la tasa de la distribución exponencial, que es el inverso de la media. Si la media es 4 minutos, entonces:

\[ \lambda = \frac{1}{4} = 0.25 \]

La probabilidad de que el tiempo de espera sea menor de 3 minutos se calcula con la función de distribución acumulada (CDF) de la distribución exponencial:

\[ P(X < x) = 1 - e^{-\lambda x} \]

Sustituyendo \(x = 3\) minutos y \(\lambda = 0.25\):

\[ P(X < 3) = 1 - e^{-0.25 \cdot 3} = 1 - e^{-0.75} \]

Calculamos \(e^{-0.75}\):

\[ e^{-0.75} \approx 0.4724 \]

Entonces:

\[ P(X < 3) = 1 - 0.4724 = 0.5276 \]

b. Usar la Distribución Binomial

Queremos encontrar la probabilidad de que una persona sea atendida en menos de 3 minutos en al menos 4 de los siguientes 6 días. La probabilidad que obtuvimos antes (0.5276) será la probabilidad de éxito en cada uno de los días, y queremos que el número de éxitos (días en los que el tiempo de espera es menor de 3 minutos) sea al menos 4 en 6 días.

Distribución binomial:

\[ X \sim \text{Binomial}(n = 6, p = 0.5276) \]

Donde \(n = 6\) es el número de ensayos (días) y \(p = 0.5276\) es la probabilidad de éxito (ser atendido en menos de 3 minutos).

Queremos calcular:

\[ P(X \geq 4) \]

Esto se puede calcular sumando las probabilidades de \(X = 4\), \(X = 5\) y \(X = 6\):

\[ P(X \geq 4) = P(X = 4) + P(X = 5) + P(X = 6) \]

Usamos la fórmula de la probabilidad binomial:

\[ P(X = k) = \binom{n}{k} p^k (1-p)^{n-k} \]

Para \(k = 4\), \(k = 5\) y \(k = 6\):

Calculamos cada término:

Sumamos estos valores:

\[ P(X \geq 4) = 0.259 + 0.116 + 0.022 = 0.397 \]

Resultado

La probabilidad de que una persona sea atendida en menos de 3 minutos en al menos 4 de los 6 días es aproximadamente 0.3962.

Codigo en R

# Definir parámetros
lambda <- 1 / 4
tiempo_objetivo <- 3
n_dias <- 6
min_dias <- 4

# Calcular la probabilidad de ser atendido en menos de 3 minutos en un solo día
probabilidad_single <- pexp(tiempo_objetivo, rate = lambda)
print(paste("La probabilidad de ser atendido en menos de 3 minutos en un solo día es:", probabilidad_single))
[1] "La probabilidad de ser atendido en menos de 3 minutos en un solo día es: 0.527633447258985"
# Usar la distribución binomial para calcular la probabilidad de que esto ocurra en al menos 4 de los 6 días
probabilidad_al_menos_4_dias <- 1 - pbinom(min_dias - 1, size = n_dias, prob = probabilidad_single)
print(paste("La probabilidad de ser atendido en menos de 3 minutos en al menos 4 de los 6 días es:", probabilidad_al_menos_4_dias))
[1] "La probabilidad de ser atendido en menos de 3 minutos en al menos 4 de los 6 días es: 0.396884699882686"

Grafico

# Cargar librería necesaria
library(ggplot2)

# Definir parámetros
lambda <- 1 / 4
tiempo_objetivo <- 3
n_dias <- 6
min_dias <- 4

# Calcular la probabilidad de ser atendido en menos de 3 minutos en un solo día
probabilidad_single <- pexp(tiempo_objetivo, rate = lambda)

# Calcular la probabilidad de ser atendido en menos de 3 minutos en al menos 4 de los 6 días
probabilidad_al_menos_4_dias <- 1 - pbinom(min_dias - 1, size = n_dias, prob = probabilidad_single)

# Crear datos para el gráfico
data <- data.frame(
  Categoria = c("En un solo día", "En al menos 4 de 6 días"),
  Probabilidad = c(probabilidad_single, probabilidad_al_menos_4_dias)
)

# Crear gráfico
ggplot(data, aes(x = Categoria, y = Probabilidad, fill = Categoria)) +
  geom_bar(stat = "identity") +
  geom_text(aes(label = sprintf("%.2f", Probabilidad)), vjust = -0.5, size = 5) +
  labs(title = "Probabilidades de ser atendido en menos de 3 minutos",
       x = "Categoría",
       y = "Probabilidad") +
  scale_fill_manual(values = c("blue", "green")) +
  theme_minimal()

7. Una máquina expendedora de bebidas gaseosas se regula para que sirva un promedio de 200 mililitros por vaso. Si la cantidad de bebida se distribuye normalmente con una desviación estándar igual a 15 mililitros:

  1. ¿Qué fracción de los vasos contendrá más de 224 mililitros?
  2. ¿Cuál es la probabilidad de que un vaso contenga entre 191 y 209 mililitros?
  3. ¿cuántos vasos probablemente se derramarán si se utilizan vasos de 230 mililitros para las siguientes 1000 bebidas?
  4. ¿por debajo de qué valor obtendremos el 25% más bajo en el llenado de las bebidas?

Definiciones de Variables y Términos

Variables

Términos a Calcular

  1. Fracción de los vasos que contendrán más de 224 mililitros
  2. Probabilidad de que un vaso contenga entre 191 y 209 mililitros
  3. Número esperado de vasos que se derramarán si se utilizan vasos de 230 mililitros para las siguientes 1000 bebidas
  4. Valor por debajo del cual obtendremos el 25% más bajo en el llenado de las bebidas

a. Fracción de los vasos que contendrán más de 224 mililitros

a.1. Estandarización del valor:

\[ Z = \frac{224 - 200}{15} = \frac{24}{15} = 1.6 \]

a.2. Probabilidad:

La probabilidad de que \(Z\) sea mayor que 1.6 se calcula utilizando la distribución normal estándar.

\[ P(Z > 1.6) = 1 - P(Z \leq 1.6) \]

De la tabla de distribución normal estándar:

\[ P(Z \leq 1.6) \approx 0.9452 \]

Entonces:

\[ P(Z > 1.6) = 1 - 0.9452 = 0.0548 \]

Fracción de vasos que contienen más de 224 mililitros: aproximadamente 0.0548 (o 5.48%).

b. Probabilidad de que un vaso contenga entre 191 y 209 mililitros

b.1. Estandarización de los valores:

Para 191 mililitros:

\[ Z = \frac{191 - 200}{15} = \frac{-9}{15} = -0.6 \]

Para 209 mililitros:

\[ Z = \frac{209 - 200}{15} = \frac{9}{15} = 0.6 \]

b.2. Probabilidad:

La probabilidad de que \(Z\) esté entre -0.6 y 0.6 se calcula como:

\[ P(-0.6 \leq Z \leq 0.6) = P(Z \leq 0.6) - P(Z \leq -0.6) \]

De la tabla de distribución normal estándar:

\[ P(Z \leq 0.6) \approx 0.7257 \] \[ P(Z \leq -0.6) \approx 0.2743 \]

Entonces:

\[ P(-0.6 \leq Z \leq 0.6) = 0.7257 - 0.2743 = 0.4514 \]

Probabilidad de que un vaso contenga entre 191 y 209 mililitros: aproximadamente 0.4514 (o 45.14%).

c. Número esperado de vasos que se derramarán si se utilizan vasos de 230 mililitros para las siguientes 1000 bebidas

c.1. Estandarización del valor:

\[ Z = \frac{230 - 200}{15} = \frac{30}{15} = 2 \]

c.2. Probabilidad:

La probabilidad de que \(Z\) sea mayor que 2 se calcula utilizando la distribución normal estándar.

\[ P(Z > 2) = 1 - P(Z \leq 2) \]

De la tabla de distribución normal estándar:

\[ P(Z \leq 2) \approx 0.9772 \]

Entonces:

\[ P(Z > 2) = 1 - 0.9772 = 0.0228 \]

c.3. Número esperado de vasos que se derramarán:

Para 1000 vasos:

\[ \text{Número esperado} = 1000 \times 0.0228 = 22.8 \]

Número esperado de vasos que se derramarán: aproximadamente 23 vasos.

d. Valor por debajo del cual obtendremos el 25% más bajo en el llenado de las bebidas

d.1. Encontrar el valor Z para el percentil 25:

El valor Z correspondiente al percentil 25 es aproximadamente -0.674.

d2. Desestandarización del valor:

\[ X = \mu + Z \cdot \sigma \] \[ X = 200 + (-0.674) \cdot 15 \] \[ X = 200 - 10.11 = 189.89 \]

Valor por debajo del cual obtendremos el 25% más bajo: aproximadamente 189.89 mililitros.

Codigo en R

# Definición de parámetros
mu <- 200          # Media en mililitros
sigma <- 15        # Desviación estándar en mililitros

# a) Fracción de los vasos que contendrán más de 224 mililitros

x1 <- 224
z1 <- (x1 - mu) / sigma
prob_greater_than_224 <- 1 - pnorm(z1)
cat("a) Fracción de los vasos que contendrán más de 224 mililitros:", prob_greater_than_224, "\n")
a) Fracción de los vasos que contendrán más de 224 mililitros: 0.05479929 
# b) Probabilidad de que un vaso contenga entre 191 y 209 mililitros

x2 <- 191
x3 <- 209
z2 <- (x2 - mu) / sigma
z3 <- (x3 - mu) / sigma
prob_between_191_and_209 <- pnorm(z3) - pnorm(z2)
cat("b) Probabilidad de que un vaso contenga entre 191 y 209 mililitros:", prob_between_191_and_209, "\n")
b) Probabilidad de que un vaso contenga entre 191 y 209 mililitros: 0.4514938 
# c) Número esperado de vasos que se derramarán si se utilizan vasos de 230 mililitros para las siguientes 1000 bebidas

x4 <- 230
z4 <- (x4 - mu) / sigma
prob_greater_than_230 <- 1 - pnorm(z4)
num_vasos_derramados <- 1000 * prob_greater_than_230
cat("c) Número esperado de vasos que se derramarán:", num_vasos_derramados, "\n")
c) Número esperado de vasos que se derramarán: 22.75013 
# d) Valor por debajo del cual obtendremos el 25% más bajo en el llenado de las bebidas

percentil_25 <- qnorm(0.25)
x25 <- mu + percentil_25 * sigma
cat("d) Valor por debajo del cual obtendremos el 25% más bajo en el llenado:", x25, "\n")
d) Valor por debajo del cual obtendremos el 25% más bajo en el llenado: 189.8827 

Grafico

# Cargar librería necesaria
library(ggplot2)

# Definir parámetros
lambda <- 1 / 4
tiempo_objetivo <- 3
n_dias <- 6
min_dias <- 4

# Calcular la probabilidad de ser atendido en menos de 3 minutos en un solo día
probabilidad_single <- pexp(tiempo_objetivo, rate = lambda)

# Calcular la probabilidad de ser atendido en menos de 3 minutos en al menos 4 de los 6 días
probabilidad_al_menos_4_dias <- 1 - pbinom(min_dias - 1, size = n_dias, prob = probabilidad_single)

# Crear datos para el gráfico
data <- data.frame(
  Categoria = c("En un solo día", "En al menos 4 de 6 días"),
  Probabilidad = c(probabilidad_single, probabilidad_al_menos_4_dias)
)

# Crear gráfico
ggplot(data, aes(x = Categoria, y = Probabilidad, fill = Categoria)) +
  geom_bar(stat = "identity") +
  labs(title = "Probabilidades de ser atendido en menos de 3 minutos",
       x = "Categoría",
       y = "Probabilidad") +
  scale_fill_manual(values = c("lightblue", "lightgreen")) +
  theme_minimal()

8. Para un componente eléctrico que tiene una tasa de fallas de una vez cada 5 horas es importante considerar el tiempo que transcurre para que fallen 2 componentes. a) Suponiendo que se aplica la distribución gamma, ¿Cuál es el tiempo promedio que transcurre para que fallen 2 componentes? b) ¿Cuál es la probabilidad de que transcurran 12 horas antes de que fallen 2 componentes?

Variables Definidas

Tasa de Fallas (\(\lambda\))

Parámetro \(\theta\) de la Distribución Gamma

Número de Fallas (\(k\))

Tiempo (\(t\))

Variables a Calcular

Tiempo Promedio

Probabilidad de que Transcurran Más de 12 Horas

Este texto en Markdown proporciona la descripción matemática de las variables y los cálculos asociados

Ejercicio de Distribución Gamma

Para un componente eléctrico que tiene una tasa de fallas de una vez cada 5 horas, es importante considerar el tiempo que transcurre para que fallen 2 componentes.

a. Tiempo Promedio

Suponiendo que se aplica la distribución gamma, queremos calcular el tiempo promedio que transcurre para que fallen 2 componentes.

Definición de parámetros:

Parámetro \(\theta\) de la distribución gamma:

\[ \theta = \frac{1}{\lambda} = 5 \text{ horas} \]

Tiempo promedio:

El tiempo promedio hasta que ocurren \(k\) fallas en una distribución gamma se calcula como:

\[ \text{Tiempo Promedio} = k \cdot \theta \]

Sustituyendo los valores:

\[ \text{Tiempo Promedio} = 2 \cdot 5 = 10 \text{ horas} \]

Por lo tanto, el tiempo promedio que transcurre hasta que fallen 2 componentes es de 10 horas.

b. Probabilidad de que Transcurran 12 Horas

Queremos calcular la probabilidad de que transcurran 12 horas antes de que fallen 2 componentes.

Cálculo de la probabilidad: La probabilidad de que el tiempo hasta que fallen 2 componentes sea mayor de 12 horas se calcula usando la función de distribución acumulada (CDF) de la distribución gamma: \[ P(T > 12) = 1 - F_{T}(12) \] donde \(F_{T}(12)\) es la CDF de la distribución gamma en \(t = 12\).

Usando métodos estadísticos, obtenemos: \[ P(T > 12) \approx 0.3084 \]

Por lo tanto, la probabilidad de que transcurran 12 horas antes de que fallen 2 componentes es aproximadamente 0.3084.

Resumen

Codigo en R

# Parámetros de la distribución gamma
lambda <- 1 / 5  # Tasa de fallas (fallas por hora)
theta <- 1 / lambda  # Parámetro theta de la distribución gamma
k <- 2  # Número de fallas

# a) Tiempo promedio hasta que fallen 2 componentes
# Tiempo promedio = k * theta
tiempo_promedio <- k * theta
cat("Tiempo promedio hasta que fallen 2 componentes:", tiempo_promedio, "horas\n")
Tiempo promedio hasta que fallen 2 componentes: 10 horas
# b) Probabilidad de que transcurran 12 horas antes de que fallen 2 componentes
tiempo <- 12

# Usamos la función `pgamma` para obtener la CDF de la distribución gamma
# `pgamma` calcula la probabilidad de que la variable aleatoria sea menor o igual a un valor dado
probabilidad_cdf <- pgamma(tiempo, shape = k, scale = theta)

# La probabilidad de que transcurran más de 12 horas es 1 menos la CDF
probabilidad_mayor_12_horas <- 1 - probabilidad_cdf
cat("Probabilidad de que transcurran más de 12 horas antes de que fallen 2 componentes:", probabilidad_mayor_12_horas, "\n")
Probabilidad de que transcurran más de 12 horas antes de que fallen 2 componentes: 0.308441 

Grafico

# Parámetros de la distribución gamma
lambda <- 1 / 5  # Tasa de fallas (fallas por hora)
theta <- 1 / lambda  # Parámetro theta de la distribución gamma
k <- 2  # Número de fallas

# Definimos el rango de valores de tiempo para el gráfico
tiempo_max <- 20
valores_tiempo <- seq(0, tiempo_max, length.out = 100)

# Calculamos la densidad de la distribución gamma
densidad_gamma <- dgamma(valores_tiempo, shape = k, scale = theta)

# Graficamos la densidad de la distribución gamma
plot(valores_tiempo, densidad_gamma, type = "l", col = "blue", lwd = 2,
     xlab = "Tiempo (horas)", ylab = "Densidad",
     main = "Distribución Gamma para el Tiempo hasta que fallen 2 componentes")

# Agregamos una línea vertical en el punto de 12 horas
abline(v = 12, col = "red", lwd = 2, lty = 2)

# Agregamos un sombreado para la probabilidad de que transcurran más de 12 horas
tiempo_sombreado <- seq(12, tiempo_max, length.out = 100)
densidad_sombreado <- dgamma(tiempo_sombreado, shape = k, scale = theta)
polygon(c(tiempo_sombreado, tiempo_max), c(densidad_sombreado, 0),
        col = rgb(1, 0, 0, 0.3), border = NA)

# Agregamos una leyenda
legend("topright", legend = c("Densidad Gamma", "12 horas"),
       col = c("blue", "red"), lty = c(1, 2), lwd = c(2, 2))

Conclusiones

La probabilidad de que la décima persona entrevistada sea la quinta con un perro se calcula utilizando la distribución geométrica, lo cual ilustra cómo modelar el primer éxito después de un número específico de intentos.

Determinar la probabilidad de necesitar menos de 4 lanzamientos para obtener un resultado uniforme con tres monedas destaca la importancia de evaluar probabilidades acumuladas en experimentos repetidos.

La proporción de embarques aceptados con un 20% de defectuosos se evalúa con la distribución binomial, permitiendo analizar cómo las inspecciones afectan la aceptación de productos.

La probabilidad de cometer 4 o más errores en una página usando la distribución de Poisson muestra cómo modelar eventos raros en el proceso de escritura.

Calcular la probabilidad de que un tema elegido en un examen sea uno estudiado ilustra la aplicación de la teoría de probabilidad a situaciones de selección aleatoria.

La probabilidad de ser atendido en menos de 3 minutos en al menos 4 de 6 días muestra cómo modelar y calcular probabilidades de tiempos de espera usando la distribución exponencial.

Evaluar el tiempo promedio hasta la falla de dos componentes y calcular la probabilidad de que transcurran 12 horas antes de dos fallas demuestra la aplicación de la distribución gamma en sistemas industriales.

El análisis de la distribución normal para la cantidad de bebida servida permite calcular probabilidades específicas, estimar el número de vasos que podrían derramarse y determinar valores críticos en el llenado de bebidas.

Al abordar los ejercicios de probabilidad y estadística, tanto de forma manual como mediante el uso de R, se obtiene una comprensión más completa y sólida de los conceptos aplicados. La comparación de ambos métodos ofrece una visión clara de cómo la teoría se traduce en prácticas computacionales eficientes.

La resolución manual de problemas de probabilidad permite una comprensión profunda de los conceptos y la aplicación directa de fórmulas y modelos. Sin embargo, este enfoque puede ser propenso a errores aritméticos o cálculos extensos. Por otro lado, el uso de R facilita cálculos precisos y rápidos, especialmente para problemas complejos o con grandes volúmenes de datos, como en el caso de distribuciones binomial y exponencial. R permite verificar la exactitud de las soluciones manuales y abordar problemas que serían tediosos de resolver manualmente.

En ejercicios que involucran distribuciones específicas, como la binomial, la geométrica, o la gamma, la implementación en R permite ejecutar simulaciones y cálculos detallados que pueden ser más difíciles de realizar manualmente. R proporciona funciones integradas y paquetes especializados para modelar estas distribuciones, como dbinom(), dgeom(), pgamma(), y pnorm(), entre otros, facilitando la resolución rápida y precisa de problemas complejos.

R ofrece herramientas avanzadas para la visualización de datos y resultados, lo cual es especialmente útil para interpretar y comunicar resultados de manera efectiva. Gráficos como histogramas, curvas de densidad y diagramas de probabilidad proporcionan una representación visual clara de cómo se distribuyen los resultados y cómo se comparan con las expectativas teóricas.

Al comparar los resultados obtenidos manualmente con los generados por R, se puede confirmar la precisión de los cálculos y comprender mejor la aplicación de las fórmulas. Este proceso de validación asegura que los métodos manuales y computacionales estén alineados y refuerza la confianza en los resultados obtenidos.

Para problemas que implican grandes conjuntos de datos o múltiples repeticiones, como en el análisis de tiempos de espera o en la evaluación de grandes muestras, el uso de R proporciona una eficiencia significativa. Los cálculos manuales serían inviables en tales casos debido al volumen de datos y la complejidad de los cálculos necesarios.

En resumen, mientras que los métodos manuales ofrecen una comprensión fundamental y detallada de los conceptos estadísticos, el uso de R complementa y amplía esta comprensión mediante la automatización de cálculos, la visualización avanzada y la capacidad de manejar datos complejos. La combinación de ambos enfoques no solo mejora la precisión y la eficiencia, sino que también proporciona una perspectiva más completa sobre la resolución de problemas probabilísticos y estadísticos.

Estos problemas proporcionan una comprensión práctica de cómo aplicar conceptos probabilísticos y distribuciones estadísticas en diversos contextos, facilitando la toma de decisiones basada en análisis de datos.