Examen
Examen Pregunta 1
Una sucursal de Farmacias Similares quiere ver si su tiempo de espera
(en minutos) es el adecuado, por lo que se le pide a usted que tome el
tiempo a los siguientes 50 clientes que lleguen a la sucursal. No se
sabe qué distribución tenga ésta información, pero su jefe le ha pedido
a usted que le de un tiempo promedio de espera estimado para ver si
están haciendo bien las cosas. En ese sentido se le pide que realice una
simulación por medio de bootstrap con 5000 repeticiones (Utilice 888
como semilla para el ejercicio) para poder responder las siguientes
preguntas:
library(boot)
# Datos originales de la base de datos Farmacias Similares
set.seed(888)
tiempos_espera <- round(runif(50, min = 2, max = 15), 1)
cat("Datos:", tiempos_espera, "\n\n")
## Datos: 2.3 6.5 2.8 10.9 12 3.4 7.1 5.5 2.6 13.7 7.2 2.5 2.2 7.6 11.4 14.7 11.6 5.9 13.2 12.1 10.1 14.2 13.9 11.2 12.8 9.7 10.5 4.6 6 13.1 3.6 4 13.5 3.3 7.5 5.4 2.2 14.7 6.8 7 8.2 3.6 7.1 9.2 5 12.7 12.2 6.3 7.4 2.3
bootstrap_media <- function(data, indices) {
return(mean(data[indices]))
}
1.-¿Cuál es el tiempo promedio de espera?
set.seed(888)
b1 <- boot(data = tiempos_espera, statistic = bootstrap_media, R = 5000)
cat("Media:", round(mean(b1$t), 2), "min | 95% CI: [", round(boot.ci(b1, type = "perc")$percent[4], 2), ", ", round(boot.ci(b1, type = "perc")$percent[5], 2), "]\n\n")
## Media: 8.05 min | 95% CI: [ 6.93 , 9.15 ]
2.- ¿Cuál es el intervalo que se genera para esta estimación?
cat("El intervalo de confianza al 95% es: [", round(boot.ci(b1, type = "perc")$percent[4], 2), ", ", round(boot.ci(b1, type = "perc")$percent[5], 2), "] minutos\n\n")
## El intervalo de confianza al 95% es: [ 6.93 , 9.15 ] minutos
3.- En sus palabras, ¿cómo aprecia el intervalo de confianza
generado? (En términos de qué tanta incertidumbre hay). (El intervalo de
confianza muestra el rango donde probablemente esté el promedio real de
espera; si es amplio hay más incertidumbre y si es reducido, la
estimación es más precisa. dame mejor repseuesta a esta pregunta)
4.- Si realiza un bootstrap adicional sobre los resultados del
anterior pero ahora con 10,000 repeticiones, ¿cómo cambia el tiempo de
atención promedio?
set.seed(888)
b2 <- boot(data = tiempos_espera, statistic = bootstrap_media, R = 10000)
cat("Media 10,000 rep:", round(mean(b2$t), 2), "min | 95% CI: [", round(boot.ci(b2, type = "perc")$percent[4], 2), ", ", round(boot.ci(b2, type = "perc")$percent[5], 2), "]\n")
## Media 10,000 rep: 8.06 min | 95% CI: [ 6.96 , 9.16 ]
cat("Diferencia media:", round(mean(b2$t) - mean(b1$t), 3), "minutos\n\n")
## Diferencia media: 0.004 minutos
5.- Genere un nuevo intervalo de confianza con el nuevo bootstrap
realizado y comparelo con el que resultó del punto 2.
cat("Comparación de intervalos:\n")
## Comparación de intervalos:
cat("Bootstrap 5000 rep: [", round(boot.ci(b1, type = "perc")$percent[4], 2), ", ", round(boot.ci(b1, type = "perc")$percent[5], 2), "] minutos\n")
## Bootstrap 5000 rep: [ 6.93 , 9.15 ] minutos
cat("Bootstrap 10000 rep: [", round(boot.ci(b2, type = "perc")$percent[4], 2), ", ", round(boot.ci(b2, type = "perc")$percent[5], 2), "] minutos\n")
## Bootstrap 10000 rep: [ 6.96 , 9.16 ] minutos
Examen Pregunta 2
Un centro de atención al cliente quiere analizar el tiempo promedio
de espera de las llamadas para estimar un intervalo de confianza. Sin
embargo, los tiempos de espera no son independientes, ya que:
Durante horas pico, los tiempos de espera suelen ser más largos. Si
hay muchas llamadas seguidas, el tiempo de espera de un cliente puede
verse afectado por la carga previa. En horas de baja demanda, los
tiempos de espera son menores y más estables. En ese sentido, se le pide
que realice un block bootstrap debido a que los tiempos en cada
observación están correlacionados con la observación anterior y se
quiere preservar la temporalidad.
La estructura de los datos es la siguiente:
En R
set.seed(888) n <- 300 #Número de llamadas analizadas
tiempos_espera <- c(rep(4, 100), rep(2, 100), rep(6, 100)) + rnorm(n,
mean = 0, sd = 0.5) #Tiempos de espera junto con ruido
Se le pide que el block bootstrap realice 5000 iteraciones y que el
tamaño del bloque que se estará utilizando será de 30 llamadas.
library(boot)
set.seed(888)
n <- 300
tiempos_espera <- c(rep(4, 100), rep(2, 100), rep(6, 100)) + rnorm(n, mean = 0, sd = 0.5)
db_tiempos <- data.frame(indices = seq(1:n), Tiempo_Espera = tiempos_espera)
bootstrap_mean <- function(data, indices) {
return(mean(data)) # Extraer datos según los índices de bootstrap
}
Responda las siguientes preguntas.
1.-¿Cuál es el tiempo promedio de espera?
# Block Bootstrap con 5000 repeticiones y bloque 30
set.seed(888)
block_boot <- tsboot(db_tiempos$Tiempo_Espera, statistic = bootstrap_mean, R = 5000, l = 30, sim = "fixed")
ic_lower <- quantile(block_boot$t, 0.025)
ic_upper <- quantile(block_boot$t, 0.975)
# Resultados
cat("Media estimada del tiempo de espera:", round(mean(db_tiempos$Tiempo_Espera), 2), "minutos\n")
## Media estimada del tiempo de espera: 4.03 minutos
cat("Media bootstrap 5000 rep:", round(mean(block_boot$t), 2), "minutos\n")
## Media bootstrap 5000 rep: 4.02 minutos
cat("Intervalo de confianza del 95% con Block Bootstrap: [", round(ic_lower, 2), ",", round(ic_upper, 2), "]\n\n")
## Intervalo de confianza del 95% con Block Bootstrap: [ 3.1 , 4.92 ]
2.- ¿Cuál es el intervalo que se genera para esta estimación?
cat("El intervalo de confianza al 95% es: [", round(ic_lower, 2), ",", round(ic_upper, 2), "] minutos\n")
## El intervalo de confianza al 95% es: [ 3.1 , 4.92 ] minutos
cat("Esto significa que hay un 95% de confianza de que el verdadero tiempo promedio este en este rango")
## Esto significa que hay un 95% de confianza de que el verdadero tiempo promedio este en este rango
3.- En sus palabras, ¿cómo aprecia el intervalo de confianza
generado? (En términos de qué tanta incertidumbre hay).
# El intervalo de confianza muestra el rango en el que es probable que esté el tiempo promedio real. Entre más amplio el intervalo, mayor incertidumbre; entre más cerrado, mayor precisión del mismo
cat("La amplitud del intervalo es:", round(ic_upper - ic_lower, 2), "minutos\n")
## La amplitud del intervalo es: 1.83 minutos
4.- Si hiciera un bootstrap adicional sobre los resultados del
anterior pero ahora con 10,000 repeticiones, ¿cómo cambia el tiempo de
atención promedio?
set.seed(888)
block_boot2 <- tsboot(block_boot$t, statistic = bootstrap_mean, R = 10000, l = 30, sim = "fixed")
# Obtener intervalo de confianza del 95%
ic_lower2 <- quantile(block_boot2$t, 0.025)
ic_upper2 <- quantile(block_boot2$t, 0.975)
# Resultados
cat("Media bootstrap 10,000 rep:", round(mean(block_boot2$t), 2), "minutos\n")
## Media bootstrap 10,000 rep: 4.02 minutos
cat("Intervalo de confianza del 95% con Block Bootstrap: [", round(ic_lower2, 2), ",", round(ic_upper2, 2), "]\n")
## Intervalo de confianza del 95% con Block Bootstrap: [ 4.01 , 4.03 ]
cat("Diferencia media:", round(mean(block_boot2$t) - mean(block_boot$t), 3), "minutos\n\n")
## Diferencia media: 0 minutos
5.- Genere un nuevo intervalo de confianza con el nuevo bootstrap
realizado y comparelo con el que resultó del punto 2.
cat("Comparación de intervalos:\n")
## Comparación de intervalos:
cat("Block Bootstrap 5000 rep: [", round(ic_lower, 2), ",", round(ic_upper, 2), "] minutos\n")
## Block Bootstrap 5000 rep: [ 3.1 , 4.92 ] minutos
cat("Block Bootstrap 10000 rep: [", round(ic_lower2, 2), ",", round(ic_upper2, 2), "] minutos\n")
## Block Bootstrap 10000 rep: [ 4.01 , 4.03 ] minutos
cat("El intervalo con 10,000 repeticiones suele ser ligeramente más estable (menos variabilidad).\n")
## El intervalo con 10,000 repeticiones suele ser ligeramente más estable (menos variabilidad).
cat("NOTA: El block bootstrap preserva la estructura temporal de los datos.\n\n")
## NOTA: El block bootstrap preserva la estructura temporal de los datos.
Examen Pregunta 3
Toeria de Filas
Un centro de atención telefónica tiene una sola línea para atender a
los clientes. Las llamadas llegan de manera aleatoria siguiendo un
proceso de Poisson con una tasa de llegada de 83 llamadas por hora.
Cada llamada es atendida por un único operador, cuyo tiempo de
servicio sigue una distribución exponencial con una tasa de 90 clientes
por hora.
library(queueing)
lambda <- 83 # llamadas por hora
mu <- 90 # clientes por hora
c1 <- 1 # 1 línea
c2 <- 2
Responda las siguientes preguntas:
1.- ¿Cuál es el nivel de saturación del sistema, el número de
clientes en la fila, el número de clientes en el sistema, el tiempo
promedio en la fila y el tiempo promedio en el sistema?
modelo1_linea <- NewInput.MMC(lambda = lambda, mu = mu, c = c1, n = 0, method = 0)
resultado1 <- QueueingModel(modelo1_linea)
# Mostrar resultados
cat("Factor de utilización (rho):", round(resultado1$RO, 4), "\n")
## Factor de utilización (rho): 0.9222
cat("Número promedio de clientes en la fila (Lq):", round(resultado1$Lq, 4), "\n")
## Número promedio de clientes en la fila (Lq): 10.9349
cat("Número promedio de clientes en el sistema (L):", round(resultado1$L, 4), "\n")
## Número promedio de clientes en el sistema (L): 11.8571
cat("Tiempo promedio en la fila (Wq):", round(resultado1$Wq * 60, 2), "minutos\n")
## Tiempo promedio en la fila (Wq): 7.9 minutos
cat("Tiempo promedio en el sistema (W):", round(resultado1$W * 60, 2), "minutos\n")
## Tiempo promedio en el sistema (W): 8.57 minutos
R: Los restulado arrojan que el sistema está
sobresaturado al 92.22%. Los clientes esperan casi 8 minutos en la fila,
con más de 10 personas esperando constantemente.
2.- Suponga que el gerente del centro revisó el análisis que
usted realizó y decidió abrir una línea más teniendo 2 en total, ¿cómo
cambia su análisis anterior agregando ésta línea telefónica adicional
(vuelva a calcular, reporte las variables solicitadas en la pregunta 1 y
compare los resultados con los de la pregunta 1)?
modelo2_lineas <- NewInput.MMC(lambda = lambda, mu = mu, c = c2, n = 0, method = 0)
# Resolver el modelo
resultado2 <- QueueingModel(modelo2_lineas)
# Mostrar resultados
cat("Factor de utilización (rho):", round(resultado2$RO, 4), "\n")
## Factor de utilización (rho): 0.4611
cat("Número promedio de clientes en la fila (Lq):", round(resultado2$Lq, 4), "\n")
## Número promedio de clientes en la fila (Lq): 0.249
cat("Número promedio de clientes en el sistema (L):", round(resultado2$L, 4), "\n")
## Número promedio de clientes en el sistema (L): 1.1713
cat("Tiempo promedio en la fila (Wq):", round(resultado2$Wq * 60, 2), "minutos\n")
## Tiempo promedio en la fila (Wq): 0.18 minutos
cat("Tiempo promedio en el sistema (W):", round(resultado2$W * 60, 2), "minutos\n")
## Tiempo promedio en el sistema (W): 0.85 minutos
R: Ahora con este cambio de agregar dos líneas, el
sistema es muy distinto. Los clientes esperan solo 18 segundos en lugar
de 7.71 minutos.
Examen Pregunta 4
Los negocios de Acme Steel Fabricators han sido muy prósperos en los
últimos cinco años. La compañía fabrica una amplia gama de productos de
acero, como barandales, escaleras y marcos de acero estructural ligero.
El método manual vigente para manejo de materiales ocasiona un exceso de
inventario y congestionamientos. Acme está considerando si debe comprar
un sistema de transporte que pende de un riel (monoriel), o un vehículo
montacargas, para incrementar su capacidad y mejorar su eficiencia
manufacturera.
Los resultados anuales del sistema, antes de impuestos, dependen de
la demanda futura. Si la demanda se mantiene en el nivel actual, lo cual
tiene una probabilidad de 0.50, el ahorro anual que producirá el
transportador elevado (monoriel) será de $10,000. Si la demanda aumenta
permitirá ahorrar $25,000 al año por la eficiencia operativa, además de
las nuevas ventas. Finalmente, si la demanda cae, provocará una pérdida
anual estimada en $65,000.
Se estima una probabilidad de 0.30 de que la demanda sea alta y de
0.20 de que sea baja. Si se compra, el montacargas, los resultados
anuales serán de $5,000 si la demanda no cambia, $10,000 si la demanda
aumenta y –$25,000 si la demanda cae.
# Librerias
library(DiagrammeR)
library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr 1.1.4 ✔ readr 2.1.5
## ✔ forcats 1.0.0 ✔ stringr 1.5.1
## ✔ ggplot2 3.5.2 ✔ tibble 3.3.0
## ✔ lubridate 1.9.3 ✔ tidyr 1.3.1
## ✔ purrr 1.1.0
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
# Definir probabilidades y parámetros
p_alta <- 0.30
p_igual <- 0.50
p_baja <- 0.20
ah_mono_alta <- 25000
ah_mono_igual <- 10000
ah_mono_baja <- -65000
ah_mont_alta <- 10000
ah_mont_igual <- 5000
ah_mont_baja <- -25000
# Calcular valores esperados (VE)
ve_monoriel <- p_alta*ah_mono_alta + p_igual*ah_mono_igual + p_baja*ah_mono_baja
ve_montacargas<- p_alta*ah_mont_alta + p_igual*ah_mont_igual + p_baja*ah_mont_baja
cat("VE Monoriel: $", format(round(ve_monoriel, 2), big.mark=","), "\n", sep = "")
## VE Monoriel: $-500
cat("VE Montacargas:$", format(round(ve_montacargas, 2), big.mark=","), "\n", sep = "")
## VE Montacargas:$500
mejor_opcion <- ifelse(ve_montacargas > ve_monoriel, "Montacargas", "Monoriel")
cat("Mejor alternativa:", mejor_opcion, "\n")
## Mejor alternativa: Montacargas
# Tabla resumen de escenarios
resumen <- tribble(
~Alternativa, ~Demanda, ~Prob, ~Ahorro_USD,
"Monoriel", "Alta", p_alta, ah_mono_alta,
"Monoriel", "Igual", p_igual, ah_mono_igual,
"Monoriel", "Baja", p_baja, ah_mono_baja,
"Montacargas", "Alta", p_alta, ah_mont_alta,
"Montacargas", "Igual", p_igual, ah_mont_igual,
"Montacargas", "Baja", p_baja, ah_mont_baja
) %>%
mutate(Prob = scales::percent(Prob, accuracy = 1),
Ahorro_USD = scales::dollar(Ahorro_USD))
resumen
## # A tibble: 6 × 4
## Alternativa Demanda Prob Ahorro_USD
## <chr> <chr> <chr> <chr>
## 1 Monoriel Alta 30% $25,000
## 2 Monoriel Igual 50% $10,000
## 3 Monoriel Baja 20% -$65,000
## 4 Montacargas Alta 30% $10,000
## 5 Montacargas Igual 50% $5,000
## 6 Montacargas Baja 20% -$25,000
# Visualizando el árbol de decisión
DiagrammeR::grViz("
digraph decision_tree {
graph [rankdir=LR]
node [shape=box, style=filled, fillcolor=lightblue];
Inicio [label='Decisión: Sistema de manejo de materiales'];
Monoriel [label='Monoriel'];
Montacargas [label='Montacargas'];
Mono_Alta [label='Alta (0.30)\\nAhorro = $25,000'];
Mono_Igual [label='Igual (0.50)\\nAhorro = $10,000'];
Mono_Baja [label='Baja (0.20)\\nAhorro = -$65,000'];
Mont_Alta [label='Alta (0.30)\\nAhorro = $10,000'];
Mont_Igual [label='Igual (0.50)\\nAhorro = $5,000'];
Mont_Baja [label='Baja (0.20)\\nAhorro = -$25,000'];
Inicio -> Monoriel
Inicio -> Montacargas
Monoriel -> Mono_Alta [label='0.30']
Monoriel -> Mono_Igual [label='0.50']
Monoriel -> Mono_Baja [label='0.20']
Montacargas -> Mont_Alta [label='0.30']
Montacargas -> Mont_Igual [label='0.50']
Montacargas -> Mont_Baja [label='0.20']
}
")
Responda las siguientes preguntas:
1.- ¿Cuál es la mejor alternativa para ACME? La mejor alternativa
para ACME es Montacargas, porque su valor esperado es mayor y su riesgo
de pérdida es menor que el del Monorriel.
2.- ¿Cuál sería el ahorro esperado en el largo plazo? El ahorro
esperado a largo plazo sería de 500 dólares por año, basado en el valor
esperado del Montacargas.
Examen Pregunta 5
Se tienen dos dados de 20 lados cada uno. Esos dados se
lanzan de manera simultánea para ver cuánto cae en ambos.
set.seed(520)
num_simulations_10k <- 10000 # Primera simulación
num_simulations_50k <- 50000 # Segunda simulación
# Simulacion con 10,000 iteraciones
dice1_10k <- sample(1:20, num_simulations_10k, replace = TRUE)
dice2_10k <- sample(1:20, num_simulations_10k, replace = TRUE)
sum_dices_10k <- dice1_10k + dice2_10k
mult_dices_10k <- dice1_10k * dice2_10k
# Estimamos las 3 probabilidades
prob_suma_30_10k <- mean(sum_dices_10k >= 30)
prob_suma_27_10k <- mean(sum_dices_10k == 27)
prob_mult_300_10k <- mean(mult_dices_10k >= 300)
# Mostramos los resultados
print(paste("1. Probabilidad suma >= 30:", round(prob_suma_30_10k * 100, 2), "%"))
## [1] "1. Probabilidad suma >= 30: 16.47 %"
print(paste("2. Probabilidad suma = 27:", round(prob_suma_27_10k * 100, 2), "%"))
## [1] "2. Probabilidad suma = 27: 3.68 %"
print(paste("3. Probabilidad multiplicación >= 300:", round(prob_mult_300_10k * 100, 2), "%"))
## [1] "3. Probabilidad multiplicación >= 300: 5.22 %"
A usted se le pide que realice una simulación de montecarlo para
calcular lo siguiente:
1.- ¿Cuál es la probabilidad de que la suma de los resultados sea
mayor o igual a 30? R: 16.47 %
2.- ¿Cuál es la probabilidad de que la suma de los resultados sea
igual a 27? R: 3.68 %
3.- ¿Cuál es la probabilidad de que la multiplicación de sus
resultados sea mayor o igual a 300? R: 5.22%
Para realizar este ejercicio por favor haga uso del seed 520 y
realice el ejercicio para 10,000 iteraciones
Una vez que realizó lo anterior, vuelva a realizar los tres
ejercicios (preguntas) pero ahora con un total de 50,000 iteraciones y
compare los resultados de ambos ejercicios con los valores reales de que
ocurran éstos escenarios. Es decir, cuál fue más cercano a la
realidad.
# Generamos los lanzamientos de los dos dados de 20 lados
dice1_50k <- sample(1:20, num_simulations_50k, replace = TRUE)
dice2_50k <- sample(1:20, num_simulations_50k, replace = TRUE)
# Calculamos la suma de los dos dados
sum_dices_50k <- dice1_50k + dice2_50k
# Calculamos la multiplicación de los dos dados
mult_dices_50k <- dice1_50k * dice2_50k
# Estimamos las probabilidades
prob_suma_30_50k <- mean(sum_dices_50k >= 30)
prob_suma_27_50k <- mean(sum_dices_50k == 27)
prob_mult_300_50k <- mean(mult_dices_50k >= 300)
# Mostramos los resultados
print(paste("1. Probabilidad suma >= 30:", round(prob_suma_30_50k * 100, 2), "%"))
## [1] "1. Probabilidad suma >= 30: 16.53 %"
print(paste("2. Probabilidad suma = 27:", round(prob_suma_27_50k * 100, 2), "%"))
## [1] "2. Probabilidad suma = 27: 3.48 %"
print(paste("3. Probabilidad multiplicación >= 300:", round(prob_mult_300_50k * 100, 2), "%"))
## [1] "3. Probabilidad multiplicación >= 300: 5.33 %"
# Valores reales proporcionados
prob_real_suma_30 <- 16.5
prob_real_suma_27 <- 3.5
prob_real_mult_300 <- 5.25
# Suma >= 30
error_10k_suma30 <- abs(prob_suma_30_10k * 100 - prob_real_suma_30)
error_50k_suma30 <- abs(prob_suma_30_50k * 100 - prob_real_suma_30)
cat("Suma>=30 |", prob_real_suma_30, "% |", round(prob_suma_30_10k * 100, 2), "% |",
round(prob_suma_30_50k * 100, 2), "% |", round(error_10k_suma30, 2), "% |",
round(error_50k_suma30, 2), "%\n")
## Suma>=30 | 16.5 % | 16.47 % | 16.53 % | 0.03 % | 0.03 %
# Suma = 27
error_10k_suma27 <- abs(prob_suma_27_10k * 100 - prob_real_suma_27)
error_50k_suma27 <- abs(prob_suma_27_50k * 100 - prob_real_suma_27)
cat("Suma=27 |", prob_real_suma_27, "% |", round(prob_suma_27_10k * 100, 2), "% |",
round(prob_suma_27_50k * 100, 2), "% |", round(error_10k_suma27, 2), "% |",
round(error_50k_suma27, 2), "%\n")
## Suma=27 | 3.5 % | 3.68 % | 3.48 % | 0.18 % | 0.02 %
# Multiplicación >= 300
error_10k_mult300 <- abs(prob_mult_300_10k * 100 - prob_real_mult_300)
error_50k_mult300 <- abs(prob_mult_300_50k * 100 - prob_real_mult_300)
cat("Mult>=300 |", prob_real_mult_300, "% |", round(prob_mult_300_10k * 100, 2), "% |",
round(prob_mult_300_50k * 100, 2), "% |", round(error_10k_mult300, 2), "% |",
round(error_50k_mult300, 2), "%\n")
## Mult>=300 | 5.25 % | 5.22 % | 5.33 % | 0.03 % | 0.08 %
# Determinar cuál es más precisa
error_total_10k <- error_10k_suma30 + error_10k_suma27 + error_10k_mult300
error_total_50k <- error_50k_suma30 + error_50k_suma27 + error_50k_mult300
cat("Error total simulación 10k:", round(error_total_10k, 2), "%\n")
## Error total simulación 10k: 0.24 %
cat("Error total simulación 50k:", round(error_total_50k, 2), "%\n")
## Error total simulación 50k: 0.12 %
if (error_total_50k < error_total_10k) {
cat("RESULTADO: La simulación con 50,000 iteraciones es MÁS PRECISA\n")
} else {
cat("RESULTADO: La simulación con 10,000 iteraciones es MÁS PRECISA\n")
}
## RESULTADO: La simulación con 50,000 iteraciones es MÁS PRECISA
1.- En el primer caso la probabilidad real es de 16.5%
2.- En el segundo caso la probabilidad real es de 3.5%
3.- En el tercer caso la probabilidad es de 5.25%
R:La simulación de Monte Carlo con 10,000
iteraciones fue muy cercana a la realidad. Los resultados mostraron que
la probabilidad de suma ≥ 30 fue 16.47% vs. 16.5% real, suma = 27 fue
3.68% vs. 3.5% real, y multiplicación ≥ 300 fue 5.22% vs. 5.25% real. El
error total fue solo 0.24%, demostrando que 10,000 iteraciones fue
excepcionalmente preciso para este ejercicio.
---
title: "Examen Modulo 2"
author: "Sebastian Espinoza A00833704"
date: "2025-08-25"
output: 
 html_document: 
  toc: TRUE
  toc_float: TRUE
  code_download: TRUE
  theme: yeti
---
# <span style='color:red;'>  Examen </span> 

## <span style='color:red;'>  Examen Pregunta 1 </span> 

Una sucursal de Farmacias Similares quiere ver si su tiempo de espera (en minutos) es el adecuado, por lo que se le pide a usted que tome el tiempo a los siguientes 50 clientes que lleguen a la sucursal. No se sabe qué distribución tenga ésta información, pero su jefe le ha pedido a usted que le de un tiempo promedio de espera estimado para ver si están haciendo bien las cosas. En ese sentido se le pide que realice una simulación por medio de bootstrap con 5000 repeticiones (Utilice 888 como semilla para el ejercicio) para poder responder las siguientes preguntas:

```{r}
library(boot)

# Datos originales de la base de datos Farmacias Similares
set.seed(888)
tiempos_espera <- round(runif(50, min = 2, max = 15), 1)
cat("Datos:", tiempos_espera, "\n\n")
bootstrap_media <- function(data, indices) {
  return(mean(data[indices]))  
}
```

1.-¿Cuál es el tiempo promedio de espera?
```{r}
set.seed(888)
b1 <- boot(data = tiempos_espera, statistic = bootstrap_media, R = 5000)
cat("Media:", round(mean(b1$t), 2), "min | 95% CI: [", round(boot.ci(b1, type = "perc")$percent[4], 2), ", ", round(boot.ci(b1, type = "perc")$percent[5], 2), "]\n\n")
```

2.- ¿Cuál es el intervalo que se genera para esta estimación?
```{r}
cat("El intervalo de confianza al 95% es: [", round(boot.ci(b1, type = "perc")$percent[4], 2), ", ", round(boot.ci(b1, type = "perc")$percent[5], 2), "] minutos\n\n")
```


3.- En sus palabras, ¿cómo aprecia el intervalo de confianza generado? (En términos de qué tanta incertidumbre hay).
(El intervalo de confianza muestra el rango donde probablemente esté el promedio real de espera; si es amplio hay más incertidumbre y si es reducido, la estimación es más precisa. dame mejor repseuesta a esta pregunta)

4.- Si realiza un bootstrap adicional sobre los resultados del anterior pero ahora con 10,000 repeticiones, ¿cómo cambia el tiempo de atención promedio?
```{r}
set.seed(888)
b2 <- boot(data = tiempos_espera, statistic = bootstrap_media, R = 10000)
cat("Media 10,000 rep:", round(mean(b2$t), 2), "min | 95% CI: [", round(boot.ci(b2, type = "perc")$percent[4], 2), ", ", round(boot.ci(b2, type = "perc")$percent[5], 2), "]\n")
cat("Diferencia media:", round(mean(b2$t) - mean(b1$t), 3), "minutos\n\n")

```



5.- Genere un nuevo intervalo de confianza con el nuevo bootstrap realizado y comparelo con el que resultó del punto 2.

```{r}
cat("Comparación de intervalos:\n")
cat("Bootstrap 5000 rep: [", round(boot.ci(b1, type = "perc")$percent[4], 2), ", ", round(boot.ci(b1, type = "perc")$percent[5], 2), "] minutos\n")
cat("Bootstrap 10000 rep: [", round(boot.ci(b2, type = "perc")$percent[4], 2), ", ", round(boot.ci(b2, type = "perc")$percent[5], 2), "] minutos\n")
```


## <span style='color:red;'>  Examen Pregunta 2 </span> 

Un centro de atención al cliente quiere analizar el tiempo promedio de espera de las llamadas para estimar un intervalo de confianza. Sin embargo, los tiempos de espera no son independientes, ya que:

Durante horas pico, los tiempos de espera suelen ser más largos.
Si hay muchas llamadas seguidas, el tiempo de espera de un cliente puede verse afectado por la carga previa. En horas de baja demanda, los tiempos de espera son menores y más estables. En ese sentido, se le pide que realice un block bootstrap debido a que los tiempos en cada observación están correlacionados con la observación anterior y se quiere preservar la temporalidad.

La estructura de los datos es la siguiente:


En R

set.seed(888)
n <- 300  #Número de llamadas analizadas
tiempos_espera <- c(rep(4, 100), rep(2, 100), rep(6, 100)) + rnorm(n, mean = 0, sd = 0.5) #Tiempos de espera junto con ruido
 

Se le pide que el block bootstrap realice 5000 iteraciones y que el tamaño del bloque que se estará utilizando será de 30 llamadas.

```{r}
library(boot)
set.seed(888)
n <- 300  
tiempos_espera <- c(rep(4, 100), rep(2, 100), rep(6, 100)) + rnorm(n, mean = 0, sd = 0.5)
db_tiempos <- data.frame(indices = seq(1:n), Tiempo_Espera = tiempos_espera)
bootstrap_mean <- function(data, indices) {
  return(mean(data))  # Extraer datos según los índices de bootstrap
}

```

Responda las siguientes preguntas.

1.-¿Cuál es el tiempo promedio de espera?
```{r}
# Block Bootstrap con 5000 repeticiones y bloque 30
set.seed(888)
block_boot <- tsboot(db_tiempos$Tiempo_Espera, statistic = bootstrap_mean, R = 5000, l = 30, sim = "fixed")
ic_lower <- quantile(block_boot$t, 0.025)
ic_upper <- quantile(block_boot$t, 0.975)

# Resultados
cat("Media estimada del tiempo de espera:", round(mean(db_tiempos$Tiempo_Espera), 2), "minutos\n")
cat("Media bootstrap 5000 rep:", round(mean(block_boot$t), 2), "minutos\n")
cat("Intervalo de confianza del 95% con Block Bootstrap: [", round(ic_lower, 2), ",", round(ic_upper, 2), "]\n\n")
```

2.- ¿Cuál es el intervalo que se genera para esta estimación?
```{r}
cat("El intervalo de confianza al 95% es: [", round(ic_lower, 2), ",", round(ic_upper, 2), "] minutos\n")
cat("Esto significa que hay un 95% de confianza de que el verdadero tiempo promedio este en este rango")
```

3.- En sus palabras, ¿cómo aprecia el intervalo de confianza generado? (En términos de qué tanta incertidumbre hay).
```{r}
# El intervalo de confianza muestra el rango en el que es probable que esté el tiempo promedio real. Entre más amplio el intervalo, mayor incertidumbre; entre más cerrado, mayor precisión del mismo 
cat("La amplitud del intervalo es:", round(ic_upper - ic_lower, 2), "minutos\n")


```

4.- Si hiciera un bootstrap adicional sobre los resultados del anterior pero ahora con 10,000 repeticiones, ¿cómo cambia el tiempo de atención promedio?
```{r}
set.seed(888)
block_boot2 <- tsboot(block_boot$t, statistic = bootstrap_mean, R = 10000, l = 30, sim = "fixed")
# Obtener intervalo de confianza del 95% 
ic_lower2 <- quantile(block_boot2$t, 0.025)
ic_upper2 <- quantile(block_boot2$t, 0.975)

# Resultados
cat("Media bootstrap 10,000 rep:", round(mean(block_boot2$t), 2), "minutos\n")
cat("Intervalo de confianza del 95% con Block Bootstrap: [", round(ic_lower2, 2), ",", round(ic_upper2, 2), "]\n")
cat("Diferencia media:", round(mean(block_boot2$t) - mean(block_boot$t), 3), "minutos\n\n")
```

5.- Genere un nuevo intervalo de confianza con el nuevo bootstrap realizado y comparelo con el que resultó del punto 2.
```{r}
cat("Comparación de intervalos:\n")
cat("Block Bootstrap 5000 rep: [", round(ic_lower, 2), ",", round(ic_upper, 2), "] minutos\n")
cat("Block Bootstrap 10000 rep: [", round(ic_lower2, 2), ",", round(ic_upper2, 2), "] minutos\n")
cat("El intervalo con 10,000 repeticiones suele ser ligeramente más estable (menos variabilidad).\n")
cat("NOTA: El block bootstrap preserva la estructura temporal de los datos.\n\n")
```


## <span style='color:red;'>  Examen Pregunta 3 </span>
### <span style='color:red;'>  Toeria de Filas</span>

Un centro de atención telefónica tiene una sola línea para atender a los clientes. Las llamadas llegan de manera aleatoria siguiendo un proceso de Poisson con una tasa de llegada de 83 llamadas por hora.

Cada llamada es atendida por un único operador, cuyo tiempo de servicio sigue una distribución exponencial con una tasa de 90 clientes por hora.

```{r}
library(queueing)
lambda <- 83   # llamadas por hora
mu <- 90       # clientes por hora
c1 <- 1        # 1 línea
c2 <- 2  
```

Responda las siguientes preguntas:

1.- ¿Cuál es el nivel de saturación del sistema, el número de clientes en la fila, el número de clientes en el sistema, el tiempo promedio en la fila y el tiempo promedio en el sistema?

```{r}
modelo1_linea <- NewInput.MMC(lambda = lambda, mu = mu, c = c1, n = 0, method = 0)
resultado1 <- QueueingModel(modelo1_linea)
# Mostrar resultados
cat("Factor de utilización (rho):", round(resultado1$RO, 4), "\n")
cat("Número promedio de clientes en la fila (Lq):", round(resultado1$Lq, 4), "\n")
cat("Número promedio de clientes en el sistema (L):", round(resultado1$L, 4), "\n")
cat("Tiempo promedio en la fila (Wq):", round(resultado1$Wq * 60, 2), "minutos\n")
cat("Tiempo promedio en el sistema (W):", round(resultado1$W * 60, 2), "minutos\n")

```
**R**: Los restulado arrojan que el sistema está sobresaturado al 92.22%. Los clientes esperan casi 8 minutos en la fila, con más de 10 personas esperando constantemente.

**2.- Suponga que el gerente del centro revisó el análisis que usted realizó y decidió abrir una línea más teniendo 2 en total, ¿cómo cambia su análisis anterior agregando ésta línea telefónica adicional (vuelva a calcular, reporte las variables solicitadas en la pregunta 1 y compare los resultados con los de la pregunta 1)?**

```{r}
modelo2_lineas <- NewInput.MMC(lambda = lambda, mu = mu, c = c2, n = 0, method = 0)

# Resolver el modelo
resultado2 <- QueueingModel(modelo2_lineas)

# Mostrar resultados
cat("Factor de utilización (rho):", round(resultado2$RO, 4), "\n")
cat("Número promedio de clientes en la fila (Lq):", round(resultado2$Lq, 4), "\n")
cat("Número promedio de clientes en el sistema (L):", round(resultado2$L, 4), "\n")
cat("Tiempo promedio en la fila (Wq):", round(resultado2$Wq * 60, 2), "minutos\n")
cat("Tiempo promedio en el sistema (W):", round(resultado2$W * 60, 2), "minutos\n")

```
**R**: Ahora con este cambio de agregar dos líneas, el sistema es muy distinto. Los clientes esperan solo 18 segundos en lugar de 7.71 minutos.


## <span style='color:red;'>  Examen Pregunta 4 </span> 

Los negocios de Acme Steel Fabricators han sido muy prósperos en los últimos cinco años. La compañía fabrica una amplia gama de productos de acero, como barandales, escaleras y marcos de acero estructural ligero. El método manual vigente para manejo de materiales ocasiona un exceso de inventario y congestionamientos. Acme está considerando si debe comprar un sistema de transporte que pende de un riel (monoriel), o un vehículo montacargas, para incrementar su capacidad y mejorar su eficiencia manufacturera.

Los resultados anuales del sistema, antes de impuestos, dependen de la demanda futura. Si la demanda se mantiene en el nivel actual, lo cual tiene una probabilidad de 0.50, el ahorro anual que producirá el transportador elevado (monoriel) será de $10,000. Si la demanda aumenta permitirá ahorrar $25,000 al año por la eficiencia operativa, además de las nuevas ventas. Finalmente, si la demanda cae, provocará una pérdida anual estimada en $65,000.

Se estima una probabilidad de 0.30 de que la demanda sea alta y de 0.20 de que sea baja. Si se compra, el montacargas, los resultados anuales serán de $5,000 si la demanda no cambia, $10,000 si la demanda aumenta y –$25,000 si la demanda cae.

```{r}
# Librerias
library(DiagrammeR)
library(tidyverse)

# Definir probabilidades y parámetros
p_alta  <- 0.30
p_igual <- 0.50
p_baja  <- 0.20

ah_mono_alta  <- 25000
ah_mono_igual <- 10000
ah_mono_baja  <- -65000

ah_mont_alta  <- 10000
ah_mont_igual <-  5000
ah_mont_baja  <- -25000

# Calcular valores esperados (VE)
ve_monoriel   <- p_alta*ah_mono_alta + p_igual*ah_mono_igual + p_baja*ah_mono_baja
ve_montacargas<- p_alta*ah_mont_alta + p_igual*ah_mont_igual + p_baja*ah_mont_baja

cat("VE Monoriel:   $", format(round(ve_monoriel, 2), big.mark=","), "\n", sep = "")
cat("VE Montacargas:$", format(round(ve_montacargas, 2), big.mark=","), "\n", sep = "")

mejor_opcion <- ifelse(ve_montacargas > ve_monoriel, "Montacargas", "Monoriel")
cat("Mejor alternativa:", mejor_opcion, "\n")

# Tabla resumen de escenarios
resumen <- tribble(
  ~Alternativa, ~Demanda, ~Prob, ~Ahorro_USD,
  "Monoriel",    "Alta",   p_alta,  ah_mono_alta,
  "Monoriel",    "Igual",  p_igual, ah_mono_igual,
  "Monoriel",    "Baja",   p_baja,  ah_mono_baja,
  "Montacargas", "Alta",   p_alta,  ah_mont_alta,
  "Montacargas", "Igual",  p_igual, ah_mont_igual,
  "Montacargas", "Baja",   p_baja,  ah_mont_baja
) %>%
  mutate(Prob = scales::percent(Prob, accuracy = 1),
         Ahorro_USD = scales::dollar(Ahorro_USD))

resumen

# Visualizando el árbol de decisión
DiagrammeR::grViz("
digraph decision_tree {
  graph [rankdir=LR]
  node [shape=box, style=filled, fillcolor=lightblue];

  Inicio [label='Decisión: Sistema de manejo de materiales'];

  Monoriel    [label='Monoriel'];
  Montacargas [label='Montacargas'];

  Mono_Alta   [label='Alta (0.30)\\nAhorro = $25,000'];
  Mono_Igual  [label='Igual (0.50)\\nAhorro = $10,000'];
  Mono_Baja   [label='Baja (0.20)\\nAhorro = -$65,000'];

  Mont_Alta   [label='Alta (0.30)\\nAhorro = $10,000'];
  Mont_Igual  [label='Igual (0.50)\\nAhorro = $5,000'];
  Mont_Baja   [label='Baja (0.20)\\nAhorro = -$25,000'];

  Inicio -> Monoriel
  Inicio -> Montacargas

  Monoriel -> Mono_Alta  [label='0.30']
  Monoriel -> Mono_Igual [label='0.50']
  Monoriel -> Mono_Baja  [label='0.20']

  Montacargas -> Mont_Alta  [label='0.30']
  Montacargas -> Mont_Igual [label='0.50']
  Montacargas -> Mont_Baja  [label='0.20']
}
")
```

Responda las siguientes preguntas:

1.- ¿Cuál es la mejor alternativa para ACME?
  La mejor alternativa para ACME es Montacargas, porque su valor esperado es mayor y su riesgo de pérdida es menor que el del Monorriel.

2.- ¿Cuál sería el ahorro esperado en el largo plazo?
  El ahorro esperado a largo plazo sería de 500 dólares por año, basado en el valor esperado del Montacargas.

## <span style='color:red;'>  Examen Pregunta 5 </span> 

**Se tienen dos dados de 20 lados cada uno. Esos dados se lanzan de manera simultánea para ver cuánto cae en ambos.**

```{r}
set.seed(520)  
num_simulations_10k <- 10000   # Primera simulación
num_simulations_50k <- 50000   # Segunda simulación
```
 
```{r}
# Simulacion con 10,000 iteraciones
dice1_10k <- sample(1:20, num_simulations_10k, replace = TRUE)
dice2_10k <- sample(1:20, num_simulations_10k, replace = TRUE)

sum_dices_10k <- dice1_10k + dice2_10k
mult_dices_10k <- dice1_10k * dice2_10k

# Estimamos las 3 probabilidades
prob_suma_30_10k <- mean(sum_dices_10k >= 30)
prob_suma_27_10k <- mean(sum_dices_10k == 27)
prob_mult_300_10k <- mean(mult_dices_10k >= 300)

# Mostramos los resultados
print(paste("1. Probabilidad suma >= 30:", round(prob_suma_30_10k * 100, 2), "%"))
print(paste("2. Probabilidad suma = 27:", round(prob_suma_27_10k * 100, 2), "%"))
print(paste("3. Probabilidad multiplicación >= 300:", round(prob_mult_300_10k * 100, 2), "%"))
```
 A usted se le pide que realice una simulación de montecarlo para calcular lo siguiente:

1.- ¿Cuál es la probabilidad de que la suma de los resultados sea mayor o igual a 30? R: 16.47 %

2.- ¿Cuál es la probabilidad de que la suma de los resultados sea igual a 27?   R: 3.68 %

3.- ¿Cuál es la probabilidad de que la multiplicación de sus resultados sea mayor o igual a 300? R: 5.22%


Para realizar este ejercicio por favor haga uso del seed 520 y realice el ejercicio para 10,000 iteraciones
 
**Una vez que realizó lo anterior, vuelva a realizar los tres ejercicios (preguntas) pero ahora con un total de 50,000 iteraciones y compare los resultados de ambos ejercicios con los valores reales de que ocurran éstos escenarios. Es decir, cuál fue más cercano a la realidad.**

```{r}
# Generamos los lanzamientos de los dos dados de 20 lados
dice1_50k <- sample(1:20, num_simulations_50k, replace = TRUE)
dice2_50k <- sample(1:20, num_simulations_50k, replace = TRUE)

# Calculamos la suma de los dos dados
sum_dices_50k <- dice1_50k + dice2_50k

# Calculamos la multiplicación de los dos dados
mult_dices_50k <- dice1_50k * dice2_50k

# Estimamos las probabilidades
prob_suma_30_50k <- mean(sum_dices_50k >= 30)
prob_suma_27_50k <- mean(sum_dices_50k == 27)
prob_mult_300_50k <- mean(mult_dices_50k >= 300)

# Mostramos los resultados
print(paste("1. Probabilidad suma >= 30:", round(prob_suma_30_50k * 100, 2), "%"))
print(paste("2. Probabilidad suma = 27:", round(prob_suma_27_50k * 100, 2), "%"))
print(paste("3. Probabilidad multiplicación >= 300:", round(prob_mult_300_50k * 100, 2), "%"))
```

```{r}
# Valores reales proporcionados
prob_real_suma_30 <- 16.5
prob_real_suma_27 <- 3.5
prob_real_mult_300 <- 5.25

# Suma >= 30
error_10k_suma30 <- abs(prob_suma_30_10k * 100 - prob_real_suma_30)
error_50k_suma30 <- abs(prob_suma_30_50k * 100 - prob_real_suma_30)
cat("Suma>=30  |", prob_real_suma_30, "% |", round(prob_suma_30_10k * 100, 2), "% |", 
    round(prob_suma_30_50k * 100, 2), "% |", round(error_10k_suma30, 2), "% |", 
    round(error_50k_suma30, 2), "%\n")

# Suma = 27
error_10k_suma27 <- abs(prob_suma_27_10k * 100 - prob_real_suma_27)
error_50k_suma27 <- abs(prob_suma_27_50k * 100 - prob_real_suma_27)
cat("Suma=27   |", prob_real_suma_27, "% |", round(prob_suma_27_10k * 100, 2), "% |", 
    round(prob_suma_27_50k * 100, 2), "% |", round(error_10k_suma27, 2), "% |", 
    round(error_50k_suma27, 2), "%\n")

# Multiplicación >= 300
error_10k_mult300 <- abs(prob_mult_300_10k * 100 - prob_real_mult_300)
error_50k_mult300 <- abs(prob_mult_300_50k * 100 - prob_real_mult_300)
cat("Mult>=300 |", prob_real_mult_300, "% |", round(prob_mult_300_10k * 100, 2), "% |", 
    round(prob_mult_300_50k * 100, 2), "% |", round(error_10k_mult300, 2), "% |", 
    round(error_50k_mult300, 2), "%\n")

# Determinar cuál es más precisa 
error_total_10k <- error_10k_suma30 + error_10k_suma27 + error_10k_mult300
error_total_50k <- error_50k_suma30 + error_50k_suma27 + error_50k_mult300

cat("Error total simulación 10k:", round(error_total_10k, 2), "%\n")
cat("Error total simulación 50k:", round(error_total_50k, 2), "%\n")

if (error_total_50k < error_total_10k) {
  cat("RESULTADO: La simulación con 50,000 iteraciones es MÁS PRECISA\n")
} else {
  cat("RESULTADO: La simulación con 10,000 iteraciones es MÁS PRECISA\n")
}
```

1.- En el primer caso la probabilidad real es de 16.5%

2.- En el segundo caso la probabilidad real es de 3.5%

3.- En el tercer caso la probabilidad es de 5.25%

**R**:La simulación de Monte Carlo con 10,000 iteraciones fue muy cercana a la realidad. Los resultados mostraron que la probabilidad de suma ≥ 30 fue 16.47% vs. 16.5% real, suma = 27 fue 3.68% vs. 3.5% real, y multiplicación ≥ 300 fue 5.22% vs. 5.25% real. El error total fue solo 0.24%, demostrando que 10,000 iteraciones fue excepcionalmente preciso para este ejercicio.












