Analizar la oferta y de manda para poder implementar una empresa dedicada al rubro de la comida rápida “hamburguesería” analizar la demanda que tiene en la zona y creando un programa adecuado para su rendimiento optimo acortando los tiempos de espera que son una de las metas y ser auto sustentable mediante la toma de mediciones con los programas que se implementan
2 Etapa de Recolección de Datos
Para esta etapa, se generó una base de datos representativa enfocada en el análisis de tiempos mediante una simulación de Monte Carlo de 100 pedidos. Esta simulación permitió estructurar datos comparativos entre los canales de venta Digital y Tradicional, incluyendo variables operativas clave como el tipo de producto (pizza, hamburguesa, pollo, salchipapa o gaseosa), la cantidad de ítems por orden y el tiempo de despacho estimado para cada escenario.
# Configuración de simulaciónset.seed(123)n_pedidos <-100productos <-c("Pizza", "Hamburguesa", "Pollo", "Salchipapa", "Gaseosa")# Generación del dataframedf_pedidos <-data.frame(ID =1:n_pedidos,Producto =sample(productos, n_pedidos, replace =TRUE),Canal =sample(c("Digital", "Tradicional"), n_pedidos, replace =TRUE),Cant =sample(1:5, n_pedidos, replace =TRUE))# Lógica de tiempos: Digital es más eficiente que el Tradicionaldf_pedidos$Tiempo <-ifelse(df_pedidos$Canal =="Digital", round(rnorm(n_pedidos, 8+ df_pedidos$Cant*0.5, 1.5), 1), round(rnorm(n_pedidos, 18+ df_pedidos$Cant*0.8, 2.5), 1))# Mostrar los primeros registroshead(df_pedidos)
ID Producto Canal Cant Tiempo
1 1 Pollo Digital 2 10.8
2 2 Pollo Digital 1 7.7
3 3 Hamburguesa Digital 2 7.5
4 4 Hamburguesa Digital 4 12.5
5 5 Pollo Tradicional 5 21.7
6 6 Gaseosa Tradicional 1 15.7
3 Análisis Descriptivo de los Datos
El análisis descriptivo se enfocó en identificar patrones de consumo y la distribución de la carga de trabajo mediante el uso de frecuencias y visualizaciones. Utilizando gráficos de cajas, se evidenció visualmente la distribución y diferencia de los tiempos de atención entre ambos canales. Complementariamente, un gráfico de barras ilustró las preferencias de los clientes, permitiendo identificar con exactitud el volumen de demanda de los productos ofrecidos, liderados por la salchipapa y el pollo.
library(ggplot2)# Gráfico de cajas para ver la distribución de tiempos por canalggplot(df_pedidos, aes(x = Canal, y = Tiempo, fill = Canal)) +geom_boxplot() +theme_minimal() +labs(title ="Distribución de Tiempos por Canal", y ="Minutos")
# Gráfico de barras de productos más pedidosggplot(df_pedidos, aes(x = Producto, fill = Producto)) +geom_bar() +coord_flip() +theme_light() +labs(title ="Preferencia de Productos")
4 Identificación de Relaciones y Tendencias
Modelar la relación entre el volumen del pedido y el tiempo de despacho, cuantificando el impacto de cada factor en el resultado.
Métodos: Regresión Lineal Múltiple, que permite evaluar el efecto combinado de variables cuantitativas (cantidad) y cualitativas (canal) sobre la variable dependiente (tiempo), lo que nos permitirá tener una tendencia para poder identificar las distintas variables
# Creación del modelo predictivomodelo_pedidos <-lm(Tiempo ~ Cant + Canal, data = df_pedidos)# Resumen estadístico del modelosummary(modelo_pedidos)
Call:
lm(formula = Tiempo ~ Cant + Canal, data = df_pedidos)
Residuals:
Min 1Q Median 3Q Max
-5.3147 -1.2063 -0.0398 1.4900 6.5181
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 7.4485 0.4731 15.743 < 2e-16 ***
Cant 0.8164 0.1339 6.096 2.21e-08 ***
CanalTradicional 10.4170 0.4182 24.910 < 2e-16 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 2.08 on 97 degrees of freedom
Multiple R-squared: 0.8776, Adjusted R-squared: 0.8751
F-statistic: 347.9 on 2 and 97 DF, p-value: < 2.2e-16
# Visualización de la tendencia linealggplot(df_pedidos, aes(x = Cant, y = Tiempo, color = Canal)) +geom_point() +geom_smooth(method ="lm", se =TRUE) +theme_minimal() +labs(title ="Tendencia: Cantidad vs Tiempo")
`geom_smooth()` using formula = 'y ~ x'
5 Evaluación de Hipótesis
Para validar si la diferencia operativa entre los canales de atención era estadísticamente significativa, se aplicó una prueba T-Student para muestras independientes. Los resultados de la prueba rechazaron de forma contundente la hipótesis de igualdad (\(p < 2.2e-16\)), demostrando que el canal Digital es significativamente más rápido, logrando un tiempo promedio de atención de 9.72 minutos frente a los 20.39 minutos del canal Tradicional.
# Prueba de Hipótesis# Ho: No hay diferencia entre Digital y Tradicional# Ha: El canal Digital es significativamente distinto al Tradicionalprueba_t <-t.test(Tiempo ~ Canal, data = df_pedidos)print(prueba_t)
Welch Two Sample t-test
data: Tiempo by Canal
t = -21.762, df = 82.9, p-value < 2.2e-16
alternative hypothesis: true difference in means between group Digital and group Tradicional is not equal to 0
95 percent confidence interval:
-11.652167 -9.700615
sample estimates:
mean in group Digital mean in group Tradicional
9.721569 20.397959