Gestión de Pedidos en Comida Rápida

Author

Grupo 1

1 Objetivo del Proyecto

Analizar la oferta y de manda para poder implementar una empresa dedicada al rubro de la comida rápida “hamburguesería” analizar la demanda que tiene en la zona y creando un programa adecuado para su rendimiento optimo acortando los tiempos de espera que son una de las metas y ser auto sustentable mediante la toma de mediciones con los programas que se implementan


2 Etapa de Recolección de Datos

Para esta etapa, se generó una base de datos representativa enfocada en el análisis de tiempos mediante una simulación de Monte Carlo de 100 pedidos. Esta simulación permitió estructurar datos comparativos entre los canales de venta Digital y Tradicional, incluyendo variables operativas clave como el tipo de producto (pizza, hamburguesa, pollo, salchipapa o gaseosa), la cantidad de ítems por orden y el tiempo de despacho estimado para cada escenario.

# Configuración de simulación
set.seed(123)
n_pedidos <- 100
productos <- c("Pizza", "Hamburguesa", "Pollo", "Salchipapa", "Gaseosa")

# Generación del dataframe
df_pedidos <- data.frame(
  ID = 1:n_pedidos,
  Producto = sample(productos, n_pedidos, replace = TRUE),
  Canal = sample(c("Digital", "Tradicional"), n_pedidos, replace = TRUE),
  Cant = sample(1:5, n_pedidos, replace = TRUE)
)

# Lógica de tiempos: Digital es más eficiente que el Tradicional
df_pedidos$Tiempo <- ifelse(df_pedidos$Canal == "Digital", 
                         round(rnorm(n_pedidos, 8 + df_pedidos$Cant*0.5, 1.5), 1), 
                         round(rnorm(n_pedidos, 18 + df_pedidos$Cant*0.8, 2.5), 1))

# Mostrar los primeros registros
head(df_pedidos)
  ID    Producto       Canal Cant Tiempo
1  1       Pollo     Digital    2   10.8
2  2       Pollo     Digital    1    7.7
3  3 Hamburguesa     Digital    2    7.5
4  4 Hamburguesa     Digital    4   12.5
5  5       Pollo Tradicional    5   21.7
6  6     Gaseosa Tradicional    1   15.7

3 Análisis Descriptivo de los Datos

El análisis descriptivo se enfocó en identificar patrones de consumo y la distribución de la carga de trabajo mediante el uso de frecuencias y visualizaciones. Utilizando gráficos de cajas, se evidenció visualmente la distribución y diferencia de los tiempos de atención entre ambos canales. Complementariamente, un gráfico de barras ilustró las preferencias de los clientes, permitiendo identificar con exactitud el volumen de demanda de los productos ofrecidos, liderados por la salchipapa y el pollo.

library(ggplot2)

# Gráfico de cajas para ver la distribución de tiempos por canal
ggplot(df_pedidos, aes(x = Canal, y = Tiempo, fill = Canal)) +
  geom_boxplot() +
  theme_minimal() +
  labs(title = "Distribución de Tiempos por Canal", y = "Minutos")

# Gráfico de barras de productos más pedidos
ggplot(df_pedidos, aes(x = Producto, fill = Producto)) +
  geom_bar() +
  coord_flip() +
  theme_light() +
  labs(title = "Preferencia de Productos")

4 Identificación de Relaciones y Tendencias

Modelar la relación entre el volumen del pedido y el tiempo de despacho, cuantificando el impacto de cada factor en el resultado.

Métodos: Regresión Lineal Múltiple, que permite evaluar el efecto combinado de variables cuantitativas (cantidad) y cualitativas (canal) sobre la variable dependiente (tiempo), lo que nos permitirá tener una tendencia para poder identificar las distintas variables

# Creación del modelo predictivo
modelo_pedidos <- lm(Tiempo ~ Cant + Canal, data = df_pedidos)

# Resumen estadístico del modelo
summary(modelo_pedidos)

Call:
lm(formula = Tiempo ~ Cant + Canal, data = df_pedidos)

Residuals:
    Min      1Q  Median      3Q     Max 
-5.3147 -1.2063 -0.0398  1.4900  6.5181 

Coefficients:
                 Estimate Std. Error t value Pr(>|t|)    
(Intercept)        7.4485     0.4731  15.743  < 2e-16 ***
Cant               0.8164     0.1339   6.096 2.21e-08 ***
CanalTradicional  10.4170     0.4182  24.910  < 2e-16 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 2.08 on 97 degrees of freedom
Multiple R-squared:  0.8776,    Adjusted R-squared:  0.8751 
F-statistic: 347.9 on 2 and 97 DF,  p-value: < 2.2e-16
# Visualización de la tendencia lineal
ggplot(df_pedidos, aes(x = Cant, y = Tiempo, color = Canal)) +
  geom_point() +
  geom_smooth(method = "lm", se = TRUE) +
  theme_minimal() +
  labs(title = "Tendencia: Cantidad vs Tiempo")
`geom_smooth()` using formula = 'y ~ x'

5 Evaluación de Hipótesis

Para validar si la diferencia operativa entre los canales de atención era estadísticamente significativa, se aplicó una prueba T-Student para muestras independientes. Los resultados de la prueba rechazaron de forma contundente la hipótesis de igualdad (\(p < 2.2e-16\)), demostrando que el canal Digital es significativamente más rápido, logrando un tiempo promedio de atención de 9.72 minutos frente a los 20.39 minutos del canal Tradicional.

# Prueba de Hipótesis
# Ho: No hay diferencia entre Digital y Tradicional
# Ha: El canal Digital es significativamente distinto al Tradicional
prueba_t <- t.test(Tiempo ~ Canal, data = df_pedidos)

print(prueba_t)

    Welch Two Sample t-test

data:  Tiempo by Canal
t = -21.762, df = 82.9, p-value < 2.2e-16
alternative hypothesis: true difference in means between group Digital and group Tradicional is not equal to 0
95 percent confidence interval:
 -11.652167  -9.700615
sample estimates:
    mean in group Digital mean in group Tradicional 
                 9.721569                 20.397959