Portada

Row

Presentación de datos de restaurante

Por: Gerónimo Cáceres, Jacobo Montoya, Samuel Galarza

Página 1

Row

Datos

Información de los datos

  • El conjunto de datos a trabajar son datos de ventas de un restaurante. Hay 9 variables: ID de la orden, fecha. Producto, precio, cantidad, tipo de compra (Online o en persona), método de pago (efectivo o tarjeta de crédito), mánager de la tienda y ciudad de la tienda.

  • En total hay 2286 datos, que sería el tamaño de la muestra.

  • Lo que deseamos saber es en qué ciudad se vende más por cantidad y por precio. También deseamos ver que producto se vende más por ciudad. Para finalmente analizar y dar una interpretación a estos datos.

  • Datos no necesarios: tipo de compra, método de pago, ID y mánager.

  • En general el conjunto de datos no presenta inconsistencias, errores de digitación, información faltante, los datos se encuentran bien organizados y procesados.

Página 2

Análisis descriptivo

Resumen datos cuantitativos

Resumen datos cualitativos

Diagramas de barras (Univariado)

Frecuencia por producto

Interpretación

  • Este gráfico muestra que la distribución de productos vendidos es relativamente equilibrada entre las cinco categorías principales: Beverages, Burgers, Chicken Sandwiches, Fries y Sides & Other. No hay un producto que domine en frecuencia absoluta, lo que indica una demanda diversificada y una oferta bien balanceada. Sin embargo, esta visión global no refleja las preferencias locales por ciudad, por lo que se complementa con los gráficos de composición por ciudad más adelante.

Frecuencia por ciudad

Interpretación

  • Lisboa y Londres lideran en número de transacciones registradas, lo que las posiciona como los mercados más activos del negocio. Madrid se ubica en un nivel intermedio, mientras que Berlín y París presentan menor frecuencia de ventas. Esta diferencia puede estar influenciada por factores operativos como disponibilidad de tiendas, horarios, o incluso eventos externos como remodelaciones o cierres temporales. La frecuencia por sí sola no determina el rendimiento, pero sí indica el nivel de actividad comercial en cada ciudad.

Diagramas de cajas (Univariados)

Diagrama de cajas de cantidad vendida

Diagrama de cajas de precio de venta

Interpretación

  • El boxplot de cantidad vendida muestra que las ventas diarias tienen una distribución relativamente concentrada, con una mediana cercana a 600 unidades. Esto sugiere que la cantidad vendida por día es una métrica estable y confiable para comparar ciudades. En contraste, el boxplot de precio de venta revela mayor dispersión y presencia de outliers, lo que indica variabilidad entre productos y posibles efectos de promociones o combos. Por tanto, se concluye que la cantidad vendida es un mejor indicador para evaluar el rendimiento por ciudad que el precio unitario.

Diagrama de cajas por grupos

Diagrama de cajas de precio de venta

Interpretación

  • Este gráfico revela diferencias importantes en el comportamiento de ventas por ciudad. Lisboa y Londres muestran cajas más altas, lo que indica mayores cantidades vendidas por día. Berlín, aunque tiene menor frecuencia de ventas, presenta una mediana sorprendentemente alta y una caja compacta, lo que sugiere que cuando hay ventas, son consistentes y de alto volumen. París, por otro lado, tiene una caja baja y compacta, reflejando ventas constantes pero de bajo volumen. Este análisis permite identificar ciudades con potencial oculto (como Berlín) y otras que requieren revisión estratégica (como París).

Diagrama de barras apiladas

Diagrama de barras apiladas por ingreso

Por cantidad

Matriz de correlación

Matriz de correlación

Interpretación

  • El signo negativo (\(< 0\)): Indica una correlación inversa (o negativa).Significa que cuando una variable aumenta, la otra variable tiende a disminuir.En tu contexto: Cuando el Price (Precio) es más alto, la Quantity (Cantidad) vendida tiende a ser menor. Esto es consistente con la ley básica de la demanda.La magnitud (0.26): Indica la fuerza de esa relación inversa.Un valor de 0.26 es considerado una correlación débil a moderada.Si fuera -1.0, la relación sería perfectamente inversa (muy fuerte). Si fuera 0.0, no habría relación lineal.Significa que, si bien hay una tendencia a vender menos cuando el precio sube, no es una regla estricta ni muy fuerte. Hay muchos otros factores (como la ciudad, el producto o la fecha) que influyen más que el precio por sí solo.

Complemento

Dispersión

Dispersión

Interpretación Dispersión

Conclusiones

Conclusiones

  1. Lisboa y Londres son los motores del negocio Lideran en frecuencia de ventas, volumen de productos vendidos e ingreso total acumulado.

    Las ventas son frecuentes y con cantidades altas por día, lo que indica alta demanda sostenida.

    El producto más rentable en ambas ciudades son los Burgers, lo que sugiere priorizar inventario, promociones y eficiencia operativa en esa categoría.

  2. Madrid muestra un rendimiento intermedio Tiene una frecuencia y volumen moderados, con una distribución de productos más equilibrada.

    Puede ser una buena candidata para experimentar nuevas estrategias de menú o fidelización, dado su perfil mixto.

  3. Berlín Berlín tiene ventas menos frecuentes pero con alto volumen por día Aunque aparece como una ciudad de bajo ingreso total, sus ventas por día son altas y consistentes.

    Esto sugiere que Berlín podría estar afectada por factores externos (cierres temporales, remodelaciones, personal reducido).

    Si se estabiliza la operación, tiene potencial de alto rendimiento.

  4. París tiene ventas frecuentes pero de bajo volumen Las ventas son constantes pero con cantidades pequeñas, lo que limita el ingreso total.

    Puede reflejar un perfil de cliente más conservador o una oferta poco atractiva.

    Requiere revisión de estrategia comercial, posiblemente enfocada en combos, promociones o rediseño de menú.

  5. La cantidad vendida es una métrica más confiable que el precio El análisis estadístico muestra que la cantidad por día es más estable que el precio unitario, que varía más entre productos.

    Por eso, las decisiones deben basarse principalmente en volumen vendido, no en precio.

  6. La frecuencia no lo es todo: importa cuánto se vende por día Ciudades como Berlín, con baja frecuencia pero alta cantidad por día, pueden ser subestimadas si solo se mira el número de ventas.

    Es clave considerar tanto la frecuencia como el volumen por transacción para evaluar el verdadero rendimiento.