1. Introducción

Este informe presenta un análisis exploratorio completo de las ventas de una cadena de tiendas deportivas con presencia en ocho ciudades de Brasil durante el año 2023.

El análisis exploratorio de datos (EDA) es un paso clave para comprender la información de ventas, identificar patrones y evaluar la distribución de las variables.

1.1 Contexto de la base de datos

La base de datos contiene tres tablas relacionadas:

Tabla Descripción
RegistroVentas Transacciones individuales de venta
Productos Catálogo de 8 artículos deportivos
Tiendas 8 puntos de venta distribuidos en Brasil

1.2 Objetivos del análisis

  • Identificar qué productos generan más ingresos y unidades vendidas.
  • Determinar qué ciudades y tiendas concentran la mayor parte de los ingresos.
  • Detectar patrones temporales en las ventas a lo largo del año.
  • Clasificar el rendimiento de cada tienda respecto al promedio general.

1.3 Preguntas de interés

  1. ¿Cuál es el producto estrella de la cadena?
  2. ¿Qué ciudades y tiendas tienen mejor desempeño?
  3. ¿Existen meses con ventas notablemente más altas o bajas?
  4. ¿Qué relación existe entre el precio y el volumen de ventas?

2. Carga y comprensión de los datos

PASO 1. Cargar librerías necesarias

PASO 2. Leer el archivo Excel

## RegistroVentas : 4761 filas, 6 columnas
## Productos      : 8 filas, 3 columnas
## Tiendas        : 8 filas, 7 columnas

PASO 3. Inspección inicial

ID Fecha_ Pedido Cod_Tienda id_producto Qtde Precio_Unitario
AX144 2023-01-15 A1500111 1007 35 630.99
AX4456 2023-07-27 A5200100 1007 33 630.99
AX2320 2023-08-03 A1500108 1005 132 999.00
AX4314 2023-07-04 A1500107 1005 72 999.00
AX151 2023-01-15 A1500111 1007 44 630.99
## Columnas RegistroVentas:
## [1] "ID"              "Fecha_ Pedido"   "Cod_Tienda"      "id_producto"    
## [5] "Qtde"            "Precio_Unitario"
## 
## Columnas Productos:
## [1] "id_produto"           "descripción_producto" "img_url"
## 
## Columnas Tiendas:
## [1] "codigo_Tienda" "nombre_Tienda" "Ciudad"        "Nombre_Estado"
## [5] "Sigla_Estado"  "Latitud"       "Longitud"

3. Limpieza y preprocesamiento

## Nulos en ventas   : 0
## Nulos en productos: 0
## Nulos en tiendas  : 0
## Rango de fechas: 2023-01-01 → 2023-12-31
## Valores negativos en cantidad: 0
id cod_tienda id_producto qtde precio_unitario fecha_pedido ingreso_total mes nombre_mes trimestre
AX144 A1500111 1007 35 630.99 2023-01-15 22084.65 1 ene 1
AX4456 A5200100 1007 33 630.99 2023-07-27 20822.67 7 jul 3
AX2320 A1500108 1005 132 999.00 2023-08-03 131868.00 8 ago 3

4. Unión de tablas

## Base integrada: 4761 filas × 14 columnas
id cod_tienda id_producto qtde precio_unitario fecha_pedido ingreso_total mes nombre_mes trimestre descripción_producto nombre_tienda ciudad nombre_estado
AX144 A1500111 1007 35 630.99 2023-01-15 22084.65 1 ene 1 Mochila Tienda 4 São Luís Maranhão
AX4456 A5200100 1007 33 630.99 2023-07-27 20822.67 7 jul 3 Mochila Tienda 3 Manaus Amazonas
AX2320 A1500108 1005 132 999.00 2023-08-03 131868.00 8 ago 3 Bolso Tienda 6 Niterói Rio de Janeiro

5. Estadísticas descriptivas

5.1 Resumen general

Indicadores generales de la base integrada
Indicador Valor
Total transacciones 4,761
Ingreso total $72,861,270
Ingreso promedio $15,303.77
Ingreso mediana $9,240
Ingreso máximo $203,796
Ingreso mínimo $119.30
Desv. estándar $17,575.46

5.2 Indicadores por producto

Ingresos y unidades por producto
descripción_producto Unidades Ingreso_total Precio_promedio N_transacciones Participacion_pct
Bolso 22334 $22,311,666 $999.00 574 30.62
Mochila 23752 $14,987,274 $630.99 637 20.57
Maleta 24189 $12,074,907 $499.19 587 16.57
Tennis 22483 $7,198,832 $320.19 563 9.88
Billetera 25351 $5,323,710 $210.00 616 7.31
Audifinos 24158 $3,841,122 $159.00 602 5.27
Botella 29944 $3,572,319 $119.30 611 4.90
Gorra 22060 $3,551,439 $160.99 571 4.87

5.3 Indicadores por ciudad

Ingresos totales por ciudad
ciudad Ingreso_total Unidades N_transacciones Participacion_pct
São Luís $16,149,706 47528 1008 22.17
São Paulo $15,990,617 41142 489 21.95
Niterói $14,063,358 37195 721 19.30
Vitória $10,060,370 25447 745 13.81
Curitiba $8,225,703 20563 1136 11.29
Manaus $6,249,207 16302 482 8.58
Salvador $1,837,147 5290 158 2.52
Goiânia $285,162 804 22 0.39

5.4 Ventas mensuales

Evolución mensual de ventas
Mes Ingreso_total Unidades
ene $7,052,940 18276
feb $6,339,704 16468
mar $7,877,338 19616
abr $7,166,507 19296
may $7,240,702 20198
jun $5,949,407 18009
jul $5,045,747 13734
ago $5,740,660 14724
sept $5,259,929 14718
oct $5,453,610 14306
nov $4,488,934 11768
dic $5,245,792 13158

6. Funciones propias

Función 1: resumen_por_grupo()

Calcula suma, promedio, mediana y participación porcentual agrupados por una variable.

## === Top 3 productos por ingreso ===
descripción_producto total promedio mediana participacion_pct
Bolso $22,311,666 $38,870.50 $31,968.00 30.62
Mochila $14,987,274 $23,527.90 $19,560.69 20.57
Maleta $12,074,907 $20,570.54 $17,471.65 16.57

Función 2: clasificar_rendimiento()

Clasifica elementos como Alto, Medio o Bajo según su distancia al promedio (±0.5 desviaciones estándar).

## === Rendimiento por tienda ===
nombre_tienda total rendimiento vs_promedio_pct
Tienda 4 $16,149,706 Alto 77.32
Tienda 5 $15,990,617 Alto 75.57
Tienda 6 $14,063,358 Alto 54.41
Tienda 2 $10,060,370 Medio 10.46
Tienda 7 $8,225,703 Medio -9.68
Tienda 3 $6,249,207 Medio -31.39
Tienda 1 $1,837,147 Bajo -79.83
Tienda 8 $285,162 Bajo -96.87

Función 3: producto_estrella_por_ciudad()

Identifica el producto con mayor ingreso en cada ciudad.

Producto estrella por ciudad
ciudad producto_estrella ingreso_top
São Paulo Bolso $5,394,600
Niterói Bolso $4,482,513
São Luís Bolso $4,471,524
Vitória Bolso $2,982,015
Curitiba Bolso $2,539,458
Manaus Bolso $1,867,131
Salvador Bolso $486,513
Goiânia Bolso $87,912

7. Visualizaciones

Figura 1. Productos: unidades vendidas e ingresos

Interpretación Figura 1.

La Mochila lidera tanto en unidades vendidas como en ingresos totales, representando la mayor participación del negocio. El Bolso y el Tennis también muestran un volumen de ventas elevado. En contraste, los Audífonos y la Billetera registran el menor desempeño en ambas métricas. Esta concentración en pocos productos sugiere que el portafolio depende de dos o tres artículos clave, lo que representa un riesgo si alguno pierde demanda.


Figura 2. Ingresos por ciudad y rendimiento de tiendas

Interpretación Figura 2.

São Paulo y Curitiba lideran en ingresos, superando el promedio general de todas las ciudades. Vitória y Salvador se encuentran por debajo y representan oportunidades de mejora. En cuanto a tiendas, se identifican tres niveles de rendimiento: las tiendas Alto superan significativamente el promedio, mientras que las tiendas Bajo requieren intervención urgente mediante revisión de estrategia comercial, oferta de productos y condiciones locales.


Figura 3. Evolución mensual de ventas

Interpretación Figura 3.

Los ingresos presentan variación a lo largo del año, con picos en meses específicos que pueden asociarse a temporadas de mayor consumo como inicio de año o mitad de año. Los meses con caídas notables son oportunidades estratégicas para implementar promociones que sostengan el flujo de ventas. La tendencia general sugiere que el volumen de transacciones es el principal motor de los ingresos.


Figura 4. Distribución de ingresos

Interpretación Figura 4.

La distribución muestra asimetría positiva: la media supera a la mediana, lo que indica que algunas transacciones de alto valor elevan el promedio. La mayoría de las transacciones se concentran en valores medios. El boxplot por producto revela diferencias claras entre artículos: algunos presentan mayor variabilidad (posiblemente por compras de gran volumen), mientras que otros tienen distribuciones más compactas y predecibles.

📌 Valores atípicos (outliers): Los puntos en rojo representan transacciones que se salen del rango esperado, posiblemente compras corporativas o de gran volumen.


Figura 5. Análisis cruzado producto × ciudad

Interpretación Figura 5.

El mapa de calor permite identificar las combinaciones más rentables de producto-ciudad. Las celdas más oscuras marcan los focos de mayor rentabilidad, útiles para priorizar inventario y campañas localizadas. El gráfico de participación confirma que la Mochila y el Bolso explican la mayor parte de los ingresos totales. Esta concentración es a la vez una fortaleza y un riesgo: si alguno de estos productos pierde demanda, el impacto sería significativo.


8. Hallazgos y conclusiones

8.1 Hallazgos principales

📦 Productos:

  • La Mochila es el producto estrella: lidera en unidades e ingresos en casi todas las ciudades.
  • El Bolso y el Tennis también tienen alta rotación y contribuyen significativamente a los ingresos.
  • Los Audífonos y la Billetera presentan el menor desempeño en volumen de ventas.

🏙️ Ciudades y tiendas:

  • São Paulo y Curitiba concentran los mayores ingresos de la cadena, superando el promedio general.
  • Vitória y Salvador se encuentran por debajo del promedio, representando oportunidades de crecimiento.
  • Las tiendas clasificadas con rendimiento Bajo requieren intervención estratégica inmediata.

📅 Temporalidad:

  • Se observan variaciones mensuales que sugieren estacionalidad en las ventas.
  • Los meses de menor venta son oportunidades para campañas promocionales.

8.2 Limitaciones del análisis

  • Solo se dispone de datos de un año (2023), sin posibilidad de comparación interanual.
  • No hay información de costos, por lo que no se puede calcular rentabilidad real.
  • Los datos no incluyen devoluciones ni descuentos aplicados.

8.3 Recomendaciones

  1. Aumentar inventario de Mochila y Bolso en todas las tiendas.
  2. Intervenir en tiendas de rendimiento bajo con auditorías operativas y estrategias comerciales locales.
  3. Diseñar campañas de marketing en los meses de baja venta para sostener el flujo de ingresos.
  4. Evaluar expansión de puntos de venta en São Paulo y Curitiba dado su alto potencial.
  5. Implementar análisis predictivos (series de tiempo) para anticipar comportamiento futuro de ventas.

Informe generado automáticamente con R Markdown · Fundamentos de Programación 2025