Este informe presenta un análisis exploratorio completo de las ventas de una cadena de tiendas deportivas con presencia en ocho ciudades de Brasil durante el año 2023.
El análisis exploratorio de datos (EDA) es un paso clave para comprender la información de ventas, identificar patrones y evaluar la distribución de las variables.
La base de datos contiene tres tablas relacionadas:
| Tabla | Descripción |
|---|---|
RegistroVentas |
Transacciones individuales de venta |
Productos |
Catálogo de 8 artículos deportivos |
Tiendas |
8 puntos de venta distribuidos en Brasil |
PASO 1. Cargar librerías necesarias
PASO 2. Leer el archivo Excel
## RegistroVentas : 4761 filas, 6 columnas
## Productos : 8 filas, 3 columnas
## Tiendas : 8 filas, 7 columnas
PASO 3. Inspección inicial
| ID | Fecha_ Pedido | Cod_Tienda | id_producto | Qtde | Precio_Unitario |
|---|---|---|---|---|---|
| AX144 | 2023-01-15 | A1500111 | 1007 | 35 | 630.99 |
| AX4456 | 2023-07-27 | A5200100 | 1007 | 33 | 630.99 |
| AX2320 | 2023-08-03 | A1500108 | 1005 | 132 | 999.00 |
| AX4314 | 2023-07-04 | A1500107 | 1005 | 72 | 999.00 |
| AX151 | 2023-01-15 | A1500111 | 1007 | 44 | 630.99 |
## Columnas RegistroVentas:
## [1] "ID" "Fecha_ Pedido" "Cod_Tienda" "id_producto"
## [5] "Qtde" "Precio_Unitario"
##
## Columnas Productos:
## [1] "id_produto" "descripción_producto" "img_url"
##
## Columnas Tiendas:
## [1] "codigo_Tienda" "nombre_Tienda" "Ciudad" "Nombre_Estado"
## [5] "Sigla_Estado" "Latitud" "Longitud"
## Nulos en ventas : 0
## Nulos en productos: 0
## Nulos en tiendas : 0
## Rango de fechas: 2023-01-01 → 2023-12-31
## Valores negativos en cantidad: 0
| id | cod_tienda | id_producto | qtde | precio_unitario | fecha_pedido | ingreso_total | mes | nombre_mes | trimestre |
|---|---|---|---|---|---|---|---|---|---|
| AX144 | A1500111 | 1007 | 35 | 630.99 | 2023-01-15 | 22084.65 | 1 | ene | 1 |
| AX4456 | A5200100 | 1007 | 33 | 630.99 | 2023-07-27 | 20822.67 | 7 | jul | 3 |
| AX2320 | A1500108 | 1005 | 132 | 999.00 | 2023-08-03 | 131868.00 | 8 | ago | 3 |
## Base integrada: 4761 filas × 14 columnas
| id | cod_tienda | id_producto | qtde | precio_unitario | fecha_pedido | ingreso_total | mes | nombre_mes | trimestre | descripción_producto | nombre_tienda | ciudad | nombre_estado |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| AX144 | A1500111 | 1007 | 35 | 630.99 | 2023-01-15 | 22084.65 | 1 | ene | 1 | Mochila | Tienda 4 | São Luís | Maranhão |
| AX4456 | A5200100 | 1007 | 33 | 630.99 | 2023-07-27 | 20822.67 | 7 | jul | 3 | Mochila | Tienda 3 | Manaus | Amazonas |
| AX2320 | A1500108 | 1005 | 132 | 999.00 | 2023-08-03 | 131868.00 | 8 | ago | 3 | Bolso | Tienda 6 | Niterói | Rio de Janeiro |
| Indicador | Valor |
|---|---|
| Total transacciones | 4,761 |
| Ingreso total | $72,861,270 |
| Ingreso promedio | $15,303.77 |
| Ingreso mediana | $9,240 |
| Ingreso máximo | $203,796 |
| Ingreso mínimo | $119.30 |
| Desv. estándar | $17,575.46 |
| descripción_producto | Unidades | Ingreso_total | Precio_promedio | N_transacciones | Participacion_pct |
|---|---|---|---|---|---|
| Bolso | 22334 | $22,311,666 | $999.00 | 574 | 30.62 |
| Mochila | 23752 | $14,987,274 | $630.99 | 637 | 20.57 |
| Maleta | 24189 | $12,074,907 | $499.19 | 587 | 16.57 |
| Tennis | 22483 | $7,198,832 | $320.19 | 563 | 9.88 |
| Billetera | 25351 | $5,323,710 | $210.00 | 616 | 7.31 |
| Audifinos | 24158 | $3,841,122 | $159.00 | 602 | 5.27 |
| Botella | 29944 | $3,572,319 | $119.30 | 611 | 4.90 |
| Gorra | 22060 | $3,551,439 | $160.99 | 571 | 4.87 |
| ciudad | Ingreso_total | Unidades | N_transacciones | Participacion_pct |
|---|---|---|---|---|
| São Luís | $16,149,706 | 47528 | 1008 | 22.17 |
| São Paulo | $15,990,617 | 41142 | 489 | 21.95 |
| Niterói | $14,063,358 | 37195 | 721 | 19.30 |
| Vitória | $10,060,370 | 25447 | 745 | 13.81 |
| Curitiba | $8,225,703 | 20563 | 1136 | 11.29 |
| Manaus | $6,249,207 | 16302 | 482 | 8.58 |
| Salvador | $1,837,147 | 5290 | 158 | 2.52 |
| Goiânia | $285,162 | 804 | 22 | 0.39 |
| Mes | Ingreso_total | Unidades |
|---|---|---|
| ene | $7,052,940 | 18276 |
| feb | $6,339,704 | 16468 |
| mar | $7,877,338 | 19616 |
| abr | $7,166,507 | 19296 |
| may | $7,240,702 | 20198 |
| jun | $5,949,407 | 18009 |
| jul | $5,045,747 | 13734 |
| ago | $5,740,660 | 14724 |
| sept | $5,259,929 | 14718 |
| oct | $5,453,610 | 14306 |
| nov | $4,488,934 | 11768 |
| dic | $5,245,792 | 13158 |
resumen_por_grupo()Calcula suma, promedio, mediana y participación porcentual agrupados por una variable.
## === Top 3 productos por ingreso ===
| descripción_producto | total | promedio | mediana | participacion_pct |
|---|---|---|---|---|
| Bolso | $22,311,666 | $38,870.50 | $31,968.00 | 30.62 |
| Mochila | $14,987,274 | $23,527.90 | $19,560.69 | 20.57 |
| Maleta | $12,074,907 | $20,570.54 | $17,471.65 | 16.57 |
clasificar_rendimiento()Clasifica elementos como Alto, Medio o Bajo según su distancia al promedio (±0.5 desviaciones estándar).
## === Rendimiento por tienda ===
| nombre_tienda | total | rendimiento | vs_promedio_pct |
|---|---|---|---|
| Tienda 4 | $16,149,706 | Alto | 77.32 |
| Tienda 5 | $15,990,617 | Alto | 75.57 |
| Tienda 6 | $14,063,358 | Alto | 54.41 |
| Tienda 2 | $10,060,370 | Medio | 10.46 |
| Tienda 7 | $8,225,703 | Medio | -9.68 |
| Tienda 3 | $6,249,207 | Medio | -31.39 |
| Tienda 1 | $1,837,147 | Bajo | -79.83 |
| Tienda 8 | $285,162 | Bajo | -96.87 |
producto_estrella_por_ciudad()Identifica el producto con mayor ingreso en cada ciudad.
| ciudad | producto_estrella | ingreso_top |
|---|---|---|
| São Paulo | Bolso | $5,394,600 |
| Niterói | Bolso | $4,482,513 |
| São Luís | Bolso | $4,471,524 |
| Vitória | Bolso | $2,982,015 |
| Curitiba | Bolso | $2,539,458 |
| Manaus | Bolso | $1,867,131 |
| Salvador | Bolso | $486,513 |
| Goiânia | Bolso | $87,912 |
Interpretación Figura 1.
La Mochila lidera tanto en unidades vendidas como en ingresos totales, representando la mayor participación del negocio. El Bolso y el Tennis también muestran un volumen de ventas elevado. En contraste, los Audífonos y la Billetera registran el menor desempeño en ambas métricas. Esta concentración en pocos productos sugiere que el portafolio depende de dos o tres artículos clave, lo que representa un riesgo si alguno pierde demanda.
Interpretación Figura 2.
São Paulo y Curitiba lideran en ingresos, superando el promedio general de todas las ciudades. Vitória y Salvador se encuentran por debajo y representan oportunidades de mejora. En cuanto a tiendas, se identifican tres niveles de rendimiento: las tiendas Alto superan significativamente el promedio, mientras que las tiendas Bajo requieren intervención urgente mediante revisión de estrategia comercial, oferta de productos y condiciones locales.
Interpretación Figura 3.
Los ingresos presentan variación a lo largo del año, con picos en meses específicos que pueden asociarse a temporadas de mayor consumo como inicio de año o mitad de año. Los meses con caídas notables son oportunidades estratégicas para implementar promociones que sostengan el flujo de ventas. La tendencia general sugiere que el volumen de transacciones es el principal motor de los ingresos.
Interpretación Figura 4.
La distribución muestra asimetría positiva: la media supera a la mediana, lo que indica que algunas transacciones de alto valor elevan el promedio. La mayoría de las transacciones se concentran en valores medios. El boxplot por producto revela diferencias claras entre artículos: algunos presentan mayor variabilidad (posiblemente por compras de gran volumen), mientras que otros tienen distribuciones más compactas y predecibles.
📌 Valores atípicos (outliers): Los puntos en rojo representan transacciones que se salen del rango esperado, posiblemente compras corporativas o de gran volumen.
Interpretación Figura 5.
El mapa de calor permite identificar las combinaciones más rentables de producto-ciudad. Las celdas más oscuras marcan los focos de mayor rentabilidad, útiles para priorizar inventario y campañas localizadas. El gráfico de participación confirma que la Mochila y el Bolso explican la mayor parte de los ingresos totales. Esta concentración es a la vez una fortaleza y un riesgo: si alguno de estos productos pierde demanda, el impacto sería significativo.
📦 Productos:
🏙️ Ciudades y tiendas:
📅 Temporalidad:
Informe generado automáticamente con R Markdown · Fundamentos de Programación 2025