Adidas AG es una de las compañías líderes en la industria global de artículos deportivos, con presencia internacional y una estructura comercial basada en múltiples distribuidores, regiones y categorías de producto. Comprender cómo se distribuyen sus ventas y resultados operativos entre distintos territorios resulta clave para evaluar la estructura de su desempeño comercial.
En este documento se desarrolla un análisis descriptivo de una base transaccional de ventas, utilizando R y herramientas de estadística descriptiva y visualización de datos. El objetivo principal es examinar la distribución de las ventas, identificar posibles asimetrías o concentraciones y evaluar si el desempeño comercial presenta dependencia significativa de determinadas regiones o estados.
A partir del estudio de variables como ventas_totales, utilidad_operativa y margen_operativo, se busca determinar el grado de concentración geográfica de los ingresos y analizar sus implicaciones estratégicas para la estabilidad y diversificación comercial de la compañía.
PASO 1. Instalar y cargar librerias
# Cargar librerías necesarias
library(readxl)
library(dplyr)
library(ggplot2)
library(plotly)
library(knitr)
library(kableExtra)
library(tidyr)
library(tidyverse)
library(RecordLinkage)
library(leaflet)
library(htmltools)
PASO 2: Cargar la base de datos
# Cargar datos desde el archivo Excel
datos_col <- read_excel("DatosCaso1.xlsx")
# Ver las primeras filas de los datos
class(datos_col)
## [1] "tbl_df" "tbl" "data.frame"
colnames(datos_col)
## [1] "distribuidor" "region" "estado"
## [4] "ciudad" "producto" "precio_unidad"
## [7] "unidades_vendidas" "ventas_total" "utilidad_operativa"
## [10] "margen_operativo" "metodo_venta"
head(datos_col)
| distribuidor | region | estado | ciudad | producto | precio_unidad | unidades_vendidas | ventas_total | utilidad_operativa | margen_operativo | metodo_venta |
|---|---|---|---|---|---|---|---|---|---|---|
| Foot Locker | Northeast | New York | New York | Men’s Street Footwear | 50 | 1200 | 60000 | 30000.0 | 0.50 | In-store |
| Foot Locker | Northeast | New York | New York | Men’s Athletic Footwear | 50 | 1000 | 50000 | 15000.0 | 0.30 | In-store |
| Foot Locker | Northeast | New York | New York | Women’s Street Footwear | 40 | 1000 | 40000 | 14000.0 | 0.35 | In-store |
| Foot Locker | Northeast | New York | New York | Women’s Athletic Footwear | 45 | 850 | 38250 | 13387.5 | 0.35 | In-store |
| Foot Locker | Northeast | New York | New York | Men’s Apparel | 60 | 900 | 54000 | 16200.0 | 0.30 | In-store |
| Foot Locker | Northeast | New York | New York | Women’s Apparel | 50 | 1000 | 50000 | 12500.0 | 0.25 | In-store |
La base contiene 9.648 registros y describe ventas por combinación de distribuidor–geografía–producto–método de venta. Cada registro representa una observación transaccional con variables de volumen (unidades), valor (ventas_total) y rentabilidad (utilidad_operativa y margen_operativo).
# Resumen estadístico de las variables financieras
resumen <- datos_col %>%
select(distribuidor, region, estado, ciudad, producto, precio_unidad, unidades_vendidas, ventas_total, utilidad_operativa, margen_operativo, metodo_venta) %>%
summary()
resumen
## distribuidor region estado ciudad
## Length:9648 Length:9648 Length:9648 Length:9648
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
## producto precio_unidad unidades_vendidas ventas_total
## Length:9648 Min. : 7.00 Min. : 0.0 Min. : 0
## Class :character 1st Qu.: 35.00 1st Qu.: 106.0 1st Qu.: 4065
## Mode :character Median : 45.00 Median : 176.0 Median : 7804
## Mean : 45.22 Mean : 256.9 Mean :12455
## 3rd Qu.: 55.00 3rd Qu.: 350.0 3rd Qu.:15864
## Max. :110.00 Max. :1275.0 Max. :82500
## utilidad_operativa margen_operativo metodo_venta
## Min. : 0 Min. :0.100 Length:9648
## 1st Qu.: 1753 1st Qu.:0.350 Class :character
## Median : 3263 Median :0.410 Mode :character
## Mean : 4895 Mean :0.423
## 3rd Qu.: 6192 3rd Qu.:0.490
## Max. :39000 Max. :0.800
Las estadísticas muestran alta dispersión en ventas_total y una diferencia marcada entre media y mediana, lo que sugiere asimetría positiva: la mayoría de las observaciones son ventas bajas/medias y un grupo pequeño concentra valores muy altos. Por esto, para comparar territorios se prioriza la mediana/promedios por grupo y la participación porcentual, más que el promedio global.
datos_col %>%
summarise(
Ventas_promedio = mean(ventas_total, na.rm = TRUE),
Ventas_mediana = median(ventas_total, na.rm = TRUE),
Ventas_sd = sd(ventas_total, na.rm = TRUE),
Utilidad_promedio = mean(utilidad_operativa, na.rm = TRUE),
Margen_promedio = mean(margen_operativo, na.rm = TRUE),
Margen_sd = sd(margen_operativo, na.rm = TRUE)
)
| Ventas_promedio | Ventas_mediana | Ventas_sd | Utilidad_promedio | Margen_promedio | Margen_sd |
|---|---|---|---|---|---|
| 12455.08 | 7803.5 | 12716.39 | 4894.794 | 0.4229913 | 0.0971974 |
Las ventas presentan alta variabilidad y una distribución asimétrica positiva. La diferencia entre media y mediana sugiere la existencia de observaciones extremas que elevan el promedio general.
Histograma
Estas gráficas se usan como diagnóstico para verificar forma de la distribución y presencia de outliers, y así justificar un análisis de concentración por geografía.
ggplot(datos_col, aes(x = ventas_total)) +
geom_histogram(bins = 30, fill = "steelblue") +
theme_minimal()
Podemos observar claramente que:
Distribución asimétrica positiva (sesgo a la derecha).
Gran concentración de observaciones en niveles bajos de ventas.
-Cola larga que llega hasta ~80.000.
Esto confirma lo que ya estaban sugiriendo media vs mediana:
✔ La media está inflada por valores extremos.
✔ La mayoría de las ventas son relativamente bajas.
✔ Un pequeño grupo genera ventas muy altas.
Boxplot
ggplot(datos_col, aes(y = ventas_total)) +
geom_boxplot(fill = "orange") +
theme_minimal()
Aquí es mucho más evidente:
Muchísimos puntos por encima del bigote superior.
Outliers fuertes entre 35.000 y 80.000.
Mediana claramente por debajo del promedio.
Esto no es normal, esto significa que hay una concentración de ingresos en pocos registros.
Como podemos ver en las graficas las ventas presentan una distribución altamente asimétrica hacia la derecha, con una concentración significativa en niveles bajos y una cola extensa de valores elevados. La diferencia entre media y mediana confirma la presencia de valores atípicos que elevan el promedio general. Esto sugiere que una proporción reducida de combinaciones producto-región-retailer genera una parte significativa del ingreso total.
Dado que se evidencia una alta variabilidad y presencia de valores extremos, se procede a analizar si esta concentración responde a factores geográficos.
ventas_region <- datos_col %>%
group_by(region) %>%
summarise(
ventas_totales = sum(ventas_total),
promedio = mean(ventas_total)
) %>%
arrange(desc(ventas_totales))
ventas_region
| region | ventas_totales | promedio |
|---|---|---|
| West | 36436157 | 14884.051 |
| Northeast | 25078267 | 10554.826 |
| Southeast | 21374436 | 17462.775 |
| South | 20603356 | 11923.238 |
| Midwest | 16674434 | 8907.283 |
grafico clave.
ggplot(ventas_region, aes(x = reorder(region, ventas_totales),
y = ventas_totales)) +
geom_bar(stat = "identity", fill = "darkblue") +
coord_flip() +
theme_minimal() +
labs(title = "Ventas Totales por Región")
ventas_region <- ventas_region %>%
mutate(participacion = ventas_totales / sum(ventas_totales) * 100)
ventas_region
| region | ventas_totales | promedio | participacion |
|---|---|---|---|
| West | 36436157 | 14884.051 | 30.32136 |
| Northeast | 25078267 | 10554.826 | 20.86957 |
| Southeast | 21374436 | 17462.775 | 17.78733 |
| South | 20603356 | 11923.238 | 17.14565 |
| Midwest | 16674434 | 8907.283 | 13.87609 |
El análisis geográfico muestra que la región West concentra el 30,3% de las ventas totales, posicionándose como el principal mercado de la compañía. Sin embargo, las demás regiones mantienen participaciones relativamente equilibradas, lo que indica una estructura moderadamente diversificada y sin dependencia extrema de un solo territorio. Además, Southeast presenta el mayor promedio por transacción, lo que sugiere diferencias en el comportamiento de consumo entre regiones.
Dado que la región West concentra la mayor proporción de las ventas totales, resulta pertinente profundizar el análisis a un nivel más desagregado. En particular, se examina el comportamiento de las ventas por estado dentro de esta región con el fin de identificar si el liderazgo de West se encuentra distribuido de manera equilibrada o si depende de un número reducido de mercados específicos.
ventas_west_estado <- datos_col %>%
filter(region == "West") %>%
group_by(estado) %>%
summarise(
ventas_totales = sum(ventas_total, na.rm = TRUE),
promedio = mean(ventas_total, na.rm = TRUE)
) %>%
arrange(desc(ventas_totales))
ventas_west_estado
| estado | ventas_totales | promedio |
|---|---|---|
| California | 8580508 | 19862.287 |
| Washington | 3222093 | 22375.646 |
| Oregon | 3047049 | 14106.708 |
| Nevada | 2981134 | 13801.546 |
| New Mexico | 2824641 | 13077.042 |
| Idaho | 2742753 | 12697.931 |
| Hawaii | 2734457 | 18989.285 |
| Colorado | 2569036 | 17840.528 |
| Wyoming | 2282342 | 15849.597 |
| Arizona | 2254096 | 10435.630 |
| Alaska | 1810428 | 12572.417 |
| Utah | 1387620 | 6424.167 |
Participacion dentro de West
ventas_west_estado <- ventas_west_estado %>%
mutate(participacion_west = ventas_totales / sum(ventas_totales) * 100)
ventas_west_estado
| estado | ventas_totales | promedio | participacion_west |
|---|---|---|---|
| California | 8580508 | 19862.287 | 23.549432 |
| Washington | 3222093 | 22375.646 | 8.843120 |
| Oregon | 3047049 | 14106.708 | 8.362707 |
| Nevada | 2981134 | 13801.546 | 8.181801 |
| New Mexico | 2824641 | 13077.042 | 7.752302 |
| Idaho | 2742753 | 12697.931 | 7.527558 |
| Hawaii | 2734457 | 18989.285 | 7.504790 |
| Colorado | 2569036 | 17840.528 | 7.050788 |
| Wyoming | 2282342 | 15849.597 | 6.263948 |
| Arizona | 2254096 | 10435.630 | 6.186426 |
| Alaska | 1810428 | 12572.417 | 4.968768 |
| Utah | 1387620 | 6424.167 | 3.808360 |
Grafico Top 10 estados
top10_west <- ventas_west_estado %>% head(10)
ggplot(top10_west, aes(x = reorder(estado, ventas_totales), y = ventas_totales)) +
geom_bar(stat = "identity") +
coord_flip() +
theme_minimal() +
labs(title = "Top 10 Estados por Ventas en West",
x = "Estado", y = "Ventas Totales")
El análisis a nivel estatal dentro de la región West evidencia que California concentra el 23,5% de las ventas regionales, posicionándose como el principal mercado interno. Dentro de West, California concentra 23,5% de las ventas regionales, lo que confirma un liderazgo claro. Aun así, el resto de estados del Top 10 se distribuye en participaciones cercanas (6% y 9%), indicando que West combina un mercado dominante con una base secundaria diversificada, reduciendo el riesgo de dependencia absoluta de un solo estado.
En consecuencia, el liderazgo de la región West se explica principalmente por el desempeño de California, aunque respaldado por una red de estados con aportes relativamente parrecidos.
Los resultados sugieren que el desempeño comercial no se distribuye de forma homogénea: existe asimetría (pocas observaciones explican ventas muy altas) y una concentración geográfica donde West lidera y California es el principal motor dentro de esa región. Estratégicamente, esto implica dos cosas: Primero: proteger y sostener los mercados que explican la mayor proporción de ventas (evitar pérdida de tracción en California/West) y Segundo: reducir vulnerabilidad diversificando el crecimiento hacia regiones con menor participación, para disminuir exposición a shocks locales (competencia, logística, demanda regional).
Con base en el análisis realizado, se recomienda:
Defender el principal: priorizar disponibilidad e inventario de las líneas con mayor rotación en los distribuidores clave del estado, y monitorear semanalmente ventas_total y margen_operativo para evitar crecimiento con caída de rentabilidad.
Crecimiento en regiones rezagadas: diseñar un plan piloto en Midwest, y la región con menor participación, con ajustes de mix (productos ganadores en West) y estrategia comercial por canal (metodo_venta), evaluando el impacto en ventas_total y margen.
Gestión de concentración: implementar un tablero de control con participación por región/estado y alertas cuando una región/estado supere un umbral de dependencia, para anticipar riesgos y orientar inversión comercial.
En conclusión, el análisis descriptivo evidencia una distribución de ventas asimétrica con presencia de valores extremos y una concentración geográfica moderada: West lidera las ventas totales y, dentro de esta región, California aporta la mayor proporción. Aunque existe diversificación entre regiones y estados secundarios, los hallazgos indican que una parte relevante del desempeño depende de territorios específicos, por lo que conviene sostener el core y, en paralelo, diversificar crecimiento en regiones con menor participación para reducir riesgo y estabilizar resultados