Adidas es una de las marcas deportivas más reconocidas del mundo. Fundada en 1949 en Alemania, ha consolidado su presencia global con líneas de calzado, ropa y accesorios deportivos y de estilo de vida. En el mercado estadounidense, la empresa distribuye sus productos a través de múltiples canales y minoristas, lo que genera una estructura comercial compleja y rica en datos.
El presente informe aplica técnicas de analítica descriptiva sobre un corte transversal de datos de ventas de Adidas en Estados Unidos. El análisis incluye estadísticas de tendencia central, variabilidad, correlaciones y visualizaciones para extraer hallazgos relevantes que apoyen la toma de decisiones comerciales y estratégicas.
Los datos contienen 9,648 registros con información sobre distribuidor, región, estado, ciudad, producto, precio por unidad, unidades vendidas, ventas totales, utilidad operativa, margen operativo y método de venta.
El análisis exploratorio de datos (EDA) permite comprender la distribución de las variables, identificar patrones y detectar posibles valores atípicos. A continuación se presentan los pasos seguidos.
PASO 1: Instalar y cargar librerías
library(readxl)
library(dplyr)
library(ggplot2)
library(plotly)
library(knitr)
library(kableExtra)
library(tidyr)
library(tidyverse)
library(scales)
PASO 2: Cargar la base de datos
datos <- read_excel("~/Desktop/SIXTH SEM/DATA ANALYTICS/DatosCaso1.xlsx")
# Exploración inicial
cat("Dimensiones:", nrow(datos), "filas x", ncol(datos), "columnas\n")
## Dimensiones: 9648 filas x 11 columnas
colnames(datos)
## [1] "distribuidor" "region" "estado"
## [4] "ciudad" "producto" "precio_unidad"
## [7] "unidades_vendidas" "ventas_total" "utilidad_operativa"
## [10] "margen_operativo" "metodo_venta"
head(datos)
| distribuidor | region | estado | ciudad | producto | precio_unidad | unidades_vendidas | ventas_total | utilidad_operativa | margen_operativo | metodo_venta |
|---|---|---|---|---|---|---|---|---|---|---|
| Foot Locker | Northeast | New York | New York | Men’s Street Footwear | 50 | 1200 | 60000 | 30000.0 | 0.50 | In-store |
| Foot Locker | Northeast | New York | New York | Men’s Athletic Footwear | 50 | 1000 | 50000 | 15000.0 | 0.30 | In-store |
| Foot Locker | Northeast | New York | New York | Women’s Street Footwear | 40 | 1000 | 40000 | 14000.0 | 0.35 | In-store |
| Foot Locker | Northeast | New York | New York | Women’s Athletic Footwear | 45 | 850 | 38250 | 13387.5 | 0.35 | In-store |
| Foot Locker | Northeast | New York | New York | Men’s Apparel | 60 | 900 | 54000 | 16200.0 | 0.30 | In-store |
| Foot Locker | Northeast | New York | New York | Women’s Apparel | 50 | 1000 | 50000 | 12500.0 | 0.25 | In-store |
resumen <- datos %>%
select(precio_unidad, unidades_vendidas, ventas_total, utilidad_operativa, margen_operativo) %>%
summary()
resumen
## precio_unidad unidades_vendidas ventas_total utilidad_operativa
## Min. : 7.00 Min. : 0.0 Min. : 0 Min. : 0
## 1st Qu.: 35.00 1st Qu.: 106.0 1st Qu.: 4065 1st Qu.: 1753
## Median : 45.00 Median : 176.0 Median : 7804 Median : 3263
## Mean : 45.22 Mean : 256.9 Mean :12455 Mean : 4895
## 3rd Qu.: 55.00 3rd Qu.: 350.0 3rd Qu.:15864 3rd Qu.: 6192
## Max. :110.00 Max. :1275.0 Max. :82500 Max. :39000
## margen_operativo
## Min. :0.100
## 1st Qu.:0.350
## Median :0.410
## Mean :0.423
## 3rd Qu.:0.490
## Max. :0.800
La tabla anterior revela varios aspectos clave:
# Tabla descriptiva clara y legible
tabla_desc <- data.frame(
Variable = c("Precio por unidad (USD)", "Unidades vendidas", "Ventas totales (USD)",
"Utilidad operativa (USD)", "Margen operativo"),
Media = c(45.22, 256.93, 12455.08, 4894.79, "42%"),
Mediana = c(45.00, 176.00, 7803.50, 3262.98, "41%"),
`Desv. Estándar` = c(14.71, 214.25, 12716.39, 4866.46, "10%"),
Mínimo = c(7.00, 0.00, 0.00, 0.00, "10%"),
Máximo = c(110.00, 1275.00, 82500.00, 39000.00, "80%"),
check.names = FALSE
)
tabla_desc %>%
kable(caption = "Tabla 1. Estadísticas descriptivas de variables clave") %>%
kable_styling(bootstrap_options = c("striped", "hover", "condensed"), full_width = TRUE)
| Variable | Media | Mediana | Desv. Estándar | Mínimo | Máximo |
|---|---|---|---|---|---|
| Precio por unidad (USD) | 45.22 | 45 | 14.71 | 7 | 110 |
| Unidades vendidas | 256.93 | 176 | 214.25 | 0 | 1275 |
| Ventas totales (USD) | 12455.08 | 7803.5 | 12716.39 | 0 | 82500 |
| Utilidad operativa (USD) | 4894.79 | 3262.98 | 4866.46 | 0 | 39000 |
| Margen operativo | 42% | 41% | 10% | 10% | 80% |
ventas_region <- datos %>%
group_by(region) %>%
summarise(
Ventas_Total = sum(ventas_total, na.rm = TRUE),
Utilidad_Total = sum(utilidad_operativa, na.rm = TRUE),
Margen_Promedio = mean(margen_operativo, na.rm = TRUE)
) %>%
arrange(desc(Ventas_Total))
plot_ly(ventas_region, x = ~reorder(region, -Ventas_Total), y = ~Ventas_Total,
type = 'bar', marker = list(color = c('#1a1a2e','#16213e','#0f3460','#533483','#e94560'))) %>%
layout(title = "Figura 1. Ventas Totales por Región",
xaxis = list(title = "Región"),
yaxis = list(title = "Ventas (USD)"),
hovermode = "x")
Hallazgo: La región West lidera con más de USD 36.4 millones en ventas, seguida de Northeast con USD 25.1 millones. Midwest es la región con menor volumen (~USD 16.7 millones). Esto sugiere que las estrategias comerciales más agresivas se concentran en el occidente del país.
ventas_producto <- datos %>%
group_by(producto) %>%
summarise(
Ventas_Total = sum(ventas_total, na.rm = TRUE),
Margen_Promedio = mean(margen_operativo, na.rm = TRUE)
) %>%
arrange(desc(Ventas_Total))
plot_ly(ventas_producto, labels = ~producto, values = ~Ventas_Total,
type = 'pie',
textposition = 'outside',
textinfo = 'label+percent',
marker = list(colors = c('#1a1a2e','#16213e','#0f3460','#533483','#e94560','#f5a623'))) %>%
layout(title = "Figura 2. Participación en Ventas por Producto",
showlegend = TRUE)
Hallazgo: Men’s Street Footwear concentra el mayor volumen de ventas (22.8%), seguido de Women’s Apparel (19.9%) y Men’s Athletic Footwear (17%). El calzado masculino domina las ventas totales, mientras que la ropa femenina es una categoría sólida. El calzado atlético femenino tiene la menor participación (11.9%).
ventas_metodo <- datos %>%
group_by(metodo_venta) %>%
summarise(
Ventas_Total = sum(ventas_total, na.rm = TRUE),
Margen_Promedio = round(mean(margen_operativo, na.rm = TRUE), 3),
Unidades_Prom = round(mean(unidades_vendidas, na.rm = TRUE), 1)
)
plot_ly(ventas_metodo, x = ~metodo_venta, y = ~Ventas_Total,
type = 'bar', color = ~metodo_venta,
colors = c('#0f3460', '#533483', '#e94560')) %>%
layout(title = "Figura 3. Ventas Totales por Método de Venta",
xaxis = list(title = "Método de Venta"),
yaxis = list(title = "Ventas (USD)"),
showlegend = FALSE)
Hallazgo: El canal Online genera el mayor volumen de ventas (USD 44.9M), superando tanto al canal Outlet (USD 39.5M) como al In-store (USD 35.7M). Este dato es estratégicamente relevante ya que indica que el e-commerce ya es el canal dominante para Adidas en este corte de datos.
top_ciudades <- datos %>%
group_by(ciudad) %>%
summarise(Ventas_Total = sum(ventas_total, na.rm = TRUE)) %>%
arrange(desc(Ventas_Total)) %>%
head(10)
plot_ly(top_ciudades, x = ~Ventas_Total, y = ~reorder(ciudad, Ventas_Total),
type = 'bar', orientation = 'h',
marker = list(color = '#0f3460')) %>%
layout(title = "Figura 4. Top 10 Ciudades por Ventas Totales",
xaxis = list(title = "Ventas (USD)"),
yaxis = list(title = "Ciudad"),
hovermode = "y")
Hallazgo: New York encabeza las ventas por ciudad con USD 5.7M, seguida de San Francisco y Charleston. La presencia de ciudades del sur y oeste (Portland, Orlando, Miami) refuerza la tendencia regional observada anteriormente.
margen_producto <- datos %>%
group_by(producto) %>%
summarise(Margen_Promedio = round(mean(margen_operativo, na.rm = TRUE), 3)) %>%
arrange(desc(Margen_Promedio))
plot_ly(margen_producto, x = ~reorder(producto, Margen_Promedio), y = ~Margen_Promedio,
type = 'bar', orientation = 'v',
marker = list(color = '#533483')) %>%
layout(title = "Figura 5. Margen Operativo Promedio por Producto",
xaxis = list(title = "Producto", tickangle = -30),
yaxis = list(title = "Margen Operativo Promedio", tickformat = ".0%"))
Hallazgo: Men’s Street Footwear no solo lidera en ventas sino que también tiene el margen operativo más alto (44.6%), lo que lo convierte en el producto más estratégico para Adidas. Women’s Athletic Footwear tiene un margen sólido (42.4%) a pesar de su menor volumen de ventas.
plot_ly(ventas_metodo, x = ~metodo_venta, y = ~Margen_Promedio,
type = 'bar', color = ~metodo_venta,
colors = c('#e94560', '#0f3460', '#533483')) %>%
layout(title = "Figura 6. Margen Operativo Promedio por Método de Venta",
xaxis = list(title = "Método de Venta"),
yaxis = list(title = "Margen Promedio", tickformat = ".0%"),
showlegend = FALSE)
Hallazgo: El canal Online presenta el mayor margen promedio (46.4%), lo que combina el mayor volumen de ventas con la mejor rentabilidad. El canal In-store tiene el margen más bajo (35.6%), posiblemente por costos operativos más elevados.
La caja del gráfico representa el 50% de las transacciones más frecuentes. La línea dentro de la caja es la utilidad típica (mediana). Los puntos rojos son ventas extraordinariamente grandes — atípicas.
ggplotly(
ggplot(datos, aes(x = reorder(region, utilidad_operativa, FUN = median),
y = utilidad_operativa, fill = region)) +
geom_boxplot(outlier.colour = "red", outlier.shape = 16, outlier.size = 2, alpha = 0.8) +
scale_fill_manual(values = c('#1a1a2e','#0f3460','#533483','#e94560','#f5a623')) +
scale_y_continuous(labels = scales::dollar_format()) +
labs(title = "Figura 7. Rango de Utilidad Operativa por Región",
subtitle = "Puntos rojos = transacciones atípicamente grandes",
x = "Región (de menor a mayor utilidad típica)",
y = "Utilidad Operativa (USD)") +
theme_minimal() +
theme(legend.position = "none")
)
Hallazgo: La región Southeast tiene la utilidad típica más alta — su caja está más arriba que las demás. Los puntos negros en todas las regiones son transacciones grandes (pedidos masivos de distribuidores), lo que explica la alta variabilidad: conviven ventas pequeñas de pocos cientos de dólares con ventas de decenas de miles en la misma región.
ventas_dist <- datos %>%
group_by(distribuidor) %>%
summarise(
Ventas_Total = sum(ventas_total, na.rm = TRUE),
Margen_Promedio = round(mean(margen_operativo, na.rm = TRUE), 3)
) %>%
arrange(desc(Ventas_Total))
plot_ly(ventas_dist, x = ~reorder(distribuidor, -Ventas_Total), y = ~Ventas_Total,
type = 'bar',
marker = list(color = c('#1a1a2e','#0f3460','#533483','#e94560','#f5a623','#16213e'))) %>%
layout(title = "Figura 8. Ventas Totales por Distribuidor",
xaxis = list(title = "Distribuidor"),
yaxis = list(title = "Ventas (USD)"),
hovermode = "x")
Hallazgo: West Gear es el distribuidor con mayor volumen de ventas (USD 32.4M), seguido de Foot Locker (USD 29.0M). Amazon y Walmart tienen los menores volúmenes (~USD 10M cada uno), lo que puede indicar menor penetración del canal digital o condiciones contractuales diferentes con estas plataformas.
mat_corr <- datos %>%
select(precio_unidad, unidades_vendidas, ventas_total, utilidad_operativa, margen_operativo) %>%
cor(use = "complete.obs") %>%
round(3)
mat_corr %>%
kable(caption = "Tabla 2. Matriz de correlaciones") %>%
kable_styling(bootstrap_options = c("striped", "hover", "condensed"), full_width = FALSE)
| precio_unidad | unidades_vendidas | ventas_total | utilidad_operativa | margen_operativo | |
|---|---|---|---|---|---|
| precio_unidad | 1.000 | 0.266 | 0.540 | 0.504 | -0.137 |
| unidades_vendidas | 0.266 | 1.000 | 0.919 | 0.872 | -0.305 |
| ventas_total | 0.540 | 0.919 | 1.000 | 0.935 | -0.302 |
| utilidad_operativa | 0.504 | 0.872 | 0.935 | 1.000 | -0.047 |
| margen_operativo | -0.137 | -0.305 | -0.302 | -0.047 | 1.000 |
Hallazgos de correlación:
ggplotly(
ggplot(datos, aes(x = precio_unidad, y = unidades_vendidas, color = metodo_venta)) +
geom_point(alpha = 0.4, size = 1.5) +
geom_smooth(method = "lm", se = FALSE, size = 1) +
scale_color_manual(values = c('#0f3460', '#533483', '#e94560')) +
labs(
title = paste("Figura 9. Precio por Unidad vs. Unidades Vendidas\nCorrelación:",
round(cor(datos$precio_unidad, datos$unidades_vendidas, use = "complete.obs"), 3)),
x = "Precio por Unidad (USD)",
y = "Unidades Vendidas",
color = "Método de Venta"
) +
theme_minimal()
)
Hallazgo: Contrario a la intuición económica clásica, existe una correlación positiva débil (0.27) entre precio y unidades vendidas. Esto sugiere que en el portafolio de Adidas, los productos de mayor precio tienen demanda independiente del efecto precio — probablemente por la percepción de marca, calidad y fidelidad del consumidor. El canal Online muestra mayor dispersión en precios altos.
combinado <- datos %>%
group_by(producto, region) %>%
summarise(
Ventas_Total = sum(ventas_total, na.rm = TRUE),
Margen_Promedio = round(mean(margen_operativo, na.rm = TRUE), 3),
.groups = "drop"
)
plot_ly(combinado, x = ~region, y = ~Ventas_Total, color = ~producto,
type = 'bar', barmode = 'group',
colors = c('#1a1a2e','#0f3460','#533483','#e94560','#f5a623','#16213e')) %>%
layout(title = "Figura 10. Ventas por Producto y Región",
xaxis = list(title = "Región"),
yaxis = list(title = "Ventas (USD)"),
legend = list(orientation = "h", y = -0.3),
hovermode = "x")
Hallazgo: Men’s Street Footwear en la región West es la combinación más rentable y de mayor volumen. En general, todas las líneas de producto muestran mayor volumen en West, lo que refuerza la importancia estratégica de esa región. Women’s Apparel tiene desempeño sólido en todas las regiones, evidenciando una demanda más uniforme geográficamente.
A partir del análisis descriptivo realizado, se identifican los siguientes hallazgos:
Canal Online como motor de crecimiento: El canal online concentra el mayor volumen de ventas (USD 44.9M) y el mejor margen operativo promedio (46.4%). Esto representa una ventaja competitiva si se consolida la estrategia digital.
Liderazgo de West y Men’s Street Footwear: La región West y el producto Men’s Street Footwear son los líderes indiscutibles tanto en ventas como en rentabilidad. La combinación de ambos representa la apuesta más estratégica para Adidas.
Alta variabilidad en utilidad operativa: La presencia de valores atípicos en todas las regiones indica transacciones de escala muy diferente. Un análisis posterior podría identificar qué ciudades o distribuidores explican estos picos.
West Gear y Foot Locker como distribuidores clave: Ambos concentran más del 50% de las ventas totales. La dependencia de estos dos distribuidores podría ser un riesgo de concentración.
Precio positivamente asociado a ventas: La correlación positiva (aunque débil) entre precio y unidades vendidas sugiere que los consumidores de Adidas no responden negativamente al precio, lo que da margen para estrategias de pricing premium.
Margen operativo relativamente uniforme entre productos: La diferencia entre el producto con mayor margen (Men’s Street Footwear: 44.6%) y el menor (Men’s Athletic Footwear: 40.3%) es de solo 4.3 puntos porcentuales, lo que indica una política de márgenes coherente entre líneas.
El análisis descriptivo del portafolio de ventas de Adidas evidencia una empresa con sólida rentabilidad operativa (margen promedio del 42%), liderazgo claro del canal Online y concentración geográfica en la región West. La relación fuerte entre ventas y utilidad operativa indica eficiencia en la conversión de ingresos a utilidad.
Potenciar el canal Online: Dado que Online tiene el mayor volumen y el mejor margen, se recomienda aumentar la inversión en marketing digital, logística de e-commerce y experiencia de usuario en plataformas digitales.
Estrategia diferenciada por región: Desarrollar planes específicos para Midwest, la región de menor desempeño, adaptando el portafolio de productos y los distribuidores locales a las preferencias del consumidor de esa región.
Gestión del riesgo de concentración en distribuidores: Reducir la dependencia de West Gear y Foot Locker diversificando hacia Amazon y otros canales digitales, que actualmente representan una fracción pequeña del total.
Impulsar Women’s Athletic Footwear: Es la categoría con menor participación en ventas (11.8%) pero con margen competitivo (42.4%). Una campaña enfocada en este segmento podría generar crecimiento incremental con buena rentabilidad.
Revisar estructura de costos del canal In-store: Con el margen más bajo (35.6%), el canal físico debería optimizarse mediante negociación con minoristas o reducción de costos operativos, para acercarse al margen de los canales Online y Outlet.
Informe elaborado por Juan Manuel Ramírez y Gabriela Trujillo — Analítica de Datos para la Toma de Decisiones — Pontificia Universidad Javeriana de Cali, 2026.