Introducción

Adidas es una de las marcas deportivas más reconocidas del mundo. Fundada en 1949 en Alemania, ha consolidado su presencia global con líneas de calzado, ropa y accesorios deportivos y de estilo de vida. En el mercado estadounidense, la empresa distribuye sus productos a través de múltiples canales y minoristas, lo que genera una estructura comercial compleja y rica en datos.

El presente informe aplica técnicas de analítica descriptiva sobre un corte transversal de datos de ventas de Adidas en Estados Unidos. El análisis incluye estadísticas de tendencia central, variabilidad, correlaciones y visualizaciones para extraer hallazgos relevantes que apoyen la toma de decisiones comerciales y estratégicas.

Los datos contienen 9,648 registros con información sobre distribuidor, región, estado, ciudad, producto, precio por unidad, unidades vendidas, ventas totales, utilidad operativa, margen operativo y método de venta.

Análisis Exploratorio

El análisis exploratorio de datos (EDA) permite comprender la distribución de las variables, identificar patrones y detectar posibles valores atípicos. A continuación se presentan los pasos seguidos.

PASO 1: Instalar y cargar librerías

library(readxl)
library(dplyr)
library(ggplot2)
library(plotly)
library(knitr)
library(kableExtra)
library(tidyr)
library(tidyverse)
library(scales)

PASO 2: Cargar la base de datos

datos <- read_excel("~/Desktop/SIXTH SEM/DATA ANALYTICS/DatosCaso1.xlsx")

# Exploración inicial
cat("Dimensiones:", nrow(datos), "filas x", ncol(datos), "columnas\n")
## Dimensiones: 9648 filas x 11 columnas
colnames(datos)
##  [1] "distribuidor"       "region"             "estado"            
##  [4] "ciudad"             "producto"           "precio_unidad"     
##  [7] "unidades_vendidas"  "ventas_total"       "utilidad_operativa"
## [10] "margen_operativo"   "metodo_venta"
head(datos)
distribuidor region estado ciudad producto precio_unidad unidades_vendidas ventas_total utilidad_operativa margen_operativo metodo_venta
Foot Locker Northeast New York New York Men’s Street Footwear 50 1200 60000 30000.0 0.50 In-store
Foot Locker Northeast New York New York Men’s Athletic Footwear 50 1000 50000 15000.0 0.30 In-store
Foot Locker Northeast New York New York Women’s Street Footwear 40 1000 40000 14000.0 0.35 In-store
Foot Locker Northeast New York New York Women’s Athletic Footwear 45 850 38250 13387.5 0.35 In-store
Foot Locker Northeast New York New York Men’s Apparel 60 900 54000 16200.0 0.30 In-store
Foot Locker Northeast New York New York Women’s Apparel 50 1000 50000 12500.0 0.25 In-store

Estadísticas Descriptivas

Indicadores de Centralidad y Dispersión

resumen <- datos %>%
  select(precio_unidad, unidades_vendidas, ventas_total, utilidad_operativa, margen_operativo) %>%
  summary()

resumen
##  precio_unidad    unidades_vendidas  ventas_total   utilidad_operativa
##  Min.   :  7.00   Min.   :   0.0    Min.   :    0   Min.   :    0     
##  1st Qu.: 35.00   1st Qu.: 106.0    1st Qu.: 4065   1st Qu.: 1753     
##  Median : 45.00   Median : 176.0    Median : 7804   Median : 3263     
##  Mean   : 45.22   Mean   : 256.9    Mean   :12455   Mean   : 4895     
##  3rd Qu.: 55.00   3rd Qu.: 350.0    3rd Qu.:15864   3rd Qu.: 6192     
##  Max.   :110.00   Max.   :1275.0    Max.   :82500   Max.   :39000     
##  margen_operativo
##  Min.   :0.100   
##  1st Qu.:0.350   
##  Median :0.410   
##  Mean   :0.423   
##  3rd Qu.:0.490   
##  Max.   :0.800

La tabla anterior revela varios aspectos clave:

  • El precio por unidad promedio es de USD 45.22, con una desviación estándar de ~USD 14.71, lo que indica variabilidad moderada entre productos.
  • Las unidades vendidas presentan alta variabilidad (min: 0, max: 1,275), con una media de 257 unidades.
  • El margen operativo promedio del 42% es sólido, con un mínimo del 10% y un máximo del 80%.
  • La utilidad operativa tiene una dispersión elevada (desv. estándar ≈ USD 4,867), evidenciando diferencias importantes entre transacciones.
# Tabla descriptiva clara y legible
tabla_desc <- data.frame(
  Variable = c("Precio por unidad (USD)", "Unidades vendidas", "Ventas totales (USD)", 
               "Utilidad operativa (USD)", "Margen operativo"),
  Media    = c(45.22, 256.93, 12455.08, 4894.79, "42%"),
  Mediana  = c(45.00, 176.00,  7803.50, 3262.98, "41%"),
  `Desv. Estándar` = c(14.71, 214.25, 12716.39, 4866.46, "10%"),
  Mínimo   = c(7.00,   0.00,     0.00,     0.00, "10%"),
  Máximo   = c(110.00, 1275.00, 82500.00, 39000.00, "80%"),
  check.names = FALSE
)

tabla_desc %>%
  kable(caption = "Tabla 1. Estadísticas descriptivas de variables clave") %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed"), full_width = TRUE)
Tabla 1. Estadísticas descriptivas de variables clave
Variable Media Mediana Desv. Estándar Mínimo Máximo
Precio por unidad (USD) 45.22 45 14.71 7 110
Unidades vendidas 256.93 176 214.25 0 1275
Ventas totales (USD) 12455.08 7803.5 12716.39 0 82500
Utilidad operativa (USD) 4894.79 3262.98 4866.46 0 39000
Margen operativo 42% 41% 10% 10% 80%

Desempeño de Ventas

Ventas por Región

ventas_region <- datos %>%
  group_by(region) %>%
  summarise(
    Ventas_Total     = sum(ventas_total, na.rm = TRUE),
    Utilidad_Total   = sum(utilidad_operativa, na.rm = TRUE),
    Margen_Promedio  = mean(margen_operativo, na.rm = TRUE)
  ) %>%
  arrange(desc(Ventas_Total))

plot_ly(ventas_region, x = ~reorder(region, -Ventas_Total), y = ~Ventas_Total,
        type = 'bar', marker = list(color = c('#1a1a2e','#16213e','#0f3460','#533483','#e94560'))) %>%
  layout(title = "Figura 1. Ventas Totales por Región",
         xaxis = list(title = "Región"),
         yaxis = list(title = "Ventas (USD)"),
         hovermode = "x")

Hallazgo: La región West lidera con más de USD 36.4 millones en ventas, seguida de Northeast con USD 25.1 millones. Midwest es la región con menor volumen (~USD 16.7 millones). Esto sugiere que las estrategias comerciales más agresivas se concentran en el occidente del país.

Ventas por Producto

ventas_producto <- datos %>%
  group_by(producto) %>%
  summarise(
    Ventas_Total    = sum(ventas_total, na.rm = TRUE),
    Margen_Promedio = mean(margen_operativo, na.rm = TRUE)
  ) %>%
  arrange(desc(Ventas_Total))

plot_ly(ventas_producto, labels = ~producto, values = ~Ventas_Total,
        type = 'pie',
        textposition = 'outside',
        textinfo = 'label+percent',
        marker = list(colors = c('#1a1a2e','#16213e','#0f3460','#533483','#e94560','#f5a623'))) %>%
  layout(title = "Figura 2. Participación en Ventas por Producto",
         showlegend = TRUE)

Hallazgo: Men’s Street Footwear concentra el mayor volumen de ventas (22.8%), seguido de Women’s Apparel (19.9%) y Men’s Athletic Footwear (17%). El calzado masculino domina las ventas totales, mientras que la ropa femenina es una categoría sólida. El calzado atlético femenino tiene la menor participación (11.9%).

Ventas por Método de Venta

ventas_metodo <- datos %>%
  group_by(metodo_venta) %>%
  summarise(
    Ventas_Total    = sum(ventas_total, na.rm = TRUE),
    Margen_Promedio = round(mean(margen_operativo, na.rm = TRUE), 3),
    Unidades_Prom   = round(mean(unidades_vendidas, na.rm = TRUE), 1)
  )

plot_ly(ventas_metodo, x = ~metodo_venta, y = ~Ventas_Total,
        type = 'bar', color = ~metodo_venta,
        colors = c('#0f3460', '#533483', '#e94560')) %>%
  layout(title = "Figura 3. Ventas Totales por Método de Venta",
         xaxis = list(title = "Método de Venta"),
         yaxis = list(title = "Ventas (USD)"),
         showlegend = FALSE)

Hallazgo: El canal Online genera el mayor volumen de ventas (USD 44.9M), superando tanto al canal Outlet (USD 39.5M) como al In-store (USD 35.7M). Este dato es estratégicamente relevante ya que indica que el e-commerce ya es el canal dominante para Adidas en este corte de datos.

Top 10 Ciudades por Ventas

top_ciudades <- datos %>%
  group_by(ciudad) %>%
  summarise(Ventas_Total = sum(ventas_total, na.rm = TRUE)) %>%
  arrange(desc(Ventas_Total)) %>%
  head(10)

plot_ly(top_ciudades, x = ~Ventas_Total, y = ~reorder(ciudad, Ventas_Total),
        type = 'bar', orientation = 'h',
        marker = list(color = '#0f3460')) %>%
  layout(title = "Figura 4. Top 10 Ciudades por Ventas Totales",
         xaxis = list(title = "Ventas (USD)"),
         yaxis = list(title = "Ciudad"),
         hovermode = "y")

Hallazgo: New York encabeza las ventas por ciudad con USD 5.7M, seguida de San Francisco y Charleston. La presencia de ciudades del sur y oeste (Portland, Orlando, Miami) refuerza la tendencia regional observada anteriormente.


Rentabilidad

Margen Operativo por Producto

margen_producto <- datos %>%
  group_by(producto) %>%
  summarise(Margen_Promedio = round(mean(margen_operativo, na.rm = TRUE), 3)) %>%
  arrange(desc(Margen_Promedio))

plot_ly(margen_producto, x = ~reorder(producto, Margen_Promedio), y = ~Margen_Promedio,
        type = 'bar', orientation = 'v',
        marker = list(color = '#533483')) %>%
  layout(title = "Figura 5. Margen Operativo Promedio por Producto",
         xaxis = list(title = "Producto", tickangle = -30),
         yaxis = list(title = "Margen Operativo Promedio", tickformat = ".0%"))

Hallazgo: Men’s Street Footwear no solo lidera en ventas sino que también tiene el margen operativo más alto (44.6%), lo que lo convierte en el producto más estratégico para Adidas. Women’s Athletic Footwear tiene un margen sólido (42.4%) a pesar de su menor volumen de ventas.

Margen Operativo por Método de Venta

plot_ly(ventas_metodo, x = ~metodo_venta, y = ~Margen_Promedio,
        type = 'bar', color = ~metodo_venta,
        colors = c('#e94560', '#0f3460', '#533483')) %>%
  layout(title = "Figura 6. Margen Operativo Promedio por Método de Venta",
         xaxis = list(title = "Método de Venta"),
         yaxis = list(title = "Margen Promedio", tickformat = ".0%"),
         showlegend = FALSE)

Hallazgo: El canal Online presenta el mayor margen promedio (46.4%), lo que combina el mayor volumen de ventas con la mejor rentabilidad. El canal In-store tiene el margen más bajo (35.6%), posiblemente por costos operativos más elevados.

Variabilidad de Utilidad Operativa por Región

La caja del gráfico representa el 50% de las transacciones más frecuentes. La línea dentro de la caja es la utilidad típica (mediana). Los puntos rojos son ventas extraordinariamente grandes — atípicas.

ggplotly(
  ggplot(datos, aes(x = reorder(region, utilidad_operativa, FUN = median), 
                    y = utilidad_operativa, fill = region)) +
    geom_boxplot(outlier.colour = "red", outlier.shape = 16, outlier.size = 2, alpha = 0.8) +
    scale_fill_manual(values = c('#1a1a2e','#0f3460','#533483','#e94560','#f5a623')) +
    scale_y_continuous(labels = scales::dollar_format()) +
    labs(title = "Figura 7. Rango de Utilidad Operativa por Región",
         subtitle = "Puntos rojos = transacciones atípicamente grandes",
         x = "Región (de menor a mayor utilidad típica)", 
         y = "Utilidad Operativa (USD)") +
    theme_minimal() +
    theme(legend.position = "none")
)

Hallazgo: La región Southeast tiene la utilidad típica más alta — su caja está más arriba que las demás. Los puntos negros en todas las regiones son transacciones grandes (pedidos masivos de distribuidores), lo que explica la alta variabilidad: conviven ventas pequeñas de pocos cientos de dólares con ventas de decenas de miles en la misma región.

Ventas Totales por Distribuidor

ventas_dist <- datos %>%
  group_by(distribuidor) %>%
  summarise(
    Ventas_Total    = sum(ventas_total, na.rm = TRUE),
    Margen_Promedio = round(mean(margen_operativo, na.rm = TRUE), 3)
  ) %>%
  arrange(desc(Ventas_Total))

plot_ly(ventas_dist, x = ~reorder(distribuidor, -Ventas_Total), y = ~Ventas_Total,
        type = 'bar',
        marker = list(color = c('#1a1a2e','#0f3460','#533483','#e94560','#f5a623','#16213e'))) %>%
  layout(title = "Figura 8. Ventas Totales por Distribuidor",
         xaxis = list(title = "Distribuidor"),
         yaxis = list(title = "Ventas (USD)"),
         hovermode = "x")

Hallazgo: West Gear es el distribuidor con mayor volumen de ventas (USD 32.4M), seguido de Foot Locker (USD 29.0M). Amazon y Walmart tienen los menores volúmenes (~USD 10M cada uno), lo que puede indicar menor penetración del canal digital o condiciones contractuales diferentes con estas plataformas.


Relación entre Variables

Correlación entre Variables Numéricas

mat_corr <- datos %>%
  select(precio_unidad, unidades_vendidas, ventas_total, utilidad_operativa, margen_operativo) %>%
  cor(use = "complete.obs") %>%
  round(3)

mat_corr %>%
  kable(caption = "Tabla 2. Matriz de correlaciones") %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed"), full_width = FALSE)
Tabla 2. Matriz de correlaciones
precio_unidad unidades_vendidas ventas_total utilidad_operativa margen_operativo
precio_unidad 1.000 0.266 0.540 0.504 -0.137
unidades_vendidas 0.266 1.000 0.919 0.872 -0.305
ventas_total 0.540 0.919 1.000 0.935 -0.302
utilidad_operativa 0.504 0.872 0.935 1.000 -0.047
margen_operativo -0.137 -0.305 -0.302 -0.047 1.000

Hallazgos de correlación:

  • Ventas totales y utilidad operativa presentan una correlación positiva alta (0.85), confirmando que a mayores ventas, mayor utilidad.
  • Precio por unidad y ventas totales tienen una correlación de 0.54, indicando que los productos de mayor precio generan más ingresos (no necesariamente por mayor volumen).
  • Margen operativo y unidades vendidas muestran una correlación negativa (-0.31), sugiriendo que las ventas de mayor volumen tienden a ocurrir a márgenes más ajustados (posiblemente por descuentos en volumen).
  • Precio y margen tienen una correlación negativa (-0.14), lo que indica que productos más caros no necesariamente son los más rentables en términos de margen porcentual.

Dispersión: Precio vs. Unidades Vendidas

ggplotly(
  ggplot(datos, aes(x = precio_unidad, y = unidades_vendidas, color = metodo_venta)) +
    geom_point(alpha = 0.4, size = 1.5) +
    geom_smooth(method = "lm", se = FALSE, size = 1) +
    scale_color_manual(values = c('#0f3460', '#533483', '#e94560')) +
    labs(
      title = paste("Figura 9. Precio por Unidad vs. Unidades Vendidas\nCorrelación:", 
                    round(cor(datos$precio_unidad, datos$unidades_vendidas, use = "complete.obs"), 3)),
      x = "Precio por Unidad (USD)",
      y = "Unidades Vendidas",
      color = "Método de Venta"
    ) +
    theme_minimal()
)

Hallazgo: Contrario a la intuición económica clásica, existe una correlación positiva débil (0.27) entre precio y unidades vendidas. Esto sugiere que en el portafolio de Adidas, los productos de mayor precio tienen demanda independiente del efecto precio — probablemente por la percepción de marca, calidad y fidelidad del consumidor. El canal Online muestra mayor dispersión en precios altos.


Análisis Combinado: Producto + Región

combinado <- datos %>%
  group_by(producto, region) %>%
  summarise(
    Ventas_Total    = sum(ventas_total, na.rm = TRUE),
    Margen_Promedio = round(mean(margen_operativo, na.rm = TRUE), 3),
    .groups = "drop"
  )

plot_ly(combinado, x = ~region, y = ~Ventas_Total, color = ~producto,
        type = 'bar', barmode = 'group',
        colors = c('#1a1a2e','#0f3460','#533483','#e94560','#f5a623','#16213e')) %>%
  layout(title = "Figura 10. Ventas por Producto y Región",
         xaxis = list(title = "Región"),
         yaxis = list(title = "Ventas (USD)"),
         legend = list(orientation = "h", y = -0.3),
         hovermode = "x")

Hallazgo: Men’s Street Footwear en la región West es la combinación más rentable y de mayor volumen. En general, todas las líneas de producto muestran mayor volumen en West, lo que refuerza la importancia estratégica de esa región. Women’s Apparel tiene desempeño sólido en todas las regiones, evidenciando una demanda más uniforme geográficamente.


Principales Hallazgos

A partir del análisis descriptivo realizado, se identifican los siguientes hallazgos:

  1. Canal Online como motor de crecimiento: El canal online concentra el mayor volumen de ventas (USD 44.9M) y el mejor margen operativo promedio (46.4%). Esto representa una ventaja competitiva si se consolida la estrategia digital.

  2. Liderazgo de West y Men’s Street Footwear: La región West y el producto Men’s Street Footwear son los líderes indiscutibles tanto en ventas como en rentabilidad. La combinación de ambos representa la apuesta más estratégica para Adidas.

  3. Alta variabilidad en utilidad operativa: La presencia de valores atípicos en todas las regiones indica transacciones de escala muy diferente. Un análisis posterior podría identificar qué ciudades o distribuidores explican estos picos.

  4. West Gear y Foot Locker como distribuidores clave: Ambos concentran más del 50% de las ventas totales. La dependencia de estos dos distribuidores podría ser un riesgo de concentración.

  5. Precio positivamente asociado a ventas: La correlación positiva (aunque débil) entre precio y unidades vendidas sugiere que los consumidores de Adidas no responden negativamente al precio, lo que da margen para estrategias de pricing premium.

  6. Margen operativo relativamente uniforme entre productos: La diferencia entre el producto con mayor margen (Men’s Street Footwear: 44.6%) y el menor (Men’s Athletic Footwear: 40.3%) es de solo 4.3 puntos porcentuales, lo que indica una política de márgenes coherente entre líneas.


Conclusiones y Recomendaciones

Conclusiones

El análisis descriptivo del portafolio de ventas de Adidas evidencia una empresa con sólida rentabilidad operativa (margen promedio del 42%), liderazgo claro del canal Online y concentración geográfica en la región West. La relación fuerte entre ventas y utilidad operativa indica eficiencia en la conversión de ingresos a utilidad.

Recomendaciones (Analítica Prescriptiva)

  • Potenciar el canal Online: Dado que Online tiene el mayor volumen y el mejor margen, se recomienda aumentar la inversión en marketing digital, logística de e-commerce y experiencia de usuario en plataformas digitales.

  • Estrategia diferenciada por región: Desarrollar planes específicos para Midwest, la región de menor desempeño, adaptando el portafolio de productos y los distribuidores locales a las preferencias del consumidor de esa región.

  • Gestión del riesgo de concentración en distribuidores: Reducir la dependencia de West Gear y Foot Locker diversificando hacia Amazon y otros canales digitales, que actualmente representan una fracción pequeña del total.

  • Impulsar Women’s Athletic Footwear: Es la categoría con menor participación en ventas (11.8%) pero con margen competitivo (42.4%). Una campaña enfocada en este segmento podría generar crecimiento incremental con buena rentabilidad.

  • Revisar estructura de costos del canal In-store: Con el margen más bajo (35.6%), el canal físico debería optimizarse mediante negociación con minoristas o reducción de costos operativos, para acercarse al margen de los canales Online y Outlet.


Informe elaborado por Juan Manuel Ramírez y Gabriela Trujillo — Analítica de Datos para la Toma de Decisiones — Pontificia Universidad Javeriana de Cali, 2026.