Introducción

Adidas AG es una de las compañías líderes en la industria global de artículos deportivos, con presencia internacional y una estructura comercial basada en múltiples distribuidores, regiones y categorías de producto. Comprender cómo se distribuyen sus ventas y resultados operativos entre distintos territorios resulta clave para evaluar la estructura de su desempeño comercial.

En este documento se desarrolla un análisis descriptivo de una base transaccional de ventas, utilizando R y herramientas de estadística descriptiva y visualización de datos. El objetivo principal es examinar la distribución de las ventas, identificar posibles asimetrías o concentraciones y evaluar si el desempeño comercial presenta dependencia significativa de determinadas regiones o estados.

A partir del estudio de variables como ventas_totales, utilidad_operativa y margen_operativo, se busca determinar el grado de concentración geográfica de los ingresos y analizar sus implicaciones estratégicas para la estabilidad y diversificación comercial de la compañía.

Análisis descriptivo

PASO 1. Instalar y cargar librerias

# Cargar librerías necesarias
library(readxl)
library(dplyr)
library(ggplot2)
library(plotly)
library(knitr)
library(kableExtra)
library(tidyr)
library(tidyverse)
library(RecordLinkage)
library(leaflet)
library(htmltools)

PASO 2: Cargar la base de datos

# Cargar datos desde el archivo Excel
datos_col <- read_excel("DatosCaso1.xlsx") 
   

# Ver las primeras filas de los datos
class(datos_col)  
## [1] "tbl_df"     "tbl"        "data.frame"
colnames(datos_col)  
##  [1] "distribuidor"       "region"             "estado"            
##  [4] "ciudad"             "producto"           "precio_unidad"     
##  [7] "unidades_vendidas"  "ventas_total"       "utilidad_operativa"
## [10] "margen_operativo"   "metodo_venta"
head(datos_col)
distribuidor region estado ciudad producto precio_unidad unidades_vendidas ventas_total utilidad_operativa margen_operativo metodo_venta
Foot Locker Northeast New York New York Men’s Street Footwear 50 1200 60000 30000.0 0.50 In-store
Foot Locker Northeast New York New York Men’s Athletic Footwear 50 1000 50000 15000.0 0.30 In-store
Foot Locker Northeast New York New York Women’s Street Footwear 40 1000 40000 14000.0 0.35 In-store
Foot Locker Northeast New York New York Women’s Athletic Footwear 45 850 38250 13387.5 0.35 In-store
Foot Locker Northeast New York New York Men’s Apparel 60 900 54000 16200.0 0.30 In-store
Foot Locker Northeast New York New York Women’s Apparel 50 1000 50000 12500.0 0.25 In-store

La base contiene 9.648 registros y describe ventas por combinación de distribuidor–geografía–producto–método de venta. Cada registro representa una observación transaccional con variables de volumen (unidades), valor (ventas_total) y rentabilidad (utilidad_operativa y margen_operativo).

Indicadores de centralidad y dispersión

# Resumen estadístico de las variables financieras
resumen <- datos_col %>% 
  select(distribuidor, region, estado, ciudad, producto, precio_unidad, unidades_vendidas, ventas_total, utilidad_operativa, margen_operativo, metodo_venta) %>% 
  summary()

resumen
##  distribuidor          region             estado             ciudad         
##  Length:9648        Length:9648        Length:9648        Length:9648       
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##    producto         precio_unidad    unidades_vendidas  ventas_total  
##  Length:9648        Min.   :  7.00   Min.   :   0.0    Min.   :    0  
##  Class :character   1st Qu.: 35.00   1st Qu.: 106.0    1st Qu.: 4065  
##  Mode  :character   Median : 45.00   Median : 176.0    Median : 7804  
##                     Mean   : 45.22   Mean   : 256.9    Mean   :12455  
##                     3rd Qu.: 55.00   3rd Qu.: 350.0    3rd Qu.:15864  
##                     Max.   :110.00   Max.   :1275.0    Max.   :82500  
##  utilidad_operativa margen_operativo metodo_venta      
##  Min.   :    0      Min.   :0.100    Length:9648       
##  1st Qu.: 1753      1st Qu.:0.350    Class :character  
##  Median : 3263      Median :0.410    Mode  :character  
##  Mean   : 4895      Mean   :0.423                      
##  3rd Qu.: 6192      3rd Qu.:0.490                      
##  Max.   :39000      Max.   :0.800

Las estadísticas muestran alta dispersión en ventas_total y una diferencia marcada entre media y mediana, lo que sugiere asimetría positiva: la mayoría de las observaciones son ventas bajas/medias y un grupo pequeño concentra valores muy altos. Por esto, para comparar territorios se prioriza la mediana/promedios por grupo y la participación porcentual, más que el promedio global.

Ventas y rentabilidad

datos_col %>%
  summarise(
    Ventas_promedio = mean(ventas_total, na.rm = TRUE),
    Ventas_mediana = median(ventas_total, na.rm = TRUE),
    Ventas_sd = sd(ventas_total, na.rm = TRUE),
    
    Utilidad_promedio = mean(utilidad_operativa, na.rm = TRUE),
    Margen_promedio = mean(margen_operativo, na.rm = TRUE),
    Margen_sd = sd(margen_operativo, na.rm = TRUE)
  )
Ventas_promedio Ventas_mediana Ventas_sd Utilidad_promedio Margen_promedio Margen_sd
12455.08 7803.5 12716.39 4894.794 0.4229913 0.0971974

Las ventas presentan alta variabilidad y una distribución asimétrica positiva. La diferencia entre media y mediana sugiere la existencia de observaciones extremas que elevan el promedio general.

Histograma

Estas gráficas se usan como diagnóstico para verificar forma de la distribución y presencia de outliers, y así justificar un análisis de concentración por geografía.

ggplot(datos_col, aes(x = ventas_total)) +
  geom_histogram(bins = 30, fill = "steelblue") +
  theme_minimal()

Podemos observar claramente que:

  • Distribución asimétrica positiva (sesgo a la derecha).

  • Gran concentración de observaciones en niveles bajos de ventas.

-Cola larga que llega hasta ~80.000.

Esto confirma lo que ya estaban sugiriendo media vs mediana:

✔ La media está inflada por valores extremos.

✔ La mayoría de las ventas son relativamente bajas.

✔ Un pequeño grupo genera ventas muy altas.

Boxplot

ggplot(datos_col, aes(y = ventas_total)) +
  geom_boxplot(fill = "orange") +
  theme_minimal()

Aquí es mucho más evidente:

Muchísimos puntos por encima del bigote superior.

Outliers fuertes entre 35.000 y 80.000.

Mediana claramente por debajo del promedio.

Esto no es normal, esto significa que hay una concentración de ingresos en pocos registros.

Como podemos ver en las graficas las ventas presentan una distribución altamente asimétrica hacia la derecha, con una concentración significativa en niveles bajos y una cola extensa de valores elevados. La diferencia entre media y mediana confirma la presencia de valores atípicos que elevan el promedio general. Esto sugiere que una proporción reducida de combinaciones producto-región-retailer genera una parte significativa del ingreso total.

Dado que se evidencia una alta variabilidad y presencia de valores extremos, se procede a analizar si esta concentración responde a factores geográficos.

ventas totales por región

ventas_region <- datos_col %>%
  group_by(region) %>%
  summarise(
    ventas_totales = sum(ventas_total),
    promedio = mean(ventas_total)
  ) %>%
  arrange(desc(ventas_totales))

ventas_region
region ventas_totales promedio
West 36436157 14884.051
Northeast 25078267 10554.826
Southeast 21374436 17462.775
South 20603356 11923.238
Midwest 16674434 8907.283

grafico clave.

ggplot(ventas_region, aes(x = reorder(region, ventas_totales),
                          y = ventas_totales)) +
  geom_bar(stat = "identity", fill = "darkblue") +
  coord_flip() +
  theme_minimal() +
  labs(title = "Ventas Totales por Región")

ventas_region <- ventas_region %>%
  mutate(participacion = ventas_totales / sum(ventas_totales) * 100)

ventas_region
region ventas_totales promedio participacion
West 36436157 14884.051 30.32136
Northeast 25078267 10554.826 20.86957
Southeast 21374436 17462.775 17.78733
South 20603356 11923.238 17.14565
Midwest 16674434 8907.283 13.87609

El análisis geográfico muestra que la región West concentra el 30,3% de las ventas totales, posicionándose como el principal mercado de la compañía. Sin embargo, las demás regiones mantienen participaciones relativamente equilibradas, lo que indica una estructura moderadamente diversificada y sin dependencia extrema de un solo territorio. Además, Southeast presenta el mayor promedio por transacción, lo que sugiere diferencias en el comportamiento de consumo entre regiones.

Dado que la región West concentra la mayor proporción de las ventas totales, resulta pertinente profundizar el análisis a un nivel más desagregado. En particular, se examina el comportamiento de las ventas por estado dentro de esta región con el fin de identificar si el liderazgo de West se encuentra distribuido de manera equilibrada o si depende de un número reducido de mercados específicos.

ventas_west_estado <- datos_col %>%
  filter(region == "West") %>%
  group_by(estado) %>%
  summarise(
    ventas_totales = sum(ventas_total, na.rm = TRUE),
    promedio = mean(ventas_total, na.rm = TRUE)
  ) %>%
  arrange(desc(ventas_totales))

ventas_west_estado
estado ventas_totales promedio
California 8580508 19862.287
Washington 3222093 22375.646
Oregon 3047049 14106.708
Nevada 2981134 13801.546
New Mexico 2824641 13077.042
Idaho 2742753 12697.931
Hawaii 2734457 18989.285
Colorado 2569036 17840.528
Wyoming 2282342 15849.597
Arizona 2254096 10435.630
Alaska 1810428 12572.417
Utah 1387620 6424.167

Participacion dentro de West

ventas_west_estado <- ventas_west_estado %>%
  mutate(participacion_west = ventas_totales / sum(ventas_totales) * 100)

ventas_west_estado
estado ventas_totales promedio participacion_west
California 8580508 19862.287 23.549432
Washington 3222093 22375.646 8.843120
Oregon 3047049 14106.708 8.362707
Nevada 2981134 13801.546 8.181801
New Mexico 2824641 13077.042 7.752302
Idaho 2742753 12697.931 7.527558
Hawaii 2734457 18989.285 7.504790
Colorado 2569036 17840.528 7.050788
Wyoming 2282342 15849.597 6.263948
Arizona 2254096 10435.630 6.186426
Alaska 1810428 12572.417 4.968768
Utah 1387620 6424.167 3.808360

Grafico Top 10 estados

top10_west <- ventas_west_estado %>% head(10)

ggplot(top10_west, aes(x = reorder(estado, ventas_totales), y = ventas_totales)) +
  geom_bar(stat = "identity") +
  coord_flip() +
  theme_minimal() +
  labs(title = "Top 10 Estados por Ventas en West",
       x = "Estado", y = "Ventas Totales")

El análisis a nivel estatal dentro de la región West evidencia que California concentra el 23,5% de las ventas regionales, posicionándose como el principal mercado interno. Dentro de West, California concentra 23,5% de las ventas regionales, lo que confirma un liderazgo claro. Aun así, el resto de estados del Top 10 se distribuye en participaciones cercanas (6% y 9%), indicando que West combina un mercado dominante con una base secundaria diversificada, reduciendo el riesgo de dependencia absoluta de un solo estado.

En consecuencia, el liderazgo de la región West se explica principalmente por el desempeño de California, aunque respaldado por una red de estados con aportes relativamente parrecidos.

Implicaciones estrategicas de la concentración geográfica

Los resultados sugieren que el desempeño comercial no se distribuye de forma homogénea: existe asimetría (pocas observaciones explican ventas muy altas) y una concentración geográfica donde West lidera y California es el principal motor dentro de esa región. Estratégicamente, esto implica dos cosas: Primero: proteger y sostener los mercados que explican la mayor proporción de ventas (evitar pérdida de tracción en California/West) y Segundo: reducir vulnerabilidad diversificando el crecimiento hacia regiones con menor participación, para disminuir exposición a shocks locales (competencia, logística, demanda regional).

Con base en el análisis realizado, se recomienda:

  1. Defender el principal: priorizar disponibilidad e inventario de las líneas con mayor rotación en los distribuidores clave del estado, y monitorear semanalmente ventas_total y margen_operativo para evitar crecimiento con caída de rentabilidad.

  2. Crecimiento en regiones rezagadas: diseñar un plan piloto en Midwest, y la región con menor participación, con ajustes de mix (productos ganadores en West) y estrategia comercial por canal (metodo_venta), evaluando el impacto en ventas_total y margen.

  3. Gestión de concentración: implementar un tablero de control con participación por región/estado y alertas cuando una región/estado supere un umbral de dependencia, para anticipar riesgos y orientar inversión comercial.

Conclusion

En conclusión, el análisis descriptivo evidencia una distribución de ventas asimétrica con presencia de valores extremos y una concentración geográfica moderada: West lidera las ventas totales y, dentro de esta región, California aporta la mayor proporción. Aunque existe diversificación entre regiones y estados secundarios, los hallazgos indican que una parte relevante del desempeño depende de territorios específicos, por lo que conviene sostener el core y, en paralelo, diversificar crecimiento en regiones con menor participación para reducir riesgo y estabilizar resultados