Introducción

En el presente informe se desarrolla un análisis descriptivo y exploratorio de la base de datos DatosCaso1, con el propósito de evaluar el comportamiento interno de la empresa Adidas, a partir de sus principales variables operativas y/o comerciales. Este análisis busca comprender cómo se están desempeñando los diferentes componentes del negocio, identificar patrones relevantes, detectar posibles ineficiencias y reconocer oportunidades de mejora.

La investigación cumple un papel fundamental dentro de la organización, ya que permite transformar los datos en información útil para la toma de decisiones estratégicas. A través de herramientas estadísticas y visualizaciones en R, se examinan tendencias, niveles de dispersión, relaciones entre variables y posibles valores atípicos que puedan estar afectando los resultados.

Los hallazgos obtenidos servirán como base para formular recomendaciones orientadas a fortalecer la gestión interna, optimizar recursos y mejorar el desempeño general de la empresa desde una perspectiva analítica y estratégica.

# Instalación librerías necesarias
knitr::opts_chunk$set(echo = TRUE, results = "show", message = FALSE, warning = FALSE)

library(readxl)
library(dplyr)
library(ggplot2)
library(plotly)
library(knitr)
library(kableExtra)
library(tidyr)
library(RecordLinkage)
library(leaflet)
library(htmltools)
library(corrplot)



# Base de datos
DatosCaso1 <- read_excel("DatosCaso1.xlsx")

# Ver primeras filas
head(DatosCaso1)
distribuidor region estado ciudad producto precio_unidad unidades_vendidas ventas_total utilidad_operativa margen_operativo metodo_venta
Foot Locker Northeast New York New York Men’s Street Footwear 50 1200 60000 30000.0 0.50 In-store
Foot Locker Northeast New York New York Men’s Athletic Footwear 50 1000 50000 15000.0 0.30 In-store
Foot Locker Northeast New York New York Women’s Street Footwear 40 1000 40000 14000.0 0.35 In-store
Foot Locker Northeast New York New York Women’s Athletic Footwear 45 850 38250 13387.5 0.35 In-store
Foot Locker Northeast New York New York Men’s Apparel 60 900 54000 16200.0 0.30 In-store
Foot Locker Northeast New York New York Women’s Apparel 50 1000 50000 12500.0 0.25 In-store

Análisis Descriptivo

#Nombres de las variables:
library(dplyr)
names(DatosCaso1)
##  [1] "distribuidor"       "region"             "estado"            
##  [4] "ciudad"             "producto"           "precio_unidad"     
##  [7] "unidades_vendidas"  "ventas_total"       "utilidad_operativa"
## [10] "margen_operativo"   "metodo_venta"
#Resumen estadísditco de las variables:
summary(DatosCaso1)
##  distribuidor          region             estado             ciudad         
##  Length:9648        Length:9648        Length:9648        Length:9648       
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##    producto         precio_unidad    unidades_vendidas  ventas_total  
##  Length:9648        Min.   :  7.00   Min.   :   0.0    Min.   :    0  
##  Class :character   1st Qu.: 35.00   1st Qu.: 106.0    1st Qu.: 4065  
##  Mode  :character   Median : 45.00   Median : 176.0    Median : 7804  
##                     Mean   : 45.22   Mean   : 256.9    Mean   :12455  
##                     3rd Qu.: 55.00   3rd Qu.: 350.0    3rd Qu.:15864  
##                     Max.   :110.00   Max.   :1275.0    Max.   :82500  
##  utilidad_operativa margen_operativo metodo_venta      
##  Min.   :    0      Min.   :0.100    Length:9648       
##  1st Qu.: 1753      1st Qu.:0.350    Class :character  
##  Median : 3263      Median :0.410    Mode  :character  
##  Mean   : 4895      Mean   :0.423                      
##  3rd Qu.: 6192      3rd Qu.:0.490                      
##  Max.   :39000      Max.   :0.800
ventas_stats <- DatosCaso1 %>%
  summarise(
    Media_Ventas = mean(ventas_total),
    Mediana_Ventas = median(ventas_total),
    SD_Ventas = sd(ventas_total),
    Min_Ventas = min(ventas_total),
    Max_Ventas = max(ventas_total),
    Media_Unidades = mean(unidades_vendidas),
    Mediana_Unidades = median(unidades_vendidas),
    SD_Unidades = sd(unidades_vendidas)
  )

ventas_stats
Media_Ventas Mediana_Ventas SD_Ventas Min_Ventas Max_Ventas Media_Unidades Mediana_Unidades SD_Unidades
12455.08 7803.5 12716.39 0 82500 256.93 176 214.252

En el caso de las ventas, la media es de 12.455,08 mientras que la mediana es de 7.803,5, lo que evidencia una asimetría positiva. Esto significa que existen algunas ventas muy altas que elevan el promedio general. Además, la desviación estándar (12.716,39) es bastante alta, incluso mayor que la mediana, lo que indica una gran variabilidad en los ingresos, no hay una estabilidad. El valor mínimo de 0 y el máximo de 82.500 muestran que hay operaciones muy pequeñas o nulas y otras de gran magnitud. En general, esto sugiere que las ventas no son homogéneas y que posiblemente una parte importante de los ingresos se concentra en pocas transacciones de alto valor.

Respecto a las unidades vendidas, la media es de 256,93 y la mediana de 176, lo que nuevamente indica una distribución sesgada hacia la derecha. Esto significa que aunque la mayoría de los pedidos son moderados, existen algunos con volúmenes altos que incrementan el promedio. La desviación estándar de 214,25 confirma que hay una variabilidad considerable en las cantidades vendidas. Esto refleja que la empresa maneja diferentes tipos de clientes, desde pequeños hasta grandes compradores, lo que impacta directamente la estabilidad y el comportamiento de las ventas.

Ahora lo analizaremos por región:

ventas_region <- DatosCaso1 %>%
  group_by(region) %>%
  summarise(
    Ventas_Totales = sum(ventas_total),
    Promedio_Ventas = mean(ventas_total)
  )

ventas_region
region Ventas_Totales Promedio_Ventas
Midwest 16674434 8907.283
Northeast 25078267 10554.826
South 20603356 11923.238
Southeast 21374436 17462.775
West 36436157 14884.051

Se puede evidenciar como Southeast tiene el mayor promedio de venta de la región, seguido de West que tiene mayor de ventas totales.

ventas_region_detalle <- DatosCaso1 %>%
  group_by(region) %>%
  summarise(
    Ventas_Totales = sum(ventas_total),
    Promedio_Ventas = mean(ventas_total),
    Total_Unidades = sum(unidades_vendidas),
    Promedio_Unidades = mean(unidades_vendidas),
    Numero_Transacciones = n()
  ) %>%
  arrange(desc(Ventas_Totales))

kable(ventas_region_detalle, digits = 2, caption = "Resumen de Ventas y Unidades por Región") %>%
kable_styling(bootstrap_options = c("striped","hover","condensed"))
Resumen de Ventas y Unidades por Región
region Ventas_Totales Promedio_Ventas Total_Unidades Promedio_Unidades Numero_Transacciones
West 36436157 14884.05 686985 280.63 2448
Northeast 25078267 10554.83 501279 210.98 2376
Southeast 21374436 17462.77 407000 332.52 1224
South 20603356 11923.24 492260 284.87 1728
Midwest 16674434 8907.28 391337 209.05 1872

Adidas debe mantener la inversión con mayor fuerza en West, ya que se evidencia su alto volumen y facturación. Tambien deben reforzar fidelización y analizar sus canales, promociones, oferta de productos, etc; para asi ser llevado al resto de regiones como Midwest.

#Ventas Totales por region
ggplot(ventas_region_detalle, aes(x = reorder(region, -Ventas_Totales), 
                                  y = Ventas_Totales)) +
  geom_bar(stat = "identity", fill = "steelblue") +
  theme_minimal() +
  labs(title = "Ventas Totales por Region",
       x = "Region",
       y = "Ventas Totales")

La mayor cantidad de ventas se ven en West

# Diagrama de cajas"

ggplot(DatosCaso1, aes(x = region, y = ventas_total)) +
  geom_boxplot(fill = "green") +
  theme_minimal() +
  labs(title = "Distribucion de Ventas por Region",
       x = "Region",
       y = "Ventas Totales")

El diagrama muestra que Southeast tiene la mediana de ventas más alta, lo que indica que, en promedio, sus transacciones son mayores frente a las demás regiones. Además, presenta mayor dispersión, lo que refleja variabilidad en los montos vendidos y la presencia de operaciones de alto valor.

La región West también presenta un buen nivel de ventas, aunque con menor variabilidad que Southeast, lo que sugiere un comportamiento fuerte pero más estable. En contraste, Midwest y Northeast tienen medianas más bajas y menor dispersión, lo que indica ventas más homogéneas pero de menor magnitud.

En todas las regiones se observan valores atípicos altos, confirmando que existen ventas extraordinarias que influyen significativamente en los ingresos totales.

#Histrograma de ventas

ggplot(DatosCaso1, aes(x = ventas_total)) +
  geom_histogram(bins = 30, fill = "orange") +
  theme_minimal() +
  labs(title = "Distribución de Ventas Totales",
       x = "Ventas",
       y = "Frecuencia")

El histograma muestra una distribución claramente asimétrica positiva (sesgada a la derecha). La mayor concentración de ventas se encuentra en los rangos bajos y medios, principalmente por debajo de los 15.000–20.000, lo que indica que la mayoría de las transacciones son de monto moderado.

Sin embargo, se observa una cola larga hacia la derecha que llega hasta valores cercanos a 80.000. Esto confirma la existencia de ventas extraordinarias que elevan el promedio general, pero que no representan el comportamiento típico de la mayoría de las operaciones.

En términos prácticos, esto significa que Adidas tiene muchas ventas pequeñas y medianas, y pocas ventas muy grandes que generan una parte importante de los ingresos. Esto refuerza la idea de concentración de ingresos y alta variabilidad en el comportamiento comercial.

#Relacion Unidades - Ventas
ggplot(DatosCaso1, aes(x = unidades_vendidas, y = ventas_total)) +
  geom_point(alpha = 0.6, color = "purple") +
  geom_smooth(method = "lm", se = FALSE, color = "red") +
  theme_minimal() +
  labs(title = "Relación entre Unidades Vendidas y Ventas Totales",
       x = "Unidades Vendidas",
       y = "Ventas Totales")

El diagrama evidencia una relación positiva clara entre ambas variables. A medida que aumentan las unidades vendidas, también se incrementan las ventas totales. Esto se observa en la tendencia ascendente de los puntos y en la línea de regresión, lo que indica que el volumen de productos vendidos es un factor determinante en los ingresos de la empresa.

También se observa que la mayor concentración de datos está en los niveles bajos y medios de unidades vendidas, aproximadamente entre 0 y 300 unidades, donde las ventas se mantienen relativamente moderadas. Sin embargo, a medida que aumentan las unidades, la dispersión de los puntos también crece, lo que sugiere que para volúmenes altos de venta pueden existir diferencias en precios, descuentos o tipos de productos vendidos.

En general, el gráfico confirma que existe una relación directa entre cantidad vendida e ingresos, aunque con cierta variabilidad en los niveles más altos de unidades, lo que puede indicar estrategias comerciales diferentes según el volumen de compra.

#Relacion Ventas - Utilidad operativa
ggplot(DatosCaso1, aes(x = ventas_total, y = utilidad_operativa)) +
  geom_point(alpha = 0.6, color = "purple") +
  geom_smooth(method = "lm", se = FALSE, color = "red") +
  theme_minimal() +
  labs(title = "Relación entre Ventas Totales y Utilidad Operativa",
       x = "Ventas Totales",
       y = "Ventas utilidad Operativa")

Se observa una relación positiva clara entre ambas variables: a medida que aumentan las ventas totales, también aumenta la utilidad operativa. Esto se evidencia en la tendencia ascendente de los puntos y en la línea de regresión, lo que indica que mayores niveles de ventas generalmente generan mayores ganancias para la empresa.

Además, la mayor concentración de datos se encuentra en niveles bajos y medios de ventas, lo que sugiere que la mayoría de las operaciones de la empresa se ubican en esos rangos. A medida que las ventas crecen, también aumenta la dispersión de los puntos, lo que puede indicar diferencias en costos, márgenes o estrategias comerciales que afectan la utilidad obtenida en cada operación.

Al comparar ambos gráficos de la empresa Adidas se puede observar una relación lógica entre las tres variables: unidades vendidas, ventas totales y utilidad operativa.

En el primer gráfico se evidenció que a mayor número de unidades vendidas, mayores son las ventas totales, lo que indica que el volumen de productos comercializados influye directamente en los ingresos de la empresa. Posteriormente, en el segundo gráfico se observa que a mayores ventas totales, mayor es la utilidad operativa, mostrando que el crecimiento en ingresos también se refleja en mayores ganancias.

En conjunto, ambos gráficos sugieren una cadena de relación: cuando aumentan las unidades vendidas, aumentan las ventas totales y, en consecuencia, también se incrementa la utilidad operativa. Sin embargo, la dispersión presente en los puntos indica que no todas las ventas generan el mismo nivel de utilidad, lo que puede estar relacionado con diferencias en costos, precios o márgenes en las distintas operaciones.

#Matriz Correlación
correlacion <- DatosCaso1 %>%
  select(ventas_total, unidades_vendidas, utilidad_operativa) %>%
  cor()

kable(correlacion, digits = 2, caption = "Matriz de Correlación")
Matriz de Correlación
ventas_total unidades_vendidas utilidad_operativa
ventas_total 1.00 0.92 0.94
unidades_vendidas 0.92 1.00 0.87
utilidad_operativa 0.94 0.87 1.00
# Relación entre precio y unidades vendidas
ggplot(DatosCaso1, aes(x = precio_unidad,
                  y = unidades_vendidas))+
  geom_point(alpha = 0.6, color = "red") +
  geom_smooth(method = "lm", se = FALSE, color = "black") +
  theme_minimal() +
  labs(title = "Precio vs Unidades Vendidas")

En el gráfico se identifica una relación positiva leve entre el precio por unidad y las unidades vendidas, lo cual se evidencia en la pendiente ascendente de la línea de regresión. Esto indica que, en promedio, cuando el precio del producto aumenta también se observa un ligero incremento en la cantidad de unidades vendidas. No obstante, esta relación no es muy fuerte, ya que los puntos del gráfico se encuentran bastante dispersos alrededor de la línea de tendencia, lo que refleja una variabilidad considerable en los datos.

Además, se observa una concentración vertical de puntos en ciertos niveles de precio, lo que sugiere que existen muchos registros con el mismo precio pero con diferentes cantidades vendidas. Este comportamiento suele presentarse cuando la empresa, en este caso Adidas, maneja precios estandarizados dentro de su estrategia comercial. Mientras el precio se mantiene fijo en ciertos niveles, la cantidad vendida puede variar debido a otros factores como la demanda, promociones, ubicación del punto de venta, estacionalidad o condiciones del mercado.

#Analisis por Producto

ventas_producto <- DatosCaso1 %>%
  group_by(producto) %>%
  summarise(Ventas = sum(ventas_total, na.rm = TRUE)) %>%
  ungroup() 

ventas_producto <- ventas_producto %>%
  mutate(Participacion = Ventas / sum(Ventas) * 100)

ventas_producto
producto Ventas Participacion
Men’s Apparel 16520632 13.74810
Men’s Athletic Footwear 20577180 17.12387
Men’s Street Footwear 27680769 23.03532
Women’s Apparel 23870985 19.86490
Women’s Athletic Footwear 14315521 11.91306
Women’s Street Footwear 17201563 14.31476

Se muestran las categorias con mayor participacion en ventas de la marca

library(dplyr)

combo_prod_region <- DatosCaso1 %>%
  group_by(producto, region) %>%
  summarise(Ventas = sum(ventas_total, na.rm = TRUE)) %>%
  ungroup()

top10_combo <- combo_prod_region %>%
  arrange(desc(Ventas)) %>%
  slice_head(n = 10)

#Top 10 mejores combinaciones producto-region
library(ggplot2)
library(scales)

ggplot(top10_combo,
       aes(x = reorder(paste(producto, region, sep = " - "), Ventas),
           y = Ventas)) +
  geom_col(fill = "blue") +
  coord_flip() +
  scale_y_continuous(labels = label_number(scale = 1e-6, suffix = " M")) +
  theme_minimal() +
  labs(title = "Top 10 Combinaciones Producto - Región",
       x = "Producto - Región",
       y = "Ventas (Millones)")

library(dplyr)
library(ggplot2)
library(scales)

# Crear dataset Producto + Región
prod_region_margen <- DatosCaso1 %>%
  group_by(producto, region) %>%
  summarise(
    Ventas = sum(ventas_total, na.rm = TRUE),
    Margen = mean(margen_operativo, na.rm = TRUE),
    Unidades = sum(unidades_vendidas, na.rm = TRUE)
  ) %>%
  ungroup()

# Gráfico de burbujas
ggplot(prod_region_margen,
       aes(x = Ventas,
           y = Margen,
           size = Unidades,
           color = producto)) +
  geom_point(alpha = 0.7) +
  scale_size_continuous(range = c(4,15)) +
  scale_x_continuous(labels = label_number(scale = 1e-6, suffix = " M")) +
  scale_color_brewer(palette = "YlGnBu") +
  theme_minimal() +
  labs(title = "Relación entre Ventas, Margen Operativo y Unidades por Producto y Región",
       subtitle = "Tamaño Burbuja = volumen de unidades vendidas",
       x = "Ventas Totales (Millones)",
       y = "Margen Operativo Promedio",
       size = "Unidades vendidas",
       color = "Producto")

En general, se observa que los mayores volúmenes de ventas (burbujas más grandes) se concentran entre 4 y 7 millones en ventas, con márgenes operativos aproximadamente entre 0.40 y 0.46. Esto sugiere que los productos con mayor demanda mantienen márgenes relativamente estables, lo que podría indicar una estrategia donde se prioriza el volumen de ventas manteniendo rentabilidad moderada.

También se identifican algunos puntos con márgenes operativos más altos (cercanos a 0.50 o superiores), pero con niveles de ventas más moderados. Esto puede indicar productos con mayor rentabilidad por unidad, aunque no necesariamente con el mayor volumen de mercado.

Por otro lado, existen casos con ventas altas pero márgenes más bajos (alrededor de 0.34–0.37), lo que sugiere que algunos productos logran gran volumen de comercialización sacrificando parte del margen, posiblemente por estrategias de precios competitivos o promociones.

En conjunto, el gráfico indica que dentro del portafolio de productos de la empresa existe un equilibrio entre volumen de ventas y rentabilidad, donde algunos productos destacan por su margen y otros por su capacidad de generar mayores niveles de ventas. Esto refleja una estrategia diversificada que busca mantener tanto participación de mercado como rentabilidad.

Conclusiones

A partir del análisis de los graficos y de los datos relacionados con ventas totales, unidades vendidas, precios y márgenes operativos de Adidas, es posible establecer algunas conclusiones que permiten orientar la analítica prescriptiva, es decir, recomendaciones concretas para la toma de decisiones estratégicas.

En primer lugar, los resultados evidencian que ciertos productos presentan un equilibrio favorable entre ventas, margen operativo y volumen de unidades vendidas. En particular, categorías como el calzado deportivo y urbano muestran una presencia relevante en los niveles más altos de ventas. Esto sugiere que la empresa debería priorizar la inversión en estas líneas de producto, fortaleciendo la disponibilidad de inventario, las campañas de marketing y la distribución en las regiones donde estos artículos muestran mayor demanda. Mantener un enfoque estratégico en los productos con mejor desempeño permitirá maximizar tanto los ingresos como la rentabilidad.

En segundo lugar, el análisis del gráfico de burbujas muestra que los mayores volúmenes de ventas suelen concentrarse en márgenes operativos intermedios, lo que indica que el crecimiento en ventas frecuentemente está asociado a estrategias de precios competitivos. Desde una perspectiva prescriptiva, la empresa podría optimizar su estrategia de precios, identificando aquellos productos que podrían soportar un leve aumento en el precio sin afectar significativamente la demanda. De esta forma se podría mejorar el margen operativo sin sacrificar volumen de ventas.

Asimismo, el análisis de la relación entre precio por unidad y unidades vendidas sugiere que la relación positiva observada es relativamente débil, lo que indica que la cantidad vendida no depende exclusivamente del precio. Factores como promociones, posicionamiento del producto, ubicación de las tiendas o estrategias comerciales influyen considerablemente en el comportamiento de la demanda. Por ello, se recomienda que la empresa integre análisis adicionales sobre campañas promocionales, estacionalidad y comportamiento regional, con el fin de identificar qué variables impulsan realmente las ventas y diseñar estrategias más precisas.

Por otro lado, la presencia de concentraciones verticales de precios en el gráfico sugiere que los productos suelen comercializarse en niveles de precio estandarizados. Esto indica que existe una estrategia de precios relativamente fija dentro de la compañía. A partir de este hallazgo, se recomienda evaluar la implementación de estrategias de precios más dinámicas, como ajustes según la demanda, promociones temporales o segmentación de precios por región o canal de venta, lo que podría aumentar la competitividad en determinados mercados.

Finalmente, el análisis general de los datos también revela casos con niveles de ventas significativamente superiores al promedio, lo que sugiere que ciertas combinaciones de producto, región o canal generan resultados especialmente positivos. Desde un enfoque prescriptivo, sería recomendable profundizar en estos casos de alto rendimiento mediante análisis más detallados que permitan identificar los factores que impulsan esas ventas. Replicar estas estrategias en otros productos o mercados podría contribuir a incrementar el desempeño global de la empresa.

En conjunto, estas recomendaciones apuntan a que la empresa fortalezca los productos más rentables, optimice su estrategia de precios, profundice en el análisis de los factores que influyen en la demanda y replique las prácticas comerciales que han demostrado generar los mejores resultados. De esta manera, Adidas podría mejorar su eficiencia comercial y consolidar un crecimiento sostenible en sus ventas y rentabilidad.