En el presente informe se desarrolla un análisis descriptivo y exploratorio de la base de datos DatosCaso1, con el propósito de evaluar el comportamiento interno de la empresa Adidas, a partir de sus principales variables operativas y/o comerciales. Este análisis busca comprender cómo se están desempeñando los diferentes componentes del negocio, identificar patrones relevantes, detectar posibles ineficiencias y reconocer oportunidades de mejora.
La investigación cumple un papel fundamental dentro de la organización, ya que permite transformar los datos en información útil para la toma de decisiones estratégicas. A través de herramientas estadísticas y visualizaciones en R, se examinan tendencias, niveles de dispersión, relaciones entre variables y posibles valores atípicos que puedan estar afectando los resultados.
Los hallazgos obtenidos servirán como base para formular recomendaciones orientadas a fortalecer la gestión interna, optimizar recursos y mejorar el desempeño general de la empresa desde una perspectiva analítica y estratégica.
# Instalación librerías necesarias
knitr::opts_chunk$set(echo = TRUE, results = "show", message = FALSE, warning = FALSE)
library(readxl)
library(dplyr)
library(ggplot2)
library(plotly)
library(knitr)
library(kableExtra)
library(tidyr)
library(RecordLinkage)
library(leaflet)
library(htmltools)
library(corrplot)
# Base de datos
DatosCaso1 <- read_excel("DatosCaso1.xlsx")
# Ver primeras filas
head(DatosCaso1)
| distribuidor | region | estado | ciudad | producto | precio_unidad | unidades_vendidas | ventas_total | utilidad_operativa | margen_operativo | metodo_venta |
|---|---|---|---|---|---|---|---|---|---|---|
| Foot Locker | Northeast | New York | New York | Men’s Street Footwear | 50 | 1200 | 60000 | 30000.0 | 0.50 | In-store |
| Foot Locker | Northeast | New York | New York | Men’s Athletic Footwear | 50 | 1000 | 50000 | 15000.0 | 0.30 | In-store |
| Foot Locker | Northeast | New York | New York | Women’s Street Footwear | 40 | 1000 | 40000 | 14000.0 | 0.35 | In-store |
| Foot Locker | Northeast | New York | New York | Women’s Athletic Footwear | 45 | 850 | 38250 | 13387.5 | 0.35 | In-store |
| Foot Locker | Northeast | New York | New York | Men’s Apparel | 60 | 900 | 54000 | 16200.0 | 0.30 | In-store |
| Foot Locker | Northeast | New York | New York | Women’s Apparel | 50 | 1000 | 50000 | 12500.0 | 0.25 | In-store |
#Nombres de las variables:
library(dplyr)
names(DatosCaso1)
## [1] "distribuidor" "region" "estado"
## [4] "ciudad" "producto" "precio_unidad"
## [7] "unidades_vendidas" "ventas_total" "utilidad_operativa"
## [10] "margen_operativo" "metodo_venta"
#Resumen estadísditco de las variables:
summary(DatosCaso1)
## distribuidor region estado ciudad
## Length:9648 Length:9648 Length:9648 Length:9648
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
## producto precio_unidad unidades_vendidas ventas_total
## Length:9648 Min. : 7.00 Min. : 0.0 Min. : 0
## Class :character 1st Qu.: 35.00 1st Qu.: 106.0 1st Qu.: 4065
## Mode :character Median : 45.00 Median : 176.0 Median : 7804
## Mean : 45.22 Mean : 256.9 Mean :12455
## 3rd Qu.: 55.00 3rd Qu.: 350.0 3rd Qu.:15864
## Max. :110.00 Max. :1275.0 Max. :82500
## utilidad_operativa margen_operativo metodo_venta
## Min. : 0 Min. :0.100 Length:9648
## 1st Qu.: 1753 1st Qu.:0.350 Class :character
## Median : 3263 Median :0.410 Mode :character
## Mean : 4895 Mean :0.423
## 3rd Qu.: 6192 3rd Qu.:0.490
## Max. :39000 Max. :0.800
ventas_stats <- DatosCaso1 %>%
summarise(
Media_Ventas = mean(ventas_total),
Mediana_Ventas = median(ventas_total),
SD_Ventas = sd(ventas_total),
Min_Ventas = min(ventas_total),
Max_Ventas = max(ventas_total),
Media_Unidades = mean(unidades_vendidas),
Mediana_Unidades = median(unidades_vendidas),
SD_Unidades = sd(unidades_vendidas)
)
ventas_stats
| Media_Ventas | Mediana_Ventas | SD_Ventas | Min_Ventas | Max_Ventas | Media_Unidades | Mediana_Unidades | SD_Unidades |
|---|---|---|---|---|---|---|---|
| 12455.08 | 7803.5 | 12716.39 | 0 | 82500 | 256.93 | 176 | 214.252 |
En el caso de las ventas, la media es de 12.455,08 mientras que la mediana es de 7.803,5, lo que evidencia una asimetría positiva. Esto significa que existen algunas ventas muy altas que elevan el promedio general. Además, la desviación estándar (12.716,39) es bastante alta, incluso mayor que la mediana, lo que indica una gran variabilidad en los ingresos, no hay una estabilidad. El valor mínimo de 0 y el máximo de 82.500 muestran que hay operaciones muy pequeñas o nulas y otras de gran magnitud. En general, esto sugiere que las ventas no son homogéneas y que posiblemente una parte importante de los ingresos se concentra en pocas transacciones de alto valor.
Respecto a las unidades vendidas, la media es de 256,93 y la mediana de 176, lo que nuevamente indica una distribución sesgada hacia la derecha. Esto significa que aunque la mayoría de los pedidos son moderados, existen algunos con volúmenes altos que incrementan el promedio. La desviación estándar de 214,25 confirma que hay una variabilidad considerable en las cantidades vendidas. Esto refleja que la empresa maneja diferentes tipos de clientes, desde pequeños hasta grandes compradores, lo que impacta directamente la estabilidad y el comportamiento de las ventas.
Ahora lo analizaremos por región:
ventas_region <- DatosCaso1 %>%
group_by(region) %>%
summarise(
Ventas_Totales = sum(ventas_total),
Promedio_Ventas = mean(ventas_total)
)
ventas_region
| region | Ventas_Totales | Promedio_Ventas |
|---|---|---|
| Midwest | 16674434 | 8907.283 |
| Northeast | 25078267 | 10554.826 |
| South | 20603356 | 11923.238 |
| Southeast | 21374436 | 17462.775 |
| West | 36436157 | 14884.051 |
Se puede evidenciar como Southeast tiene el mayor promedio de venta de la región, seguido de West que tiene mayor de ventas totales.
ventas_region_detalle <- DatosCaso1 %>%
group_by(region) %>%
summarise(
Ventas_Totales = sum(ventas_total),
Promedio_Ventas = mean(ventas_total),
Total_Unidades = sum(unidades_vendidas),
Promedio_Unidades = mean(unidades_vendidas),
Numero_Transacciones = n()
) %>%
arrange(desc(Ventas_Totales))
kable(ventas_region_detalle, digits = 2, caption = "Resumen de Ventas y Unidades por Región") %>%
kable_styling(bootstrap_options = c("striped","hover","condensed"))
| region | Ventas_Totales | Promedio_Ventas | Total_Unidades | Promedio_Unidades | Numero_Transacciones |
|---|---|---|---|---|---|
| West | 36436157 | 14884.05 | 686985 | 280.63 | 2448 |
| Northeast | 25078267 | 10554.83 | 501279 | 210.98 | 2376 |
| Southeast | 21374436 | 17462.77 | 407000 | 332.52 | 1224 |
| South | 20603356 | 11923.24 | 492260 | 284.87 | 1728 |
| Midwest | 16674434 | 8907.28 | 391337 | 209.05 | 1872 |
Adidas debe mantener la inversión con mayor fuerza en West, ya que se evidencia su alto volumen y facturación. Tambien deben reforzar fidelización y analizar sus canales, promociones, oferta de productos, etc; para asi ser llevado al resto de regiones como Midwest.
#Ventas Totales por region
ggplot(ventas_region_detalle, aes(x = reorder(region, -Ventas_Totales),
y = Ventas_Totales)) +
geom_bar(stat = "identity", fill = "steelblue") +
theme_minimal() +
labs(title = "Ventas Totales por Region",
x = "Region",
y = "Ventas Totales")
La mayor cantidad de ventas se ven en West
# Diagrama de cajas"
ggplot(DatosCaso1, aes(x = region, y = ventas_total)) +
geom_boxplot(fill = "green") +
theme_minimal() +
labs(title = "Distribucion de Ventas por Region",
x = "Region",
y = "Ventas Totales")
El diagrama muestra que Southeast tiene la mediana de ventas más alta, lo que indica que, en promedio, sus transacciones son mayores frente a las demás regiones. Además, presenta mayor dispersión, lo que refleja variabilidad en los montos vendidos y la presencia de operaciones de alto valor.
La región West también presenta un buen nivel de ventas, aunque con menor variabilidad que Southeast, lo que sugiere un comportamiento fuerte pero más estable. En contraste, Midwest y Northeast tienen medianas más bajas y menor dispersión, lo que indica ventas más homogéneas pero de menor magnitud.
En todas las regiones se observan valores atípicos altos, confirmando que existen ventas extraordinarias que influyen significativamente en los ingresos totales.
#Histrograma de ventas
ggplot(DatosCaso1, aes(x = ventas_total)) +
geom_histogram(bins = 30, fill = "orange") +
theme_minimal() +
labs(title = "Distribución de Ventas Totales",
x = "Ventas",
y = "Frecuencia")
El histograma muestra una distribución claramente asimétrica positiva (sesgada a la derecha). La mayor concentración de ventas se encuentra en los rangos bajos y medios, principalmente por debajo de los 15.000–20.000, lo que indica que la mayoría de las transacciones son de monto moderado.
Sin embargo, se observa una cola larga hacia la derecha que llega hasta valores cercanos a 80.000. Esto confirma la existencia de ventas extraordinarias que elevan el promedio general, pero que no representan el comportamiento típico de la mayoría de las operaciones.
En términos prácticos, esto significa que Adidas tiene muchas ventas pequeñas y medianas, y pocas ventas muy grandes que generan una parte importante de los ingresos. Esto refuerza la idea de concentración de ingresos y alta variabilidad en el comportamiento comercial.
#Relacion Unidades - Ventas
ggplot(DatosCaso1, aes(x = unidades_vendidas, y = ventas_total)) +
geom_point(alpha = 0.6, color = "purple") +
geom_smooth(method = "lm", se = FALSE, color = "red") +
theme_minimal() +
labs(title = "Relación entre Unidades Vendidas y Ventas Totales",
x = "Unidades Vendidas",
y = "Ventas Totales")
El diagrama evidencia una relación positiva clara entre ambas variables. A medida que aumentan las unidades vendidas, también se incrementan las ventas totales. Esto se observa en la tendencia ascendente de los puntos y en la línea de regresión, lo que indica que el volumen de productos vendidos es un factor determinante en los ingresos de la empresa.
También se observa que la mayor concentración de datos está en los niveles bajos y medios de unidades vendidas, aproximadamente entre 0 y 300 unidades, donde las ventas se mantienen relativamente moderadas. Sin embargo, a medida que aumentan las unidades, la dispersión de los puntos también crece, lo que sugiere que para volúmenes altos de venta pueden existir diferencias en precios, descuentos o tipos de productos vendidos.
En general, el gráfico confirma que existe una relación directa entre cantidad vendida e ingresos, aunque con cierta variabilidad en los niveles más altos de unidades, lo que puede indicar estrategias comerciales diferentes según el volumen de compra.
#Relacion Ventas - Utilidad operativa
ggplot(DatosCaso1, aes(x = ventas_total, y = utilidad_operativa)) +
geom_point(alpha = 0.6, color = "purple") +
geom_smooth(method = "lm", se = FALSE, color = "red") +
theme_minimal() +
labs(title = "Relación entre Ventas Totales y Utilidad Operativa",
x = "Ventas Totales",
y = "Ventas utilidad Operativa")
Se observa una relación positiva clara entre ambas variables: a medida que aumentan las ventas totales, también aumenta la utilidad operativa. Esto se evidencia en la tendencia ascendente de los puntos y en la línea de regresión, lo que indica que mayores niveles de ventas generalmente generan mayores ganancias para la empresa.
Además, la mayor concentración de datos se encuentra en niveles bajos y medios de ventas, lo que sugiere que la mayoría de las operaciones de la empresa se ubican en esos rangos. A medida que las ventas crecen, también aumenta la dispersión de los puntos, lo que puede indicar diferencias en costos, márgenes o estrategias comerciales que afectan la utilidad obtenida en cada operación.
Al comparar ambos gráficos de la empresa Adidas se puede observar una relación lógica entre las tres variables: unidades vendidas, ventas totales y utilidad operativa.
En el primer gráfico se evidenció que a mayor número de unidades vendidas, mayores son las ventas totales, lo que indica que el volumen de productos comercializados influye directamente en los ingresos de la empresa. Posteriormente, en el segundo gráfico se observa que a mayores ventas totales, mayor es la utilidad operativa, mostrando que el crecimiento en ingresos también se refleja en mayores ganancias.
En conjunto, ambos gráficos sugieren una cadena de relación: cuando aumentan las unidades vendidas, aumentan las ventas totales y, en consecuencia, también se incrementa la utilidad operativa. Sin embargo, la dispersión presente en los puntos indica que no todas las ventas generan el mismo nivel de utilidad, lo que puede estar relacionado con diferencias en costos, precios o márgenes en las distintas operaciones.
#Matriz Correlación
correlacion <- DatosCaso1 %>%
select(ventas_total, unidades_vendidas, utilidad_operativa) %>%
cor()
kable(correlacion, digits = 2, caption = "Matriz de Correlación")
| ventas_total | unidades_vendidas | utilidad_operativa | |
|---|---|---|---|
| ventas_total | 1.00 | 0.92 | 0.94 |
| unidades_vendidas | 0.92 | 1.00 | 0.87 |
| utilidad_operativa | 0.94 | 0.87 | 1.00 |
# Relación entre precio y unidades vendidas
ggplot(DatosCaso1, aes(x = precio_unidad,
y = unidades_vendidas))+
geom_point(alpha = 0.6, color = "red") +
geom_smooth(method = "lm", se = FALSE, color = "black") +
theme_minimal() +
labs(title = "Precio vs Unidades Vendidas")
En el gráfico se identifica una relación positiva leve entre el precio por unidad y las unidades vendidas, lo cual se evidencia en la pendiente ascendente de la línea de regresión. Esto indica que, en promedio, cuando el precio del producto aumenta también se observa un ligero incremento en la cantidad de unidades vendidas. No obstante, esta relación no es muy fuerte, ya que los puntos del gráfico se encuentran bastante dispersos alrededor de la línea de tendencia, lo que refleja una variabilidad considerable en los datos.
Además, se observa una concentración vertical de puntos en ciertos niveles de precio, lo que sugiere que existen muchos registros con el mismo precio pero con diferentes cantidades vendidas. Este comportamiento suele presentarse cuando la empresa, en este caso Adidas, maneja precios estandarizados dentro de su estrategia comercial. Mientras el precio se mantiene fijo en ciertos niveles, la cantidad vendida puede variar debido a otros factores como la demanda, promociones, ubicación del punto de venta, estacionalidad o condiciones del mercado.
#Analisis por Producto
ventas_producto <- DatosCaso1 %>%
group_by(producto) %>%
summarise(Ventas = sum(ventas_total, na.rm = TRUE)) %>%
ungroup()
ventas_producto <- ventas_producto %>%
mutate(Participacion = Ventas / sum(Ventas) * 100)
ventas_producto
| producto | Ventas | Participacion |
|---|---|---|
| Men’s Apparel | 16520632 | 13.74810 |
| Men’s Athletic Footwear | 20577180 | 17.12387 |
| Men’s Street Footwear | 27680769 | 23.03532 |
| Women’s Apparel | 23870985 | 19.86490 |
| Women’s Athletic Footwear | 14315521 | 11.91306 |
| Women’s Street Footwear | 17201563 | 14.31476 |
Se muestran las categorias con mayor participacion en ventas de la marca
library(dplyr)
combo_prod_region <- DatosCaso1 %>%
group_by(producto, region) %>%
summarise(Ventas = sum(ventas_total, na.rm = TRUE)) %>%
ungroup()
top10_combo <- combo_prod_region %>%
arrange(desc(Ventas)) %>%
slice_head(n = 10)
#Top 10 mejores combinaciones producto-region
library(ggplot2)
library(scales)
ggplot(top10_combo,
aes(x = reorder(paste(producto, region, sep = " - "), Ventas),
y = Ventas)) +
geom_col(fill = "blue") +
coord_flip() +
scale_y_continuous(labels = label_number(scale = 1e-6, suffix = " M")) +
theme_minimal() +
labs(title = "Top 10 Combinaciones Producto - Región",
x = "Producto - Región",
y = "Ventas (Millones)")
library(dplyr)
library(ggplot2)
library(scales)
# Crear dataset Producto + Región
prod_region_margen <- DatosCaso1 %>%
group_by(producto, region) %>%
summarise(
Ventas = sum(ventas_total, na.rm = TRUE),
Margen = mean(margen_operativo, na.rm = TRUE),
Unidades = sum(unidades_vendidas, na.rm = TRUE)
) %>%
ungroup()
# Gráfico de burbujas
ggplot(prod_region_margen,
aes(x = Ventas,
y = Margen,
size = Unidades,
color = producto)) +
geom_point(alpha = 0.7) +
scale_size_continuous(range = c(4,15)) +
scale_x_continuous(labels = label_number(scale = 1e-6, suffix = " M")) +
scale_color_brewer(palette = "YlGnBu") +
theme_minimal() +
labs(title = "Relación entre Ventas, Margen Operativo y Unidades por Producto y Región",
subtitle = "Tamaño Burbuja = volumen de unidades vendidas",
x = "Ventas Totales (Millones)",
y = "Margen Operativo Promedio",
size = "Unidades vendidas",
color = "Producto")
En general, se observa que los mayores volúmenes de ventas (burbujas más grandes) se concentran entre 4 y 7 millones en ventas, con márgenes operativos aproximadamente entre 0.40 y 0.46. Esto sugiere que los productos con mayor demanda mantienen márgenes relativamente estables, lo que podría indicar una estrategia donde se prioriza el volumen de ventas manteniendo rentabilidad moderada.
También se identifican algunos puntos con márgenes operativos más altos (cercanos a 0.50 o superiores), pero con niveles de ventas más moderados. Esto puede indicar productos con mayor rentabilidad por unidad, aunque no necesariamente con el mayor volumen de mercado.
Por otro lado, existen casos con ventas altas pero márgenes más bajos (alrededor de 0.34–0.37), lo que sugiere que algunos productos logran gran volumen de comercialización sacrificando parte del margen, posiblemente por estrategias de precios competitivos o promociones.
En conjunto, el gráfico indica que dentro del portafolio de productos de la empresa existe un equilibrio entre volumen de ventas y rentabilidad, donde algunos productos destacan por su margen y otros por su capacidad de generar mayores niveles de ventas. Esto refleja una estrategia diversificada que busca mantener tanto participación de mercado como rentabilidad.
A partir del análisis de los graficos y de los datos relacionados con ventas totales, unidades vendidas, precios y márgenes operativos de Adidas, es posible establecer algunas conclusiones que permiten orientar la analítica prescriptiva, es decir, recomendaciones concretas para la toma de decisiones estratégicas.
En primer lugar, los resultados evidencian que ciertos productos presentan un equilibrio favorable entre ventas, margen operativo y volumen de unidades vendidas. En particular, categorías como el calzado deportivo y urbano muestran una presencia relevante en los niveles más altos de ventas. Esto sugiere que la empresa debería priorizar la inversión en estas líneas de producto, fortaleciendo la disponibilidad de inventario, las campañas de marketing y la distribución en las regiones donde estos artículos muestran mayor demanda. Mantener un enfoque estratégico en los productos con mejor desempeño permitirá maximizar tanto los ingresos como la rentabilidad.
En segundo lugar, el análisis del gráfico de burbujas muestra que los mayores volúmenes de ventas suelen concentrarse en márgenes operativos intermedios, lo que indica que el crecimiento en ventas frecuentemente está asociado a estrategias de precios competitivos. Desde una perspectiva prescriptiva, la empresa podría optimizar su estrategia de precios, identificando aquellos productos que podrían soportar un leve aumento en el precio sin afectar significativamente la demanda. De esta forma se podría mejorar el margen operativo sin sacrificar volumen de ventas.
Asimismo, el análisis de la relación entre precio por unidad y unidades vendidas sugiere que la relación positiva observada es relativamente débil, lo que indica que la cantidad vendida no depende exclusivamente del precio. Factores como promociones, posicionamiento del producto, ubicación de las tiendas o estrategias comerciales influyen considerablemente en el comportamiento de la demanda. Por ello, se recomienda que la empresa integre análisis adicionales sobre campañas promocionales, estacionalidad y comportamiento regional, con el fin de identificar qué variables impulsan realmente las ventas y diseñar estrategias más precisas.
Por otro lado, la presencia de concentraciones verticales de precios en el gráfico sugiere que los productos suelen comercializarse en niveles de precio estandarizados. Esto indica que existe una estrategia de precios relativamente fija dentro de la compañía. A partir de este hallazgo, se recomienda evaluar la implementación de estrategias de precios más dinámicas, como ajustes según la demanda, promociones temporales o segmentación de precios por región o canal de venta, lo que podría aumentar la competitividad en determinados mercados.
Finalmente, el análisis general de los datos también revela casos con niveles de ventas significativamente superiores al promedio, lo que sugiere que ciertas combinaciones de producto, región o canal generan resultados especialmente positivos. Desde un enfoque prescriptivo, sería recomendable profundizar en estos casos de alto rendimiento mediante análisis más detallados que permitan identificar los factores que impulsan esas ventas. Replicar estas estrategias en otros productos o mercados podría contribuir a incrementar el desempeño global de la empresa.
En conjunto, estas recomendaciones apuntan a que la empresa fortalezca los productos más rentables, optimice su estrategia de precios, profundice en el análisis de los factores que influyen en la demanda y replique las prácticas comerciales que han demostrado generar los mejores resultados. De esta manera, Adidas podría mejorar su eficiencia comercial y consolidar un crecimiento sostenible en sus ventas y rentabilidad.