Adidas es una de las marcas más reconocidas en el mundo en el sector de productos deportivos. Fue fundada en 1949 en Alemania y hoy está presente en más de 160 países, ofreciendo calzado, ropa y accesorios para diferentes actividades deportivas. Gracias a su innovación constante, campañas de mercadeo y compromiso con la sostenibilidad, se ha posicionado como una de las empresas líderes en su industria.
Analizar la información financiera de Adidas permite conocer cómo ha sido su desempeño en el mercado, ver cómo ha cambiado con el tiempo y entender qué factores han influido en sus resultados. En este trabajo, se realizará un análisis de algunos datos financieros importantes de la empresa, usando la herramienta R. Se aplicarán métodos básicos de estadística y gráficos para observar comportamientos, identificar posibles irregularidades y entender mejor cómo ha evolucionado la compañía.
El objetivo de este análisis es ofrecer una visión más clara de la situación económica de Adidas en Estados Unidos, lo cual puede ser útil para inversionistas, personas interesadas en el mundo financiero y quienes estudian el comportamiento de grandes empresas a nivel global.
El análisis exploratorio de datos (EDA) es un paso clave para comprender la información financiera de Adidas, identificar patrones y evaluar la distribución de las variables.
A través de estadísticas descriptivas y visualización de datos con R, identificaremos tendencias, relaciones entre variables y posibles anomalías, proporcionando una base sólida para interpretar el desempeño financiero de Adidas en Estados Unidos.
PASO 1. Instalar y cargar librerias
# Cargar librerías necesarias
library(readxl)
library(dplyr)
library(ggplot2)
library(plotly)
library(knitr)
library(kableExtra)
library(tidyr)
library(RecordLinkage)
library(leaflet)
library(htmltools)
library(readxl)
adidas <- read_excel("E:/Analítica de Negocios/Adidas/Adidas.xlsx")
#Generar una secuencia de números desde 1 hasta el número total de filas y grega esta secuencia a la tabla como una nueva columna.
id=1:dim(adidas)[1]
adidas=data.frame(id,adidas)
# **Análisis de Rentabilidad**
## Estadísticas descriptivas del margen operativo
adidas %>%
summarise(
promedio_margen = mean(operating_margin, na.rm = TRUE),
mediana_margen = median(operating_margin, na.rm = TRUE),
min_margen = min(operating_margin, na.rm = TRUE),
max_margen = max(operating_margin, na.rm = TRUE),
sd_margen = sd(operating_margin, na.rm = TRUE)
) %>%
kable(caption = "Estadísticas del Margen Operativo")
| promedio_margen | mediana_margen | min_margen | max_margen | sd_margen |
|---|---|---|---|---|
| 0.4229913 | 0.41 | 0.1 | 0.8 | 0.0971974 |
## Histograma del margen operativo
ggplotly(
ggplot(adidas, aes(x = operating_margin)) +
geom_histogram(fill = "skyblue", color = "black", binwidth = 0.05) +
labs(title = "Distribución del Margen Operativo", x = "Margen", y = "Frecuencia") +
theme_minimal()
)
Interpretación Distribución del Margen Operativo
La mayoría de los productos de Adidas tienen márgenes de ganancia en un rango considerado bueno, existiendo mayor concentración de en un margen de 0.4, lo que indica que la empresa maneja bien sus precios y costos en general. Sin embargo, hay algunos casos con márgenes muy bajos que vale la pena revisar para entender qué los causa y ver si se pueden mejorar. También es recomendable comparar los márgenes entre regiones, productos o canales de venta para identificar áreas con mayor potencial de crecimiento.
## Boxplot del margen operativo
ggplotly(
ggplot(adidas, aes(y = operating_margin)) +
geom_boxplot(fill = "lightgreen", outlier.colour = "red") +
labs(title = "Boxplot del Margen Operativo", y = "Margen") +
theme_minimal()
)
Interpretación Boxplot del Margen Operativo
El boxplot del margen operativo muestra que la mayoría de los márgenes de ganancia de los productos de Adidas están agrupados en un rango considerado positivo de 0.35 y 0.49, aunque existen algunos casos con valores muy altos o bajos (los puntos fuera de la “caja”), que representan situaciones menos comunes. Esto indica que la empresa generalmente mantiene buenos resultados en sus operaciones, pero sería recomendable revisar los casos fuera del rango normal para identificar si hay oportunidades de mejora o riesgos a atender.
#EFICIENCIA EN VENTAS
# Crear precios agrupados (bins)
adidas_line <- adidas %>%
mutate(
precio_cat = cut(price_per_unit, breaks = pretty(price_per_unit, n = 6), include.lowest = TRUE)
) %>%
group_by(precio_cat) %>%
summarise(
total_unidades_vendidas = sum(units_sold, na.rm = TRUE)
)
# Gráfico de línea interactivo del total vendido por rango de precio
ggplotly(
ggplot(adidas_line, aes(x = precio_cat, y = total_unidades_vendidas, group = 1)) +
geom_line(color = "seagreen", size = 1) +
geom_point(color = "seagreen", size = 3) +
labs(
title = "Total de Unidades Vendidas según Rangos de Precio",
x = "Rango de Precio",
y = "Total Unidades Vendidas"
) +
theme_minimal()
)
Interpretación Total de Unidades Vendidas según Rango de Precios
El gráfico muestra que la mayoría de las unidades vendidas de Adidas se concentran en el rango de precio entre 40 y 60, seguido por el rango de 20 a 40. A medida que el precio sube más allá de 60, las ventas disminuyen notablemente, siendo muy bajas en los rangos más altos (80 a 120). Esto indica que los productos de precio medio son los más populares entre los clientes, mientras que los de precio bajo y alto tienen menos demanda.
library(readxl)
library(dplyr)
df <- read_excel("E:/Analítica de Negocios/Módulo 1/Adidas/Adidas.xlsx")
# Crear el dataframe ventas_region
ventas_region <- df %>%
group_by(Region) %>%
summarise(
total_sales = sum(total_sales, na.rm = TRUE),
units_sold = sum(units_sold, na.rm = TRUE)
)
# Gráfico combinado: barras para ventas y línea para unidades
library(plotly)
library(ggplot2)
colores_region <- c("Midwest" = "#FF9999",
"Northeast" = "#FFDB58",
"South" = "#66CDAA",
"Southeast" = "#87CEEB",
"West" = "#EE82EE")
plot_ly() %>%
add_bars(
data = ventas_region,
x = ~Region,
y = ~total_sales,
name = "Valor venta",
marker = list(color = unname(colores_region[ventas_region$Region]))
) %>%
add_lines(
data = ventas_region,
x = ~Region,
y = ~units_sold,
name = "Unidades vendidas",
yaxis = "y2",
line = list(color = 'black', width = 3)
) %>%
layout(
title = "Ventas y Unidades Vendidas por Región",
xaxis = list(title = "Región"),
yaxis = list(title = "Valor venta"),
yaxis2 = list(
title = "Unidades vendidas",
overlaying = "y",
side = "right"
),
legend = list(x = 0.1, y = 1)
)
Interpretación Ventas y Unidades por Region
El gráfico muestra que la región West lidera tanto en valor de ventas como en unidades vendidas, seguida por Northeast. Las regiones South y Southeast tienen resultados intermedios, mientras que Midwest tiene el menor desempeño en ambos aspectos. Esto confirma que la mayor parte del éxito comercial de Adidas está concentrado en la Costa Oeste, mientras que el Midwest representa el mercado más débil, lo que sugiere que allí hay oportunidades de mejora.
# Librerías necesarias
library(leaflet)
library(dplyr)
# Ejemplo: si tu dataframe de resumen es ventas_region (con columnas Region, total_sales, lat, lng)
# Primero, crea coordenadas representativas para cada región (puedes ajustarlas según tus datos)
ventas_region <- adidas %>%
group_by(Region) %>%
summarise(total_sales = sum(total_sales, na.rm = TRUE)) %>%
mutate(
lat = case_when(
Region == "West" ~ 37.5,
Region == "Midwest" ~ 41.5,
Region == "South" ~ 32,
Region == "Southeast" ~ 34,
Region == "Northeast" ~ 42,
TRUE ~ 39
),
lng = case_when(
Region == "West" ~ -119,
Region == "Midwest" ~ -93,
Region == "South" ~ -95,
Region == "Southeast" ~ -83,
Region == "Northeast" ~ -75,
TRUE ~ -98
)
)
# Mapa interactivo
leaflet(ventas_region) %>%
addTiles() %>%
addCircleMarkers(
~lng, ~lat,
radius = ~sqrt(total_sales) / 200, # Ajusta el divisor para el tamaño de los círculos
color = "blue",
fillOpacity = 0.6,
popup = ~paste0("<b>Región: </b>", Region, "<br><b>Ventas totales: </b>$", formatC(total_sales, big.mark = ",")),
label = ~Region
) %>%
addLegend(
position = "bottomright",
title = "Ventas por región",
colors = "blue",
labels = "Círculo proporcional a ventas"
)
Interpretación Ventas Totales por Región
La mayor parte de las ventas de Adidas en Estados Unidos se concentra en las regiones West y Northeast, donde hay más clientes y mayor poder de compra, mientras que otras zonas como Midwest, South y Southeast venden mucho menos. Por eso, sería útil investigar qué hacen bien en las regiones líderes para aplicar esas ideas en las demás, sobre todo en el Midwest, y analizar cada ciudad para encontrar nuevos lugares con potencial de crecimiento.
# 5. Gráficos exploratorios
library(ggplot2)
# Histograma: Unidades vendidas
ggplot(adidas, aes(x = units_sold)) +
geom_histogram(fill = "steelblue", bins = 30) +
labs(title = "Distribución de Unidades Vendidas", x = "Unidades vendidas", y = "Frecuencia") +
theme_minimal()
Interpretación Distribución de Unidades Vendidas
El gráfico muestra cómo se reparten las cantidades de productos vendidos. Se observa que la mayoría de los productos tienen ventas bajas, es decir, en la mayor parte de los casos se venden pocas unidades de cada producto. A medida que aumenta el número de unidades vendidas, la cantidad de productos que logran ese nivel de ventas va disminuyendo mucho. Solo unos pocos productos llegan a tener ventas muy altas, lo que significa que los “superventas” son una minoría. Esto es normal en la mayoría de las empresas: la mayoría de los productos tienen una demanda moderada o baja, y solo unos pocos son los que realmente sobresalen en ventas.
# Boxplot: Precio por unidad por producto
ggplot(adidas, aes(x = Product, y = price_per_unit, fill = Product)) +
geom_boxplot() +
labs(title = "Precio por unidad según Producto", x = "Producto", y = "Precio por unidad") +
theme_minimal() +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
Interpretación Precio por Unidad Según Producto
El gráfico muestra que el precio por unidad varía bastante entre los diferentes tipos de productos de Adidas. La ropa de mujer tiene los precios más altos en promedio, mientras que el calzado deportivo masculino y femenino suele tener precios más bajos y menos dispersión. Todos los productos presentan algunos casos con precios mucho mayores o menores a lo común (puntos fuera de la “caja”)
# Dispersión: Unidades vendidas vs total de ventas, coloreado por región
ggplot(adidas, aes(x = units_sold, y = total_sales, color = Region)) +
geom_point(alpha = 0.6) +
labs(title = "Unidades Vendidas vs Total de Ventas por Región", x = "Unidades vendidas", y = "Total de ventas") +
theme_minimal()
Interpretación Unidades Vendida vs Total de Ventas por
Región
El gráfico muestra que, en general, a mayor cantidad de unidades vendidas, mayor es el total de ventas, lo cual es esperado. Además, se observa que las regiones West y Northeast tienden a concentrar los puntos con mayores ventas y más unidades, mientras que el Midwest está más presente en los rangos bajos. Esto confirma que las zonas líderes no solo venden más productos, sino que también logran mayores ingresos, mientras que el Midwest suele tener resultados menores en ambos aspectos.
```
El análisis de las ventas de Adidas muestra que la empresa tiene una operación sólida, siendo las regiones West y Northeast las que más venden y más productos colocan. La mayoría de las ventas dejan buenas ganancias, aunque en algunos casos se detectaron márgenes bajos.
El rango de precios más exitoso está entre 40 y 60 unidades monetarias, donde se vende la mayor cantidad de productos. Los artículos más costosos se venden menos, pero pueden ser útiles para mantener una imagen de marca exclusiva.
Por otro lado, hay regiones como Midwest que tienen menos ventas y unidades, por lo que sería recomendable enfocar más esfuerzos y estrategias en esas zonas para mejorar los resultados.
En resumen, es clave seguir analizando y comparando los resultados por región, producto y canal de venta para aprovechar las oportunidades, evitar riesgos y asegurar que la empresa siga siendo rentable y competitiva en el futuro