library(readxl)
## Warning: package 'readxl' was built under R version 4.4.3
data <- read_excel("C:/Users/Adriana Motta/Documents/R/shopping_trends.xlsx")
category_colors <- c(
"Accessories" = "#2CA25F", # Verde
"Clothing" = "#F58634", # Naranja
"Footwear" = "#8E6CC3", # Morado
"Outerwear" = "#F72585" # Rosa intenso
)
freq_category <- table(data$Category)
freq_gender <- table(data$Gender)
freq_season <- table(data$Season)
freq_payment <- table(data$`Payment Method`)
freq_shipping <- table(data$`Shipping Type`)
print("Frecuencia por Categoría")
## [1] "Frecuencia por Categoría"
print(freq_category)
##
## Accessories Clothing Footwear Outerwear
## 1240 1737 599 324
print("Frecuencia por Género")
## [1] "Frecuencia por Género"
print(freq_gender)
##
## Female Male
## 1248 2652
print("Frecuencia por Temporada")
## [1] "Frecuencia por Temporada"
print(freq_season)
##
## Fall Spring Summer Winter
## 975 999 955 971
print("Frecuencia por Método de Pago")
## [1] "Frecuencia por Método de Pago"
print(freq_payment)
##
## Bank Transfer Cash Credit Card Debit Card PayPal
## 632 648 696 633 638
## Venmo
## 653
print("Frecuencia por Tipo de Envío")
## [1] "Frecuencia por Tipo de Envío"
print(freq_shipping)
##
## 2-Day Shipping Express Free Shipping Next Day Air Standard
## 627 646 675 648 654
## Store Pickup
## 650
library(ggplot2)
ggplot(data, aes(x = Category, fill = Category)) +
geom_bar() +
# Asignamos la paleta de colores
scale_fill_manual(values = category_colors) +
theme_minimal() +
labs(
title = "Distribución de Categorías",
x = "Categorías",
y = "Frecuencia"
)
## Interpretación:
Ropa y Accesorios dominan el conjunto de datos, lo que sugiere una alta preferencia de los clientes. Esto indica que estas dos categorías tienen mayor representación en las compras, lo cual sugiere que los clientes prefieren estos productos o que la empresa tiene una oferta más amplia de los mismos.
Calzado y Ropa de Calle tienen menor participación, representando una oportunidad para estrategias de marketing dirigidas. Estas categorías podrían beneficiarse de campañas de publicidad específicas o de descuentos para incentivar las compras. Y, también puede ser útil analizar por qué estas categorías tienen menos participación: ¿es por falta de interés del cliente, menor oferta, o limitaciones de marketing?
Existe un desbalance que puede aumentar el riesgo si no se diversifican las ventas. Es recomendable diversificar las estrategias de marketing y buscar equilibrar las ventas promoviendo las categorías con menor frecuencia.
Es crucial monitorear tendencias emergentes para ajustar estrategias comerciales y optimizar el inventario. Es importante monitorear estas tendencias para anticipar cambios en las preferencias de los clientes. Además, si una categoría está ganando popularidad, se podrían reforzar campañas publicitarias o expandir la oferta en esas áreas.
ggplot(data, aes(x = `Purchase Amount (USD)`, fill = Category)) +
geom_histogram(binwidth = 10, alpha = 0.7, position = "identity") +
scale_fill_manual(values = category_colors) +
theme_minimal() +
labs(
title = "Distribución del monto de compra por categoría",
x = "Monto de compra (USD)",
y = "Frecuencia"
)
## 1.Comportamiento por categoria.
Es la categoría dominante en casi todos los rangos de precios.
Tiene una frecuencia alta en montos de 25 a 100 USD, destacando como la segunda categoría más importante.
Presenta una frecuencia constante pero menor en comparación con Ropa y Accesorios.
Está distribuido de manera homogénea a lo largo de todos los montos, lo que indica una oferta variada en diferentes precios.
Es la categoría con menor frecuencia en todos los rangos.
Su presencia es más notable en montos bajos (25-50 USD), lo que sugiere que estos productos tienden a ser más económicos o menos demandados.
Existe una distribución amplia y equilibrada, lo que indica que los clientes realizan compras en diversos rangos de precios sin una preferencia marcada por montos bajos o altos.
La presencia de todas las categorías en los diferentes rangos sugiere una oferta variada, aunque la ropa tiene un claro liderazgo en volumen de ventas.
Es importante notar que no hay una concentración extrema en ningún rango específico, lo que implica que las compras están diversificadas.
ggplot(data, aes(x = Season, y = `Purchase Amount (USD)`, fill = Season)) +
geom_boxplot() +
# Podemos reutilizar la misma paleta o definir otra para las temporadas
scale_fill_manual(values = c("Winter" = "#F58634",
"Spring" = "#2CA25F",
"Summer" = "#8E6CC3",
"Fall" = "#F72585")) +
theme_minimal() +
labs(
title = "Distribución del monto de compra según la temporada",
x = "Temporada",
y = "Monto de compra (USD)"
)
La mediana (línea negra dentro de cada caja) de las cuatro estaciones parece estar a un nivel similar, lo que indica que el gasto medio en compras no varía significativamente entre temporadas.
La caja representa el rango intercuartílico (Q1 a Q3), y este también es similar entre las estaciones.
Los valores de compra oscilan entre aproximadamente 20 y 100 USD.
Las cajas muestran que el 50% central de los datos se encuentra en un rango similar en todas las estaciones.
La longitud de los bigotes sugiere que la dispersión de los datos es relativamente uniforme en todas las estaciones.
No se observan valores atípicos (outliers), lo que indica que no hay compras extremadamente altas o bajas en comparación con la distribución general.
No hay una variación significativa en el gasto de compra según la temporada.
La distribución de los datos es bastante homogénea, lo que sugiere que el monto de compra no está influenciado por la estación del año.
heatmap_data <- as.data.frame(table(data$Category, data$Gender))
names(heatmap_data) <- c("Category", "Gender", "n")
ggplot(heatmap_data, aes(x = Category, y = Gender, fill = n)) +
geom_tile() +
scale_fill_gradient(low = "#DCEECF", high = "#084081") +
theme_minimal() +
labs(
title = "Frecuencia entre categoría y género",
x = "Categoría",
y = "Género",
fill = "Frecuencia"
)
Este mapa de calor representa la frecuencia de compras en función de dos variables: Categoría de producto (Accessories, Clothing, Footwear, Outerwear) y Género (Male, Female).
Colores más oscuros (morados) representan una frecuencia más alta.
Colores más claros (rosas) indican una frecuencia más baja.
Es la categoría con la mayor frecuencia de compras, especialmente por el género masculino (Male), ya que es el cuadrante con el color más oscuro.
El género femenino (Female) también tiene una alta participación, aunque ligeramente inferior al masculino.
Interpretación: La ropa es la categoría más popular, con una mayor demanda por parte de los hombres.
Tiene una frecuencia intermedia y está equilibrada entre hombres y mujeres (ambos cuadrantes tienen una tonalidad similar).
Interpretación: Los accesorios tienen una distribución pareja entre ambos géneros, sin una preferencia marcada por algún grupo.
Esta categoría presenta una frecuencia moderada, con una participación similar entre hombres y mujeres.
Interpretación: El calzado tiene una demanda estable en ambos géneros, sin diferencias significativas en las preferencias de compra.
Es la categoría con menor frecuencia de compras, ya que ambos cuadrantes tienen el color más claro del gráfico.
Interpretación: La ropa de calle es menos popular en comparación con las otras categorías, y no se observan grandes diferencias entre géneros.
Ropa (Clothing) es la categoría más demandada, con una ligera preferencia masculina.
Accesorios (Accessories) y Calzado (Footwear) tienen una frecuencia moderada y una distribución equilibrada entre ambos géneros.
Ropa de Calle (Outerwear) es la categoría con la menor popularidad, mostrando baja demanda en general.
Este gráfico ayuda a identificar preferencias de compra por género, lo que puede ser útil para estrategias de marketing personalizadas y gestión de inventario.
ggplot(data, aes(x = Age, y = `Purchase Amount (USD)`, color = Category)) +
geom_point(alpha = 0.7) +
# Asignamos la misma paleta de colores para Category
scale_color_manual(values = category_colors) +
theme_minimal() +
labs(
title = "Relación entre edad y monto de compra",
x = "Edad",
y = "Monto de compra (USD)"
)
Este gráfico de dispersión muestra la relación entre la edad de los clientes (en el eje x) y el monto de compra en USD (en el eje y), diferenciando las categorías de producto mediante colores distintos.
El monto de compra se encuentra distribuido de manera uniforme entre los 20 y 100 USD a lo largo de todas las edades.
No se observa una tendencia clara de que las personas más jóvenes o mayores gasten significativamente más o menos.
El rango de edades abarca desde 20 hasta 70 años, con una distribución homogénea en todas las categorías.
No hay un grupo etario que destaque por realizar más compras que otro.
Es la categoría más representada en todas las edades y rangos de compra (se observa una gran densidad de puntos de color rosa).
Esto indica que la ropa es popular y tiene una alta demanda constante en todas las edades.
Tiene una presencia considerable, aunque ligeramente menor que la ropa, y está distribuida de manera homogénea en todo el rango de edades.
No hay un grupo etario dominante, lo que sugiere que los accesorios tienen atracción generalizada.
Estas dos categorías aparecen con menor frecuencia (menos puntos de color verde y naranja).
Los clientes de todas las edades compran estas categorías, pero no son las más populares en comparación con ropa y accesorios.
No existe una relación evidente entre la edad y el monto de compra, lo que sugiere que todos los grupos de edad tienen un comportamiento de gasto similar.
La ropa (Clothing) es la categoría más popular en todas las edades, seguida por los accesorios (Accessories).
Las categorías Footwear y Outerwear tienen menor frecuencia de compra, pero están distribuidas uniformemente entre todos los grupos de edad.
Este análisis indica una demanda constante en diversas categorías sin importar la edad, lo que sugiere oportunidades para estrategias de marketing dirigidas a audiencias amplias.