Base de datos

library(readxl)
## Warning: package 'readxl' was built under R version 4.4.3
data <- read_excel("C:/Users/Adriana Motta/Documents/R/shopping_trends.xlsx")

Paleta de colores

category_colors <- c(
  "Accessories" = "#2CA25F",  # Verde
  "Clothing"    = "#F58634",  # Naranja
  "Footwear"    = "#8E6CC3",  # Morado
  "Outerwear"   = "#F72585"   # Rosa intenso
)

Generar tablas de frecuencia

freq_category <- table(data$Category)
freq_gender <- table(data$Gender)
freq_season <- table(data$Season)
freq_payment <- table(data$`Payment Method`)
freq_shipping <- table(data$`Shipping Type`)

Mostrar las tablas de frecuencia

print("Frecuencia por Categoría")
## [1] "Frecuencia por Categoría"
print(freq_category)
## 
## Accessories    Clothing    Footwear   Outerwear 
##        1240        1737         599         324
print("Frecuencia por Género")
## [1] "Frecuencia por Género"
print(freq_gender)
## 
## Female   Male 
##   1248   2652
print("Frecuencia por Temporada")
## [1] "Frecuencia por Temporada"
print(freq_season)
## 
##   Fall Spring Summer Winter 
##    975    999    955    971
print("Frecuencia por Método de Pago")
## [1] "Frecuencia por Método de Pago"
print(freq_payment)
## 
## Bank Transfer          Cash   Credit Card    Debit Card        PayPal 
##           632           648           696           633           638 
##         Venmo 
##           653
print("Frecuencia por Tipo de Envío")
## [1] "Frecuencia por Tipo de Envío"
print(freq_shipping)
## 
## 2-Day Shipping        Express  Free Shipping   Next Day Air       Standard 
##            627            646            675            648            654 
##   Store Pickup 
##            650

1. Diagrama de barras: Preferencia de los clientes por categoría

library(ggplot2)
ggplot(data, aes(x = Category, fill = Category)) +
  geom_bar() +
  # Asignamos la paleta de colores
  scale_fill_manual(values = category_colors) +
  theme_minimal() +
  labs(
    title = "Distribución de Categorías",
    x = "Categorías",
    y = "Frecuencia"
  )

## Interpretación:

Ropa y Accesorios dominan el conjunto de datos, lo que sugiere una alta preferencia de los clientes. Esto indica que estas dos categorías tienen mayor representación en las compras, lo cual sugiere que los clientes prefieren estos productos o que la empresa tiene una oferta más amplia de los mismos.

Calzado y Ropa de Calle tienen menor participación, representando una oportunidad para estrategias de marketing dirigidas. Estas categorías podrían beneficiarse de campañas de publicidad específicas o de descuentos para incentivar las compras. Y, también puede ser útil analizar por qué estas categorías tienen menos participación: ¿es por falta de interés del cliente, menor oferta, o limitaciones de marketing?

Existe un desbalance que puede aumentar el riesgo si no se diversifican las ventas. Es recomendable diversificar las estrategias de marketing y buscar equilibrar las ventas promoviendo las categorías con menor frecuencia.

Es crucial monitorear tendencias emergentes para ajustar estrategias comerciales y optimizar el inventario. Es importante monitorear estas tendencias para anticipar cambios en las preferencias de los clientes. Además, si una categoría está ganando popularidad, se podrían reforzar campañas publicitarias o expandir la oferta en esas áreas.

2. Histograma: Distribución del monto de compra por categoría

ggplot(data, aes(x = `Purchase Amount (USD)`, fill = Category)) +
  geom_histogram(binwidth = 10, alpha = 0.7, position = "identity") +
  scale_fill_manual(values = category_colors) +
  theme_minimal() +
  labs(
    title = "Distribución del monto de compra por categoría",
    x = "Monto de compra (USD)",
    y = "Frecuencia"
  )

## 1.Comportamiento por categoria.

Clothing (Ropa):

Es la categoría dominante en casi todos los rangos de precios.

Accessories (Accesorios):

Tiene una frecuencia alta en montos de 25 a 100 USD, destacando como la segunda categoría más importante.

Footwear (Calzado):

Presenta una frecuencia constante pero menor en comparación con Ropa y Accesorios.

Está distribuido de manera homogénea a lo largo de todos los montos, lo que indica una oferta variada en diferentes precios.

Outerwear (Ropa de Calle):

Es la categoría con menor frecuencia en todos los rangos.

Su presencia es más notable en montos bajos (25-50 USD), lo que sugiere que estos productos tienden a ser más económicos o menos demandados.

2.Interpretación de la Distribución de los Montos:

Existe una distribución amplia y equilibrada, lo que indica que los clientes realizan compras en diversos rangos de precios sin una preferencia marcada por montos bajos o altos.

La presencia de todas las categorías en los diferentes rangos sugiere una oferta variada, aunque la ropa tiene un claro liderazgo en volumen de ventas.

Es importante notar que no hay una concentración extrema en ningún rango específico, lo que implica que las compras están diversificadas.

3. Caja de bigotes: Monto de compra según la temporada

ggplot(data, aes(x = Season, y = `Purchase Amount (USD)`, fill = Season)) +
  geom_boxplot() +
  # Podemos reutilizar la misma paleta o definir otra para las temporadas
  scale_fill_manual(values = c("Winter" = "#F58634", 
                               "Spring" = "#2CA25F", 
                               "Summer" = "#8E6CC3",
                               "Fall"   = "#F72585")) +
  theme_minimal() +
  labs(
    title = "Distribución del monto de compra según la temporada",
    x = "Temporada",
    y = "Monto de compra (USD)"
  )

Distribución similar entre estaciones:

La mediana (línea negra dentro de cada caja) de las cuatro estaciones parece estar a un nivel similar, lo que indica que el gasto medio en compras no varía significativamente entre temporadas.

La caja representa el rango intercuartílico (Q1 a Q3), y este también es similar entre las estaciones.

Rango de valores:

Los valores de compra oscilan entre aproximadamente 20 y 100 USD.

Las cajas muestran que el 50% central de los datos se encuentra en un rango similar en todas las estaciones.

Simetría en la dispersión:

La longitud de los bigotes sugiere que la dispersión de los datos es relativamente uniforme en todas las estaciones.

No se observan valores atípicos (outliers), lo que indica que no hay compras extremadamente altas o bajas en comparación con la distribución general.

Conclusión:

No hay una variación significativa en el gasto de compra según la temporada.

La distribución de los datos es bastante homogénea, lo que sugiere que el monto de compra no está influenciado por la estación del año.

5. Mapa de calor: Frecuencia entre categoría y género

heatmap_data <- as.data.frame(table(data$Category, data$Gender))
names(heatmap_data) <- c("Category", "Gender", "n")

ggplot(heatmap_data, aes(x = Category, y = Gender, fill = n)) +
  geom_tile() +
  scale_fill_gradient(low = "#DCEECF", high = "#084081") +
  theme_minimal() +
  labs(
    title = "Frecuencia entre categoría y género",
    x = "Categoría",
    y = "Género",
    fill = "Frecuencia"
  )

Este mapa de calor representa la frecuencia de compras en función de dos variables: Categoría de producto (Accessories, Clothing, Footwear, Outerwear) y Género (Male, Female).

La intensidad del color indica la frecuencia de las compras:

Colores más oscuros (morados) representan una frecuencia más alta.

Colores más claros (rosas) indican una frecuencia más baja.

1.Análisis por categoría y género:

Clothing (Ropa):

Es la categoría con la mayor frecuencia de compras, especialmente por el género masculino (Male), ya que es el cuadrante con el color más oscuro.

El género femenino (Female) también tiene una alta participación, aunque ligeramente inferior al masculino.

Interpretación: La ropa es la categoría más popular, con una mayor demanda por parte de los hombres.

Accessories (Accesorios):

Tiene una frecuencia intermedia y está equilibrada entre hombres y mujeres (ambos cuadrantes tienen una tonalidad similar).

Interpretación: Los accesorios tienen una distribución pareja entre ambos géneros, sin una preferencia marcada por algún grupo.

Footwear (Calzado):

Esta categoría presenta una frecuencia moderada, con una participación similar entre hombres y mujeres.

Interpretación: El calzado tiene una demanda estable en ambos géneros, sin diferencias significativas en las preferencias de compra.

Outerwear (Ropa de Calle):

Es la categoría con menor frecuencia de compras, ya que ambos cuadrantes tienen el color más claro del gráfico.

Interpretación: La ropa de calle es menos popular en comparación con las otras categorías, y no se observan grandes diferencias entre géneros.

2.Conclusión del mapa de calor:

Ropa (Clothing) es la categoría más demandada, con una ligera preferencia masculina.

Accesorios (Accessories) y Calzado (Footwear) tienen una frecuencia moderada y una distribución equilibrada entre ambos géneros.

Ropa de Calle (Outerwear) es la categoría con la menor popularidad, mostrando baja demanda en general.

Este gráfico ayuda a identificar preferencias de compra por género, lo que puede ser útil para estrategias de marketing personalizadas y gestión de inventario.

6. Diagrama de puntos: Relación entre edad y monto de compra.

ggplot(data, aes(x = Age, y = `Purchase Amount (USD)`, color = Category)) +
  geom_point(alpha = 0.7) +
  # Asignamos la misma paleta de colores para Category
  scale_color_manual(values = category_colors) +
  theme_minimal() +
  labs(
    title = "Relación entre edad y monto de compra",
    x = "Edad",
    y = "Monto de compra (USD)"
  )

Este gráfico de dispersión muestra la relación entre la edad de los clientes (en el eje x) y el monto de compra en USD (en el eje y), diferenciando las categorías de producto mediante colores distintos.

1. Análisis General del Patrón de Distribución:

Distribución Uniforme del Monto de Compra:

El monto de compra se encuentra distribuido de manera uniforme entre los 20 y 100 USD a lo largo de todas las edades.

No se observa una tendencia clara de que las personas más jóvenes o mayores gasten significativamente más o menos.

Amplitud de las Edades:

El rango de edades abarca desde 20 hasta 70 años, con una distribución homogénea en todas las categorías.

No hay un grupo etario que destaque por realizar más compras que otro.

2.Análisis por Categoría de Producto:

Clothing (Ropa) – Mayor Frecuencia:

Es la categoría más representada en todas las edades y rangos de compra (se observa una gran densidad de puntos de color rosa).

Esto indica que la ropa es popular y tiene una alta demanda constante en todas las edades.

Accessories (Accesorios):

Tiene una presencia considerable, aunque ligeramente menor que la ropa, y está distribuida de manera homogénea en todo el rango de edades.

No hay un grupo etario dominante, lo que sugiere que los accesorios tienen atracción generalizada.

Footwear (Calzado) y Outerwear (Ropa de Calle):

Estas dos categorías aparecen con menor frecuencia (menos puntos de color verde y naranja).

Los clientes de todas las edades compran estas categorías, pero no son las más populares en comparación con ropa y accesorios.

3.Conclusiones del Gráfico de Dispersión:

No existe una relación evidente entre la edad y el monto de compra, lo que sugiere que todos los grupos de edad tienen un comportamiento de gasto similar.

La ropa (Clothing) es la categoría más popular en todas las edades, seguida por los accesorios (Accessories).

Las categorías Footwear y Outerwear tienen menor frecuencia de compra, pero están distribuidas uniformemente entre todos los grupos de edad.

Este análisis indica una demanda constante en diversas categorías sin importar la edad, lo que sugiere oportunidades para estrategias de marketing dirigidas a audiencias amplias.