Análisis de datos clientes

Este análisis consta de 6 clientes en los cuales se analizo su categoria de cliente, su gasto mensual, su edad y sus visitas mensuales

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
datos <- read.csv("datos_negocios_var_9_clientes.csv")
head(datos)
##   Categoria_Cliente Gasto_Mensual Edad Visitas_Mensuales
## 1         Frecuente       2048.07   45                18
## 2             Nuevo       2187.73   74                16
## 3         Frecuente       1991.32   75                26
## 4         Ocasional        182.28   19                24
## 5             Nuevo       2485.97   59                23
## 6         Frecuente       2486.65   53                28
summary(datos)
##  Categoria_Cliente  Gasto_Mensual         Edad       Visitas_Mensuales
##  Length:100         Min.   : 107.4   Min.   :18.00   Min.   : 1.00    
##  Class :character   1st Qu.:1155.6   1st Qu.:29.00   1st Qu.:10.75    
##  Mode  :character   Median :1817.3   Median :47.00   Median :17.50    
##                     Mean   :1738.9   Mean   :46.21   Mean   :17.09    
##                     3rd Qu.:2393.2   3rd Qu.:64.00   3rd Qu.:24.25    
##                     Max.   :3073.0   Max.   :75.00   Max.   :30.00

Los datos muestran que los clientes frecuentes combinan alto gasto y alta recurrencia, siendo los más valiosos. Los clientes nuevos tienen buen nivel de gasto pero menor constancia, lo que indica potencial de fidelización. En general, la variabilidad del gasto y las visitas evidencia distintos perfiles de consumo que requieren segmentación.

library(ggplot2)
ggplot(datos, aes(x = Visitas_Mensuales, y = Gasto_Mensual ,fill = Categoria_Cliente)) +
  geom_boxplot() +
  labs(title = "Análisis de datos clientes",
       x = " Visitas_Mensuales",
       y = "Gasto_Mensual",)+
  theme_minimal()

El gráfico muestra que el gasto mensual presenta una distribución relativamente amplia en todas las categorías, con una ligera mayor mediana en clientes nuevos, lo que sugiere un mayor nivel de consumo inicial. Sin embargo, la dispersión en frecuentes y ocasionales indica heterogeneidad en el comportamiento de gasto, con presencia de valores altos en todos los grupos. En conjunto, no hay diferencias extremas, pero sí una tendencia a mayor gasto en clientes nuevos frente a los demás.

datos <- read.csv("datos_negocios_var_9_clientes.csv")

resumen_categoria <- datos %>%
  group_by(Categoria_Cliente) %>%
  summarise(
    Gasto_Promedio    = mean(Gasto_Mensual),
    Visitas_Promedio  = mean(Visitas_Mensuales),
    Edad_Promedio     = mean(Edad)
  )

print(resumen_categoria)
## # A tibble: 3 × 4
##   Categoria_Cliente Gasto_Promedio Visitas_Promedio Edad_Promedio
##   <chr>                      <dbl>            <dbl>         <dbl>
## 1 Frecuente                  1865.             18.3          49.9
## 2 Nuevo                      1714.             18.7          46.5
## 3 Ocasional                  1606.             13.9          41.2