Este análisis consta de 6 clientes en los cuales se analizo su categoria de cliente, su gasto mensual, su edad y sus visitas mensuales
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
datos <- read.csv("datos_negocios_var_9_clientes.csv")
head(datos)
## Categoria_Cliente Gasto_Mensual Edad Visitas_Mensuales
## 1 Frecuente 2048.07 45 18
## 2 Nuevo 2187.73 74 16
## 3 Frecuente 1991.32 75 26
## 4 Ocasional 182.28 19 24
## 5 Nuevo 2485.97 59 23
## 6 Frecuente 2486.65 53 28
summary(datos)
## Categoria_Cliente Gasto_Mensual Edad Visitas_Mensuales
## Length:100 Min. : 107.4 Min. :18.00 Min. : 1.00
## Class :character 1st Qu.:1155.6 1st Qu.:29.00 1st Qu.:10.75
## Mode :character Median :1817.3 Median :47.00 Median :17.50
## Mean :1738.9 Mean :46.21 Mean :17.09
## 3rd Qu.:2393.2 3rd Qu.:64.00 3rd Qu.:24.25
## Max. :3073.0 Max. :75.00 Max. :30.00
Los datos muestran que los clientes frecuentes combinan alto gasto y alta recurrencia, siendo los más valiosos. Los clientes nuevos tienen buen nivel de gasto pero menor constancia, lo que indica potencial de fidelización. En general, la variabilidad del gasto y las visitas evidencia distintos perfiles de consumo que requieren segmentación.
library(ggplot2)
ggplot(datos, aes(x = Visitas_Mensuales, y = Gasto_Mensual ,fill = Categoria_Cliente)) +
geom_boxplot() +
labs(title = "Análisis de datos clientes",
x = " Visitas_Mensuales",
y = "Gasto_Mensual",)+
theme_minimal()
El gráfico muestra que el gasto mensual presenta una distribución relativamente amplia en todas las categorías, con una ligera mayor mediana en clientes nuevos, lo que sugiere un mayor nivel de consumo inicial. Sin embargo, la dispersión en frecuentes y ocasionales indica heterogeneidad en el comportamiento de gasto, con presencia de valores altos en todos los grupos. En conjunto, no hay diferencias extremas, pero sí una tendencia a mayor gasto en clientes nuevos frente a los demás.
datos <- read.csv("datos_negocios_var_9_clientes.csv")
resumen_categoria <- datos %>%
group_by(Categoria_Cliente) %>%
summarise(
Gasto_Promedio = mean(Gasto_Mensual),
Visitas_Promedio = mean(Visitas_Mensuales),
Edad_Promedio = mean(Edad)
)
print(resumen_categoria)
## # A tibble: 3 × 4
## Categoria_Cliente Gasto_Promedio Visitas_Promedio Edad_Promedio
## <chr> <dbl> <dbl> <dbl>
## 1 Frecuente 1865. 18.3 49.9
## 2 Nuevo 1714. 18.7 46.5
## 3 Ocasional 1606. 13.9 41.2