Optimizando la Lealtad del Cliente en Supermercados plazaVea: Modelado de Senderos para Amas de Casa Jóvenes de NSE A

Contexto:

El equipo de marketing de Supermercados plazaVea ha identificado a las amas de casa jóvenes (18-35 años) del nivel socioeconómico A (NSE A) como un segmento de clientes de alto valor. Sin embargo, no se comprende del todo qué factores impulsan su lealtad a la marca PlazaVea, y cómo se traduce esta lealtad en un mayor gasto en el supermercado. Para mejorar las estrategias de marketing y la experiencia del cliente, se decide realizar un análisis de senderos para entender estas relaciones.

Objetivo General del Análisis:

Analizar las relaciones causales entre la percepción de la conveniencia de PlazaVea, la calidad de los productos ofrecidos, la experiencia de compra en línea y la lealtad (medida a través del gasto) de las amas de casa jóvenes de NSE A en Supermercados PlazaVea.

Variables:

  • Gasto_Mensual (Numérica): Gasto promedio mensual en PlazaVea (en soles). (Variable Dependiente)
  • Conveniencia (Numérica): Percepción de la conveniencia de comprar en PlazaVea (escala de 1 a 7, donde 7 es “muy conveniente”).
  • Calidad_Productos (Numérica): Percepción de la calidad de los productos ofrecidos (escala de 1 a 7, donde 7 es “excelente calidad”).
  • Experiencia_Online (Numérica): Calidad de la experiencia de compra en línea (app o web) (escala de 1 a 7, donde 7 es “excelente”).

Hipótesis:

Se plantea el siguiente modelo causal:

  • La percepción de la conveniencia de PlazaVea influye positivamente en la Calidad percibida de los productos.
  • La percepción de la conveniencia de PlazaVea influye positivamente en la experiencia de compra en línea.
  • La percepción de la calidad de los productos influye positivamente en el gasto mensual.
  • La calidad de la experiencia de compra en línea influye positivamente en el gasto mensual.

Tareas:

  1. Especificación del Modelo de Análisis de Senderos: Define el modelo de análisis de senderos en la sintaxis de lavaan, especificando las relaciones causales entre las variables.
  2. Ajuste del Modelo: Ajusta el modelo a los datos simulados usando la función sem() de lavaan.
  3. Evaluación del Ajuste del Modelo: Analiza los índices de ajuste del modelo (CFI, TLI, RMSEA) para determinar si el modelo tiene un ajuste aceptable a los datos.
  4. Interpretación de los Coeficientes de Trayectoria: Examina los coeficientes estandarizados del modelo para determinar la fuerza y dirección de las relaciones entre las variables. Identifica las trayectorias directas e indirectas significativas.
  5. Análisis de los Efectos Indirectos: Calcula los efectos indirectos de Conveniencia sobre Gasto_Mensual a través de Calidad_Productos e Influencia_Redes.
  6. Conclusiones y Recomendaciones: ¿Qué estrategias debería seguir PlazaVea para optimizar la lealtad y el gasto de este segmento de clientes?

Importación de librerías.

library(lavaan)    # Para Modelos de Ecuaciones Estructurales
## This is lavaan 0.6-19
## lavaan is FREE software! Please report any bugs.
library(dplyr)     # Para manipulación de datos
## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(ggplot2)   # Para gráficos
library(car) # VIF
## Cargando paquete requerido: carData
## 
## Adjuntando el paquete: 'car'
## The following object is masked from 'package:dplyr':
## 
##     recode
library(semPlot)   # Para el Diagrama de Senderos 

Importación de la base

data_plazavea=read.csv(file.choose())
head(data_plazavea)
##   X Gasto_Mensual Conveniencia Calidad_Productos Experiencia_Online
## 1 1      195.5706            5                 5                  4
## 2 2      365.9174            5                 7                  6
## 3 3      297.9437            6                 6                  6
## 4 4      171.5125            5                 5                  4
## 5 5      280.4522            5                 5                  5
## 6 6      354.2704            6                 7                  5
  1. Especificación del Modelo de Análisis de Senderos Definimos las relaciones causales usando la sintaxis de lavaan
modelo_sem <- '
  # Regresiones
  Calidad_Productos ~ Conveniencia
  Experiencia_Online ~ Conveniencia
  Gasto_Mensual ~ Calidad_Productos + Experiencia_Online

  # Varianzas
  Conveniencia ~~ Conveniencia
  Calidad_Productos ~~ Calidad_Productos
  Experiencia_Online ~~ Experiencia_Online
  Gasto_Mensual ~~ Gasto_Mensual
'
  1. Ajuste del Modelo Ajustamos el modelo a los datos usando la función sem().
modelo_ajustado <- sem(modelo_sem, data = data_plazavea)
  1. Evaluación del Ajuste del Modelo Evaluamos qué tan bien se ajusta el modelo a los datos.
summary(modelo_ajustado, fit.measures = TRUE, standardized = TRUE)
## lavaan 0.6-19 ended normally after 6 iterations
## 
##   Estimator                                         ML
##   Optimization method                           NLMINB
##   Number of model parameters                         8
## 
##   Number of observations                           300
## 
## Model Test User Model:
##                                                       
##   Test statistic                                 3.493
##   Degrees of freedom                                 2
##   P-value (Chi-square)                           0.174
## 
## Model Test Baseline Model:
## 
##   Test statistic                               206.688
##   Degrees of freedom                                 6
##   P-value                                        0.000
## 
## User Model versus Baseline Model:
## 
##   Comparative Fit Index (CFI)                    0.993
##   Tucker-Lewis Index (TLI)                       0.978
## 
## Loglikelihood and Information Criteria:
## 
##   Loglikelihood user model (H0)              -2907.673
##   Loglikelihood unrestricted model (H1)      -2905.927
##                                                       
##   Akaike (AIC)                                5831.346
##   Bayesian (BIC)                              5860.976
##   Sample-size adjusted Bayesian (SABIC)       5835.605
## 
## Root Mean Square Error of Approximation:
## 
##   RMSEA                                          0.050
##   90 Percent confidence interval - lower         0.000
##   90 Percent confidence interval - upper         0.135
##   P-value H_0: RMSEA <= 0.050                    0.388
##   P-value H_0: RMSEA >= 0.080                    0.357
## 
## Standardized Root Mean Square Residual:
## 
##   SRMR                                           0.027
## 
## Parameter Estimates:
## 
##   Standard errors                             Standard
##   Information                                 Expected
##   Information saturated (h1) model          Structured
## 
## Regressions:
##                        Estimate  Std.Err  z-value  P(>|z|)   Std.lv  Std.all
##   Calidad_Productos ~                                                       
##     Conveniencia          0.394    0.048    8.274    0.000    0.394    0.431
##   Experiencia_Online ~                                                      
##     Conveniencia          0.449    0.067    6.684    0.000    0.449    0.360
##   Gasto_Mensual ~                                                           
##     Calidad_Prdcts       15.707    3.910    4.017    0.000   15.707    0.198
##     Experienc_Onln       27.436    2.867    9.570    0.000   27.436    0.471
## 
## Variances:
##                    Estimate  Std.Err  z-value  P(>|z|)   Std.lv  Std.all
##     Conveniencia      0.973    0.079   12.247    0.000    0.973    1.000
##    .Calidad_Prdcts    0.662    0.054   12.247    0.000    0.662    0.814
##    .Experienc_Onln    1.315    0.107   12.247    0.000    1.315    0.870
##    .Gasto_Mensual  3636.919  296.953   12.247    0.000 3636.919    0.710
fitMeasures(modelo_ajustado, c("cfi", "tli", "rmsea"))
##   cfi   tli rmsea 
## 0.993 0.978 0.050
  1. Interpretación de los Coeficientes de Trayectoria Analizamos los coeficientes estandarizados para determinar la fuerza y dirección de las relaciones.
parameterEstimates(modelo_ajustado, standardized = TRUE) %>%
  filter(op == "~")
##                  lhs op                rhs    est    se     z pvalue ci.lower
## 1  Calidad_Productos  ~       Conveniencia  0.394 0.048 8.274      0    0.301
## 2 Experiencia_Online  ~       Conveniencia  0.449 0.067 6.684      0    0.317
## 3      Gasto_Mensual  ~  Calidad_Productos 15.707 3.910 4.017      0    8.044
## 4      Gasto_Mensual  ~ Experiencia_Online 27.436 2.867 9.570      0   21.817
##   ci.upper std.lv std.all
## 1    0.487  0.394   0.431
## 2    0.580  0.449   0.360
## 3   23.370 15.707   0.198
## 4   33.055 27.436   0.471
  1. Análisis de los Efectos Indirectos Calculamos los efectos indirectos de Conveniencia en Gasto_Mensual.
# Calcula efectos indirectos (¡ojo con el orden!):
parametros <- parameterEstimates(modelo_ajustado, standardized = TRUE) %>% filter(op == "~")
a <- parametros$std.all[1] # Conveniencia -> Calidad_Productos
b <- parametros$std.all[2] # Conveniencia -> Experiencia_Online
c <- parametros$std.all[3] # Calidad_Productos -> Gasto_Mensual
d <- parametros$std.all[4] # Experiencia_Online -> Gasto_Mensual

#Efecto indirecto 1: Conveniencia -> Calidad_Productos -> Gasto_Mensual
efecto_indirecto_1 <- a*c
cat("Efecto Indirecto Estandarizado (Conveniencia -> Calidad -> Gasto):", round(efecto_indirecto_1, 3), "\n")
## Efecto Indirecto Estandarizado (Conveniencia -> Calidad -> Gasto): 0.085
#Efecto indirecto 2: Conveniencia -> Experiencia_Online -> Gasto_Mensual
efecto_indirecto_2 <- b*d
cat("Efecto Indirecto Estandarizado (Conveniencia -> Online -> Gasto):", round(efecto_indirecto_2, 3), "\n")
## Efecto Indirecto Estandarizado (Conveniencia -> Online -> Gasto): 0.17
#Efecto indirecto total
efecto_indirecto_total <- a*c + b*d

cat("Efecto Indirecto Total Estandarizado (Conveniencia -> Gasto):", round(efecto_indirecto_total, 3), "\n")
## Efecto Indirecto Total Estandarizado (Conveniencia -> Gasto): 0.255
  1. Visualización de los Resultados (Diagrama de Senderos) Creamos un diagrama de senderos para visualizar las relaciones y los coeficientes. NOTA: Requiere instalar y utilizar la librería semPlot
  library(semPlot)
  semPaths(modelo_ajustado,
           whatLabels = "std",         # Mostrar coeficientes estandarizados
           layout = "tree2",          # Diseño del diagrama
           edge.label.cex = 0.8,     # Tamaño de las etiquetas de las flechas
           curve = 1,                # Curvatura de las flechas
           mar = c(1,1,1,1),            # Márgenes
           residuals = FALSE,          # Ocultar varianzas residuales
           fade = FALSE)               # No atenuar las variables no significativas

  1. Conclusiones y Recomendaciones [Esquema]

Basado en este análisis, el equipo de marketing de PlazaVea puede concluir que:

[Escribir conclusiones sobre el impacto de la conveniencia, la calidad de los productos y la experiencia online en el gasto. ¿Qué trayectorias fueron significativas? ¿Qué variables parecen ser los impulsores más importantes del gasto?]

En función de estas conclusiones, se recomienda a PlazaVea:

[Recomendación 1: Por ejemplo, si la Calidad_Productos tiene un fuerte impacto directo en el Gasto, invertir en mejorar la calidad percibida a través de estrategias de selección de proveedores y control de calidad.] [Recomendación 2: Por ejemplo, si el efecto indirecto de Conveniencia a través de Experiencia_Online es importante, optimizar la experiencia de compra en línea para mejorar la satisfacción del cliente.]