Contexto

Una empresa de e-commerce quiere evaluar el impacto de una nueva campaña de marketing sobre sus ventas diarias. Tienen datos de ventas antes y después de la campaña y desean determinar si la campaña tuvo un efecto significativo en el aumento de las ventas.

Dado que los datos de ventas pueden tener alta variabilidad y dependencia temporal, se decide usar el doble bootstrap para mejorar la estimación del intervalo de confianza del efecto de la campaña.

Información de la Data

Datos:

Se dispone de un dataset con 90 días de ventas antes de la campaña y 90 días después de la campaña.

Variables del dataset:

  • Día: Es la etiqueta correspondiente al día de la venta.
  • Ventas: Es el monto de venta resultante.
  • Periodo: Indica si la venta es previa o posterior a la implementación de la campaña.

Herramientas para la simulación

Cargar librerías

library(boot)
library(utils)

Leer base de datos y Exploración

venta <- read.csv("C:\\Users\\aleja\\Documents\\00_Carrera_y_formación\\00_TEC_Por semestre_LIT\\SEMESTRE_8\\Bases_de_Datos\\dataset_ventas.csv")
head(venta)
##   dia    ventas periodo
## 1   1  83.71554   antes
## 2   2 114.96018   antes
## 3   3 104.24468   antes
## 4   4  77.40558   antes
## 5   5  91.32100   antes
## 6   6 124.77155   antes

Crear subconjuntos para determinar impacto de la campaña

venta_antes<-venta[venta$periodo == "antes",]
head(venta_antes)
##   dia    ventas periodo
## 1   1  83.71554   antes
## 2   2 114.96018   antes
## 3   3 104.24468   antes
## 4   4  77.40558   antes
## 5   5  91.32100   antes
## 6   6 124.77155   antes
venta_despues<-venta[venta$periodo == "despues",]
head(venta_despues)
##    dia    ventas periodo
## 91   1 127.25308 despues
## 92   2  90.98972 despues
## 93   3 112.71553 despues
## 94   4 127.66793 despues
## 95   5 104.97484 despues
## 96   6 125.46672 despues

Bootstrapping Sencillo

Calcular media y aplicar bootstrapping sencillo.

#Función para calcular la media
bootstrap_media <- function(data, indices) {
  return(mean(data[indices]))  
}

set.seed(386) 

#Aplicar Bootstrap con 100000 repeticiones
Rbootstrap_va <- boot(data = venta_antes$ventas, statistic = bootstrap_media, R = 100000)

#Mostrar resumen de resultados
print(Rbootstrap_va)
## 
## ORDINARY NONPARAMETRIC BOOTSTRAP
## 
## 
## Call:
## boot(data = venta_antes$ventas, statistic = bootstrap_media, 
##     R = 1e+05)
## 
## 
## Bootstrap Statistics :
##     original     bias    std. error
## t1* 100.5368 0.00116431    1.815028
#Calcular Intervalo de Confianza del 95%
intervalo_conf <- boot.ci(Rbootstrap_va, type = "perc")
print("Intervalo de confianza de ventas anteriores_________________")
## [1] "Intervalo de confianza de ventas anteriores_________________"
print(intervalo_conf)
## BOOTSTRAP CONFIDENCE INTERVAL CALCULATIONS
## Based on 100000 bootstrap replicates
## 
## CALL : 
## boot.ci(boot.out = Rbootstrap_va, type = "perc")
## 
## Intervals : 
## Level     Percentile     
## 95%   ( 97.0, 104.1 )  
## Calculations and Intervals on Original Scale
hist(Rbootstrap_va$t, main = "Distribución Bootstrap de la Media (Ventas Anteriores)",
     xlab = "Media Remuestreada", col = "powderblue", border = "black")

#Aplicar Bootstrap con 100000 repeticiones
Rbootstrap_vd <- boot(data = venta_despues$ventas, statistic = bootstrap_media, R = 100000)

#Mostrar resumen de resultados
print(Rbootstrap_vd)
## 
## ORDINARY NONPARAMETRIC BOOTSTRAP
## 
## 
## Call:
## boot(data = venta_despues$ventas, statistic = bootstrap_media, 
##     R = 1e+05)
## 
## 
## Bootstrap Statistics :
##     original     bias    std. error
## t1* 110.5493 0.01502967    1.484184
#Calcular Intervalo de Confianza del 95%
intervalo_conf2 <- boot.ci(Rbootstrap_vd, type = "perc")
print("Intervalo de confianza de ventas posteriores_________________")
## [1] "Intervalo de confianza de ventas posteriores_________________"
print(intervalo_conf2)
## BOOTSTRAP CONFIDENCE INTERVAL CALCULATIONS
## Based on 100000 bootstrap replicates
## 
## CALL : 
## boot.ci(boot.out = Rbootstrap_vd, type = "perc")
## 
## Intervals : 
## Level     Percentile     
## 95%   (107.7, 113.5 )  
## Calculations and Intervals on Original Scale
hist(Rbootstrap_vd$t, main = "Distribución Bootstrap de la Media (Ventas Posteriores)",
     xlab = "Media Remuestreada", col = "powderblue", border = "black")

Aplicación de Doble Bootstrapping

set.seed(386)

#f(): Calcular promedio de ventas
ventas_av <- function(data,indices){
  muestraE <- data[indices, ]
  return(mean(muestraE$ventas))
}


#f(): Realizar simulación de Doble bootstrapping
doble_bootstrap <- function(data, n_outer, n_inner) {
  set.seed(386)
  outer_results <- replicate(n_outer, {
    outer_sample <- data[sample(nrow(data), 90, replace = TRUE), ]  # Muestra de 9 días de venta
    inner_boot <- boot(data = outer_sample, statistic = ventas_av, R = n_inner)
    return(mean(inner_boot$t))  #Promedio de ventas en el nivel interno
  })
  
  return(outer_results)
}

#Aplicamos el doble bootstrapping
n_outer <- 1000    #Muestras bootstrap externas
n_inner <- 750    #Muestras bootstrap internas

doble_resultados_A <- doble_bootstrap(venta_antes, n_outer, n_inner)
doble_resultados_D <- doble_bootstrap(venta_despues, n_outer, n_inner)


#Calcular intervalos de confianza al 95%
conf_intervals <- quantile(doble_resultados_A, probs = c(0.025, 0.975))

#Mostrar resultados
cat("Calificación promedio estimada:", mean(doble_resultados_A), "\n")
## Calificación promedio estimada: 100.5336
cat("Intervalo de confianza al 95%:", conf_intervals[1], "-", conf_intervals[2], "\n")
## Intervalo de confianza al 95%: 97.01549 - 104.136
#Calcular intervalos de confianza al 95%
conf_intervals <- quantile(doble_resultados_D, probs = c(0.025, 0.975))

#Mostrar resultados
cat("Calificación promedio estimada:", mean(doble_resultados_D), "\n")
## Calificación promedio estimada: 110.5021
cat("Intervalo de confianza al 95%:", conf_intervals[1], "-", conf_intervals[2], "\n")
## Intervalo de confianza al 95%: 107.5073 - 113.5529

Conclusión Comparativa

Resultados con 100,000 iteraciones de bootstrapp de primer nivel

Medias:

  • Antes: $100.53 por venta
  • Después: $110.54 por venta

Intervalos:

  • Antes: ( 97.0, 104.1 )
  • Después: (107.7, 113.5 )

Resultados con n_outer = 1000 & n_inner = 750 de iteraciones de bootstrapp de segundo nivel

Medias:

  • Antes: $100.53 por venta
  • Después: $110.50 por venta

Intervalos:

  • Antes: ( 97.01, 104.13 )
  • Después: (107.50, 113.55 )

En ambos métodos de simulaciones podemos observar un valor similar tanto en intervalos como en medias. Esto puede deberse a que ambos tienen una muestra bastante grande así como un número de iteraciones altas.

¿La campaña tuvo un impacto significativo?

Según las dos simulación realizadas puedo concluir que, efectivamente, la campaña tuvo un impacto significativo subiendo un 10% la media de ventas

