Contexto
Una empresa de e-commerce quiere evaluar el impacto de una nueva
campaña de marketing sobre sus ventas diarias. Tienen
datos de ventas antes y después de la campaña y desean determinar si la
campaña tuvo un efecto significativo en el aumento de las ventas.
Dado que los datos de ventas pueden tener alta variabilidad y
dependencia temporal, se decide usar el doble bootstrap
para mejorar la estimación del intervalo de confianza del efecto de la
campaña.
Herramientas para la simulación
Cargar librerías
library(boot)
library(utils)
Leer base de datos y Exploración
venta <- read.csv("C:\\Users\\aleja\\Documents\\00_Carrera_y_formación\\00_TEC_Por semestre_LIT\\SEMESTRE_8\\Bases_de_Datos\\dataset_ventas.csv")
head(venta)
## dia ventas periodo
## 1 1 83.71554 antes
## 2 2 114.96018 antes
## 3 3 104.24468 antes
## 4 4 77.40558 antes
## 5 5 91.32100 antes
## 6 6 124.77155 antes
Crear subconjuntos para determinar
impacto de la campaña
venta_antes<-venta[venta$periodo == "antes",]
head(venta_antes)
## dia ventas periodo
## 1 1 83.71554 antes
## 2 2 114.96018 antes
## 3 3 104.24468 antes
## 4 4 77.40558 antes
## 5 5 91.32100 antes
## 6 6 124.77155 antes
venta_despues<-venta[venta$periodo == "despues",]
head(venta_despues)
## dia ventas periodo
## 91 1 127.25308 despues
## 92 2 90.98972 despues
## 93 3 112.71553 despues
## 94 4 127.66793 despues
## 95 5 104.97484 despues
## 96 6 125.46672 despues
Bootstrapping Sencillo
Calcular media y aplicar
bootstrapping sencillo.
#Función para calcular la media
bootstrap_media <- function(data, indices) {
return(mean(data[indices]))
}
set.seed(386)
#Aplicar Bootstrap con 100000 repeticiones
Rbootstrap_va <- boot(data = venta_antes$ventas, statistic = bootstrap_media, R = 100000)
#Mostrar resumen de resultados
print(Rbootstrap_va)
##
## ORDINARY NONPARAMETRIC BOOTSTRAP
##
##
## Call:
## boot(data = venta_antes$ventas, statistic = bootstrap_media,
## R = 1e+05)
##
##
## Bootstrap Statistics :
## original bias std. error
## t1* 100.5368 0.00116431 1.815028
#Calcular Intervalo de Confianza del 95%
intervalo_conf <- boot.ci(Rbootstrap_va, type = "perc")
print("Intervalo de confianza de ventas anteriores_________________")
## [1] "Intervalo de confianza de ventas anteriores_________________"
print(intervalo_conf)
## BOOTSTRAP CONFIDENCE INTERVAL CALCULATIONS
## Based on 100000 bootstrap replicates
##
## CALL :
## boot.ci(boot.out = Rbootstrap_va, type = "perc")
##
## Intervals :
## Level Percentile
## 95% ( 97.0, 104.1 )
## Calculations and Intervals on Original Scale
hist(Rbootstrap_va$t, main = "Distribución Bootstrap de la Media (Ventas Anteriores)",
xlab = "Media Remuestreada", col = "powderblue", border = "black")

#Aplicar Bootstrap con 100000 repeticiones
Rbootstrap_vd <- boot(data = venta_despues$ventas, statistic = bootstrap_media, R = 100000)
#Mostrar resumen de resultados
print(Rbootstrap_vd)
##
## ORDINARY NONPARAMETRIC BOOTSTRAP
##
##
## Call:
## boot(data = venta_despues$ventas, statistic = bootstrap_media,
## R = 1e+05)
##
##
## Bootstrap Statistics :
## original bias std. error
## t1* 110.5493 0.01502967 1.484184
#Calcular Intervalo de Confianza del 95%
intervalo_conf2 <- boot.ci(Rbootstrap_vd, type = "perc")
print("Intervalo de confianza de ventas posteriores_________________")
## [1] "Intervalo de confianza de ventas posteriores_________________"
print(intervalo_conf2)
## BOOTSTRAP CONFIDENCE INTERVAL CALCULATIONS
## Based on 100000 bootstrap replicates
##
## CALL :
## boot.ci(boot.out = Rbootstrap_vd, type = "perc")
##
## Intervals :
## Level Percentile
## 95% (107.7, 113.5 )
## Calculations and Intervals on Original Scale
hist(Rbootstrap_vd$t, main = "Distribución Bootstrap de la Media (Ventas Posteriores)",
xlab = "Media Remuestreada", col = "powderblue", border = "black")

Aplicación de Doble Bootstrapping
set.seed(386)
#f(): Calcular promedio de ventas
ventas_av <- function(data,indices){
muestraE <- data[indices, ]
return(mean(muestraE$ventas))
}
#f(): Realizar simulación de Doble bootstrapping
doble_bootstrap <- function(data, n_outer, n_inner) {
set.seed(386)
outer_results <- replicate(n_outer, {
outer_sample <- data[sample(nrow(data), 90, replace = TRUE), ] # Muestra de 9 días de venta
inner_boot <- boot(data = outer_sample, statistic = ventas_av, R = n_inner)
return(mean(inner_boot$t)) #Promedio de ventas en el nivel interno
})
return(outer_results)
}
#Aplicamos el doble bootstrapping
n_outer <- 1000 #Muestras bootstrap externas
n_inner <- 750 #Muestras bootstrap internas
doble_resultados_A <- doble_bootstrap(venta_antes, n_outer, n_inner)
doble_resultados_D <- doble_bootstrap(venta_despues, n_outer, n_inner)
#Calcular intervalos de confianza al 95%
conf_intervals <- quantile(doble_resultados_A, probs = c(0.025, 0.975))
#Mostrar resultados
cat("Calificación promedio estimada:", mean(doble_resultados_A), "\n")
## Calificación promedio estimada: 100.5336
cat("Intervalo de confianza al 95%:", conf_intervals[1], "-", conf_intervals[2], "\n")
## Intervalo de confianza al 95%: 97.01549 - 104.136
#Calcular intervalos de confianza al 95%
conf_intervals <- quantile(doble_resultados_D, probs = c(0.025, 0.975))
#Mostrar resultados
cat("Calificación promedio estimada:", mean(doble_resultados_D), "\n")
## Calificación promedio estimada: 110.5021
cat("Intervalo de confianza al 95%:", conf_intervals[1], "-", conf_intervals[2], "\n")
## Intervalo de confianza al 95%: 107.5073 - 113.5529
Conclusión Comparativa
Resultados con
100,000 iteraciones de bootstrapp de primer nivel
Medias:
- Antes: $100.53 por venta
- Después: $110.54 por venta
Intervalos:
- Antes: ( 97.0, 104.1 )
- Después: (107.7, 113.5 )
Resultados con n_outer = 1000
& n_inner = 750 de iteraciones de bootstrapp de segundo
nivel
Medias:
- Antes: $100.53 por venta
- Después: $110.50 por venta
Intervalos:
- Antes: ( 97.01, 104.13 )
- Después: (107.50, 113.55 )
En ambos métodos de simulaciones podemos observar un valor similar
tanto en intervalos como en medias. Esto puede deberse a que ambos
tienen una muestra bastante grande así como un número de iteraciones
altas.
¿La campaña tuvo un impacto significativo?
Según las dos simulación realizadas puedo concluir que,
efectivamente, la campaña tuvo un impacto significativo subiendo un 10%
la media de ventas
