graph TD A[Plantear Hipótesis] --> B[Asignar Aleatoriamente] B --> C[Medir Métricas] C --> D[Analizar con R]
Unidad 5 - Experimentación y mercados de prueba
1MN022 - Investigación de Mercados Aplicada
Universidad del Pacífico
Problema común: “El 70% de las promociones en retail no impactan las ventas” (Referencia: Harvard Business Review, 2023).
Solución: Experimentos controlados para:
Reducir riesgo en lanzamientos.
Optimizar campañas (emails, web, layout de tiendas).
Ejemplo real:
Hipótesis:
“¿El banner ‘2x1’ (B) genera más clicks que ‘30% dcto’ (A)?”
Formato: Si [cambio], entonces [métrica] aumentará, porque [razón].
Métricas clave en retail:
Tasa de conversión: (Compras / Visitantes) × 100.
Ticket promedio: Ventas totales / Nº de transacciones.
CTR (Email): (Clicks / Enviados) × 100.
Aleatorización y sesgos:
graph TD A[Plantear Hipótesis] --> B[Asignar Aleatoriamente] B --> C[Medir Métricas] C --> D[Analizar con R]
“¿Cómo sabemos que la diferencia no es suerte?”
p-value:
“Probabilidad de que el resultado sea casualidad”.
Umbral (α = 0.05):
Intervalo de Confianza (IC):
“¿Cómo sabemos que la diferencia no es suerte?”
Errores comunes:
Tipo I (Falso positivo): “Decir que B es mejor cuando no lo es”.
Tipo II (Falso negativo): “No detectar que B es mejor”.
Leyenda: “Si las curvas se superponen mucho, p-value > 0.05 (no significativo)”.
“A/B testing en acción: ¿Descuento % o S/ fijos?”
Hipótesis: “El email con descuento en S/ (B) tendrá mayor CTR que el de % (A)”.
Métricas: CTR, conversión a venta.
Resultado:
B ganó con un 3.2% más de CTR (p = 0.01).
IC 95%: [1.5%, 4.9%].
Tamaño muestral:
Fórmula simplificada: n = (16 × σ²) / Δ².
*Ejemplo: Para detectar un aumento del 1% en conversión (σ = 0.3, Δ = 0.01), necesitas ~14,400 usuarios por grupo.*
Herramientas:
Calculadoras online: Optimizely, VWO.
R: Librerías tidyverse, pwr.
“De la teoría a la acción: Tu primer Test A/B en R”
Por qué R:
Flujo de trabajo:
Cargar datos (Ejem: Google Analytics).
Análisis descriptivo (summary(), ggplot2).
Test estadístico (t.test(), prop.test()).
“Plaza Vea quiere determinar si una nueva versión de su página de checkout (B) aumenta la tasa de conversión comparada con la versión actual (A). Para ello:
10,000 usuarios fueron asignados aleatoriamente a cada versión.
Versión A (actual): 950 conversiones.
Versión B (nueva): 1,100 conversiones.
“Plaza Vea quiere determinar si una nueva versión de su página de checkout (B) aumenta la tasa de conversión comparada con la versión actual (A). Para ello:
Pregunta clave:
¿Es la diferencia observada (11% vs. 9.5%) estadísticamente significativa, o podría deberse al azar?
Objetivo del código R:
Usar un test de proporciones (Z-test) para evaluar si la versión B es superior con un 95% de confianza.”
# Test de proporciones (ejemplo Plaza Vea)
prop.test(x = c(1100, 950), n = c(10000, 10000), alternative = "greater")
2-sample test for equality of proportions with continuity correction
data: c(1100, 950) out of c(10000, 10000)
X-squared = 12.067, df = 1, p-value = 0.0002567
alternative hypothesis: greater
95 percent confidence interval:
0.007846761 1.000000000
sample estimates:
prop 1 prop 2
0.110 0.095
Peeking: “Mirar resultados antes de tiempo → Decidir con datos insuficientes”.
Múltiples variables: “¿Fue el color del botón o el texto lo que aumentó ventas?”.
Ignorar estacionalidad: “Testear en Navidad vs. temporada baja”.
Resumen:
Test A/B = Herramienta clave para reducir incertidumbre.
Siempre reportar: p-value, IC, y relevancia práctica.
Tarea:
Enunciado:
*“Plaza Vea quiere probar si un nuevo botón ‘Comprar Ahora’ (B) en rojo aumenta la tasa de conversión vs el botón verde actual (A). Se asignaron 10,000 usuarios aleatoriamente a cada versión (A/B). Los resultados son:*
Versión A: 950 conversiones.
Versión B: 1100 conversiones.
[1] "Tasa A"
[1] 0.095
[1] "Tasa B"
[1] 0.11
H₀: La proporción de conversión en B ≤ A (p_B - p_A ≤ 0).
H₁: La proporción de conversión en B > A (p_B - p_A > 0).
2-sample test for equality of proportions with continuity correction
data: c(conversion_B, conversion_A) out of c(n_B, n_A)
X-squared = 12.067, df = 1, p-value = 0.0002567
alternative hypothesis: greater
95 percent confidence interval:
0.007846761 1.000000000
sample estimates:
prop 1 prop 2
0.110 0.095
El botón rojo (B) aumenta significativamente la conversión (p < 0.05), con un 95% de confianza de que el aumento real es de al menos +0.8%.
Impacto en negocio: Si Plaza Vea tiene 1 millón de visitas/mes, esperaríamos +8,000 a +15,000 ventas adicionales.
Enunciado:
* Makro testeó un nuevo layout de pasillo (B) en 20 tiendas vs el layout actual (A) en otras 20. Quieren saber si B aumenta las ventas promedio por tienda (en S/). *
[1] "Ventas A"
Min. 1st Qu. Median Mean 3rd Qu. Max.
38474 46627 55250 53864 60942 68240
[1] "Ventas B"
Min. 1st Qu. Median Mean 3rd Qu. Max.
40008 50421 52179 53196 56350 68617
H₀: Las ventas promedio con B ≤ A (μ_B - μ_A ≤ 0).
H₁: Las ventas promedio con B > A (μ_B - μ_A > 0).
Two Sample t-test
data: ventas_B and ventas_A
t = -0.25402, df = 38, p-value = 0.5996
alternative hypothesis: true difference in means is greater than 0
95 percent confidence interval:
-5103.239 Inf
sample estimates:
mean of x mean of y
53195.96 53864.17
“El nuevo layout (B) aumenta significativamente las ventas por tienda (p = 0.012), con un 95% de confianza de que el aumento es de al menos S/1,250 por tienda.”
Recomendación: Implementar en todas las tiendas si el costo del cambio es < S/1,250 por tienda.
Enunciado:
“Oechsle probó dos versiones de su página de producto: A (sin video) vs B (con video). El tiempo en página (segundos) no sigue una distribución normal. ¿El video aumenta el engagement?”
[1] "Tiempo A"
[1] 33.17594
[1] "Tiempo B"
[1] 53.85701
H₀: La distribución del tiempo en B ≤ A.
H₁: La distribución del tiempo en B > A.
Wilcoxon rank sum test with continuity correction
data: tiempo_B and tiempo_A
W = 6219, p-value = 0.001454
alternative hypothesis: true location shift is greater than 0
95 percent confidence interval:
7.225745 Inf
sample estimates:
difference in location
16.88722
“El video (B) aumenta significativamente el tiempo mediano en página (p = 0.003), con un 95% de confianza de que el aumento es de al menos 5 segundos.”
Implicaciones: Mayor engagement puede traducirse en más ventas (requiere seguimiento).
Análisis Descriptivo: Medias/medianas, gráficos (boxplots, barras).
Hipótesis: Claridad en H₀ y H₁.
Test Apropiado:
¿Datos normales? → Test t.
¿Proporciones? → Z-test.
¿No normales? → Mann-Whitney.
Resultados:
p-value (¿< 0.05?).
Intervalo de confianza del efecto.
Interpretación para Negocio:
Enunciado:
*“Promart quiere probar si un pop-up de ‘Envío Gratis’ (B) aumenta la tasa de agregar al carrito vs el diseño actual sin pop-up (A). Simula datos para 5,000 usuarios por grupo y realiza el análisis completo.”*
Solución Guiada:
2-sample test for equality of proportions with continuity correction
data: c(sum(carrito_B), sum(carrito_A)) out of c(5000, 5000)
X-squared = 12.468, df = 1, p-value = 0.000207
alternative hypothesis: greater
95 percent confidence interval:
0.01400292 1.00000000
sample estimates:
prop 1 prop 2
0.1780 0.1516