Data Driven Decisions

Dirigir por datos significa que las decisiones están tomadas basado en informaciones inferidos de datos, no por intuición ni experiencia personal.

Problemas

  • Datos son muy sucios y requieren un tratamiento especial.
  • A veces son difícil de obtener.
  • A veces hay demasiado datos.
  • ¿Como podemos estar seguro que la interferencia es razonable?
  • Correlation does not imply causation.
  • ¿Como controlar flujo de información?
  • ¿Como automatizar decisiones?

Ejemplos

  • Walmart desde años setentas (cervezas y pañales)
  • UPS (conductores no doblan a la izquierda)
  • Oakland Athletics (Moneyball)
  • Campaña de Obama (mas que 500 A/B testing)
  • Google, Amazon, Facebook, LinkedIn, Twitter

Muy bien. Pero … ¿Como hacerlo?

  • Empieza con datos, explora.
  • Desarrolla intuición.
  • Formula pregunats.
  • Investiga si la pregunta tiene sentido, si se puede transformar en hiposesis. Si no, empieza de nuevo.
  • Crea framework para tests.
  • Analiza resultados.

Objetivo: ROI

Pricing

  • Herramiente muy potente para elevar ganancias.

Ejemplos

  • The Economist (percepción)
  • A veces 5% de discueno puede ser muy malo
  • Amazon: diferentes precios para diferentes usarios (peligroso)
  • Deutche Bhan (ejemplo de precios dinamicos que resultaron fatal)

Exploración y formulacón de hipótesis

  • Datos historicos de venta.
  • Datos historicos de costes.
  • Cambio el precio - consequencias.
  • Valorar clientes: RFM- Recency, Frequency, Monetary Value.
  • Segmentación de clientes utilizando custering.
  • Caracterices comunes de clientes mas valorado.
  • Precios de competencia.
  • Market-basket.
  • Efecto de dias de semana, tiempo, festivos, etc.

Test A/B

  • ¿Pricing: Economía o matemática o psicóloga? C
  • Con tests: no importa.

Hay que crear herramientas para test.

  • Test A/B: forma científica y extemamede eficaz de verificar resultados de cambio.
  • Redireción alreatora de trafico.
  • Intervalos de confianza.
  • ROI como la métrica principal.
  • Automatización de tests para correr y verificar muchas hipótesis durante corto tiempo.
  • Problemas de test A/B: tests alternativo.

Problemas con interpretación de Tests

¿Si tiramos 1000 veces una moneda y nos sale 517 de caras, esto significa que moneda no se simétrica? ¿Y si sale 542?

  • Usa estatistica.
  • T-test.
  • Bootstrap.

Data Mining: market-basket model

  • Compras comunes: data mining para encontrar relaciones no triviales que contiene productos frecuentemente buscado.
  • Monitoreo automatizado de competencia de estos productos.
  • Oferta del producto popular mejor que competición.
  • Precio normal o alto de productos relacionados interferidos de data mining.
  • Ventaja: significante mejora de ganancia.
  • ¿Funciona? Tests.

Categorizar clientes

RFM- Recency, Frequency, Monetary Value.

  • Técnica antigua, pero brutalmente eficaz basada en historico de compra.
  • Con herramientas tecnológicas fácil de implementar a escala grande, por ejemplo utilizando quntiles.

Clustering automático de clientes:

  • Técnica moderan de Machine Learnig, que permite categorización basada en muchas dimensiones a la vez como compras, tipo de compra, comportamiento, enganche etc.

Aplicación a priceing

  • Ofertas dedicadas para grupo/cluster de usuarios.
  • Control automática de niveles de pedidos (descuentos deberían implicar mas compras, si no es así, a se anula oferta para el grupo/cluster).
  • Para gente de cluster que realiza muchas de compras, mejores precios de algunos productos.

Otras ideas