Modelos de Canastas y Reglas de Asociación

Unidad 4 - Técnicas de Personalización en Investigación de Mercados

Enver G. Tarazona Vargas
tarazona_eg@up.edu.pe

1MN022 - Investigación de Mercados Aplicada
Universidad del Pacífico

¿Qué aprenderás?

  • Conocer los usos y ventajas del análisis de la canasta de compras (reglas de asociación).

  • Reconocer la importancia del análisis de la canasta de compras para direccionar campañas de marketing basadas en analítica.

  • Generar reglas de asociación relevantes a través del algoritmo A-Priori usando R.

Modelo Mercado - Canasta

Reglas de Asociación

  • Estas relaciones se describen en la forma de reglas de asociación.

  • Las reglas de asociación son útiles para descubrir relaciones que sean de interés en conjuntos de datos.

  • Las reglas de asociación usualmente parten de una base de datos de transacciones, \(D\).

  • Cada transacción consiste de un identificador y un conjunto de items (p. ej. productos, páginas web, cursos) \(\left\{ i_{1},i_{2},\ldots,i_{n}\right\}\) seleccionados de todos los ítems posibles \((I)\).

Bases de Datos de Transacciones

  • Por ejemplo, la siguiente tabla es un ejemplo de una base de datos de transacciones:

  • Una regla de asociación es un implicancia de la forma \(X\Rightarrow Y\), tal que \(X\subset I\), \(Y\subset I\) y \(X\cap Y=\emptyset\).

Reglas de Asociación

  • Es importante notar que las reglas de asociación son de naturaleza estocástica, lo cual implica que no deben ser interpretados como verdades universales y son caracterizadas por medidas estadísticas que cuantifican la fuerza de la asociación.

  • Las reglas miden asociaciones y no deben ser interpretadas de forma causal.

Ejercicio:

¿Cuál es el soporte, la confianza y el lift de la regla \(\{Milk, Diaper\}\Rightarrow \{Beer\}\)?

Algoritmo A-Priori

Algoritmo A-Priori

Generalmente se siguen 2 pasos:

  • Generacion de itemsets frecuentes: Encontrar todos los itemsets que cumplan con Soporte \(\geq\) minsup

  • Derivacion de reglas de asociacion: Generar reglas de asociación a partir de los itemset frecuentes encontrados que cumplan con Confianza \(\geq\) mincon.

Generación de itemsets frecuentes

Derivación de reglas de asociación

  • Una vez encontrados los itemset frecuentes, se encuentran las reglas de asociación:

  • Por ejemplo si ${ A,B,C,D} $ es un itemset frecuente, entonces las posibles reglas de asociación serian:

  • Se encontrarían las reglas que cumplan con Confianza \(\geq\) mincon

Ideas finales

  • El análisis de la canasta de compras es una de las técnicas claves utilizadas dentro de la analítica de clientes para descubrir asociaciones entre productos

  • Permite optimizar campañas, generar promociones y, con ello, impulsan mayores ventas.

  • El algoritmo a-priori permite definir reglas de asociación relevantes para descubrir combinaciones de productos frecuentes; y así, por ejemplo, colocar los productos asociados cerca unos de otros en un ámbito presencial, o generar recomendaciones sobre el entorno digital.

¿Quieres aprender más?

  • Leskovec, J., Rajaraman, A., & Ullman, J. D. (2014). Mining of massive datasets (Second edition.) (pp.capitulo 6). Cambridge University Press

  • Han, J., Pei, J., & Kamber, M. (2023). Data Mining Concepts and Techniques (4th Edition). (pp. Capítulo 6). Elsevier.