INTRODUCCIÓN

a minería de reglas de asociación se emplea para descubrir patrones de objetos o atributos que suelen ocurrir juntos, a partir del estudio de bases de datos transaccionales. Concretamente, una regla de asociación es una implicación de la forma X ⇒Y ⟹Y, donde X e Y son dos conjuntos disjuntos de items. Esto significa que si encontramos todos los items en X en una transacción, esperamos encontrar también los items en Y (con una determinada confianza). El lado izquierdo de la regla recibe el nombre de antecedente o lenft-hand-side (LHS) y el lado derecho el nombre de consecuente o right-hand-side (RHS). Esto permite establecer relaciones entre variables cualitativas.

EJEMPLIFICACIÓN

A continuación se realizará un ejemplo de obtención de reglas de asociación a partir de un conjunto de datos que contiene 12500 pedidos (transacciones) en un establecimiento de alimentación.

Base

##   order_id          product_name
## 1        2    Organic Egg Whites
## 2        2 Michigan Organic Kale
## 3        2         Garlic Powder
## 4        2        Coconut Butter
## 5        2     Natural Sweetener
## 6        2               Carrots
Como se puede observar la base cuenta con dos variables, order_id, que hace referencia al número o ID del pedido, de igual manera cuenta con una (product_name)
Para poder realizar el análisis se procederá a reestructurar la información. Para lo cual se transformará los datos en formato tipo trformatean los datos a una matriz booleada.
## [1] "100"  "1000" "1002"
## [1] "#2 Coffee Filters"                     
## [2] "#4 Natural Brown Coffee Filters"       
## [3] "& Go! Hazelnut Spread + Pretzel Sticks"
## transactions in sparse format with
##  12500 transactions (rows) and
##  17917 items (columns)
Como se puede observar una vez realizado el proceso, obtenemos una base en la cual consta con transcciones en las filas e items en las columnas, teniendo un total de 17917 item y 12500 transacciones.

Inspección items

A continuación se presenta los items correspondientes a las dos primeras transacciones, con lo cual se puede observar que la primera transacción está compuesta por soda y agua de manantial, y la segunda con exactamente 7 items, entre ellos se tiene a las semillas de chía enteras,manzana de jazz,entre otros productos.
##     items                                                                                      transactionID
## [1] {Soda,                                                                                                  
##      Spring Water}                                                                                      100 
## [2] {Cacao Sweet Raw Chocolate Nibs,                                                                        
##      Jazz Apple,                                                                                            
##      No. 01 Organic Vegan Cold Pressed Juice Kale Spinach Romaine Celery Cucumber Apple Lemon,              
##      Organic Baby Kale Mix,                                                                                 
##      Organic Unsweetened Almond Milk,                                                                       
##      Pitted Dates,                                                                                          
##      Whole Chia Seeds}                                                                                  1000

Tamaños de transacciones

##   tamano
## 1      2
## 2      7
## 3     33
## 4     11
## 5      1
## 6      3
Se presentan las 6 primeras transacciones,en la cual se puede observar que el número de items es muy variado entre transaccions, por ejemplo la transación 3 y 4 cuentan con 33 y 11 items respectivamente.
De igual forma se presenta la distribucion del tamaño de todas las transacciones

##      tamano      
##  Min.   : 1.000  
##  1st Qu.: 4.000  
##  Median : 8.000  
##  Mean   : 9.354  
##  3rd Qu.:13.000  
##  Max.   :68.000
El número máximo de items en un pedido es de 68, y el mínimo es de 1, además la mitad de clientes compran un máximo de 8 items.

Aproximadamente las transacciones que cuentan con alrededor de 8 a 10 items son las que más se han realizado con 2500 transacciones. Además mientras aumentan los items, el número de transacciones son menores.

Soporte por Items

Acontinuación, se presenta el soporte de los primeros 6 Items, es decir la frecuencia en la que cada item aparece a lo largo de las transacciones.
##                                   #2 Coffee Filters 
##                                             0.00024 
##                     #4 Natural Brown Coffee Filters 
##                                             0.00008 
##              & Go! Hazelnut Spread + Pretzel Sticks 
##                                             0.00016 
##                           \\"Darn Good\\" Chili Mix 
##                                             0.00008 
## \\"Mokaccino\\" Milk + Blue Bottle Coffee Chocolate 
##                                             0.00016 
##             0 Calorie Acai Raspberry Water Beverage 
##                                             0.00008
Sin embargo, nos interesa conocer las transacciones en las cuales se han comprado más de un item. Por lo cual se procederá a restringir la información para las transacciones que cuenten con más de dos items.
## [1] 11733 17917
Una vez realizada la restricción, se cuenta con un total de 11733 transacciones y 17917 items, es decir se ha tenido una reducción de 767 transacciones.

Soporte y Confianza

Umbral de Soporte

El soporte hace referencia al número de transacciones que contienen un itemset dividido entre el total de transacciones. Se debe considerar que la base cuenta con una alta dimensionalidad (11733 x 17917), por lo cual se esperaría que cada evento sea poco común, teniendo como resultado un soporte pequeño. Consideremos que un itemset es frecuente cuando aparece en al menos 25 transacciones (se ha comprado al menos 25 veces) y con una confianza del 75%.
## [1] 0.001022756

Umbral de Confianza

## [1] 0.75

El soporte obtenido corresponde al 0,10%.

Para conocer el el número de itemsets recuentes con el soporte anteriormente establecido, procederemos aplicar dos algoritmos, el primero es el Apriori y el segundo.

MÉTODO DE ASOCIACIÓN

Una vez obtenida una variable booleana de cada artículo que representa la presencia o ausencia del mismo en la cesta de compra de la transacción, se pueden analizar los patrones de compra frecuentes representados como reglas de asociación. Para conocer el número de itemsets frecuentes con el soporte anteriormente establecido, se procede a aplicar el método del algoritmo Apriori.

APRIORI

El algoritmo Apriori se caracteriza porque emplea un enfoque iterativo conocido como búsqueda por nivel. En este se utiliza conocimiento previo de las propiedades frecuentes de los conjunto de productos e ir reduciendo el espacio de búsqueda.
## set of 3658 itemsets
## 
## most frequent items:
##                 Banana Bag of Organic Bananas   Organic Strawberries 
##                    315                    276                    212 
##   Organic Baby Spinach   Organic Hass Avocado                (Other) 
##                    203                    198                   4664 
## 
## element (itemset/transaction) length distribution:sizes
##    1    2    3    4 
## 1670 1769  216    3 
## 
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.000   1.000   2.000   1.604   2.000   4.000 
## 
## summary of quality measures:
##     support             count        
##  Min.   :0.001108   Min.   :  13.00  
##  1st Qu.:0.001278   1st Qu.:  15.00  
##  Median :0.001705   Median :  20.00  
##  Mean   :0.002826   Mean   :  33.16  
##  3rd Qu.:0.002727   3rd Qu.:  32.00  
##  Max.   :0.145743   Max.   :1710.00  
## 
## includes transaction ID lists: FALSE 
## 
## mining info:
##           data ntransactions     support confidence
##  transacciones         11733 0.001022756          1
Una vez aplicado el algortimo Apriori se determina que hay 3658 itemsets frecuentes, estos son los que superan el umbral del soporte mínimo establecido correspondiente a 0.10%. Por otro lado, se observa que la mayoría de frecuentes están formados por el item 2.

Top itemsets mas frecuentes

Un itemset

##      items                    support    count
## [1]  {Banana}                 0.14574278 1710 
## [2]  {Bag of Organic Bananas} 0.11957726 1403 
## [3]  {Organic Strawberries}   0.08003068  939 
## [4]  {Organic Baby Spinach}   0.07628058  895 
## [5]  {Organic Hass Avocado}   0.06878036  807 
## [6]  {Organic Avocado}        0.05284241  620 
## [7]  {Large Lemon}            0.04866616  571 
## [8]  {Strawberries}           0.04338191  509 
## [9]  {Limes}                  0.04304100  505 
## [10] {Organic Raspberries}    0.04218870  495

Ahora bien, para un análisis más descriptivo se han tomado los 10 itemsets que presentan un soporte más alto. Entre estos, con un soporte cerca de 0.15 se encuentra el producto “Bananas”. Mientras que el décimo itemset con un soporte alto (un poco menos que 0.05) son las frambuesas orgánicas.

Más de un itemsets

Para viasualizar de mejor forma preliminar las cestas de compra que contengan más de un itemset y a su vez sean frecuentes se realiza el siguiente proceso:.
##      items                                         support    count
## [1]  {Bag of Organic Bananas,Organic Hass Avocado} 0.01968806 231  
## [2]  {Bag of Organic Bananas,Organic Strawberries} 0.01815392 213  
## [3]  {Banana,Organic Baby Spinach}                 0.01713117 201  
## [4]  {Banana,Organic Strawberries}                 0.01704594 200  
## [5]  {Bag of Organic Bananas,Organic Baby Spinach} 0.01670502 196  
## [6]  {Banana,Organic Avocado}                      0.01585272 186  
## [7]  {Bag of Organic Bananas,Organic Raspberries}  0.01329583 156  
## [8]  {Organic Hass Avocado,Organic Strawberries}   0.01286968 151  
## [9]  {Organic Baby Spinach,Organic Strawberries}   0.01201739 141  
## [10] {Banana,Large Lemon}                          0.01176170 138

Como se visualiza en el gráfico, tomando el top 10 de itemsets; ahora con dos productos frecuentes, los que mayor soporte presentan con casi 0.20 es la cesta de aguacates Hass orgánicos y bolsa de bananos orgánicos.

Obtención de reglas

## [1] "Reglas generadas: 8"
## set of 8 rules
## 
## rule length distribution (lhs + rhs):sizes
## 2 3 4 
## 1 6 1 
## 
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##       2       3       3       3       3       4 
## 
## summary of quality measures:
##     support           confidence          lift             count      
##  Min.   :0.001108   Min.   :0.7500   Min.   :  6.602   Min.   :13.00  
##  1st Qu.:0.001342   1st Qu.:0.7619   1st Qu.: 33.937   1st Qu.:15.75  
##  Median :0.001364   Median :0.7771   Median :167.611   Median :16.00  
##  Mean   :0.001385   Mean   :0.7973   Mean   :173.504   Mean   :16.25  
##  3rd Qu.:0.001385   3rd Qu.:0.8024   3rd Qu.:320.646   3rd Qu.:16.25  
##  Max.   :0.001790   Max.   :0.9412   Max.   :335.229   Max.   :21.00  
## 
## mining info:
##           data ntransactions     support confidence
##  transacciones         11733 0.001022756       0.75
En primer lugar, los parámetros indican que hay 8 reglas de asociación, con un lift mínimo de 6.6, al ser este mayor a 1 se muestra que hay patrones reales en las compras.
##     lhs                                                        rhs                                                         support confidence       lift count
## [1] {Yotoddler Organic Pear Spinach Mango Yogurt}           => {Organic Whole Milk Strawberry Beet Berry Yogurt Pouch} 0.001789824  0.7500000 258.816176    21
## [2] {Blueberry Whole Milk Yogurt Pouch,                                                                                                                       
##      Yotoddler Organic Pear Spinach Mango Yogurt}           => {Organic Whole Milk Strawberry Beet Berry Yogurt Pouch} 0.001363675  0.9411765 324.788927    16
## [3] {Blueberry Whole Milk Yogurt Pouch,                                                                                                                       
##      Organic Whole Milk Strawberry Beet Berry Yogurt Pouch} => {Yotoddler Organic Pear Spinach Mango Yogurt}           0.001363675  0.8000000 335.228571    16
## [4] {Organic Whole Milk Strawberry Beet Berry Yogurt Pouch,                                                                                                   
##      Yotoddler Organic Pear Spinach Mango Yogurt}           => {Blueberry Whole Milk Yogurt Pouch}                     0.001363675  0.7619048 319.265306    16
## [5] {Total 2% Lowfat Greek Strained Yogurt With Blueberry,                                                                                                    
##      Total 2% Lowfat Greek Strained Yogurt with Peach}      => {Total 2% with Strawberry Lowfat Greek Strained Yogurt} 0.001363675  0.7619048  76.405372    16
## [6] {Pure Sparkling Water,                                                                                                                                    
##      Sparkling Lemon Water}                                 => {Sparkling Water Grapefruit}                            0.001107986  0.7647059  32.508312    13
## [7] {Lime Sparkling Water,                                                                                                                                    
##      Pure Sparkling Water}                                  => {Sparkling Water Grapefruit}                            0.001448905  0.8095238  34.413561    17
## [8] {Organic Baby Spinach,                                                                                                                                    
##      Organic Hass Avocado,                                                                                                                                    
##      Organic Raspberries}                                   => {Bag of Organic Bananas}                                0.001278445  0.7894737   6.602206    15
Por otro lado, de las 8 reglas, 2 contienen 2 items, 1 contiene 3 y las demás más de 3 en el antecedente (lhs).

Reglas Redundantes

## set of 0 rules
Las reglas son redundantes cuando tienen el mismo antecedente y consecuente. Es decir, cuando la parte izquierda es igual a la parte derecha. En relación al nivel de confianza. Por lo que no se presenta redundancia en cuanto a las reglas establecidas con anterioridad.

Reglas obtenidas ordenadas por orden descendente de confianza

##     lhs                                                        rhs                                                         support confidence       lift count
## [1] {Blueberry Whole Milk Yogurt Pouch,                                                                                                                       
##      Yotoddler Organic Pear Spinach Mango Yogurt}           => {Organic Whole Milk Strawberry Beet Berry Yogurt Pouch} 0.001363675  0.9411765 324.788927    16
## [2] {Lime Sparkling Water,                                                                                                                                    
##      Pure Sparkling Water}                                  => {Sparkling Water Grapefruit}                            0.001448905  0.8095238  34.413561    17
## [3] {Blueberry Whole Milk Yogurt Pouch,                                                                                                                       
##      Organic Whole Milk Strawberry Beet Berry Yogurt Pouch} => {Yotoddler Organic Pear Spinach Mango Yogurt}           0.001363675  0.8000000 335.228571    16
## [4] {Organic Baby Spinach,                                                                                                                                    
##      Organic Hass Avocado,                                                                                                                                    
##      Organic Raspberries}                                   => {Bag of Organic Bananas}                                0.001278445  0.7894737   6.602206    15
## [5] {Pure Sparkling Water,                                                                                                                                    
##      Sparkling Lemon Water}                                 => {Sparkling Water Grapefruit}                            0.001107986  0.7647059  32.508312    13
## [6] {Organic Whole Milk Strawberry Beet Berry Yogurt Pouch,                                                                                                   
##      Yotoddler Organic Pear Spinach Mango Yogurt}           => {Blueberry Whole Milk Yogurt Pouch}                     0.001363675  0.7619048 319.265306    16
## [7] {Total 2% Lowfat Greek Strained Yogurt With Blueberry,                                                                                                    
##      Total 2% Lowfat Greek Strained Yogurt with Peach}      => {Total 2% with Strawberry Lowfat Greek Strained Yogurt} 0.001363675  0.7619048  76.405372    16
## [8] {Yotoddler Organic Pear Spinach Mango Yogurt}           => {Organic Whole Milk Strawberry Beet Berry Yogurt Pouch} 0.001789824  0.7500000 258.816176    21
Las primeras reglas son las que se presentan con mayor nivel de confianza de las que las siguen.

Filtros

Tomando en cuenta las reglas que ya se establecieron con anterioridad, es posible crear restricciones de las que contengan determinado item. Para ello, se toma a consideración aquellos items que más se presenta en las reglas, en este caso es la bolsa de yogurt de leche entera de arándanos, seguido de agua con gas de lima. Con ello se ejecuta el filtro con una confianza superior al 90%. También hay la posibilidad que estas restricciones contengan más de un item.
##     lhs                                              rhs                                                         support confidence     lift count
## [1] {Blueberry Whole Milk Yogurt Pouch,                                                                                                           
##      Yotoddler Organic Pear Spinach Mango Yogurt} => {Organic Whole Milk Strawberry Beet Berry Yogurt Pouch} 0.001363675  0.9411765 324.7889    16
##     lhs                       rhs                              support confidence     lift count
## [1] {Lime Sparkling Water,                                                                      
##      Pure Sparkling Water} => {Sparkling Water Grapefruit} 0.001448905  0.8095238 34.41356    17

Reglas Maximales

## set of 7 rules
##     lhs                                                        rhs                                                         support confidence       lift count
## [1] {Blueberry Whole Milk Yogurt Pouch,                                                                                                                       
##      Yotoddler Organic Pear Spinach Mango Yogurt}           => {Organic Whole Milk Strawberry Beet Berry Yogurt Pouch} 0.001363675  0.9411765 324.788927    16
## [2] {Blueberry Whole Milk Yogurt Pouch,                                                                                                                       
##      Organic Whole Milk Strawberry Beet Berry Yogurt Pouch} => {Yotoddler Organic Pear Spinach Mango Yogurt}           0.001363675  0.8000000 335.228571    16
## [3] {Organic Whole Milk Strawberry Beet Berry Yogurt Pouch,                                                                                                   
##      Yotoddler Organic Pear Spinach Mango Yogurt}           => {Blueberry Whole Milk Yogurt Pouch}                     0.001363675  0.7619048 319.265306    16
## [4] {Total 2% Lowfat Greek Strained Yogurt With Blueberry,                                                                                                    
##      Total 2% Lowfat Greek Strained Yogurt with Peach}      => {Total 2% with Strawberry Lowfat Greek Strained Yogurt} 0.001363675  0.7619048  76.405372    16
## [5] {Pure Sparkling Water,                                                                                                                                    
##      Sparkling Lemon Water}                                 => {Sparkling Water Grapefruit}                            0.001107986  0.7647059  32.508312    13
## [6] {Lime Sparkling Water,                                                                                                                                    
##      Pure Sparkling Water}                                  => {Sparkling Water Grapefruit}                            0.001448905  0.8095238  34.413561    17
## [7] {Organic Baby Spinach,                                                                                                                                    
##      Organic Hass Avocado,                                                                                                                                    
##      Organic Raspberries}                                   => {Bag of Organic Bananas}                                0.001278445  0.7894737   6.602206    15
Una de las ventajas de determinar qué reglas son maximales es la reducción del espacio ya que apartir de itemsets frecuentes maximales (para los que ninguno de sus superconjuntos inmediatos son frecuentes) se pueden deducir cuáles son los itemsets frecuentes. En este caso, 7 de las 8 reglas son maximales.

Métrica de Evaluación

Chi Cuadrado

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   81.12  526.16 3151.20 2914.89 5228.79 5421.83
Debido a que todos los p-valores son mayores a 1, se establece que las reglas tienen un grado de asociación o relación, es decir, no son independientes entre sí.

Fisher

##      Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
## 0.000e+00 0.000e+00 0.000e+00 4.139e-12 0.000e+00 3.312e-11
Debido a que todos los p-valores son menores que 0, existe una alta probabilidad de que las reglas reflejen la existencia de patrones de comportamiento a la hora de comprar.

Coseno

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
## 0.09187 0.21492 0.49131 0.43873 0.66817 0.68061
El valor varía entre 0 y 1, mientras más alto es el valor, más cercana es la relación de asocación entre las reglas. Como se observa, el valor máximo es de 068, que si bien es alto y sobrepasa los 0.5, en promedio las asociaciones son de 0.49. Es decir, existe una relación, pero esta no es muy alta. Sin embargo, esta medida tiene ciertas limitaciones ya que no está influenciado por el número total de transacciones.

Máxima Confianza

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.7500  0.7619  0.7771  0.7973  0.8024  0.9412
Los valores son altos ya que se presentan en un intervalo de 0 a 1. Por lo que se determina que existe en general una confianza máxima entre las reglas de asociación.

Lift

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   6.602  33.937 167.611 173.504 320.646 335.229
Esta es una medida de correlación simple. Como se presentan valores bastante mayores a 1 se determina que las reglas están correlacionadas positivamente, es decir, la ocurrencia de uno implica la ocurrencia de otro.

Kulczynski

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.4001  0.4281  0.5580  0.5541  0.6843  0.7059
Esta medida se puede ver como un promedio de dos medidas de confianza. Además, es la más opcionada para presentar relaciones de patrones entre conjuntos de elementos ya que cuenta con la propiedad de nulovarianza y además trata a la relación de los conjuntos como neutral sin interpretar conjeturas fuertes como en el caso de los demás métodos. Por otro lado, los resultados obtenidos muestran que efectivamente existen relación en las reglas de asociación.

Visualización

En el gráfico se observa la relación de confianza y soporte con la medida lift o correlación simple. De forma preliminar se observa que cuatro de las reglas presentan una alta correlación (entre 250 y 300). Y, una de estas reglas presenta un alto nivel de confianza con un soporte de 0.0013. Mientras que por el contrario, otra regla tiene un soporte alto de 0.0017 con un bajo nivel de confianza (0.75).

ECLAT

Este algoritmo utiliza operaciones de intersección simples para la agrupación de clases de equivalencia junto con el recorrido de la red de abajo hacia arriba.
La principal diferencia entre este algoritmo y Apriori es la forma en que se escanean y analizan los datos. El algoritmo Apriori emplea transacciones almacenadas de forma horizontal, es decir, todos los elementos que forman una misma transacción están en la misma línea. El algoritmo Eclat, sin embargo, analiza las transacciones en formato vertical, donde cada línea contiene un item y las transacciones en las que aparece ese item.
## Eclat
## 
## parameter specification:
##  tidLists     support minlen maxlen            target   ext
##     FALSE 0.001022756      1      5 frequent itemsets FALSE
## 
## algorithmic control:
##  sparse sort verbose
##       7   -2    TRUE
## 
## Absolute minimum support count: 12 
## 
## create itemset ... 
## set transactions ...[17746 item(s), 11733 transaction(s)] done [0.52s].
## sorting and recoding items ... [1670 item(s)] done [0.01s].
## creating sparse bit matrix ... [1670 row(s), 11733 column(s)] done [0.02s].
## writing  ... [3658 set(s)] done [1.91s].
## Creating S4 object  ... done [0.00s].
## set of 3658 itemsets
## set of 3658 itemsets
## 
## most frequent items:
##                 Banana Bag of Organic Bananas   Organic Strawberries 
##                    315                    276                    212 
##   Organic Baby Spinach   Organic Hass Avocado                (Other) 
##                    203                    198                   4664 
## 
## element (itemset/transaction) length distribution:sizes
##    1    2    3    4 
## 1670 1769  216    3 
## 
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.000   1.000   2.000   1.604   2.000   4.000 
## 
## summary of quality measures:
##     support             count        
##  Min.   :0.001108   Min.   :  13.00  
##  1st Qu.:0.001278   1st Qu.:  15.00  
##  Median :0.001705   Median :  20.00  
##  Mean   :0.002826   Mean   :  33.16  
##  3rd Qu.:0.002727   3rd Qu.:  32.00  
##  Max.   :0.145743   Max.   :1710.00  
## 
## includes transaction ID lists: FALSE 
## 
## mining info:
##           data ntransactions     support
##  transacciones         11733 0.001022756
Una vez aplicado el algortimo Eclat y al igual que el Apriori se observa que hay 3658 itemsets frecuentes, es decir aquellos que superan el soporte mínimo establecido.Por otro lado, se observa que la mayoría de frecuentes están formados por el itemset 2, seguido de los formados por y itemset.

Reglas

## set of 8 rules
## set of 8 rules
## 
## rule length distribution (lhs + rhs):sizes
## 2 3 4 
## 1 6 1 
## 
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##       2       3       3       3       3       4 
## 
## summary of quality measures:
##     support           confidence          lift            itemset      
##  Min.   :0.001108   Min.   :0.7500   Min.   :  6.602   Min.   :   9.0  
##  1st Qu.:0.001342   1st Qu.:0.7619   1st Qu.: 33.937   1st Qu.:   9.0  
##  Median :0.001364   Median :0.7771   Median :167.611   Median :  74.0  
##  Mean   :0.001385   Mean   :0.7973   Mean   :173.504   Mean   : 365.4  
##  3rd Qu.:0.001385   3rd Qu.:0.8024   3rd Qu.:320.646   3rd Qu.: 415.5  
##  Max.   :0.001790   Max.   :0.9412   Max.   :335.229   Max.   :1910.0  
## 
## mining info:
##           data ntransactions     support confidence
##  transacciones         11733 0.001022756       0.75
Como se puede observar se han generado 8 reglas. El mínimo lift es de 6.602 y al ser este myor a uno indica que hay patrones reales de compra.
##     lhs                                                        rhs                                                         support confidence       lift itemset
## [1] {Organic Whole Milk Strawberry Beet Berry Yogurt Pouch,                                                                                                     
##      Yotoddler Organic Pear Spinach Mango Yogurt}           => {Blueberry Whole Milk Yogurt Pouch}                     0.001363675  0.7619048 319.265306       9
## [2] {Blueberry Whole Milk Yogurt Pouch,                                                                                                                         
##      Yotoddler Organic Pear Spinach Mango Yogurt}           => {Organic Whole Milk Strawberry Beet Berry Yogurt Pouch} 0.001363675  0.9411765 324.788927       9
## [3] {Blueberry Whole Milk Yogurt Pouch,                                                                                                                         
##      Organic Whole Milk Strawberry Beet Berry Yogurt Pouch} => {Yotoddler Organic Pear Spinach Mango Yogurt}           0.001363675  0.8000000 335.228571       9
## [4] {Yotoddler Organic Pear Spinach Mango Yogurt}           => {Organic Whole Milk Strawberry Beet Berry Yogurt Pouch} 0.001789824  0.7500000 258.816176      13
## [5] {Total 2% Lowfat Greek Strained Yogurt With Blueberry,                                                                                                      
##      Total 2% Lowfat Greek Strained Yogurt with Peach}      => {Total 2% with Strawberry Lowfat Greek Strained Yogurt} 0.001363675  0.7619048  76.405372     135
## [6] {Pure Sparkling Water,                                                                                                                                      
##      Sparkling Lemon Water}                                 => {Sparkling Water Grapefruit}                            0.001107986  0.7647059  32.508312     412
## [7] {Lime Sparkling Water,                                                                                                                                      
##      Pure Sparkling Water}                                  => {Sparkling Water Grapefruit}                            0.001448905  0.8095238  34.413561     426
## [8] {Organic Baby Spinach,                                                                                                                                      
##      Organic Hass Avocado,                                                                                                                                      
##      Organic Raspberries}                                   => {Bag of Organic Bananas}                                0.001278445  0.7894737   6.602206    1910
A diferencia del Apriori las reglas generadas en este métod, muestra que 6 de las reglas contienen 3 items, y las otras dos cuentan con 2 y 4 items en el antecedente (lhs).

Reglas Redundantes

## set of 0 rules
No se presenta redundancia en cuanto a las reglas obtenidas anteiormente.

Reglas obtenidas ordenadas por orden descendente de confianza

##     lhs                                                        rhs                                                         support confidence       lift itemset
## [1] {Blueberry Whole Milk Yogurt Pouch,                                                                                                                         
##      Yotoddler Organic Pear Spinach Mango Yogurt}           => {Organic Whole Milk Strawberry Beet Berry Yogurt Pouch} 0.001363675  0.9411765 324.788927       9
## [2] {Lime Sparkling Water,                                                                                                                                      
##      Pure Sparkling Water}                                  => {Sparkling Water Grapefruit}                            0.001448905  0.8095238  34.413561     426
## [3] {Blueberry Whole Milk Yogurt Pouch,                                                                                                                         
##      Organic Whole Milk Strawberry Beet Berry Yogurt Pouch} => {Yotoddler Organic Pear Spinach Mango Yogurt}           0.001363675  0.8000000 335.228571       9
## [4] {Organic Baby Spinach,                                                                                                                                      
##      Organic Hass Avocado,                                                                                                                                      
##      Organic Raspberries}                                   => {Bag of Organic Bananas}                                0.001278445  0.7894737   6.602206    1910
## [5] {Pure Sparkling Water,                                                                                                                                      
##      Sparkling Lemon Water}                                 => {Sparkling Water Grapefruit}                            0.001107986  0.7647059  32.508312     412
## [6] {Organic Whole Milk Strawberry Beet Berry Yogurt Pouch,                                                                                                     
##      Yotoddler Organic Pear Spinach Mango Yogurt}           => {Blueberry Whole Milk Yogurt Pouch}                     0.001363675  0.7619048 319.265306       9
## [7] {Total 2% Lowfat Greek Strained Yogurt With Blueberry,                                                                                                      
##      Total 2% Lowfat Greek Strained Yogurt with Peach}      => {Total 2% with Strawberry Lowfat Greek Strained Yogurt} 0.001363675  0.7619048  76.405372     135
## [8] {Yotoddler Organic Pear Spinach Mango Yogurt}           => {Organic Whole Milk Strawberry Beet Berry Yogurt Pouch} 0.001789824  0.7500000 258.816176      13
Como se puede observar la regla más importante en relación a la confianza, es aquella en la cual comprar Bolsa de yogurt de leche entera de arándanos y también un Yogur de Pera, Espinacas y Mango implicaría tambien que se va a adquirir una Bolsa de yogurt de yogur de fresa y remolacha con leche entera orgánica.

Métrica de Evaluación

Fisher

##      Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
## 0.000e+00 0.000e+00 0.000e+00 4.139e-12 0.000e+00 3.312e-11
Como los valores son inferiores a 0, se puede evidenciar que existe una alta probabilidad de las reglas reflejen la existencia de patrones de comportamiento a la hora de comprar.

Kulczynski

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.4001  0.4281  0.5580  0.5541  0.6843  0.7059
Los resultados obtenidos muestran que efectivamente existen relación en las reglas de asociación.

CONCLUSIONES

A l analizar los dos métodos tanto el Apriori como el Eclat, aunque sus estructuras son diferentes para generar reglas de asosiación, se pudo obsrvar que ambos métodos regenraron exactamente las mismas reglas, dado el soporte mínimo y la confianza.
Aunque los métodos de evaluación presentados cumplen con la propiedad de ser invarientes nulos, los valores presentados a la hora de la medición son bastante diferentes, ello provoca conclusciones drásticas como que los conjuntos están asociados de forma negativa o positiva. Por esta razón, el método más adecuado a utilizar es Kulczynski, ya que este toma a ambos conjuntos como netrales, para tratar a la asimetría de forma más equilibrada.
Finalmente, e podría utilizar cualquiera d elos dos métodos ya que tienen resultados similares, sin embargo el Apriori es el más utilizado al momento de establecer transacciones frecuentes y reglas de asociación.