###Poner imagenes en codigo, tiene que ser png o algún GIF, puedes usar file.choose() en la consola para encontrar la dirección de un documento

Instalar paquetes y llamar librerías</span)>

#install.packages("tidyverse") #Paquete global para manipulación y análisis de datos, tinyverse ess un paquete global que tiene muchos otros paquetes incluidos, que es para manipular datos. 
library(tidyverse)

#install.packages("plyr")
library(plyr)

# install.packages("dplyr") #Sirve para filtrar bases de datos
library(dplyr)

#install.packages("janitor") #Examinar y limpiar bases de datos sucias
library(janitor)

#install.packages("Matrix") #Para trabajar con matrices
library(Matrix)

#install.packages("arules") #Genera reglas de asociación
library(arules)

#install.packages("arulesViz") #Visualizar reglas de asociación
library(arulesViz)

#install.packages("datasets") 
library(datasets)

#Importar la base de datos

#file.choose()
df <- read.csv("/Users/danielaibarra/Desktop/Bootcamp Programación/abarrotes.csv")

#Análisis Descriptivo

summary(df)
##  vcClaveTienda        DescGiro         Codigo.Barras            PLU        
##  Length:200625      Length:200625      Min.   :8.347e+05   Min.   : 1.00   
##  Class :character   Class :character   1st Qu.:7.501e+12   1st Qu.: 1.00   
##  Mode  :character   Mode  :character   Median :7.501e+12   Median : 1.00   
##                                        Mean   :5.950e+12   Mean   : 2.11   
##                                        3rd Qu.:7.501e+12   3rd Qu.: 1.00   
##                                        Max.   :1.750e+13   Max.   :30.00   
##                                                            NA's   :199188  
##     Fecha               Hora              Marca            Fabricante       
##  Length:200625      Length:200625      Length:200625      Length:200625     
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##                                                                             
##    Producto             Precio          Ult.Costo         Unidades     
##  Length:200625      Min.   :-147.00   Min.   :  0.38   Min.   : 0.200  
##  Class :character   1st Qu.:  11.00   1st Qu.:  8.46   1st Qu.: 1.000  
##  Mode  :character   Median :  16.00   Median : 12.31   Median : 1.000  
##                     Mean   :  19.42   Mean   : 15.31   Mean   : 1.262  
##                     3rd Qu.:  25.00   3rd Qu.: 19.23   3rd Qu.: 1.000  
##                     Max.   :1000.00   Max.   :769.23   Max.   :96.000  
##                                                                        
##     F.Ticket      NombreDepartamento NombreFamilia      NombreCategoria   
##  Min.   :     1   Length:200625      Length:200625      Length:200625     
##  1st Qu.: 33964   Class :character   Class :character   Class :character  
##  Median :105993   Mode  :character   Mode  :character   Mode  :character  
##  Mean   :193990                                                           
##  3rd Qu.:383005                                                           
##  Max.   :450040                                                           
##                                                                           
##     Estado              Mts.2      Tipo.ubicación         Giro          
##  Length:200625      Min.   :47.0   Length:200625      Length:200625     
##  Class :character   1st Qu.:53.0   Class :character   Class :character  
##  Mode  :character   Median :60.0   Mode  :character   Mode  :character  
##                     Mean   :56.6                                        
##                     3rd Qu.:60.0                                        
##                     Max.   :62.0                                        
##                                                                         
##  Hora.inicio        Hora.cierre       
##  Length:200625      Length:200625     
##  Class :character   Class :character  
##  Mode  :character   Mode  :character  
##                                       
##                                       
##                                       
## 
str(df)
## 'data.frame':    200625 obs. of  22 variables:
##  $ vcClaveTienda     : chr  "MX001" "MX001" "MX001" "MX001" ...
##  $ DescGiro          : chr  "Abarrotes" "Abarrotes" "Abarrotes" "Abarrotes" ...
##  $ Codigo.Barras     : num  7.5e+12 7.5e+12 7.5e+12 7.5e+12 7.5e+12 ...
##  $ PLU               : int  NA NA NA NA NA NA NA NA NA NA ...
##  $ Fecha             : chr  "19/06/20" "19/06/20" "19/06/20" "19/06/20" ...
##  $ Hora              : chr  "8:16:21" "8:23:33" "8:24:33" "8:24:33" ...
##  $ Marca             : chr  "NUTRI LECHE" "DAN UP" "BIMBO" "PEPSI" ...
##  $ Fabricante        : chr  "MEXILAC" "DANONE DE MEXICO" "GRUPO BIMBO" "PEPSI-COLA MEXICANA" ...
##  $ Producto          : chr  "Nutri Leche 1 Litro" "DANUP STRAWBERRY P/BEBER 350GR NAL" "Rebanadas Bimbo 2Pz" "Pepsi N.R. 400Ml" ...
##  $ Precio            : num  16 14 5 8 19.5 16 14 5 8 19.5 ...
##  $ Ult.Costo         : num  12.3 14 5 8 15 ...
##  $ Unidades          : num  1 1 1 1 1 1 1 1 1 1 ...
##  $ F.Ticket          : int  1 2 3 3 4 1 2 3 3 4 ...
##  $ NombreDepartamento: chr  "Abarrotes" "Abarrotes" "Abarrotes" "Abarrotes" ...
##  $ NombreFamilia     : chr  "Lacteos y Refrigerados" "Lacteos y Refrigerados" "Pan y Tortilla" "Bebidas" ...
##  $ NombreCategoria   : chr  "Leche" "Yogurt" "Pan Dulce Empaquetado" "Refrescos Plástico (N.R.)" ...
##  $ Estado            : chr  "Nuevo León" "Nuevo León" "Nuevo León" "Nuevo León" ...
##  $ Mts.2             : int  60 60 60 60 60 60 60 60 60 60 ...
##  $ Tipo.ubicación    : chr  "Esquina" "Esquina" "Esquina" "Esquina" ...
##  $ Giro              : chr  "Abarrotes" "Abarrotes" "Abarrotes" "Abarrotes" ...
##  $ Hora.inicio       : chr  "8:00" "8:00" "8:00" "8:00" ...
##  $ Hora.cierre       : chr  "22:00" "22:00" "22:00" "22:00" ...
# count(df, vcClaveTienda, sort= TRUE)
# count(df, DescGiro, sort= TRUE)
# count(df, Fecha, sort= TRUE)
# count(df, Hora, sort= TRUE)
# count(df, Marca, sort= TRUE)
# count(df, Fabricante, sort= TRUE)
# count(df, Producto, sort= TRUE)
# count(df, NombreDepartamento, sort= TRUE)
# count(df, NombreFamilia, sort= TRUE)
# count(df, NombreCategoria, sort= TRUE)
# count(df, Mts.2, sort= TRUE)
# count(df, Tipo.ubicación, sort= TRUE)
# count(df, Giro, sort= TRUE)
# count(df, Hora.inicio, sort= TRUE)
# count(df, Hora.cierre, sort= TRUE)

head(df, n=10)
##    vcClaveTienda  DescGiro Codigo.Barras PLU    Fecha    Hora
## 1          MX001 Abarrotes   7.50102e+12  NA 19/06/20 8:16:21
## 2          MX001 Abarrotes   7.50103e+12  NA 19/06/20 8:23:33
## 3          MX001 Abarrotes   7.50100e+12  NA 19/06/20 8:24:33
## 4          MX001 Abarrotes   7.50103e+12  NA 19/06/20 8:24:33
## 5          MX001 Abarrotes   7.50103e+12  NA 19/06/20 8:26:28
## 6          MX001 Abarrotes   7.50102e+12  NA 19/06/20 8:16:21
## 7          MX001 Abarrotes   7.50103e+12  NA 19/06/20 8:23:33
## 8          MX001 Abarrotes   7.50100e+12  NA 19/06/20 8:24:33
## 9          MX001 Abarrotes   7.50103e+12  NA 19/06/20 8:24:33
## 10         MX001 Abarrotes   7.50103e+12  NA 19/06/20 8:26:28
##                         Marca                 Fabricante
## 1                 NUTRI LECHE                    MEXILAC
## 2                      DAN UP           DANONE DE MEXICO
## 3                       BIMBO                GRUPO BIMBO
## 4                       PEPSI        PEPSI-COLA MEXICANA
## 5  BLANCA NIEVES (DETERGENTE) FABRICA DE JABON LA CORONA
## 6                 NUTRI LECHE                    MEXILAC
## 7                      DAN UP           DANONE DE MEXICO
## 8                       BIMBO                GRUPO BIMBO
## 9                       PEPSI        PEPSI-COLA MEXICANA
## 10 BLANCA NIEVES (DETERGENTE) FABRICA DE JABON LA CORONA
##                              Producto Precio Ult.Costo Unidades F.Ticket
## 1                 Nutri Leche 1 Litro   16.0     12.31        1        1
## 2  DANUP STRAWBERRY P/BEBER 350GR NAL   14.0     14.00        1        2
## 3                 Rebanadas Bimbo 2Pz    5.0      5.00        1        3
## 4                    Pepsi N.R. 400Ml    8.0      8.00        1        3
## 5       Detergente Blanca Nieves 500G   19.5     15.00        1        4
## 6                 Nutri Leche 1 Litro   16.0     12.31        1        1
## 7  DANUP STRAWBERRY P/BEBER 350GR NAL   14.0     14.00        1        2
## 8                 Rebanadas Bimbo 2Pz    5.0      5.00        1        3
## 9                    Pepsi N.R. 400Ml    8.0      8.00        1        3
## 10      Detergente Blanca Nieves 500G   19.5     15.00        1        4
##    NombreDepartamento          NombreFamilia           NombreCategoria
## 1           Abarrotes Lacteos y Refrigerados                     Leche
## 2           Abarrotes Lacteos y Refrigerados                    Yogurt
## 3           Abarrotes         Pan y Tortilla     Pan Dulce Empaquetado
## 4           Abarrotes                Bebidas Refrescos Plástico (N.R.)
## 5           Abarrotes     Limpieza del Hogar                Lavandería
## 6           Abarrotes Lacteos y Refrigerados                     Leche
## 7           Abarrotes Lacteos y Refrigerados                    Yogurt
## 8           Abarrotes         Pan y Tortilla     Pan Dulce Empaquetado
## 9           Abarrotes                Bebidas Refrescos Plástico (N.R.)
## 10          Abarrotes     Limpieza del Hogar                Lavandería
##        Estado Mts.2 Tipo.ubicación      Giro Hora.inicio Hora.cierre
## 1  Nuevo León    60        Esquina Abarrotes        8:00       22:00
## 2  Nuevo León    60        Esquina Abarrotes        8:00       22:00
## 3  Nuevo León    60        Esquina Abarrotes        8:00       22:00
## 4  Nuevo León    60        Esquina Abarrotes        8:00       22:00
## 5  Nuevo León    60        Esquina Abarrotes        8:00       22:00
## 6  Nuevo León    60        Esquina Abarrotes        8:00       22:00
## 7  Nuevo León    60        Esquina Abarrotes        8:00       22:00
## 8  Nuevo León    60        Esquina Abarrotes        8:00       22:00
## 9  Nuevo León    60        Esquina Abarrotes        8:00       22:00
## 10 Nuevo León    60        Esquina Abarrotes        8:00       22:00
tail(df, n=10)
##        vcClaveTienda DescGiro Codigo.Barras PLU    Fecha     Hora
## 200616         MX005 Depósito   7.62221e+12  NA 07/08/20 19:30:13
## 200617         MX005 Depósito   7.62221e+12  NA 25/07/20 18:42:24
## 200618         MX005 Depósito   7.62221e+12  NA 18/07/20 22:45:58
## 200619         MX005 Depósito   7.62221e+12  NA 12/07/20  0:36:34
## 200620         MX005 Depósito   7.62221e+12  NA 12/07/20  1:08:25
## 200621         MX005 Depósito   7.62221e+12  NA 23/10/20 22:17:37
## 200622         MX005 Depósito   7.62221e+12  NA 10/10/20 20:30:20
## 200623         MX005 Depósito   7.62221e+12  NA 10/10/20 22:40:43
## 200624         MX005 Depósito   7.62221e+12  NA 27/06/20 22:30:19
## 200625         MX005 Depósito   7.62221e+12  NA 26/06/20 23:43:34
##                    Marca    Fabricante                          Producto Precio
## 200616 TRIDENT XTRA CARE CADBURY ADAMS Trident Xtracare Freshmint 16.32G      9
## 200617 TRIDENT XTRA CARE CADBURY ADAMS Trident Xtracare Freshmint 16.32G      9
## 200618 TRIDENT XTRA CARE CADBURY ADAMS Trident Xtracare Freshmint 16.32G      9
## 200619 TRIDENT XTRA CARE CADBURY ADAMS Trident Xtracare Freshmint 16.32G      9
## 200620 TRIDENT XTRA CARE CADBURY ADAMS Trident Xtracare Freshmint 16.32G      9
## 200621 TRIDENT XTRA CARE CADBURY ADAMS Trident Xtracare Freshmint 16.32G      9
## 200622 TRIDENT XTRA CARE CADBURY ADAMS Trident Xtracare Freshmint 16.32G      9
## 200623 TRIDENT XTRA CARE CADBURY ADAMS Trident Xtracare Freshmint 16.32G      9
## 200624 TRIDENT XTRA CARE CADBURY ADAMS Trident Xtracare Freshmint 16.32G      9
## 200625 TRIDENT XTRA CARE CADBURY ADAMS Trident Xtracare Freshmint 16.32G      9
##        Ult.Costo Unidades F.Ticket NombreDepartamento NombreFamilia
## 200616      6.92        1   106411          Abarrotes      Dulcería
## 200617      6.92        1   104693          Abarrotes      Dulcería
## 200618      6.92        1   103856          Abarrotes      Dulcería
## 200619      6.92        1   103087          Abarrotes      Dulcería
## 200620      6.92        1   103100          Abarrotes      Dulcería
## 200621      6.92        1   116598          Abarrotes      Dulcería
## 200622      6.92        1   114886          Abarrotes      Dulcería
## 200623      6.92        1   114955          Abarrotes      Dulcería
## 200624      6.92        1   101121          Abarrotes      Dulcería
## 200625      6.92        1   100879          Abarrotes      Dulcería
##        NombreCategoria       Estado Mts.2 Tipo.ubicación       Giro Hora.inicio
## 200616 Gomas de Mazcar Quintana Roo    58        Esquina Mini súper        8:00
## 200617 Gomas de Mazcar Quintana Roo    58        Esquina Mini súper        8:00
## 200618 Gomas de Mazcar Quintana Roo    58        Esquina Mini súper        8:00
## 200619 Gomas de Mazcar Quintana Roo    58        Esquina Mini súper        8:00
## 200620 Gomas de Mazcar Quintana Roo    58        Esquina Mini súper        8:00
## 200621 Gomas de Mazcar Quintana Roo    58        Esquina Mini súper        8:00
## 200622 Gomas de Mazcar Quintana Roo    58        Esquina Mini súper        8:00
## 200623 Gomas de Mazcar Quintana Roo    58        Esquina Mini súper        8:00
## 200624 Gomas de Mazcar Quintana Roo    58        Esquina Mini súper        8:00
## 200625 Gomas de Mazcar Quintana Roo    58        Esquina Mini súper        8:00
##        Hora.cierre
## 200616       21:00
## 200617       21:00
## 200618       21:00
## 200619       21:00
## 200620       21:00
## 200621       21:00
## 200622       21:00
## 200623       21:00
## 200624       21:00
## 200625       21:00

##Tablas

#Tablas de Tienda y Departamento
tabyl(df, vcClaveTienda, NombreDepartamento)
##  vcClaveTienda Abarrotes Bebes e Infantiles Carnes Farmacia Ferretería Mercería
##          MX001     95415                515      1      147        245       28
##          MX002      6590                 21      0        4         10        0
##          MX003      4026                 15      0        2          8        0
##          MX004     82234                932      0      102        114       16
##          MX005     10014                  0      0        0          0        0
##  Papelería Productos a Eliminar Vinos y Licores
##         35                    3              80
##          0                    0               4
##          0                    0               0
##         32                    5              20
##          7                    0               0
#Tablas de Estado y Hora de inicio
tabyl(df, Estado, Hora.inicio)
##        Estado  7:00  8:00 9:00
##       Chiapas  4051     0    0
##       Jalisco     0     0 6629
##    Nuevo León     0 96469    0
##  Quintana Roo     0 10021    0
##       Sinaloa 83455     0    0

#Limpieza de Datos

##Técnica 1. Eliminar valores irrelevantes

#Eliminar columnas
#df <- subset(df, select= -c(PLU))

#Eliminar renglones
#df <- df[df$Precio >0, ]

##Técnica 2. Eliminar valores repetidos

df <- distinct(df)

##Técnica 3. Corregir errores tipográficos y similares

df$Unidades <- ceiling(df$Unidades)
summary(df$Unidades)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.000   1.000   1.000   1.262   1.000  96.000

##Técnica 4. Convertir los tipos de datos

#Convertir de caracter a fecha
df$Fecha <- as.Date(df$Fecha, format="%d/%m/%Y") #"Y" es para año con 4 digitos, "y" es para año con 2 digitos
str(df$Fecha)
##  Date[1:200620], format: "0020-06-19" "0020-06-19" "0020-06-19" "0020-06-19" "0020-06-19" ...
summary(df$Fecha)
##         Min.      1st Qu.       Median         Mean      3rd Qu.         Max. 
## "0020-05-01" "0020-06-06" "0020-07-11" "0020-07-18" "0020-08-29" "0020-11-11"

## Técnica 5. Tratar valores faltantes

#Borrar todos los NAs
#df <- na.omit(df)

#Reemplazar los NAs con CEROS
#df[is.na(df)] <- 0

#Reemplazar los NAs con el PROMEDIO
#df$altura[is.na(df$altura)] <- mean(df$altura, na.rm=TRUE)

## Técnica 6. Herramientas Estadísticas

boxplot(df$Precio, horizontal = TRUE)

boxplot(df$Unidades, horizontal = TRUE)

#Generar basket

#Ordenar de menor a mayor la columna Ticket
df <- df[order(df$F.Ticket), ]

head(df)
##   vcClaveTienda  DescGiro Codigo.Barras PLU      Fecha    Hora
## 1         MX001 Abarrotes   7.50102e+12  NA 0020-06-19 8:16:21
## 2         MX001 Abarrotes   7.50103e+12  NA 0020-06-19 8:23:33
## 3         MX001 Abarrotes   7.50100e+12  NA 0020-06-19 8:24:33
## 4         MX001 Abarrotes   7.50103e+12  NA 0020-06-19 8:24:33
## 5         MX001 Abarrotes   7.50103e+12  NA 0020-06-19 8:26:28
## 6         MX001 Abarrotes   7.50103e+12  NA 0020-06-19 8:26:28
##                        Marca                 Fabricante
## 1                NUTRI LECHE                    MEXILAC
## 2                     DAN UP           DANONE DE MEXICO
## 3                      BIMBO                GRUPO BIMBO
## 4                      PEPSI        PEPSI-COLA MEXICANA
## 5 BLANCA NIEVES (DETERGENTE) FABRICA DE JABON LA CORONA
## 6                      FLASH                       ALEN
##                             Producto Precio Ult.Costo Unidades F.Ticket
## 1                Nutri Leche 1 Litro   16.0     12.31        1        1
## 2 DANUP STRAWBERRY P/BEBER 350GR NAL   14.0     14.00        1        2
## 3                Rebanadas Bimbo 2Pz    5.0      5.00        1        3
## 4                   Pepsi N.R. 400Ml    8.0      8.00        1        3
## 5      Detergente Blanca Nieves 500G   19.5     15.00        1        4
## 6      Flash Xtra Brisa Marina 500Ml    9.5      7.31        1        4
##   NombreDepartamento          NombreFamilia           NombreCategoria
## 1          Abarrotes Lacteos y Refrigerados                     Leche
## 2          Abarrotes Lacteos y Refrigerados                    Yogurt
## 3          Abarrotes         Pan y Tortilla     Pan Dulce Empaquetado
## 4          Abarrotes                Bebidas Refrescos Plástico (N.R.)
## 5          Abarrotes     Limpieza del Hogar                Lavandería
## 6          Abarrotes     Limpieza del Hogar      Limpiadores Líquidos
##       Estado Mts.2 Tipo.ubicación      Giro Hora.inicio Hora.cierre
## 1 Nuevo León    60        Esquina Abarrotes        8:00       22:00
## 2 Nuevo León    60        Esquina Abarrotes        8:00       22:00
## 3 Nuevo León    60        Esquina Abarrotes        8:00       22:00
## 4 Nuevo León    60        Esquina Abarrotes        8:00       22:00
## 5 Nuevo León    60        Esquina Abarrotes        8:00       22:00
## 6 Nuevo León    60        Esquina Abarrotes        8:00       22:00
tail(df)
##        vcClaveTienda   DescGiro Codigo.Barras PLU      Fecha     Hora
## 107394         MX004 Carnicería  1.024877e+10  NA 0020-10-15 11:51:40
## 167771         MX004 Carnicería  7.501080e+12  NA 0020-10-15 11:51:40
## 149429         MX004 Carnicería  7.501060e+12  NA 0020-10-15 11:54:37
## 168750         MX004 Carnicería  7.501210e+12  NA 0020-10-15 11:56:52
## 161193         MX004 Carnicería  7.501030e+12  NA 0020-10-15 12:01:54
## 112970         MX004 Carnicería  7.500470e+07  NA 0020-10-15 12:02:36
##                 Marca           Fabricante                       Producto
## 107394         YEMINA               HERDEZ    PASTA SPAGHETTI YEMINA 200G
## 167771     DEL FUERTE ALIMENTOS DEL FUERTE PURE DE TOMATE DEL FUERTE 345G
## 149429 COCA COLA ZERO            COCA COLA           COCA COLA ZERO 600ML
## 168750       DIAMANTE           EMPACADOS              ARROZ DIAMANTE225G
## 161193          PEPSI  PEPSI-COLA MEXICANA              PEPSI N. R. 500ML
## 112970      COCA COLA            COCA COLA     COCA COLA RETORNABLE 500ML
##        Precio Ult.Costo Unidades F.Ticket NombreDepartamento
## 107394      7      5.38        2   450032          Abarrotes
## 167771     12      9.23        1   450032          Abarrotes
## 149429     15     11.54        2   450034          Abarrotes
## 168750     11      8.46        1   450037          Abarrotes
## 161193     10      7.69        1   450039          Abarrotes
## 112970     10      7.69        8   450040          Abarrotes
##               NombreFamilia               NombreCategoria  Estado Mts.2
## 107394       Sopas y Pastas Fideos, Spaguetti, Tallarines Sinaloa    53
## 167771 Salsas y Sazonadores          Salsa para Spaguetti Sinaloa    53
## 149429              Bebidas         Refrescos Retornables Sinaloa    53
## 168750    Granos y Semillas                         Arroz Sinaloa    53
## 161193              Bebidas     Refrescos Plástico (N.R.) Sinaloa    53
## 112970              Bebidas         Refrescos Retornables Sinaloa    53
##        Tipo.ubicación      Giro Hora.inicio Hora.cierre
## 107394        Esquina Abarrotes        7:00       23:00
## 167771        Esquina Abarrotes        7:00       23:00
## 149429        Esquina Abarrotes        7:00       23:00
## 168750        Esquina Abarrotes        7:00       23:00
## 161193        Esquina Abarrotes        7:00       23:00
## 112970        Esquina Abarrotes        7:00       23:00
#Generar el basket
basket <- ddply(df,c("F.Ticket"), function(df)paste(df$Marca, collapse = "," ))

#Eliminar el número de Ticker
basket$F.Ticket <- NULL

#Cambiar el titulo de la columna "V1" a "Marca"
colnames(basket) <- c("Marca")

#Exportar basket
write.csv(basket, "basket.csv", quote = FALSE, row.names = FALSE)

#Market Basket Analysis

#file.choose()
tr <- read.transactions("/Users/danielaibarra/Desktop/Bootcamp Programación/basket.csv", format = "basket", sep=","
                        )
reglas.asociacion <- apriori(tr, parameter = list(supp=0.001, conf=0.2, maxlen=10))
## Apriori
## 
## Parameter specification:
##  confidence minval smax arem  aval originalSupport maxtime support minlen
##         0.2    0.1    1 none FALSE            TRUE       5   0.001      1
##  maxlen target  ext
##      10  rules TRUE
## 
## Algorithmic control:
##  filter tree heap memopt load sort verbose
##     0.1 TRUE TRUE  FALSE TRUE    2    TRUE
## 
## Absolute minimum support count: 115 
## 
## set item appearances ...[0 item(s)] done [0.00s].
## set transactions ...[604 item(s), 115031 transaction(s)] done [0.04s].
## sorting and recoding items ... [207 item(s)] done [0.00s].
## creating transaction tree ... done [0.04s].
## checking subsets of size 1 2 3 done [0.00s].
## writing ... [11 rule(s)] done [0.00s].
## creating S4 object  ... done [0.02s].
summary(reglas.asociacion)
## set of 11 rules
## 
## rule length distribution (lhs + rhs):sizes
##  2 
## 11 
## 
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##       2       2       2       2       2       2 
## 
## summary of quality measures:
##     support           confidence        coverage             lift       
##  Min.   :0.001017   Min.   :0.2069   Min.   :0.003564   Min.   : 1.326  
##  1st Qu.:0.001104   1st Qu.:0.2358   1st Qu.:0.004507   1st Qu.: 1.789  
##  Median :0.001417   Median :0.2442   Median :0.005807   Median : 3.972  
##  Mean   :0.001521   Mean   :0.2537   Mean   :0.006056   Mean   :17.558  
##  3rd Qu.:0.001652   3rd Qu.:0.2685   3rd Qu.:0.006894   3rd Qu.:21.808  
##  Max.   :0.002747   Max.   :0.3098   Max.   :0.010502   Max.   :65.862  
##      count      
##  Min.   :117.0  
##  1st Qu.:127.0  
##  Median :163.0  
##  Mean   :174.9  
##  3rd Qu.:190.0  
##  Max.   :316.0  
## 
## mining info:
##  data ntransactions support confidence
##    tr        115031   0.001        0.2
##                                                                         call
##  apriori(data = tr, parameter = list(supp = 0.001, conf = 0.2, maxlen = 10))
inspect(reglas.asociacion)
##      lhs                  rhs         support     confidence coverage   
## [1]  {FANTA}           => {COCA COLA} 0.001051890 0.2439516  0.004311881
## [2]  {SALVO}           => {FABULOSO}  0.001104050 0.3097561  0.003564257
## [3]  {FABULOSO}        => {SALVO}     0.001104050 0.2347505  0.004703080
## [4]  {COCA COLA ZERO}  => {COCA COLA} 0.001417009 0.2969035  0.004772627
## [5]  {SPRITE}          => {COCA COLA} 0.001347463 0.2069426  0.006511288
## [6]  {PINOL}           => {CLORALEX}  0.001017117 0.2368421  0.004294495
## [7]  {BLUE HOUSE}      => {BIMBO}     0.001712582 0.2720994  0.006293956
## [8]  {HELLMANN´S}      => {BIMBO}     0.001538716 0.2649701  0.005807130
## [9]  {REYMA}           => {CONVERMEX} 0.002095087 0.2441743  0.008580296
## [10] {FUD}             => {BIMBO}     0.001590876 0.2186380  0.007276299
## [11] {COCA COLA LIGHT} => {COCA COLA} 0.002747086 0.2615894  0.010501517
##      lift      count
## [1]   1.562646 121  
## [2]  65.862391 127  
## [3]  65.862391 127  
## [4]   1.901832 163  
## [5]   1.325583 155  
## [6]  25.063647 117  
## [7]   4.078691 197  
## [8]   3.971823 177  
## [9]  18.551922 241  
## [10]  3.277319 183  
## [11]  1.675626 316
reglas.asociacion <- sort(reglas.asociacion, by ="confidence", decreasing = TRUE)
summary(reglas.asociacion)
## set of 11 rules
## 
## rule length distribution (lhs + rhs):sizes
##  2 
## 11 
## 
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##       2       2       2       2       2       2 
## 
## summary of quality measures:
##     support           confidence        coverage             lift       
##  Min.   :0.001017   Min.   :0.2069   Min.   :0.003564   Min.   : 1.326  
##  1st Qu.:0.001104   1st Qu.:0.2358   1st Qu.:0.004507   1st Qu.: 1.789  
##  Median :0.001417   Median :0.2442   Median :0.005807   Median : 3.972  
##  Mean   :0.001521   Mean   :0.2537   Mean   :0.006056   Mean   :17.558  
##  3rd Qu.:0.001652   3rd Qu.:0.2685   3rd Qu.:0.006894   3rd Qu.:21.808  
##  Max.   :0.002747   Max.   :0.3098   Max.   :0.010502   Max.   :65.862  
##      count      
##  Min.   :117.0  
##  1st Qu.:127.0  
##  Median :163.0  
##  Mean   :174.9  
##  3rd Qu.:190.0  
##  Max.   :316.0  
## 
## mining info:
##  data ntransactions support confidence
##    tr        115031   0.001        0.2
##                                                                         call
##  apriori(data = tr, parameter = list(supp = 0.001, conf = 0.2, maxlen = 10))
inspect(reglas.asociacion)
##      lhs                  rhs         support     confidence coverage   
## [1]  {SALVO}           => {FABULOSO}  0.001104050 0.3097561  0.003564257
## [2]  {COCA COLA ZERO}  => {COCA COLA} 0.001417009 0.2969035  0.004772627
## [3]  {BLUE HOUSE}      => {BIMBO}     0.001712582 0.2720994  0.006293956
## [4]  {HELLMANN´S}      => {BIMBO}     0.001538716 0.2649701  0.005807130
## [5]  {COCA COLA LIGHT} => {COCA COLA} 0.002747086 0.2615894  0.010501517
## [6]  {REYMA}           => {CONVERMEX} 0.002095087 0.2441743  0.008580296
## [7]  {FANTA}           => {COCA COLA} 0.001051890 0.2439516  0.004311881
## [8]  {PINOL}           => {CLORALEX}  0.001017117 0.2368421  0.004294495
## [9]  {FABULOSO}        => {SALVO}     0.001104050 0.2347505  0.004703080
## [10] {FUD}             => {BIMBO}     0.001590876 0.2186380  0.007276299
## [11] {SPRITE}          => {COCA COLA} 0.001347463 0.2069426  0.006511288
##      lift      count
## [1]  65.862391 127  
## [2]   1.901832 163  
## [3]   4.078691 197  
## [4]   3.971823 177  
## [5]   1.675626 316  
## [6]  18.551922 241  
## [7]   1.562646 121  
## [8]  25.063647 117  
## [9]  65.862391 127  
## [10]  3.277319 183  
## [11]  1.325583 155
top10reglas <- head(reglas.asociacion, n=10, by= "confidence")
plot(top10reglas, method= "graph", engine= "htmlwidget")
LS0tCnRpdGxlOiAiTWFya2V0IEJhc2tldCBBbmFseXNpcyIKYXV0aG9yOiAiRGFuaWVsYSBJYmFycmEgQTAxNTcxMzgwIgpkYXRlOiAiMjAyNC0wOS0xMCIKb3V0cHV0OiAKICBodG1sX2RvY3VtZW50OgogICAgdG9jOiBUUlVFICNUYWJsZSBvZiBDb250ZW50cwogICAgdG9jX2Zsb2F0OiBUUlVFCiAgICBjb2RlX2Rvd25sb2FkOiBUUlVFICNQb2RlciBkZXNjYXJnYXIgdHUgY29kaWdvIHBvciBzaSBzZSB0ZSBwaWVyZGUgZXN0ZSwgbm8gaGFjZXJsbyBjb24gY29kaWdvcyBkZSBlbXByZXNhcy4KICAgIHRoZW1lOiBjb3NtbyAjQ2FtYmlhciB0aXBvZ3JhZsOtYQplZGl0b3Jfb3B0aW9uczogCiAgY2h1bmtfb3V0cHV0X3R5cGU6IGNvbnNvbGUKLS0tCgojIyNQb25lciBpbWFnZW5lcyBlbiBjb2RpZ28sIHRpZW5lIHF1ZSBzZXIgcG5nIG8gYWxnw7puIEdJRiwgcHVlZGVzIHVzYXIgZmlsZS5jaG9vc2UoKSBlbiBsYSBjb25zb2xhIHBhcmEgZW5jb250cmFyIGxhIGRpcmVjY2nDs24gZGUgdW4gZG9jdW1lbnRvCgohW10oL1VzZXJzL2RhbmllbGFpYmFycmEvRGVza3RvcC9Cb290Y2FtcCBQcm9ncmFtYWNpb8yBbi9HSUYgSk9LRVIuZ2lmKSAKCiMgPHNwYW4gc3R5bGU9ImNvbG9yOiByZWQ7Ij4gSW5zdGFsYXIgcGFxdWV0ZXMgeSBsbGFtYXIgbGlicmVyw61hczwvc3Bhbik+CmBgYHtyIG1lc3NhZ2U9RkFMU0UsIHdhcm5pbmc9RkFMU0V9CiNpbnN0YWxsLnBhY2thZ2VzKCJ0aWR5dmVyc2UiKSAjUGFxdWV0ZSBnbG9iYWwgcGFyYSBtYW5pcHVsYWNpw7NuIHkgYW7DoWxpc2lzIGRlIGRhdG9zLCB0aW55dmVyc2UgZXNzIHVuIHBhcXVldGUgZ2xvYmFsIHF1ZSB0aWVuZSBtdWNob3Mgb3Ryb3MgcGFxdWV0ZXMgaW5jbHVpZG9zLCBxdWUgZXMgcGFyYSBtYW5pcHVsYXIgZGF0b3MuIApsaWJyYXJ5KHRpZHl2ZXJzZSkKCiNpbnN0YWxsLnBhY2thZ2VzKCJwbHlyIikKbGlicmFyeShwbHlyKQoKIyBpbnN0YWxsLnBhY2thZ2VzKCJkcGx5ciIpICNTaXJ2ZSBwYXJhIGZpbHRyYXIgYmFzZXMgZGUgZGF0b3MKbGlicmFyeShkcGx5cikKCiNpbnN0YWxsLnBhY2thZ2VzKCJqYW5pdG9yIikgI0V4YW1pbmFyIHkgbGltcGlhciBiYXNlcyBkZSBkYXRvcyBzdWNpYXMKbGlicmFyeShqYW5pdG9yKQoKI2luc3RhbGwucGFja2FnZXMoIk1hdHJpeCIpICNQYXJhIHRyYWJhamFyIGNvbiBtYXRyaWNlcwpsaWJyYXJ5KE1hdHJpeCkKCiNpbnN0YWxsLnBhY2thZ2VzKCJhcnVsZXMiKSAjR2VuZXJhIHJlZ2xhcyBkZSBhc29jaWFjacOzbgpsaWJyYXJ5KGFydWxlcykKCiNpbnN0YWxsLnBhY2thZ2VzKCJhcnVsZXNWaXoiKSAjVmlzdWFsaXphciByZWdsYXMgZGUgYXNvY2lhY2nDs24KbGlicmFyeShhcnVsZXNWaXopCgojaW5zdGFsbC5wYWNrYWdlcygiZGF0YXNldHMiKSAKbGlicmFyeShkYXRhc2V0cykKCmBgYAoKIzxzcGFuIHN0eWxlPSJjb2xvcjogcmVkOyI+SW1wb3J0YXIgbGEgYmFzZSBkZSBkYXRvczwvc3Bhbj4KYGBge3J9CiNmaWxlLmNob29zZSgpCmRmIDwtIHJlYWQuY3N2KCIvVXNlcnMvZGFuaWVsYWliYXJyYS9EZXNrdG9wL0Jvb3RjYW1wIFByb2dyYW1hY2lvzIFuL2FiYXJyb3Rlcy5jc3YiKQpgYGAKCiM8c3BhbiBzdHlsZT0iY29sb3I6IHJlZDsiPkFuw6FsaXNpcyBEZXNjcmlwdGl2bzwvc3Bhbj4KYGBge3J9CnN1bW1hcnkoZGYpCnN0cihkZikKCiMgY291bnQoZGYsIHZjQ2xhdmVUaWVuZGEsIHNvcnQ9IFRSVUUpCiMgY291bnQoZGYsIERlc2NHaXJvLCBzb3J0PSBUUlVFKQojIGNvdW50KGRmLCBGZWNoYSwgc29ydD0gVFJVRSkKIyBjb3VudChkZiwgSG9yYSwgc29ydD0gVFJVRSkKIyBjb3VudChkZiwgTWFyY2EsIHNvcnQ9IFRSVUUpCiMgY291bnQoZGYsIEZhYnJpY2FudGUsIHNvcnQ9IFRSVUUpCiMgY291bnQoZGYsIFByb2R1Y3RvLCBzb3J0PSBUUlVFKQojIGNvdW50KGRmLCBOb21icmVEZXBhcnRhbWVudG8sIHNvcnQ9IFRSVUUpCiMgY291bnQoZGYsIE5vbWJyZUZhbWlsaWEsIHNvcnQ9IFRSVUUpCiMgY291bnQoZGYsIE5vbWJyZUNhdGVnb3JpYSwgc29ydD0gVFJVRSkKIyBjb3VudChkZiwgTXRzLjIsIHNvcnQ9IFRSVUUpCiMgY291bnQoZGYsIFRpcG8udWJpY2FjacOzbiwgc29ydD0gVFJVRSkKIyBjb3VudChkZiwgR2lybywgc29ydD0gVFJVRSkKIyBjb3VudChkZiwgSG9yYS5pbmljaW8sIHNvcnQ9IFRSVUUpCiMgY291bnQoZGYsIEhvcmEuY2llcnJlLCBzb3J0PSBUUlVFKQoKaGVhZChkZiwgbj0xMCkKdGFpbChkZiwgbj0xMCkKYGBgCgojIzxzcGFuIHN0eWxlPSJjb2xvcjogcmVkOyI+VGFibGFzPC9zcGFuPgpgYGB7cn0KI1RhYmxhcyBkZSBUaWVuZGEgeSBEZXBhcnRhbWVudG8KdGFieWwoZGYsIHZjQ2xhdmVUaWVuZGEsIE5vbWJyZURlcGFydGFtZW50bykKI1RhYmxhcyBkZSBFc3RhZG8geSBIb3JhIGRlIGluaWNpbwp0YWJ5bChkZiwgRXN0YWRvLCBIb3JhLmluaWNpbykKYGBgCgojPHNwYW4gc3R5bGU9ImNvbG9yOiByZWQ7Ij5MaW1waWV6YSBkZSBEYXRvczwvc3Bhbj4KCiMjPHNwYW4gc3R5bGU9ImNvbG9yOiByZWQ7Ij5Uw6ljbmljYSAxLiBFbGltaW5hciB2YWxvcmVzIGlycmVsZXZhbnRlczwvc3Bhbj4KYGBge3J9CiNFbGltaW5hciBjb2x1bW5hcwojZGYgPC0gc3Vic2V0KGRmLCBzZWxlY3Q9IC1jKFBMVSkpCgojRWxpbWluYXIgcmVuZ2xvbmVzCiNkZiA8LSBkZltkZiRQcmVjaW8gPjAsIF0KYGBgCgojIzxzcGFuIHN0eWxlPSJjb2xvcjogcmVkOyI+VMOpY25pY2EgMi4gRWxpbWluYXIgdmFsb3JlcyByZXBldGlkb3M8L3NwYW4+CmBgYHtyfQpkZiA8LSBkaXN0aW5jdChkZikKYGBgCgojIzxzcGFuIHN0eWxlPSJjb2xvcjogcmVkOyI+VMOpY25pY2EgMy4gQ29ycmVnaXIgZXJyb3JlcyB0aXBvZ3LDoWZpY29zIHkgc2ltaWxhcmVzPC9zcGFuPgpgYGB7cn0KZGYkVW5pZGFkZXMgPC0gY2VpbGluZyhkZiRVbmlkYWRlcykKc3VtbWFyeShkZiRVbmlkYWRlcykKYGBgCgojIzxzcGFuIHN0eWxlPSJjb2xvcjogcmVkOyI+VMOpY25pY2EgNC4gQ29udmVydGlyIGxvcyB0aXBvcyBkZSBkYXRvczwvc3Bhbj4KYGBge3J9CiNDb252ZXJ0aXIgZGUgY2FyYWN0ZXIgYSBmZWNoYQpkZiRGZWNoYSA8LSBhcy5EYXRlKGRmJEZlY2hhLCBmb3JtYXQ9IiVkLyVtLyVZIikgIyJZIiBlcyBwYXJhIGHDsW8gY29uIDQgZGlnaXRvcywgInkiIGVzIHBhcmEgYcOxbyBjb24gMiBkaWdpdG9zCnN0cihkZiRGZWNoYSkKc3VtbWFyeShkZiRGZWNoYSkKYGBgCiMjPHNwYW4gc3R5bGU9ImNvbG9yOiByZWQ7Ij4gVMOpY25pY2EgNS4gVHJhdGFyIHZhbG9yZXMgZmFsdGFudGVzPC9zcGFuPgpgYGB7cn0KI0JvcnJhciB0b2RvcyBsb3MgTkFzCiNkZiA8LSBuYS5vbWl0KGRmKQoKI1JlZW1wbGF6YXIgbG9zIE5BcyBjb24gQ0VST1MKI2RmW2lzLm5hKGRmKV0gPC0gMAoKI1JlZW1wbGF6YXIgbG9zIE5BcyBjb24gZWwgUFJPTUVESU8KI2RmJGFsdHVyYVtpcy5uYShkZiRhbHR1cmEpXSA8LSBtZWFuKGRmJGFsdHVyYSwgbmEucm09VFJVRSkKYGBgCgojIzxzcGFuIHN0eWxlPSJjb2xvcjogcmVkOyI+IFTDqWNuaWNhIDYuIEhlcnJhbWllbnRhcyBFc3RhZMOtc3RpY2FzPC9zcGFuPgpgYGB7cn0KYm94cGxvdChkZiRQcmVjaW8sIGhvcml6b250YWwgPSBUUlVFKQpib3hwbG90KGRmJFVuaWRhZGVzLCBob3Jpem9udGFsID0gVFJVRSkKYGBgCgojPHNwYW4gc3R5bGU9ImNvbG9yOiByZWQ7Ij5HZW5lcmFyIGJhc2tldDwvc3Bhbj4KYGBge3J9CiNPcmRlbmFyIGRlIG1lbm9yIGEgbWF5b3IgbGEgY29sdW1uYSBUaWNrZXQKZGYgPC0gZGZbb3JkZXIoZGYkRi5UaWNrZXQpLCBdCgpoZWFkKGRmKQp0YWlsKGRmKQoKI0dlbmVyYXIgZWwgYmFza2V0CmJhc2tldCA8LSBkZHBseShkZixjKCJGLlRpY2tldCIpLCBmdW5jdGlvbihkZilwYXN0ZShkZiRNYXJjYSwgY29sbGFwc2UgPSAiLCIgKSkKCiNFbGltaW5hciBlbCBuw7ptZXJvIGRlIFRpY2tlcgpiYXNrZXQkRi5UaWNrZXQgPC0gTlVMTAoKI0NhbWJpYXIgZWwgdGl0dWxvIGRlIGxhIGNvbHVtbmEgIlYxIiBhICJNYXJjYSIKY29sbmFtZXMoYmFza2V0KSA8LSBjKCJNYXJjYSIpCgojRXhwb3J0YXIgYmFza2V0CndyaXRlLmNzdihiYXNrZXQsICJiYXNrZXQuY3N2IiwgcXVvdGUgPSBGQUxTRSwgcm93Lm5hbWVzID0gRkFMU0UpCmBgYAoKIzxzcGFuIHN0eWxlPSJjb2xvcjogcmVkOyI+TWFya2V0IEJhc2tldCBBbmFseXNpczwvc3Bhbj4KYGBge3IgbWVzc2FnZT1GQUxTRSwgd2FybmluZz1GQUxTRX0KI2ZpbGUuY2hvb3NlKCkKdHIgPC0gcmVhZC50cmFuc2FjdGlvbnMoIi9Vc2Vycy9kYW5pZWxhaWJhcnJhL0Rlc2t0b3AvQm9vdGNhbXAgUHJvZ3JhbWFjaW/MgW4vYmFza2V0LmNzdiIsIGZvcm1hdCA9ICJiYXNrZXQiLCBzZXA9IiwiCiAgICAgICAgICAgICAgICAgICAgICAgICkKcmVnbGFzLmFzb2NpYWNpb24gPC0gYXByaW9yaSh0ciwgcGFyYW1ldGVyID0gbGlzdChzdXBwPTAuMDAxLCBjb25mPTAuMiwgbWF4bGVuPTEwKSkKc3VtbWFyeShyZWdsYXMuYXNvY2lhY2lvbikKaW5zcGVjdChyZWdsYXMuYXNvY2lhY2lvbikKCnJlZ2xhcy5hc29jaWFjaW9uIDwtIHNvcnQocmVnbGFzLmFzb2NpYWNpb24sIGJ5ID0iY29uZmlkZW5jZSIsIGRlY3JlYXNpbmcgPSBUUlVFKQpzdW1tYXJ5KHJlZ2xhcy5hc29jaWFjaW9uKQppbnNwZWN0KHJlZ2xhcy5hc29jaWFjaW9uKQoKdG9wMTByZWdsYXMgPC0gaGVhZChyZWdsYXMuYXNvY2lhY2lvbiwgbj0xMCwgYnk9ICJjb25maWRlbmNlIikKcGxvdCh0b3AxMHJlZ2xhcywgbWV0aG9kPSAiZ3JhcGgiLCBlbmdpbmU9ICJodG1sd2lkZ2V0IikKYGBgCgoK