Instalar paquetes y llamar librerias

#install.packages("tidyverse")
library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr     1.1.4     ✔ readr     2.1.5
## ✔ forcats   1.0.0     ✔ stringr   1.5.1
## ✔ ggplot2   3.5.1     ✔ tibble    3.2.1
## ✔ lubridate 1.9.4     ✔ tidyr     1.3.1
## ✔ purrr     1.0.4     
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
#install.packages("dplyr")
library(dplyr)
#install.packages("lubridate")
library(lubridate)
#install.packages("Matrix")
library(Matrix)
## 
## Adjuntando el paquete: 'Matrix'
## 
## The following objects are masked from 'package:tidyr':
## 
##     expand, pack, unpack
#install.packages("arules")
library(arules)
## 
## Adjuntando el paquete: 'arules'
## 
## The following object is masked from 'package:dplyr':
## 
##     recode
## 
## The following objects are masked from 'package:base':
## 
##     abbreviate, write
#install.packages("arulesViz")
library(arulesViz)
#install.packages("datasets")
library(datasets)
#install.packages("plyr")
library(plyr)
## ------------------------------------------------------------------------------
## You have loaded plyr after dplyr - this is likely to cause problems.
## If you need functions from both plyr and dplyr, please load plyr first, then dplyr:
## library(plyr); library(dplyr)
## ------------------------------------------------------------------------------
## 
## Adjuntando el paquete: 'plyr'
## 
## The following objects are masked from 'package:dplyr':
## 
##     arrange, count, desc, failwith, id, mutate, rename, summarise,
##     summarize
## 
## The following object is masked from 'package:purrr':
## 
##     compact

Importar la base de Datos

# file.choose()
bd <- read.csv("C:\\Users\\cesar\\Downloads\\abarrotes.csv")

Entender la base de datos

summary(bd)
##  vcClaveTienda        DescGiro         Codigo.Barras            PLU        
##  Length:200625      Length:200625      Min.   :8.347e+05   Min.   : 1.00   
##  Class :character   Class :character   1st Qu.:7.501e+12   1st Qu.: 1.00   
##  Mode  :character   Mode  :character   Median :7.501e+12   Median : 1.00   
##                                        Mean   :5.950e+12   Mean   : 2.11   
##                                        3rd Qu.:7.501e+12   3rd Qu.: 1.00   
##                                        Max.   :1.750e+13   Max.   :30.00   
##                                                            NA's   :199188  
##     Fecha               Hora              Marca            Fabricante       
##  Length:200625      Length:200625      Length:200625      Length:200625     
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##                                                                             
##    Producto             Precio          Ult.Costo         Unidades     
##  Length:200625      Min.   :-147.00   Min.   :  0.38   Min.   : 0.200  
##  Class :character   1st Qu.:  11.00   1st Qu.:  8.46   1st Qu.: 1.000  
##  Mode  :character   Median :  16.00   Median : 12.31   Median : 1.000  
##                     Mean   :  19.42   Mean   : 15.31   Mean   : 1.262  
##                     3rd Qu.:  25.00   3rd Qu.: 19.23   3rd Qu.: 1.000  
##                     Max.   :1000.00   Max.   :769.23   Max.   :96.000  
##                                                                        
##     F.Ticket      NombreDepartamento NombreFamilia      NombreCategoria   
##  Min.   :     1   Length:200625      Length:200625      Length:200625     
##  1st Qu.: 33964   Class :character   Class :character   Class :character  
##  Median :105993   Mode  :character   Mode  :character   Mode  :character  
##  Mean   :193990                                                           
##  3rd Qu.:383005                                                           
##  Max.   :450040                                                           
##                                                                           
##     Estado              Mts.2      Tipo.ubicación         Giro          
##  Length:200625      Min.   :47.0   Length:200625      Length:200625     
##  Class :character   1st Qu.:53.0   Class :character   Class :character  
##  Mode  :character   Median :60.0   Mode  :character   Mode  :character  
##                     Mean   :56.6                                        
##                     3rd Qu.:60.0                                        
##                     Max.   :62.0                                        
##                                                                         
##  Hora.inicio        Hora.cierre       
##  Length:200625      Length:200625     
##  Class :character   Class :character  
##  Mode  :character   Mode  :character  
##                                       
##                                       
##                                       
## 
str(bd)
## 'data.frame':    200625 obs. of  22 variables:
##  $ vcClaveTienda     : chr  "MX001" "MX001" "MX001" "MX001" ...
##  $ DescGiro          : chr  "Abarrotes" "Abarrotes" "Abarrotes" "Abarrotes" ...
##  $ Codigo.Barras     : num  7.5e+12 7.5e+12 7.5e+12 7.5e+12 7.5e+12 ...
##  $ PLU               : int  NA NA NA NA NA NA NA NA NA NA ...
##  $ Fecha             : chr  "19/06/2020" "19/06/2020" "19/06/2020" "19/06/2020" ...
##  $ Hora              : chr  "08:16:21" "08:23:33" "08:24:33" "08:24:33" ...
##  $ Marca             : chr  "NUTRI LECHE" "DAN UP" "BIMBO" "PEPSI" ...
##  $ Fabricante        : chr  "MEXILAC" "DANONE DE MEXICO" "GRUPO BIMBO" "PEPSI-COLA MEXICANA" ...
##  $ Producto          : chr  "Nutri Leche 1 Litro" "DANUP STRAWBERRY P/BEBER 350GR NAL" "Rebanadas Bimbo 2Pz" "Pepsi N.R. 400Ml" ...
##  $ Precio            : num  16 14 5 8 19.5 16 14 5 8 19.5 ...
##  $ Ult.Costo         : num  12.3 14 5 8 15 ...
##  $ Unidades          : num  1 1 1 1 1 1 1 1 1 1 ...
##  $ F.Ticket          : int  1 2 3 3 4 1 2 3 3 4 ...
##  $ NombreDepartamento: chr  "Abarrotes" "Abarrotes" "Abarrotes" "Abarrotes" ...
##  $ NombreFamilia     : chr  "Lacteos y Refrigerados" "Lacteos y Refrigerados" "Pan y Tortilla" "Bebidas" ...
##  $ NombreCategoria   : chr  "Leche" "Yogurt" "Pan Dulce Empaquetado" "Refrescos Plástico (N.R.)" ...
##  $ Estado            : chr  "Nuevo León" "Nuevo León" "Nuevo León" "Nuevo León" ...
##  $ Mts.2             : int  60 60 60 60 60 60 60 60 60 60 ...
##  $ Tipo.ubicación    : chr  "Esquina" "Esquina" "Esquina" "Esquina" ...
##  $ Giro              : chr  "Abarrotes" "Abarrotes" "Abarrotes" "Abarrotes" ...
##  $ Hora.inicio       : chr  "08:00" "08:00" "08:00" "08:00" ...
##  $ Hora.cierre       : chr  "22:00" "22:00" "22:00" "22:00" ...
head(bd, n=10)
##    vcClaveTienda  DescGiro Codigo.Barras PLU      Fecha     Hora
## 1          MX001 Abarrotes  7.501021e+12  NA 19/06/2020 08:16:21
## 2          MX001 Abarrotes  7.501032e+12  NA 19/06/2020 08:23:33
## 3          MX001 Abarrotes  7.501000e+12  NA 19/06/2020 08:24:33
## 4          MX001 Abarrotes  7.501031e+12  NA 19/06/2020 08:24:33
## 5          MX001 Abarrotes  7.501026e+12  NA 19/06/2020 08:26:28
## 6          MX001 Abarrotes  7.501021e+12  NA 19/06/2020 08:16:21
## 7          MX001 Abarrotes  7.501032e+12  NA 19/06/2020 08:23:33
## 8          MX001 Abarrotes  7.501000e+12  NA 19/06/2020 08:24:33
## 9          MX001 Abarrotes  7.501031e+12  NA 19/06/2020 08:24:33
## 10         MX001 Abarrotes  7.501026e+12  NA 19/06/2020 08:26:28
##                         Marca                 Fabricante
## 1                 NUTRI LECHE                    MEXILAC
## 2                      DAN UP           DANONE DE MEXICO
## 3                       BIMBO                GRUPO BIMBO
## 4                       PEPSI        PEPSI-COLA MEXICANA
## 5  BLANCA NIEVES (DETERGENTE) FABRICA DE JABON LA CORONA
## 6                 NUTRI LECHE                    MEXILAC
## 7                      DAN UP           DANONE DE MEXICO
## 8                       BIMBO                GRUPO BIMBO
## 9                       PEPSI        PEPSI-COLA MEXICANA
## 10 BLANCA NIEVES (DETERGENTE) FABRICA DE JABON LA CORONA
##                              Producto Precio Ult.Costo Unidades F.Ticket
## 1                 Nutri Leche 1 Litro   16.0     12.31        1        1
## 2  DANUP STRAWBERRY P/BEBER 350GR NAL   14.0     14.00        1        2
## 3                 Rebanadas Bimbo 2Pz    5.0      5.00        1        3
## 4                    Pepsi N.R. 400Ml    8.0      8.00        1        3
## 5       Detergente Blanca Nieves 500G   19.5     15.00        1        4
## 6                 Nutri Leche 1 Litro   16.0     12.31        1        1
## 7  DANUP STRAWBERRY P/BEBER 350GR NAL   14.0     14.00        1        2
## 8                 Rebanadas Bimbo 2Pz    5.0      5.00        1        3
## 9                    Pepsi N.R. 400Ml    8.0      8.00        1        3
## 10      Detergente Blanca Nieves 500G   19.5     15.00        1        4
##    NombreDepartamento          NombreFamilia           NombreCategoria
## 1           Abarrotes Lacteos y Refrigerados                     Leche
## 2           Abarrotes Lacteos y Refrigerados                    Yogurt
## 3           Abarrotes         Pan y Tortilla     Pan Dulce Empaquetado
## 4           Abarrotes                Bebidas Refrescos Plástico (N.R.)
## 5           Abarrotes     Limpieza del Hogar                Lavandería
## 6           Abarrotes Lacteos y Refrigerados                     Leche
## 7           Abarrotes Lacteos y Refrigerados                    Yogurt
## 8           Abarrotes         Pan y Tortilla     Pan Dulce Empaquetado
## 9           Abarrotes                Bebidas Refrescos Plástico (N.R.)
## 10          Abarrotes     Limpieza del Hogar                Lavandería
##        Estado Mts.2 Tipo.ubicación      Giro Hora.inicio Hora.cierre
## 1  Nuevo León    60        Esquina Abarrotes       08:00       22:00
## 2  Nuevo León    60        Esquina Abarrotes       08:00       22:00
## 3  Nuevo León    60        Esquina Abarrotes       08:00       22:00
## 4  Nuevo León    60        Esquina Abarrotes       08:00       22:00
## 5  Nuevo León    60        Esquina Abarrotes       08:00       22:00
## 6  Nuevo León    60        Esquina Abarrotes       08:00       22:00
## 7  Nuevo León    60        Esquina Abarrotes       08:00       22:00
## 8  Nuevo León    60        Esquina Abarrotes       08:00       22:00
## 9  Nuevo León    60        Esquina Abarrotes       08:00       22:00
## 10 Nuevo León    60        Esquina Abarrotes       08:00       22:00
tail(bd, n=10)
##        vcClaveTienda DescGiro Codigo.Barras PLU      Fecha     Hora
## 200616         MX005 Depósito   7.62221e+12  NA 07/08/2020 19:30:13
## 200617         MX005 Depósito   7.62221e+12  NA 25/07/2020 18:42:24
## 200618         MX005 Depósito   7.62221e+12  NA 18/07/2020 22:45:58
## 200619         MX005 Depósito   7.62221e+12  NA 12/07/2020 00:36:34
## 200620         MX005 Depósito   7.62221e+12  NA 12/07/2020 01:08:25
## 200621         MX005 Depósito   7.62221e+12  NA 23/10/2020 22:17:37
## 200622         MX005 Depósito   7.62221e+12  NA 10/10/2020 20:30:20
## 200623         MX005 Depósito   7.62221e+12  NA 10/10/2020 22:40:43
## 200624         MX005 Depósito   7.62221e+12  NA 27/06/2020 22:30:19
## 200625         MX005 Depósito   7.62221e+12  NA 26/06/2020 23:43:34
##                    Marca    Fabricante                          Producto Precio
## 200616 TRIDENT XTRA CARE CADBURY ADAMS Trident Xtracare Freshmint 16.32G      9
## 200617 TRIDENT XTRA CARE CADBURY ADAMS Trident Xtracare Freshmint 16.32G      9
## 200618 TRIDENT XTRA CARE CADBURY ADAMS Trident Xtracare Freshmint 16.32G      9
## 200619 TRIDENT XTRA CARE CADBURY ADAMS Trident Xtracare Freshmint 16.32G      9
## 200620 TRIDENT XTRA CARE CADBURY ADAMS Trident Xtracare Freshmint 16.32G      9
## 200621 TRIDENT XTRA CARE CADBURY ADAMS Trident Xtracare Freshmint 16.32G      9
## 200622 TRIDENT XTRA CARE CADBURY ADAMS Trident Xtracare Freshmint 16.32G      9
## 200623 TRIDENT XTRA CARE CADBURY ADAMS Trident Xtracare Freshmint 16.32G      9
## 200624 TRIDENT XTRA CARE CADBURY ADAMS Trident Xtracare Freshmint 16.32G      9
## 200625 TRIDENT XTRA CARE CADBURY ADAMS Trident Xtracare Freshmint 16.32G      9
##        Ult.Costo Unidades F.Ticket NombreDepartamento NombreFamilia
## 200616      6.92        1   106411          Abarrotes      Dulcería
## 200617      6.92        1   104693          Abarrotes      Dulcería
## 200618      6.92        1   103856          Abarrotes      Dulcería
## 200619      6.92        1   103087          Abarrotes      Dulcería
## 200620      6.92        1   103100          Abarrotes      Dulcería
## 200621      6.92        1   116598          Abarrotes      Dulcería
## 200622      6.92        1   114886          Abarrotes      Dulcería
## 200623      6.92        1   114955          Abarrotes      Dulcería
## 200624      6.92        1   101121          Abarrotes      Dulcería
## 200625      6.92        1   100879          Abarrotes      Dulcería
##        NombreCategoria       Estado Mts.2 Tipo.ubicación       Giro Hora.inicio
## 200616 Gomas de Mazcar Quintana Roo    58        Esquina Mini súper       08:00
## 200617 Gomas de Mazcar Quintana Roo    58        Esquina Mini súper       08:00
## 200618 Gomas de Mazcar Quintana Roo    58        Esquina Mini súper       08:00
## 200619 Gomas de Mazcar Quintana Roo    58        Esquina Mini súper       08:00
## 200620 Gomas de Mazcar Quintana Roo    58        Esquina Mini súper       08:00
## 200621 Gomas de Mazcar Quintana Roo    58        Esquina Mini súper       08:00
## 200622 Gomas de Mazcar Quintana Roo    58        Esquina Mini súper       08:00
## 200623 Gomas de Mazcar Quintana Roo    58        Esquina Mini súper       08:00
## 200624 Gomas de Mazcar Quintana Roo    58        Esquina Mini súper       08:00
## 200625 Gomas de Mazcar Quintana Roo    58        Esquina Mini súper       08:00
##        Hora.cierre
## 200616       21:00
## 200617       21:00
## 200618       21:00
## 200619       21:00
## 200620       21:00
## 200621       21:00
## 200622       21:00
## 200623       21:00
## 200624       21:00
## 200625       21:00
#dplyr::count(bd,vcClaveTienda, sort=TRUE)
#dplyr::count(bd,DescGiro, sort=TRUE)
#dplyr::count(bd,Fecha, sort=TRUE)
#dplyr::count(bd,Hora, sort=TRUE)
#dplyr::count(bd,Marca, sort=TRUE)
#dplyr::count(bd,Fabricante, sort=TRUE)
#dplyr::count(bd,Producto, sort=TRUE)
#dplyr::count(bd,NombreDepartamento, sort=TRUE)
#dplyr::count(bd,NombreFamilia, sort=TRUE)
#dplyr::count(bd,NombreCategoria, sort=TRUE)
#dplyr::count(bd,Estado, sort=TRUE)
#dplyr::count(bd,Tipo.ubicación, sort=TRUE)
#dplyr::count(bd,Giro, sort=TRUE)
#dplyr::count(bd,Hora.inicio, sort=TRUE)
#dplyr::count(bd,Hora.cierre, sort=TRUE)

Limpiar la base de datos

Técnica 1. Remover valores irrelevantes

# Eliminar columnas
bd1 <- bd
bd1 <- subset(bd1, select = -c(PLU, Codigo.Barras))

# Eliminar renglones
bd2 <- bd1
bd2 <- bd2[bd2$Precio > 0, ]
summary(bd1$Precio)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
## -147.00   11.00   16.00   19.42   25.00 1000.00
summary(bd2$Precio)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.50   11.00   16.00   19.45   25.00 1000.00

Técnica 2. Remover valores duplicados

# Cuantos renglones duplicados tenemos
sum(duplicated(bd2))
## [1] 5
# Cuales son los renglones duplicados 
bd2[duplicated(bd2),]
##    vcClaveTienda  DescGiro      Fecha     Hora                      Marca
## 6          MX001 Abarrotes 19/06/2020 08:16:21                NUTRI LECHE
## 7          MX001 Abarrotes 19/06/2020 08:23:33                     DAN UP
## 8          MX001 Abarrotes 19/06/2020 08:24:33                      BIMBO
## 9          MX001 Abarrotes 19/06/2020 08:24:33                      PEPSI
## 10         MX001 Abarrotes 19/06/2020 08:26:28 BLANCA NIEVES (DETERGENTE)
##                    Fabricante                           Producto Precio
## 6                     MEXILAC                Nutri Leche 1 Litro   16.0
## 7            DANONE DE MEXICO DANUP STRAWBERRY P/BEBER 350GR NAL   14.0
## 8                 GRUPO BIMBO                Rebanadas Bimbo 2Pz    5.0
## 9         PEPSI-COLA MEXICANA                   Pepsi N.R. 400Ml    8.0
## 10 FABRICA DE JABON LA CORONA      Detergente Blanca Nieves 500G   19.5
##    Ult.Costo Unidades F.Ticket NombreDepartamento          NombreFamilia
## 6      12.31        1        1          Abarrotes Lacteos y Refrigerados
## 7      14.00        1        2          Abarrotes Lacteos y Refrigerados
## 8       5.00        1        3          Abarrotes         Pan y Tortilla
## 9       8.00        1        3          Abarrotes                Bebidas
## 10     15.00        1        4          Abarrotes     Limpieza del Hogar
##              NombreCategoria     Estado Mts.2 Tipo.ubicación      Giro
## 6                      Leche Nuevo León    60        Esquina Abarrotes
## 7                     Yogurt Nuevo León    60        Esquina Abarrotes
## 8      Pan Dulce Empaquetado Nuevo León    60        Esquina Abarrotes
## 9  Refrescos Plástico (N.R.) Nuevo León    60        Esquina Abarrotes
## 10                Lavandería Nuevo León    60        Esquina Abarrotes
##    Hora.inicio Hora.cierre
## 6        08:00       22:00
## 7        08:00       22:00
## 8        08:00       22:00
## 9        08:00       22:00
## 10       08:00       22:00
# Eliminar renglones duplicados
bd3 <- bd2 
bd3 <- distinct(bd3)

Técnica 3. Eliminar renglones duplicados

# Cantidaddes en enteros
bd4 <- bd3
bd4$Unidades <- ceiling(bd4$Unidades)

Técnica 4. Convertir tipos de datos

# Convertir de caracter a fecha
bd5 <- bd4
bd5$Fecha <- as.Date(bd5$Fecha, format = "%d/%m/%Y")
# Convertir de caracter entero a entero
bd6 <- bd5
bd6$Hora <- substr(bd6$Hora, start = 1, stop = 2)
bd6$Hora <- as.integer(bd6$Hora)

Técnica 5. Reemplazar valores faltantes

# ¿Cuántos NAs tengo en la base de datos?
sum(is.na(bd6))
## [1] 0
sum(is.na(bd))
## [1] 199188
# ¿Cuántos NAs tengo por variable?
sapply(bd, function(x) sum(is.na(x)))
##      vcClaveTienda           DescGiro      Codigo.Barras                PLU 
##                  0                  0                  0             199188 
##              Fecha               Hora              Marca         Fabricante 
##                  0                  0                  0                  0 
##           Producto             Precio          Ult.Costo           Unidades 
##                  0                  0                  0                  0 
##           F.Ticket NombreDepartamento      NombreFamilia    NombreCategoria 
##                  0                  0                  0                  0 
##             Estado              Mts.2     Tipo.ubicación               Giro 
##                  0                  0                  0                  0 
##        Hora.inicio        Hora.cierre 
##                  0                  0
# Opción 1. Borrrar todos los NAs de una tabla

# bd100 <- na.omit(bd)

# Opción 2. Remplazar los NAs con CEROS. 

# bd101 <- bd
# bd101[is.na(bd101)]<-0

# Opción 3. Reemplazar los NAs con el PROMEDIO

# bd102 < bd
# bd102$PLU[is.na(bd102$PLU)]<- mean(bd102$PLU, na.rm=TRUE)

Técnica 6. Correciones por métodos estadisticos

boxplot(bd6$Precio, horizontal=TRUE)

boxplot(bd6$Unidades, horizontal=TRUE)

Agregar Columnas

#Agregar día de la semana
bd6$Dia_Semana <- wday(bd6$Fecha) #1 es domingo y #7 es sabado

# Agregar el subtotal de la venta
bd6$Subtotal <- bd6$Precio * bd6$Unidades

Exportar la base de datos

#write.csv(bd6, file="abarrotes_limpia.csv", row.names = FALSE)

Generar Market Baskey Analysis

# Ordenar de menor a mayor
bd7 <- bd6
bd7 <- bd7[order(bd7$F.Ticket), ]

# Generar el canasto
basket <- ddply(bd7, c("F.Ticket"), function(bd7)paste(bd7$Marca, collapse = ","))

# Eliminar la columna ticket
basket$F.Ticket <- NULL

# Renombrar nombre de la columna a Marca
colnames(basket) <- c("Marca")

# Exportar basket
#write.csv(basket, file = "basket.csv", row.names = FALSE)

#file.choose()
tr <- read.transactions("C:\\Users\\cesar\\OneDrive\\Documentos\\basket.csv", format = "basket", sep = ",")
summary(tr)
## transactions as itemMatrix in sparse format with
##  115031 rows (elements/itemsets/transactions) and
##  28710 columns (items) and a density of 3.483107e-05 
## 
## most frequent items:
## COCA COLA     PEPSI    TECATE     BIMBO      LALA   (Other) 
##      7911      6694      5022      2106      1694     91604 
## 
## element (itemset/transaction) length distribution:
## sizes
##      1 
## 115031 
## 
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##       1       1       1       1       1       1 
## 
## includes extended item information - examples:
##                                                           labels
## 1                                              1-2-3 (ABARROTES)
## 2                                        1-2-3 (ABARROTES),BIMBO
## 3 1-2-3 (ABARROTES),BIMBO,BIMBO,LA ANITA,VARIOS DANONE,DEL MONTE
reglas.asociacion <- apriori(tr, parameter = list(supp = 0.0005, conf = 0.1, maxlen = 10))
## Apriori
## 
## Parameter specification:
##  confidence minval smax arem  aval originalSupport maxtime support minlen
##         0.1    0.1    1 none FALSE            TRUE       5   5e-04      1
##  maxlen target  ext
##      10  rules TRUE
## 
## Algorithmic control:
##  filter tree heap memopt load sort verbose
##     0.1 TRUE TRUE  FALSE TRUE    2    TRUE
## 
## Absolute minimum support count: 57 
## 
## set item appearances ...[0 item(s)] done [0.00s].
## set transactions ...[28710 item(s), 115031 transaction(s)] done [0.05s].
## sorting and recoding items ... [196 item(s)] done [0.00s].
## creating transaction tree ... done [0.02s].
## checking subsets of size 1 done [0.00s].
## writing ... [0 rule(s)] done [0.00s].
## creating S4 object  ... done [0.00s].
summary(reglas.asociacion)
## set of 0 rules
inspect(reglas.asociacion)

reglas.asociacion <- sort(reglas.asociacion, by ="confidence", decreasing = TRUE)

# Graficar TOP10 de reglas de asociación
#top10reglas <- head(reglas.asociacion, n=10, by = "confidence")
#plot(reglas.asociacion,method="graph", engine="htmlwidget")

Reglas de asosiaciones

Conclusiones

La herramienta R permite seleccionar, limpiar y complementar bases de datos, adaptándolas a las necesidades específicas del análisis. A través de este programa, es posible eliminar o agregar columnas según los requerimientos del estudio. Además, proporciona un panorama general de la información, facilitando la identificación de sus características esenciales mediante funciones como summary(), head() y tail().

Asimismo, R permite exportar los datos ya procesados para su uso en otras plataformas de visualización como Tableau, Power BI y otras herramientas de análisis, optimizando así la presentación de la información.

Otro aspecto fundamental de R es su capacidad para generar boxplots, los cuales resultan esenciales para la detección y eliminación de datos atípicos que podrían distorsionar el análisis. En este caso, los valores atípicos identificados reflejaban un escenario realista, por lo que no se eliminaron.

Por último, una función clave de R es apriori, que permite establecer asociaciones entre los datos recopilados. En esta actividad el análisis, permitio identificar 11 reglas, entre ellas la tendencia de los clientes que compran la marca Fanta a compran también Coca-Cola. De manera similar, se observó que quienes compran Salvo suelen adquirir Fabuloso y viceversa. De forma que, a través de estos hallazgos se pueden diseñar estrategias comerciales que potencialicen las ventas de diversos productos, aprovechando las relaciones entre marcas.

LS0tDQp0aXRsZTogIk1hcmtldCBCYXNrZXQgQW5hbHlzaXMiDQphdXRob3I6ICJKdWxpbyBDw6lzYXIgU2lsdmEgZGUgbGEgUm9zYSBBMDA4MzkxNDciDQpkYXRlOiAiMjAyNS0wMy0xOSINCm91dHB1dDogDQogIGh0bWxfZG9jdW1lbnQ6DQogICAgdG9jOiBUUlVFDQogICAgdG9jX2Zsb2F0OiBUUlVFDQogICAgY29kZV9kb3dubG9hZDogVFJVRQ0KICAgIHRoZW1lOiAic2FuZHN0b25lIiANCi0tLQ0KDQohW10oaHR0cHM6Ly9kdXBsb3NpdGUud29yZHByZXNzLmNvbS93cC1jb250ZW50L3VwbG9hZHMvMjAxNi8xMS9naXBqbGtoeS5naWYpDQoNCiMgKipJbnN0YWxhciBwYXF1ZXRlcyB5IGxsYW1hciBsaWJyZXJpYXMqKg0KYGBge3IgbWVzc2FnZT1UUlVFLCB3YXJuaW5nPVRSVUV9DQojaW5zdGFsbC5wYWNrYWdlcygidGlkeXZlcnNlIikNCmxpYnJhcnkodGlkeXZlcnNlKQ0KI2luc3RhbGwucGFja2FnZXMoImRwbHlyIikNCmxpYnJhcnkoZHBseXIpDQojaW5zdGFsbC5wYWNrYWdlcygibHVicmlkYXRlIikNCmxpYnJhcnkobHVicmlkYXRlKQ0KI2luc3RhbGwucGFja2FnZXMoIk1hdHJpeCIpDQpsaWJyYXJ5KE1hdHJpeCkNCiNpbnN0YWxsLnBhY2thZ2VzKCJhcnVsZXMiKQ0KbGlicmFyeShhcnVsZXMpDQojaW5zdGFsbC5wYWNrYWdlcygiYXJ1bGVzVml6IikNCmxpYnJhcnkoYXJ1bGVzVml6KQ0KI2luc3RhbGwucGFja2FnZXMoImRhdGFzZXRzIikNCmxpYnJhcnkoZGF0YXNldHMpDQojaW5zdGFsbC5wYWNrYWdlcygicGx5ciIpDQpsaWJyYXJ5KHBseXIpDQpgYGANCg0KIyAqKkltcG9ydGFyIGxhIGJhc2UgZGUgRGF0b3MqKg0KYGBge3J9DQojIGZpbGUuY2hvb3NlKCkNCmJkIDwtIHJlYWQuY3N2KCJDOlxcVXNlcnNcXGNlc2FyXFxEb3dubG9hZHNcXGFiYXJyb3Rlcy5jc3YiKQ0KYGBgDQoNCiMgKipFbnRlbmRlciBsYSBiYXNlIGRlIGRhdG9zKioNCmBgYHtyfQ0Kc3VtbWFyeShiZCkNCnN0cihiZCkNCmhlYWQoYmQsIG49MTApDQp0YWlsKGJkLCBuPTEwKQ0KI2RwbHlyOjpjb3VudChiZCx2Y0NsYXZlVGllbmRhLCBzb3J0PVRSVUUpDQojZHBseXI6OmNvdW50KGJkLERlc2NHaXJvLCBzb3J0PVRSVUUpDQojZHBseXI6OmNvdW50KGJkLEZlY2hhLCBzb3J0PVRSVUUpDQojZHBseXI6OmNvdW50KGJkLEhvcmEsIHNvcnQ9VFJVRSkNCiNkcGx5cjo6Y291bnQoYmQsTWFyY2EsIHNvcnQ9VFJVRSkNCiNkcGx5cjo6Y291bnQoYmQsRmFicmljYW50ZSwgc29ydD1UUlVFKQ0KI2RwbHlyOjpjb3VudChiZCxQcm9kdWN0bywgc29ydD1UUlVFKQ0KI2RwbHlyOjpjb3VudChiZCxOb21icmVEZXBhcnRhbWVudG8sIHNvcnQ9VFJVRSkNCiNkcGx5cjo6Y291bnQoYmQsTm9tYnJlRmFtaWxpYSwgc29ydD1UUlVFKQ0KI2RwbHlyOjpjb3VudChiZCxOb21icmVDYXRlZ29yaWEsIHNvcnQ9VFJVRSkNCiNkcGx5cjo6Y291bnQoYmQsRXN0YWRvLCBzb3J0PVRSVUUpDQojZHBseXI6OmNvdW50KGJkLFRpcG8udWJpY2FjacOzbiwgc29ydD1UUlVFKQ0KI2RwbHlyOjpjb3VudChiZCxHaXJvLCBzb3J0PVRSVUUpDQojZHBseXI6OmNvdW50KGJkLEhvcmEuaW5pY2lvLCBzb3J0PVRSVUUpDQojZHBseXI6OmNvdW50KGJkLEhvcmEuY2llcnJlLCBzb3J0PVRSVUUpDQoNCmBgYA0KDQojICoqTGltcGlhciBsYSBiYXNlIGRlIGRhdG9zKioNCiMjICpUw6ljbmljYSAxLiBSZW1vdmVyIHZhbG9yZXMgaXJyZWxldmFudGVzKg0KYGBge3J9DQojIEVsaW1pbmFyIGNvbHVtbmFzDQpiZDEgPC0gYmQNCmJkMSA8LSBzdWJzZXQoYmQxLCBzZWxlY3QgPSAtYyhQTFUsIENvZGlnby5CYXJyYXMpKQ0KDQojIEVsaW1pbmFyIHJlbmdsb25lcw0KYmQyIDwtIGJkMQ0KYmQyIDwtIGJkMltiZDIkUHJlY2lvID4gMCwgXQ0Kc3VtbWFyeShiZDEkUHJlY2lvKQ0Kc3VtbWFyeShiZDIkUHJlY2lvKQ0KYGBgDQoNCiMjICpUw6ljbmljYSAyLiBSZW1vdmVyIHZhbG9yZXMgZHVwbGljYWRvcyoNCmBgYHtyfQ0KIyBDdWFudG9zIHJlbmdsb25lcyBkdXBsaWNhZG9zIHRlbmVtb3MNCnN1bShkdXBsaWNhdGVkKGJkMikpDQoNCiMgQ3VhbGVzIHNvbiBsb3MgcmVuZ2xvbmVzIGR1cGxpY2Fkb3MgDQpiZDJbZHVwbGljYXRlZChiZDIpLF0NCg0KIyBFbGltaW5hciByZW5nbG9uZXMgZHVwbGljYWRvcw0KYmQzIDwtIGJkMiANCmJkMyA8LSBkaXN0aW5jdChiZDMpDQpgYGANCg0KIyMgKlTDqWNuaWNhIDMuIEVsaW1pbmFyIHJlbmdsb25lcyBkdXBsaWNhZG9zKg0KYGBge3J9DQojIENhbnRpZGFkZGVzIGVuIGVudGVyb3MNCmJkNCA8LSBiZDMNCmJkNCRVbmlkYWRlcyA8LSBjZWlsaW5nKGJkNCRVbmlkYWRlcykNCmBgYA0KDQojIyAqVMOpY25pY2EgNC4gQ29udmVydGlyIHRpcG9zIGRlIGRhdG9zKg0KYGBge3J9DQojIENvbnZlcnRpciBkZSBjYXJhY3RlciBhIGZlY2hhDQpiZDUgPC0gYmQ0DQpiZDUkRmVjaGEgPC0gYXMuRGF0ZShiZDUkRmVjaGEsIGZvcm1hdCA9ICIlZC8lbS8lWSIpDQojIENvbnZlcnRpciBkZSBjYXJhY3RlciBlbnRlcm8gYSBlbnRlcm8NCmJkNiA8LSBiZDUNCmJkNiRIb3JhIDwtIHN1YnN0cihiZDYkSG9yYSwgc3RhcnQgPSAxLCBzdG9wID0gMikNCmJkNiRIb3JhIDwtIGFzLmludGVnZXIoYmQ2JEhvcmEpDQpgYGANCg0KIyMgKlTDqWNuaWNhIDUuIFJlZW1wbGF6YXIgdmFsb3JlcyBmYWx0YW50ZXMqDQpgYGB7cn0NCiMgwr9DdcOhbnRvcyBOQXMgdGVuZ28gZW4gbGEgYmFzZSBkZSBkYXRvcz8NCnN1bShpcy5uYShiZDYpKQ0Kc3VtKGlzLm5hKGJkKSkNCg0KIyDCv0N1w6FudG9zIE5BcyB0ZW5nbyBwb3IgdmFyaWFibGU/DQpzYXBwbHkoYmQsIGZ1bmN0aW9uKHgpIHN1bShpcy5uYSh4KSkpDQoNCiMgT3BjacOzbiAxLiBCb3JycmFyIHRvZG9zIGxvcyBOQXMgZGUgdW5hIHRhYmxhDQoNCiMgYmQxMDAgPC0gbmEub21pdChiZCkNCg0KIyBPcGNpw7NuIDIuIFJlbXBsYXphciBsb3MgTkFzIGNvbiBDRVJPUy4gDQoNCiMgYmQxMDEgPC0gYmQNCiMgYmQxMDFbaXMubmEoYmQxMDEpXTwtMA0KDQojIE9wY2nDs24gMy4gUmVlbXBsYXphciBsb3MgTkFzIGNvbiBlbCBQUk9NRURJTw0KDQojIGJkMTAyIDwgYmQNCiMgYmQxMDIkUExVW2lzLm5hKGJkMTAyJFBMVSldPC0gbWVhbihiZDEwMiRQTFUsIG5hLnJtPVRSVUUpDQpgYGANCiMjICpUw6ljbmljYSA2LiBDb3JyZWNpb25lcyBwb3IgbcOpdG9kb3MgZXN0YWRpc3RpY29zKg0KYGBge3J9DQpib3hwbG90KGJkNiRQcmVjaW8sIGhvcml6b250YWw9VFJVRSkNCmJveHBsb3QoYmQ2JFVuaWRhZGVzLCBob3Jpem9udGFsPVRSVUUpDQpgYGANCg0KIyAqKkFncmVnYXIgQ29sdW1uYXMqKg0KYGBge3J9DQojQWdyZWdhciBkw61hIGRlIGxhIHNlbWFuYQ0KYmQ2JERpYV9TZW1hbmEgPC0gd2RheShiZDYkRmVjaGEpICMxIGVzIGRvbWluZ28geSAjNyBlcyBzYWJhZG8NCg0KIyBBZ3JlZ2FyIGVsIHN1YnRvdGFsIGRlIGxhIHZlbnRhDQpiZDYkU3VidG90YWwgPC0gYmQ2JFByZWNpbyAqIGJkNiRVbmlkYWRlcw0KYGBgDQoNCiMgKipFeHBvcnRhciBsYSBiYXNlIGRlIGRhdG9zKioNCmBgYHtyfQ0KI3dyaXRlLmNzdihiZDYsIGZpbGU9ImFiYXJyb3Rlc19saW1waWEuY3N2Iiwgcm93Lm5hbWVzID0gRkFMU0UpDQpgYGANCg0KIyAqKkdlbmVyYXIgTWFya2V0IEJhc2tleSBBbmFseXNpcyoqDQpgYGB7cn0NCiMgT3JkZW5hciBkZSBtZW5vciBhIG1heW9yDQpiZDcgPC0gYmQ2DQpiZDcgPC0gYmQ3W29yZGVyKGJkNyRGLlRpY2tldCksIF0NCg0KIyBHZW5lcmFyIGVsIGNhbmFzdG8NCmJhc2tldCA8LSBkZHBseShiZDcsIGMoIkYuVGlja2V0IiksIGZ1bmN0aW9uKGJkNylwYXN0ZShiZDckTWFyY2EsIGNvbGxhcHNlID0gIiwiKSkNCg0KIyBFbGltaW5hciBsYSBjb2x1bW5hIHRpY2tldA0KYmFza2V0JEYuVGlja2V0IDwtIE5VTEwNCg0KIyBSZW5vbWJyYXIgbm9tYnJlIGRlIGxhIGNvbHVtbmEgYSBNYXJjYQ0KY29sbmFtZXMoYmFza2V0KSA8LSBjKCJNYXJjYSIpDQoNCiMgRXhwb3J0YXIgYmFza2V0DQojd3JpdGUuY3N2KGJhc2tldCwgZmlsZSA9ICJiYXNrZXQuY3N2Iiwgcm93Lm5hbWVzID0gRkFMU0UpDQoNCiNmaWxlLmNob29zZSgpDQp0ciA8LSByZWFkLnRyYW5zYWN0aW9ucygiQzpcXFVzZXJzXFxjZXNhclxcT25lRHJpdmVcXERvY3VtZW50b3NcXGJhc2tldC5jc3YiLCBmb3JtYXQgPSAiYmFza2V0Iiwgc2VwID0gIiwiKQ0Kc3VtbWFyeSh0cikNCg0KcmVnbGFzLmFzb2NpYWNpb24gPC0gYXByaW9yaSh0ciwgcGFyYW1ldGVyID0gbGlzdChzdXBwID0gMC4wMDA1LCBjb25mID0gMC4xLCBtYXhsZW4gPSAxMCkpDQpzdW1tYXJ5KHJlZ2xhcy5hc29jaWFjaW9uKQ0KaW5zcGVjdChyZWdsYXMuYXNvY2lhY2lvbikNCg0KcmVnbGFzLmFzb2NpYWNpb24gPC0gc29ydChyZWdsYXMuYXNvY2lhY2lvbiwgYnkgPSJjb25maWRlbmNlIiwgZGVjcmVhc2luZyA9IFRSVUUpDQoNCiMgR3JhZmljYXIgVE9QMTAgZGUgcmVnbGFzIGRlIGFzb2NpYWNpw7NuDQojdG9wMTByZWdsYXMgPC0gaGVhZChyZWdsYXMuYXNvY2lhY2lvbiwgbj0xMCwgYnkgPSAiY29uZmlkZW5jZSIpDQojcGxvdChyZWdsYXMuYXNvY2lhY2lvbixtZXRob2Q9ImdyYXBoIiwgZW5naW5lPSJodG1sd2lkZ2V0IikNCmBgYA0KDQojICoqUmVnbGFzIGRlIGFzb3NpYWNpb25lcyoqDQoNCiFbXShDOi9Vc2Vycy9jZXNhci9Eb3dubG9hZHMvSU1HMi5QTkcpDQoNCiFbXShDOi9Vc2Vycy9jZXNhci9Eb3dubG9hZHMvSU1HLnBuZykNCg0KIyAqKkNvbmNsdXNpb25lcyoqDQoNCkxhIGhlcnJhbWllbnRhICoqUioqIHBlcm1pdGUgc2VsZWNjaW9uYXIsIGxpbXBpYXIgeSBjb21wbGVtZW50YXIgYmFzZXMgZGUgZGF0b3MsIGFkYXB0w6FuZG9sYXMgYSBsYXMgbmVjZXNpZGFkZXMgZXNwZWPDrWZpY2FzIGRlbCBhbsOhbGlzaXMuIEEgdHJhdsOpcyBkZSBlc3RlIHByb2dyYW1hLCBlcyBwb3NpYmxlIGVsaW1pbmFyIG8gYWdyZWdhciBjb2x1bW5hcyBzZWfDum4gbG9zIHJlcXVlcmltaWVudG9zIGRlbCBlc3R1ZGlvLiBBZGVtw6FzLCBwcm9wb3JjaW9uYSB1biBwYW5vcmFtYSBnZW5lcmFsIGRlIGxhIGluZm9ybWFjacOzbiwgZmFjaWxpdGFuZG8gbGEgaWRlbnRpZmljYWNpw7NuIGRlIHN1cyBjYXJhY3RlcsOtc3RpY2FzIGVzZW5jaWFsZXMgbWVkaWFudGUgZnVuY2lvbmVzIGNvbW8gKnN1bW1hcnkoKSwgaGVhZCgpIHkgdGFpbCgpKi4NCg0KQXNpbWlzbW8sICoqUioqIHBlcm1pdGUgKmV4cG9ydGFyIGxvcyBkYXRvcyB5YSBwcm9jZXNhZG9zKiBwYXJhIHN1IHVzbyBlbiBvdHJhcyBwbGF0YWZvcm1hcyBkZSB2aXN1YWxpemFjacOzbiBjb21vIFRhYmxlYXUsIFBvd2VyIEJJIHkgb3RyYXMgaGVycmFtaWVudGFzIGRlIGFuw6FsaXNpcywgb3B0aW1pemFuZG8gYXPDrSBsYSBwcmVzZW50YWNpw7NuIGRlIGxhIGluZm9ybWFjacOzbi4NCg0KT3RybyBhc3BlY3RvIGZ1bmRhbWVudGFsIGRlIFIgZXMgc3UgY2FwYWNpZGFkIHBhcmEgZ2VuZXJhciBib3hwbG90cywgbG9zIGN1YWxlcyByZXN1bHRhbiBlc2VuY2lhbGVzIHBhcmEgbGEgZGV0ZWNjacOzbiB5IGVsaW1pbmFjacOzbiBkZSBkYXRvcyBhdMOtcGljb3MgcXVlIHBvZHLDrWFuIGRpc3RvcnNpb25hciBlbCBhbsOhbGlzaXMuIEVuIGVzdGUgY2FzbywgbG9zIHZhbG9yZXMgYXTDrXBpY29zIGlkZW50aWZpY2Fkb3MgcmVmbGVqYWJhbiB1biBlc2NlbmFyaW8gcmVhbGlzdGEsIHBvciBsbyBxdWUgbm8gc2UgZWxpbWluYXJvbi4NCg0KUG9yIMO6bHRpbW8sIHVuYSBmdW5jacOzbiBjbGF2ZSBkZSBSIGVzICphcHJpb3JpKiwgcXVlIHBlcm1pdGUgZXN0YWJsZWNlciBhc29jaWFjaW9uZXMgZW50cmUgbG9zIGRhdG9zIHJlY29waWxhZG9zLiBFbiBlc3RhIGFjdGl2aWRhZCBlbCBhbsOhbGlzaXMsIHBlcm1pdGlvIGlkZW50aWZpY2FyIDExIHJlZ2xhcywgZW50cmUgZWxsYXMgbGEgdGVuZGVuY2lhIGRlIGxvcyBjbGllbnRlcyBxdWUgY29tcHJhbiBsYSBtYXJjYSBGYW50YSBhIGNvbXByYW4gdGFtYmnDqW4gQ29jYS1Db2xhLiBEZSBtYW5lcmEgc2ltaWxhciwgc2Ugb2JzZXJ2w7MgcXVlIHF1aWVuZXMgY29tcHJhbiBTYWx2byBzdWVsZW4gYWRxdWlyaXIgRmFidWxvc28geSB2aWNldmVyc2EuIERlIGZvcm1hIHF1ZSwgYSB0cmF2w6lzIGRlIGVzdG9zICBoYWxsYXpnb3Mgc2UgcHVlZGVuIGRpc2XDsWFyIGVzdHJhdGVnaWFzIGNvbWVyY2lhbGVzIHF1ZSBwb3RlbmNpYWxpY2VuIGxhcyB2ZW50YXMgZGUgZGl2ZXJzb3MgcHJvZHVjdG9zLCBhcHJvdmVjaGFuZG8gbGFzIHJlbGFjaW9uZXMgZW50cmUgbWFyY2FzLg0KDQo=