##Market Basket Analysis
library(plyr)
library(Matrix)
library(arules)
##
## Attaching package: 'arules'
## The following objects are masked from 'package:base':
##
## abbreviate, write
library(arulesViz)
library(datasets)
##Importar base de datos
file.choose()
## [1] "C:\\Users\\nico4\\OneDrive\\Documentos\\Bootcamp de programacion\\Limpia-Abarrotes.Rmd"
bdl <- read.csv("C:\\Users\\nico4\\Downloads\\abarrotes_bd_limpia.csv")
bdl <- bdl[order(bdl$F.Ticket),]
head(bdl)
## vcClaveTienda DescGiro Fecha Hora Marca
## 1 MX001 Abarrotes 19/06/2020 8 NUTRI LECHE
## 2 MX001 Abarrotes 19/06/2020 8 DAN UP
## 3 MX001 Abarrotes 19/06/2020 8 BIMBO
## 4 MX001 Abarrotes 19/06/2020 8 PEPSI
## 5 MX001 Abarrotes 19/06/2020 8 BLANCA NIEVES (DETERGENTE)
## 6 MX001 Abarrotes 19/06/2020 8 FLASH
## Fabricante Producto Precio
## 1 MEXILAC Nutri Leche 1 Litro 16.0
## 2 DANONE DE MEXICO DANUP STRAWBERRY P/BEBER 350GR NAL 14.0
## 3 GRUPO BIMBO Rebanadas Bimbo 2Pz 5.0
## 4 PEPSI-COLA MEXICANA Pepsi N.R. 400Ml 8.0
## 5 FABRICA DE JABON LA CORONA Detergente Blanca Nieves 500G 19.5
## 6 ALEN Flash Xtra Brisa Marina 500Ml 9.5
## Ult.Costo Unidades F.Ticket NombreDepartamento NombreFamilia
## 1 12.31 1 1 Abarrotes Lacteos y Refrigerados
## 2 14.00 1 2 Abarrotes Lacteos y Refrigerados
## 3 5.00 1 3 Abarrotes Pan y Tortilla
## 4 8.00 1 3 Abarrotes Bebidas
## 5 15.00 1 4 Abarrotes Limpieza del Hogar
## 6 7.31 1 4 Abarrotes Limpieza del Hogar
## NombreCategoria Estado Mts.2 Tipo.ubicación Giro
## 1 Leche Nuevo León 60 Esquina Abarrotes
## 2 Yogurt Nuevo León 60 Esquina Abarrotes
## 3 Pan Dulce Empaquetado Nuevo León 60 Esquina Abarrotes
## 4 Refrescos Plástico (N.R.) Nuevo León 60 Esquina Abarrotes
## 5 Lavandería Nuevo León 60 Esquina Abarrotes
## 6 Limpiadores Líquidos Nuevo León 60 Esquina Abarrotes
## Hora.inicio Hora.cierre Dia_de_la_Semana Subtotal Utilidad
## 1 08:00 22:00 6 16.0 3.69
## 2 08:00 22:00 6 14.0 0.00
## 3 08:00 22:00 6 5.0 0.00
## 4 08:00 22:00 6 8.0 0.00
## 5 08:00 22:00 6 19.5 4.50
## 6 08:00 22:00 6 9.5 2.19
tail(bdl)
## vcClaveTienda DescGiro Fecha Hora Marca
## 107394 MX004 Carnicería 15/10/2020 11 YEMINA
## 167771 MX004 Carnicería 15/10/2020 11 DEL FUERTE
## 149429 MX004 Carnicería 15/10/2020 11 COCA COLA ZERO
## 168750 MX004 Carnicería 15/10/2020 11 DIAMANTE
## 161193 MX004 Carnicería 15/10/2020 12 PEPSI
## 112970 MX004 Carnicería 15/10/2020 12 COCA COLA
## Fabricante Producto Precio Ult.Costo
## 107394 HERDEZ PASTA SPAGHETTI YEMINA 200G 7 5.38
## 167771 ALIMENTOS DEL FUERTE PURE DE TOMATE DEL FUERTE 345G 12 9.23
## 149429 COCA COLA COCA COLA ZERO 600ML 15 11.54
## 168750 EMPACADOS ARROZ DIAMANTE225G 11 8.46
## 161193 PEPSI-COLA MEXICANA PEPSI N. R. 500ML 10 7.69
## 112970 COCA COLA COCA COLA RETORNABLE 500ML 10 7.69
## Unidades F.Ticket NombreDepartamento NombreFamilia
## 107394 2 450032 Abarrotes Sopas y Pastas
## 167771 1 450032 Abarrotes Salsas y Sazonadores
## 149429 2 450034 Abarrotes Bebidas
## 168750 1 450037 Abarrotes Granos y Semillas
## 161193 1 450039 Abarrotes Bebidas
## 112970 8 450040 Abarrotes Bebidas
## NombreCategoria Estado Mts.2 Tipo.ubicación Giro
## 107394 Fideos, Spaguetti, Tallarines Sinaloa 53 Esquina Abarrotes
## 167771 Salsa para Spaguetti Sinaloa 53 Esquina Abarrotes
## 149429 Refrescos Retornables Sinaloa 53 Esquina Abarrotes
## 168750 Arroz Sinaloa 53 Esquina Abarrotes
## 161193 Refrescos Plástico (N.R.) Sinaloa 53 Esquina Abarrotes
## 112970 Refrescos Retornables Sinaloa 53 Esquina Abarrotes
## Hora.inicio Hora.cierre Dia_de_la_Semana Subtotal Utilidad
## 107394 07:00 23:00 5 14 1.62
## 167771 07:00 23:00 5 12 2.77
## 149429 07:00 23:00 5 30 3.46
## 168750 07:00 23:00 5 11 2.54
## 161193 07:00 23:00 5 10 2.31
## 112970 07:00 23:00 5 80 2.31
library(plyr)
basket <- ddply(bdl,c("F.Ticket"), function(bdl)paste(bdl$Marca, collapse = ","))
basket$F.Ticket <- NULL
colnames(basket) <- c("Marca")