entender la base de datos
summary(bd)
## vcClaveTienda DescGiro Codigo.Barras PLU
## Length:200625 Length:200625 Min. :8.347e+05 Min. : 1.00
## Class :character Class :character 1st Qu.:7.501e+12 1st Qu.: 1.00
## Mode :character Mode :character Median :7.501e+12 Median : 1.00
## Mean :5.950e+12 Mean : 2.11
## 3rd Qu.:7.501e+12 3rd Qu.: 1.00
## Max. :1.750e+13 Max. :30.00
## NA's :199188
## Fecha Hora Marca Fabricante
## Length:200625 Length:200625 Length:200625 Length:200625
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
##
## Producto Precio Ult.Costo Unidades
## Length:200625 Min. :-147.00 Min. : 0.38 Min. : 0.200
## Class :character 1st Qu.: 11.00 1st Qu.: 8.46 1st Qu.: 1.000
## Mode :character Median : 16.00 Median : 12.31 Median : 1.000
## Mean : 19.42 Mean : 15.31 Mean : 1.262
## 3rd Qu.: 25.00 3rd Qu.: 19.23 3rd Qu.: 1.000
## Max. :1000.00 Max. :769.23 Max. :96.000
##
## F.Ticket NombreDepartamento NombreFamilia NombreCategoria
## Min. : 1 Length:200625 Length:200625 Length:200625
## 1st Qu.: 33964 Class :character Class :character Class :character
## Median :105993 Mode :character Mode :character Mode :character
## Mean :193990
## 3rd Qu.:383005
## Max. :450040
##
## Estado Mts.2 Tipo.ubicación Giro
## Length:200625 Min. :47.0 Length:200625 Length:200625
## Class :character 1st Qu.:53.0 Class :character Class :character
## Mode :character Median :60.0 Mode :character Mode :character
## Mean :56.6
## 3rd Qu.:60.0
## Max. :62.0
##
## Hora.inicio Hora.cierre
## Length:200625 Length:200625
## Class :character Class :character
## Mode :character Mode :character
##
##
##
##
# install.packages("dplyr")
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
count(bd, vcClaveTienda, sort = TRUE)
## vcClaveTienda n
## 1 MX001 96469
## 2 MX004 83455
## 3 MX005 10021
## 4 MX002 6629
## 5 MX003 4051
count(bd, DescGiro, sort = TRUE)
## DescGiro n
## 1 Abarrotes 100520
## 2 Carnicería 83455
## 3 Depósito 16650
count(bd, Marca, sort = TRUE)
## Marca n
## 1 COCA COLA 18686
## 2 PEPSI 15967
## 3 TECATE 11674
## 4 BIMBO 8317
## 5 LALA 5866
## 6 MARINELA 3696
## 7 DORITOS 3142
## 8 CHEETOS 3130
## 9 NUTRI LECHE 3128
## 10 MARLBORO 2579
## 11 JOYA 2502
## 12 LA COSTEÑA 2441
## 13 RUFFLES 2270
## 14 SABRITAS 2191
## 15 LA ARDILLA 2150
## 16 DEL FUERTE 2098
## 17 LINK 2041
## 18 BOKADOS 2016
## 19 DEL MONTE 1956
## 20 NORTEÑITA 1921
## 21 TANG 1912
## 22 YEMINA 1904
## 23 CONVERMEX 1817
## 24 SALADITAS (GAMESA) 1740
## 25 TOPO CHICO 1606
## 26 POWERADE 1597
## 27 EPURA 1500
## 28 VALLE FRUT 1500
## 29 CONSOMATE 1487
## 30 DEL VALLE 1382
## 31 JUMEX 1310
## 32 KLEENEX 1295
## 33 GAMESA 1267
## 34 VELADORA MEXICO 1253
## 35 PALL MALL 1234
## 36 COCA COLA LIGHT 1219
## 37 DIAMANTE 1163
## 38 CLORALEX 1097
## 39 CHIMEX 1065
## 40 MARUCHAN 1053
## 41 REYMA 1048
## 42 PAKETAXO 1037
## 43 TOSTITOS 1028
## 44 SQUIRT 1007
## 45 BONAFONT 995
## 46 NESCAFE 892
## 47 FUD 887
## 48 ZOTE 879
## 49 ENCANTO 874
## 50 KNORR 837
## 51 MARIAS 835
## 52 BLANCA NIEVES (DETERGENTE) 829
## 53 FRESCA 770
## 54 SPRITE 757
## 55 YOPLAIT 744
## 56 FOCA 735
## 57 BLUE HOUSE 726
## 58 MANZANITA SOL 723
## 59 CIEL 721
## 60 LA FINA 720
## 61 KARTAMUS 713
## 62 PEDIGREE 710
## 63 MASECA 693
## 64 EL GALLO DE ORO 683
## 65 COLGATE 681
## 66 HELLMANN´S 668
## 67 CLAMATO 656
## 68 CAMELIA 622
## 69 KINDER 614
## 70 GATORADE 610
## 71 ISADORA 600
## 72 JARRITOS 600
## 73 INCA 594
## 74 LA NUESTRA 588
## 75 CARTA BLANCA 582
## 76 SABA 573
## 77 SELECTA 569
## 78 DANONE 559
## 79 INDIO 556
## 80 LEO 553
## 81 COCA COLA ZERO 549
## 82 FABULOSO 547
## 83 SOL 528
## 84 FRUTSI 526
## 85 DOÑA MARIA 508
## 86 ELECTROLIT 505
## 87 ENSUEÑO 505
## 88 PINOL 500
## 89 BOING 497
## 90 FANTA 497
## 91 MIRINDA 496
## 92 LA VILLITA 480
## 93 TIA ROSA 475
## 94 PEPSI LIGHT 474
## 95 ZUKO 472
## 96 REGIO 465
## 97 GERBER 463
## 98 LA SIERRA 461
## 99 SEVEN UP 459
## 100 LA BOTANERA 453
## 101 SUAVITEL 438
## 102 PAPIRRINGAS 432
## 103 FRUTIMAX 424
## 104 SALVO 413
## 105 VIRMAR 411
## 106 RANCHERITOS 401
## 107 AXION 399
## 108 CRUJITOS 394
## 109 FLASH 386
## 110 LECHE FORTILECHE 384
## 111 BARRILITOS (DEL FRUTO) 375
## 112 KRAFT 367
## 113 NEVADA 361
## 114 NORVER 356
## 115 BENSON & HEDGES 343
## 116 BE-LIGHT 336
## 117 ACT II 329
## 118 NESTLE 322
## 119 PAISA 320
## 120 HUNTS 314
## 121 5 ESTRELLAS 305
## 122 CREMAX DE NIEVE 305
## 123 TOSTILEO 304
## 124 CRISTAL 303
## 125 DOS EQUIS LAGER 295
## 126 ARCOIRIS (GAMESA) 291
## 127 NUTRIOLI 288
## 128 CHOKIS 285
## 129 DANONINO 281
## 130 NIDO 281
## 131 PEÑAFIEL 280
## 132 TUNY 276
## 133 ARIZONA 275
## 134 ARIEL 271
## 135 NORTEÑO 269
## 136 LARA 260
## 137 ZONA DEL SABOR 255
## 138 GILLETTE 252
## 139 EMPERADOR (SENZO) 250
## 140 FRITOS 239
## 141 HALLS 239
## 142 PEÑAFIEL SABORES 239
## 143 RANCH STYLE 239
## 144 VARIOS DANONE 239
## 145 BUBBA XTREME 238
## 146 ACE 231
## 147 CHOCO MILK 230
## 148 FIOR DI PASTA 230
## 149 ELECTROPURA 229
## 150 JAGUAR 226
## 151 ABSOR SEC 224
## 152 TAJIN 224
## 153 CARNATION CLAVEL 220
## 154 KOTEX 218
## 155 KOLALOKA 213
## 156 ROMA 209
## 157 RAID 203
## 158 PRISPAS 201
## 159 DAN UP 199
## 160 MAMUT 196
## 161 DART (PLAST DESECH) 193
## 162 LIRIO 191
## 163 SANTA CLARA 191
## 164 PALMOLIVE 187
## 165 TRIDENT 176
## 166 LA MODERNA 175
## 167 1-2-3 (LAVANDERíA) 173
## 168 FLAMA 171
## 169 MCCORMICK 171
## 170 SAVILé 169
## 171 BABY 167
## 172 LUCAS 167
## 173 WHISKAS 167
## 174 PRIMAVERA 166
## 175 PULPY 166
## 176 MICHE-MIX 164
## 177 VOLT 159
## 178 GIRO 157
## 179 PANASONIC 157
## 180 REXAL 155
## 181 MAIZENA 151
## 182 BOGO´S 150
## 183 HERSHEYS 149
## 184 PERMA SHARP 149
## 185 EGO 148
## 186 GOLOS 148
## 187 NATURELLA 147
## 188 EFICAZ 144
## 189 POFFETS 142
## 190 SABRITONES 139
## 191 VIVE 100 % 139
## 192 ALPURA 138
## 193 CHEN 138
## 194 SIDRAL MUNDET 137
## 195 VALENTINA 136
## 196 ZEST 135
## 197 BEBIN 130
## 198 HERDEZ 130
## 199 BIG COLA 129
## 200 LA ANITA 129
## 201 1-2-3 (ABARROTES) 128
## 202 CHURRUMAIS 124
## 203 RUEDAS 124
## 204 CAPRICE 121
## 205 YOP TEENS 118
## 206 LOL-TUN 117
## 207 TOKAI 117
## 208 CHEESES PUFFS (ENCANTO) 116
## 209 TOPITOS (BK2) 115
## 210 LEO CACHAHUATES 113
## 211 VARIOS QUALTIA 113
## 212 CONCHITAS 112
## 213 CHEESE PUFFS (LEO) 110
## 214 BIDA 107
## 215 PICOT 104
## 216 KLEEN BEBE 103
## 217 MARIANITAS 103
## 218 NISSIN 103
## 219 VICK 103
## 220 CLASICOS DE LUJO 102
## 221 ALAMO 101
## 222 DEL PRIMO 100
## 223 GUAYMEX 100
## 224 QUAKER 100
## 225 SUPREMO 100
## 226 ORBIT 99
## 227 SAN LUIS 99
## 228 DE LA VIUDA 97
## 229 HOLANDA 96
## 230 MILPA REAL 94
## 231 ROGELIO BUENO 94
## 232 PREMIER 93
## 233 ELTORITO REGIO 91
## 234 BUBBALOO 90
## 235 KELLOGG'S 87
## 236 CLEMENTE JACQUES 84
## 237 JAZMIN 83
## 238 TOSTADAS SAN MIGUEL 82
## 239 TRIDENT XTRA CARE 82
## 240 MAZAPAN AZTECA (BK2) 81
## 241 CARIBE COOLER 80
## 242 VERDE VALLE 80
## 243 VIGOR 80
## 244 EL DORADO 79
## 245 MASSISO 78
## 246 CIERVO 75
## 247 JALOMA 75
## 248 ALFRESCO 74
## 249 PRONTO 73
## 250 CHOCO KRISPIS 71
## 251 MEDIA CREMA 71
## 252 BARRILITO (CERV. MODELO) 70
## 253 MAS 70
## 254 NESCAFE DECAF 70
## 255 AVANT 69
## 256 GARAÑON 69
## 257 KIR 69
## 258 BARILLA 66
## 259 ELITE 66
## 260 ENRE-2 66
## 261 FUZE TEA 66
## 262 KARO 66
## 263 TIX TIX 65
## 264 BAYGON 64
## 265 CHIQUITIN 64
## 266 CLAMATO VUELVE A LA VIDA 63
## 267 CHARRONES 61
## 268 STARKIS 61
## 269 VIRREY 61
## 270 ZUCARITAS 61
## 271 FROOT LOOPS 60
## 272 CHICHARRON DE CERDO (SABRITAS) 59
## 273 LA LECHERA 57
## 274 BOOTS 56
## 275 CAMPBELL'S 55
## 276 DIPAZOS 55
## 277 GIL 55
## 278 HUEKOS 54
## 279 PRODUCTOS CIERVO 54
## 280 DOWNY 53
## 281 BUBU LUBU 52
## 282 NAYAR 52
## 283 SANISSIMO 52
## 284 CORN FLAKES (KELLOGGS) 51
## 285 ROCKALETA 51
## 286 BRILUX 50
## 287 EL JIMADOR 50
## 288 FUERTE 50
## 289 KARAMELADAS POP 49
## 290 SUAVEL 49
## 291 AVE 48
## 292 CHICHARRONES HARINA (BK2) 48
## 293 COORS LIGHT 48
## 294 H24 48
## 295 ALWAYS 47
## 296 BUD LIGHT (CERV. MODELO) 47
## 297 CAPERUCITA 47
## 298 DELICIOSAS (LARA) 47
## 299 MAGGI 47
## 300 MARIPOSA 47
## 301 PHILADELPHIA 47
## 302 VELVET 47
## 303 BIG ROLL 46
## 304 HEINEKEN 46
## 305 HIDALGO (TOSTADAS) 46
## 306 FRUTZZO 45
## 307 HOT CAKES (GAMESA) 45
## 308 ANIMALITOS (LARA) 44
## 309 BIC 43
## 310 NUGGET 43
## 311 CORONA (CERV. MODELO) 42
## 312 SUANDY 42
## 313 VEL ROSITA 42
## 314 AXE 41
## 315 EVENFLO 41
## 316 EPIX 40
## 317 GARDUÑO 40
## 318 GARNIER NUTRISSE 40
## 319 MAZATUN 40
## 320 NUGS 40
## 321 SAVILE 40
## 322 VERO 40
## 323 CHOCO CHISPAS (LARA) 39
## 324 DEL HOGAR 39
## 325 ACTIVIA 37
## 326 CROSEE & BLACKWELL 36
## 327 O-DOLEX 36
## 328 HABANERAS 35
## 329 DOVE 34
## 330 M&M 34
## 331 MILKY WAY 34
## 332 TIC TAC 34
## 333 EL GUISANDERO 33
## 334 MONARCA 33
## 335 NESTEA 33
## 336 SULTAN 33
## 337 SULTANA 33
## 338 MAYA 32
## 339 TOSTADITAS HIDALGO 32
## 340 SNICKERS 31
## 341 MONELI 30
## 342 OBAO 30
## 343 SEIS HERMANOS 30
## 344 MODELO (CERV. MODELO) 29
## 345 SUPER REBANADITAS 29
## 346 CHIP-OTLES 28
## 347 GUDU POP 28
## 348 LA GUACAMAYA 28
## 349 LEGAL 28
## 350 NESQUIK 28
## 351 CABALLITO 27
## 352 CLORETS 27
## 353 KODYZ 27
## 354 RICOLINO (DULCE) 27
## 355 ABUELITA 26
## 356 ESTRELLA 25
## 357 HERBAL ESSENCES 25
## 358 IBEROMEX 25
## 359 TARASQUITOS 25
## 360 ORAL-B 24
## 361 PETIT (COSECHA PURA) 24
## 362 YOPI 24
## 363 BRASSO 23
## 364 CAMAY 23
## 365 COFFEE MATE 23
## 366 NEW MIX 23
## 367 PRINGLES 23
## 368 BUFALO 22
## 369 CHUPA CHUPS 22
## 370 HEAD & SHOULDERS 22
## 371 MAX AIR DENTYNE 22
## 372 PIZZAS FUD 22
## 373 TRES ESTRELLAS 22
## 374 B:OOST 21
## 375 LA PEÑITA 21
## 376 PETALO 21
## 377 BARCEL 20
## 378 CLORO PATITO 20
## 379 LA PERLA 20
## 380 POLVORONES 20
## 381 SONRICS 20
## 382 CAZO MEXICANO 18
## 383 EASY OFF 18
## 384 LADY SPEED STICK 18
## 385 MANZANA LIFT 18
## 386 PALOLA 18
## 387 SPEED STICK 18
## 388 SUATEL 18
## 389 CORN POPS 17
## 390 MR MUSCULO 17
## 391 PAPATINAS 17
## 392 PLASTIPAK 17
## 393 MORELIA 16
## 394 PAU-PAU 16
## 395 CAPULLO 15
## 396 NORDIKO 15
## 397 SCRIBE (GRUPO PAPELERO SCRIBE) 15
## 398 SKWINKLES 15
## 399 BON O BON 14
## 400 CARLOS V 14
## 401 CHIPS 14
## 402 LOS PERICOS 14
## 403 VOGUE 14
## 404 AJAX 13
## 405 BLANCA NIEVES 13
## 406 CANELS 13
## 407 LAS CANITAS 13
## 408 LUBRIDERM 13
## 409 SEDAL 13
## 410 VIUDA DE SANCHEZ 13
## 411 FIORE 12
## 412 HOT NUTS 12
## 413 JANEL 12
## 414 JOSE CUERVO ESPECIAL 12
## 415 KARLA 12
## 416 LUZ ETERNA 12
## 417 SCOTCH-BRITE 12
## 418 VICTORIA (CERV. MODELO) 12
## 419 ANCLA 11
## 420 DUVALIN 11
## 421 HELLMANNS 11
## 422 MISION 11
## 423 RATIGUM 11
## 424 SALSA CASERA 11
## 425 SARAZA 11
## 426 CHICOLASTIC 10
## 427 GELY CREAM 10
## 428 GLADE 10
## 429 INDY 10
## 430 LA VIUDA NEGRA 10
## 431 LIMONCHO 10
## 432 NESCAFE DOLCA 10
## 433 MORELOS 9
## 434 PIKAROS 9
## 435 SCHICK 9
## 436 SERALON 9
## 437 CALIFORNIA 8
## 438 DOLORES 8
## 439 LYS 8
## 440 PELIKAN 8
## 441 PERSIL 8
## 442 POLIRIS 8
## 443 SUAVELASTIC 8
## 444 TENDAL 8
## 445 CALAHUA 7
## 446 CANADA DRY 7
## 447 CREST 7
## 448 JACK DANIEL´S 7
## 449 LIPTON 7
## 450 PALETA PAYASO 7
## 451 SALMAS 7
## 452 TAKIS 7
## 453 TOP 7
## 454 3 EN 1 6
## 455 ADES 6
## 456 ATM 6
## 457 AVANCE 6
## 458 BIG MIX 6
## 459 CLORTEX 6
## 460 FERRERO ROCHER 6
## 461 MUSIQUERAS 6
## 462 PANTENE 6
## 463 WINIS 6
## 464 BREF 5
## 465 CAFE OLE 5
## 466 COLORFIEL 5
## 467 DELICADOS 5
## 468 GARNIER 5
## 469 OSO 5
## 470 PASTISETAS (SUANDY) 5
## 471 TOSTADAS MUSIQUERAS 5
## 472 ALPINO 4
## 473 BUCHANAN'S 4
## 474 DEL CAMPO 4
## 475 MONSTER 4
## 476 NIVEA 4
## 477 PROSAZON 4
## 478 TOTITO 4
## 479 VITACILINA 4
## 480 ADORABLE 3
## 481 CONTAC 3
## 482 CREMINO 3
## 483 EL PATO 3
## 484 EUCALIPTOL 3
## 485 K'NOX 3
## 486 MAGITEL 3
## 487 MEGA SUPREMA 3
## 488 NUTELLA 3
## 489 PLEDGE 3
## 490 REXONA 3
## 491 SAN RAFAEL 3
## 492 TREPA 3
## 493 ARCOIRIS 2
## 494 BIO BALANCE 2
## 495 BOMBIUX 2
## 496 CAL-C-TOSE 2
## 497 HINDS 2
## 498 IRIS 2
## 499 LOVENA 2
## 500 LUCKY STRIKE 2
## 501 NEUTRO BALANCE 2
## 502 PLASTI LOKA 2
## 503 RED BULL 2
## 504 SMMTY 2
## 505 SPECIAL K 2
## 506 STAR VALUE 2
## 507 SUPER STAR 2
## 508 TORTILLAS REGIAS 2
## 509 ZUMBA PICA 2
## 510 AFFECTIVE 1
## 511 BACARDI 1
## 512 BACO 1
## 513 CAMPO AZUL 1
## 514 CHOCOLATINES 1
## 515 CHURRITOS (BARCEL) 1
## 516 CHURRITOS (LEO) 1
## 517 CUéTARA 1
## 518 DAMY 1
## 519 DE LA ROSA 1
## 520 DODY´S 1
## 521 DOÑA EMILIA 1
## 522 EL TORITO REGIO 1
## 523 GUTEN 1
## 524 HARPIC 1
## 525 HUGGIES 1
## 526 JOHSONS 1
## 527 LA CAMPANA 1
## 528 LA CARRETA 1
## 529 LIRIO (JAB Y DET) 1
## 530 MILLER 1
## 531 NEO-MELUBRINA 1
## 532 PEPSI KICK 1
## 533 PPINTAAZUL 1
## 534 PURINA 1
## 535 SAN MARCOS 1
## 536 SANTA ISABEL 1
## 537 SENIOR 1
## 538 SUAVICREMAS (MARINELA) 1
## 539 TOSTACHOS 1
## 540 VIOLETA 1
count(bd, Fabricante, sort = TRUE)
## Fabricante n
## 1 COCA COLA 27519
## 2 PEPSI-COLA MEXICANA 22416
## 3 SABRITAS 14296
## 4 CERVECERIA CUAUHTEMOC MOCTEZUMA 13681
## 5 GRUPO BIMBO 13078
## 6 SIGMA ALIMENTOS 8014
## 7 GRUPO INDUSTRIAL LALA 5868
## 8 GRUPO GAMESA 5527
## 9 NESTLE 3698
## 10 JUGOS DEL VALLE S.A. DE C.V. 3581
## 11 MEXILAC 3128
## 12 CIGATAM 2927
## 13 NACIONAL DE ALIMENTOS Y HELADOS 2908
## 14 HERDEZ 2757
## 15 ALEN 2698
## 16 FABRICA DE JABON LA CORONA 2652
## 17 CONAGRA FOODS MEXICO 2509
## 18 COLGATE PALMOLIVE 2506
## 19 CONSERVAS LA COSTEÑA 2441
## 20 MANUEL UGALDE MATA 2150
## 21 ALIMENTOS DEL FUERTE 2098
## 22 UNILEVER DE MEXICO 2081
## 23 LINK 2041
## 24 KRAFT FOODS 1959
## 25 CONVERTIDORA DE PLASTICOS 1817
## 26 KIMBERLY CLARK 1708
## 27 BOTANAS LEO, S.A. DE C.V. 1652
## 28 CIA. TOPO CHICO 1606
## 29 PROCTER & GAMBLE COMPANY 1506
## 30 JUMEX 1505
## 31 DANONE DE MEXICO 1315
## 32 KURUMBA 1290
## 33 VELADORA MEXICO 1253
## 34 EMPACADOS 1164
## 35 FRITOS ENCANTO DE MONTERREY, S.A. DE C.V 1163
## 36 MARUCHAN 1053
## 37 PLASTICOS ADHERIBLES DEL BAJIO 1048
## 38 ACEITES GRASAS Y DERIVADOS 1016
## 39 LIQUIMEX 995
## 40 QUALAMEX 880
## 41 MASTER FOODS USA 877
## 42 CADBURY ADAMS 874
## 43 GRUPO PEÑAFIEL 851
## 44 SALES DEL ISTMO 720
## 45 MOLINOS AZTECA 693
## 46 TOSTADAS Y BOTANAS PREMIUM 686
## 47 PRODUCTOS VERDE VALLE S.A. DE C.V. 680
## 48 FERRERO 657
## 49 ALIMENTOS CAPULLO 609
## 50 DISTRIBUIDORA UNIVERSAL DE MERCANCIAS 588
## 51 SABORMEX 573
## 52 SCA CONSUMIDOR 573
## 53 MOLINERA DE MEXICO 569
## 54 LABORATORIOS PISA 505
## 55 Refrescos Pascual, S.A. 497
## 56 GOMEZ CUETARA HNOS 473
## 57 SCA CONSUMIDOR MéXICO 465
## 58 PRODUCTOS GERBER 463
## 59 MEGA ALIMENTOS 456
## 60 GILLETTE MANUFACTURA 425
## 61 LALA 384
## 62 DEL FRUTO 375
## 63 NEVADA 361
## 64 EMPACADORA NORVER 356
## 65 KELLOGG DE MEXICO 349
## 66 RAGASA INDUSTRIAS 336
## 67 BRISTOL-MYERS SQUIBB 334
## 68 HENKEL 331
## 69 ACT II 329
## 70 Mexicana de Arroz, S.A. de C.V 320
## 71 EMPACADORA JIMENEZ 305
## 72 EMBOTELLADORA DE MARCAS INTERNACIONALES 280
## 73 PRODUCTOS ALIMENTICIOS LA MODERNA 278
## 74 MARINDUSTRIAS 276
## 75 DRINKARIZONA 275
## 76 LA CENTRAL 273
## 77 IMPORTACIONES HNOS. CANTú S.A. DE C.V. 255
## 78 S. C. JOHNSON AND SON 238
## 79 QUALTIA ALIMENTOS 233
## 80 KLEEN BEBE 232
## 81 PASTAS MOLISABA S.A DE C.V 230
## 82 CENTRAL DE BOLSAS 226
## 83 EMPRESAS TAJIN 224
## 84 INDUSTRIAS KOLALOKA 215
## 85 CERVECERIA MODELO, S.A. DE C.V 200
## 86 MARS 198
## 87 DART DE MEXICO, S. DE R.L DE C.V 193
## 88 PRODUCTOS LIRIO 191
## 89 SANTA CLARA PRODUCTOS LACTEOS 191
## 90 SONRICS 188
## 91 EFEM DE MEXICO 182
## 92 LABORATORIOS AVANT 169
## 93 BUENO ALIMENTOS 168
## 94 COMPAÑIA ALIMENTICIA DEL NORTE 164
## 95 BOTANAS BOGO´S 161
## 96 AJEMEX 159
## 97 PANASONIC 157
## 98 BARCEL 155
## 99 REXAL 155
## 100 HERSHEY MEXICO 149
## 101 GRUPO ALPURA 138
## 102 SALSA TAMAZULA 136
## 103 FABRICA DE PAPEL SAN FRANCISCO 135
## 104 LAMBI S.A. DE C.V. 131
## 105 AJEMONTERREY 129
## 106 LA ANITA CONDIMENTOS 129
## 107 CORONA 128
## 108 PESCADOS INDUSTRIALIZADOS 127
## 109 CASA CUERVO 118
## 110 PRODUCTOS LOL-TUN 117
## 111 TOKAI 117
## 112 ABSORMEX S.A DE C.V 112
## 113 BELTICOS 107
## 114 JUGOMEX 107
## 115 RICOLINO 106
## 116 AVANT 105
## 117 NISSIN FOODS DE MEXICO S.A DE C.V 103
## 118 QUIMICA GONCAL 101
## 119 GRUPO GUAYMEX 100
## 120 STAR COMPANY S.A 100
## 121 DETERSOL 99
## 122 PRODUCTOS PREMIER 93
## 123 GRUPO CHI-SO S DE RLMI 91
## 124 RECKITT BENCHISER 91
## 125 TOSTADAS SAN MIGUEL 82
## 126 INDUSTRIAS VINICOLAS PEDRO DOMECQ 80
## 127 CON ALIMENTOS 76
## 128 PRODUCTOS CIERVO 75
## 129 GARAÑON 69
## 130 BARILLA DE MEXICO 66
## 131 BAYGON 64
## 132 VIRREY 61
## 133 ABASTECIMIENTOS PLáSTICOS Y ELéCTRICOS, 55
## 134 CAMPBELL'S DE MEXICO 55
## 135 SANISSIMO S.A. DE C.V. 52
## 136 CASA HERRADURA 50
## 137 DONATO ELIZONDO CANTU 50
## 138 VELADORAS MISTICAS 50
## 139 COORS BREWING CO 48
## 140 INDUSTRIAS H24 48
## 141 FABRICA DE JABON LA REINERA 47
## 142 TOSTADAS HIDALGO SA DE CV 46
## 143 FRABEL S.A DE C.V 45
## 144 NO SABE FALLAR 43
## 145 DULCES VERO 41
## 146 EVENFLO MEXICO 41
## 147 MAZAPAN DE LA ROSA 41
## 148 Bolsas y Vasos Garduño S.A. de C.V. 40
## 149 DEL HOGAR 39
## 150 COMERCIALIZADORA GOMEZ 33
## 151 LA PIARA S.A DE C.V 33
## 152 Fabrica de Cerillos y Fosforos la Indepe 32
## 153 TOSTADAS HIDALGO S.A DE C.V 32
## 154 COSBEL 30
## 155 EMPALMES SEIS HERMANOS 30
## 156 LABORATORIO MONELI 30
## 157 CANDY POP 29
## 158 INDUSTRIAS GUACAMAYA 28
## 159 MONROE CHEMICAL 27
## 160 GRUPO GONHER 26
## 161 TARASQUITOS 25
## 162 TORTILLAS ESTRELLA DEL NORTE, S.A. DE C. 25
## 163 Global Brands SRL 24
## 164 PRODUCTOS INTERNACIONALES MABE 23
## 165 TEQUILA HERRADURA 23
## 166 TRES ESTRELLAS 22
## 167 TOSTADAS LA PEÑITA 21
## 168 LA PERLA 20
## 169 Palola Distribuciones S.A. de C.V. 18
## 170 RAUL S. GONZALEZ GONZALEZ 18
## 171 SPEED STICK 18
## 172 BECTON DICKINSON DE MEXICO 17
## 173 GRUPO PAPELERO SCRIBE 15
## 174 LA IMPERIAL 15
## 175 COMERCIALIZADORA Y PROCESADORA LOS ALAMO 14
## 176 UNIDAL MEXICO 14
## 177 BLANCA NIEVES 13
## 178 Edmundo Sánchez 13
## 179 PFIZER 13
## 180 TEMMY S.A 13
## 181 ULTRA 13
## 182 3M MEXICO 12
## 183 DULCES KARLA 12
## 184 JANEL 12
## 185 LUZ ETERNA 12
## 186 PROCOPSA DE CV 12
## 187 TEQUILA CUERVO 12
## 188 Grupo Ancla S.A 11
## 189 PES 11
## 190 PRODUCTOS Y DISTRIBUIDORA AZTECA 11
## 191 MULTIDISTRIBUIDORA DE ALIMENTOS 10
## 192 PRODUCTOS INDY S.A. DE C.V. 10
## 193 Sanjuana Rodriguez Bustamante 10
## 194 COATS MEXICO 9
## 195 ESTHER CAMACHO GARNICA 9
## 196 EVEREADY DE MEXICO 9
## 197 ENKAPLAST 8
## 198 HILOS HIRIS 8
## 199 PRODUCTOS PELIKAN 8
## 200 BROWN FORMAN TEQUILA MEXICO 7
## 201 PRODUCTOS SEBRING 7
## 202 CONFICORP 6
## 203 LAFONT LAUNAY 6
## 204 PRODUCTOS DESHIDRATADOS PAGA, S.A DE C.V 6
## 205 PRODUCTOS PESQUEROS DE MATANCITAS 6
## 206 Productos Deshidratados Paga SA de CV 5
## 207 TOSTADORES Y MOLINOS 5
## 208 BDF MEXICO 4
## 209 COMPAÑIA INTERNACIONAL DE COMERCIO 4
## 210 EMPACADORA DEL CAMPO 4
## 211 JAMES BUCHANAN & CO. 4
## 212 MONSTER BEVERAGE COMPANY 4
## 213 PROSAZON 4
## 214 GLAXOSMITHKLINE 3
## 215 NUTRESA 3
## 216 Walker Foods Inc 3
## 217 BRISTOL-MYERS SQUIBB DE MEXICO 2
## 218 BRITISH AMERICAN TOBACCO MEXICO 2
## 219 DETERGENTES Y JABONES SASIL, S.A. DE C.V 2
## 220 GARZA ELIZONDO Y CIA. 2
## 221 HINDS 2
## 222 HORTENCIA SALAZAR BORJAS 2
## 223 MEGA ALIMENTOS, S.A. DE C.V. 2
## 224 PLASTICOS Y PRODUCTOS DE MONTERREY 2
## 225 RED BULL 2
## 226 ALIMENTOS DELICIAS DEL NORTE 1
## 227 ALIMENTOS SANTA ISABEL 1
## 228 ANALARA, S.A. 1
## 229 AVENTIS PHARMA 1
## 230 BACARDI Y COMPAÑIA 1
## 231 BACO 1
## 232 BETONE 1
## 233 EL TORITO REGIO 1
## 234 EMPACADORA SAN MARCOS 1
## 235 ESTILO Y VANIDAD 1
## 236 HUGGIES 1
## 237 JOHNSON & JOHNSON DE MEXICO 1
## 238 MILLER BREWING COMPANY 1
## 239 MONTES Y CIA 1
## 240 PRODUCTOS FINOS DE AGAVE 1
## 241 Sánchez y Martín s.a. de c.v 1
count(bd, NombreDepartamento, sort = TRUE)
## NombreDepartamento n
## 1 Abarrotes 198279
## 2 Bebes e Infantiles 1483
## 3 Ferretería 377
## 4 Farmacia 255
## 5 Vinos y Licores 104
## 6 Papelería 74
## 7 Mercería 44
## 8 Productos a Eliminar 8
## 9 Carnes 1
count(bd, NombreFamilia, sort = TRUE)
## NombreFamilia n
## 1 Bebidas 64918
## 2 Botanas 21583
## 3 Lacteos y Refrigerados 17659
## 4 Cerveza 14017
## 5 Pan y Tortilla 10502
## 6 Limpieza del Hogar 8724
## 7 Galletas 7487
## 8 Cigarros 6817
## 9 Cuidado Personal 5433
## 10 Salsas y Sazonadores 5320
## 11 Latería 5107
## 12 Especias 4921
## 13 Sopas y Pastas 4141
## 14 Desechables 3460
## 15 Dulcería 2671
## 16 Granos y Semillas 2663
## 17 C. Frías y Salchichonería 2123
## 18 Harinas y Complementos 1760
## 19 Velas y Veladoras 1638
## 20 Aderezos 1507
## 21 Aceite 1483
## 22 Te, Chocolate y Café 1431
## 23 Alimentos para Mascotas 878
## 24 Alimentos 810
## 25 Mantecas 797
## 26 Cereales 760
## 27 Azúcar y Miel 391
## 28 Pañales 337
## 29 Pegamentos 220
## 30 Productos Higiénicos 190
## 31 Pilas para uso Doméstico 157
## 32 Accesorios 146
## 33 Varios 113
## 34 Postres 87
## 35 Tequila 63
## 36 Antigripal 57
## 37 Material de Curación 57
## 38 Dermatológicos 54
## 39 Materiales y Accesorios 53
## 40 Bebidas Premezcladas 23
## 41 Alcohol 16
## 42 Cuadernos 15
## 43 Sangría 13
## 44 Productos sin Familia 8
## 45 Artículos de Escritura 6
## 46 Whisky 4
## 47 Alimentos a Granel 1
## 48 Analgésicos 1
## 49 Antiácido 1
## 50 Pollo 1
## 51 Ron 1
count(bd, NombreCategoria, sort = TRUE)
## NombreCategoria n
## 1 Refrescos Plástico (N.R.) 32862
## 2 Refrescos Retornables 13880
## 3 Frituras 11082
## 4 Lata 8150
## 5 Leche 7054
## 6 Cajetilla 6329
## 7 Botella 5867
## 8 Productos sin Categoria 5455
## 9 Papas Fritas 5344
## 10 Jugos y Néctares 5295
## 11 Lavandería 4587
## 12 Pan Dulce Empaquetado 4466
## 13 Platos y Vasos 3271
## 14 Concentrados en Polvo 3211
## 15 Energizantes e Hidratantes 3077
## 16 Aguas 2985
## 17 Quesos 2912
## 18 Aguas Saborizadas 2630
## 19 Salsa para Spaguetti 2485
## 20 Cremas 2447
## 21 Yogurt 2374
## 22 Pastelillos 2162
## 23 Chiles Envasados 2125
## 24 Arroz 2047
## 25 Papel Higiénico 2035
## 26 Saladas 1812
## 27 Especias 1761
## 28 Consome 1604
## 29 Limpiadores Líquidos 1603
## 30 Leche Saborizada 1559
## 31 Tradicionales 1553
## 32 Sopas Instantáneas 1494
## 33 Fideos, Spaguetti, Tallarines 1404
## 34 Verduras y Vegetales 1366
## 35 Pastas de Figuritas 1243
## 36 Pan para Hamburguesa, HotDog y Tortas 1136
## 37 Blanqueador de Ropa 1123
## 38 Tostadas 1070
## 39 Café 1066
## 40 Higiene Femenina 999
## 41 Chocolate 963
## 42 Lavatrastes 962
## 43 Pan de Barra Blanco 954
## 44 Frijoles en Lata 949
## 45 Populares 915
## 46 Chocolates 897
## 47 Salsa Picante 874
## 48 Surtido 859
## 49 Empanizador 857
## 50 Mayonesa 820
## 51 Sal 806
## 52 Cacahuates 742
## 53 Sandwich 720
## 54 Comida para Perros 711
## 55 Sazonadores 706
## 56 Postres Refrigerados 686
## 57 Malvavisco 671
## 58 Cuidado del Cabello 657
## 59 Chicharrón de Harina 628
## 60 Mole 621
## 61 Salchicha para Asar 580
## 62 Pasta Dental 578
## 63 Trigo 569
## 64 Rellenas 537
## 65 Pan de Barra Integral 534
## 66 Maíz 528
## 67 Gomas de Mazcar 515
## 68 Refrescos en Lata 483
## 69 Nachos 480
## 70 Jamón de Pavo 471
## 71 Paletas 471
## 72 Cuidado de la Piel 444
## 73 Salchicha HotDog y Viena 431
## 74 Catsup 424
## 75 Atún 414
## 76 Semillas 411
## 77 Afeitado y Depilación 408
## 78 Té helado 381
## 79 Chile Seco 367
## 80 Chicharrón de Cerdo 339
## 81 Frijol Varios 336
## 82 Papillas 334
## 83 Palomitas para Microondas 329
## 84 Insecticidas y Venenos 326
## 85 Salsa Botanera 318
## 86 Azúcar 311
## 87 Cerillos 305
## 88 Cremas de Nieve 305
## 89 Chorizo 301
## 90 Margarina 298
## 91 Frijol Bayo 296
## 92 Pastillas 293
## 93 Pan Tostado y Crotones 282
## 94 Leche en Polvo 281
## 95 Palomitas 258
## 96 Barras Energéticas 254
## 97 Azucarados 191
## 98 Jamón de Cerdo 186
## 99 Encendedores 183
## 100 Comida para Gatos 167
## 101 Harina para Pastel 165
## 102 Mezclas para Cerveza 164
## 103 Bicarbonato de Sodio 159
## 104 Mantequilla 159
## 105 Polvo para Hornear 155
## 106 Atoles 151
## 107 Fruta Acidulada 148
## 108 Tocino 143
## 109 Saborizante para Leche 142
## 110 Cepillo Dental 134
## 111 Jugos 129
## 112 Achiotes 127
## 113 Desodorantes 119
## 114 Vinagre 118
## 115 Productos del mar Envasados 116
## 116 Hot Cakes 114
## 117 Tropicales 114
## 118 Varios 114
## 119 Leches y Cremas 112
## 120 Sal Combinada 103
## 121 Frutas secas 102
## 122 Servilletas 102
## 123 Helados 96
## 124 Tamarindos 94
## 125 Mostaza 90
## 126 Dulce Macizo 83
## 127 Mazapán 82
## 128 Avena 81
## 129 Mermeladas 80
## 130 Puré de Papa 78
## 131 Avena y Fibra 67
## 132 Miel 66
## 133 Gelatinas en Polvo y Ligth 61
## 134 Cucharas, Tenedores y Cuchillos 60
## 135 Tortillas de Harina e Integrales 58
## 136 Hojuelas de Maíz 57
## 137 Aderezo para Ensalada 55
## 138 Polvos 51
## 139 Cal Hidratada 50
## 140 Limpieza de Calzado 49
## 141 Antojitos Mexicanos 48
## 142 Aromatizantes de Ambiente 48
## 143 Chocolate Macizo 47
## 144 Finas 47
## 145 Limpieza de Cocina 41
## 146 Tortillas de Maíz 27
## 147 Artículos de Limpieza 26
## 148 Maíz Rocero 26
## 149 Pizzas 26
## 150 Repostería 26
## 151 Extractos 25
## 152 Frutas Envasadas 25
## 153 Palillos de Madera 25
## 154 Charal 23
## 155 Te 20
## 156 Azúcar Glass 19
## 157 Camarón Seco 19
## 158 Salsa Casera 17
## 159 Lentejas 15
## 160 Carne Seca 12
## 161 Mortadela 11
## 162 Cosméticos 9
## 163 Salsas Varias 8
## 164 Tendederos y Pinzas 8
## 165 Bombónes 7
## 166 Chiclosos 6
## 167 Gomas 6
## 168 Pistaches 6
## 169 Sustituto de Crema 5
## 170 Aluminios y Envolturas 2
## 171 Flan en Polvo 2
## 172 Fibras 1
## 173 Light 1
## 174 Pañal para Adulto 1
count(bd, Estado, sort = TRUE)
## Estado n
## 1 Nuevo León 96469
## 2 Sinaloa 83455
## 3 Quintana Roo 10021
## 4 Jalisco 6629
## 5 Chiapas 4051
count(bd, Mts.2, sort = TRUE)
## Mts.2 n
## 1 60 96469
## 2 53 83455
## 3 58 10021
## 4 47 6629
## 5 62 4051
count(bd, Tipo.ubicación, sort = TRUE)
## Tipo.ubicación n
## 1 Esquina 189945
## 2 Rotonda 6629
## 3 Entre calles 4051
count(bd, Giro, sort = TRUE)
## Giro n
## 1 Abarrotes 183975
## 2 Mini súper 16650
count(bd, Hora.inicio, sort = TRUE)
## Hora.inicio n
## 1 08:00 106490
## 2 07:00 87506
## 3 09:00 6629
count(bd, Hora.cierre, sort = TRUE)
## Hora.cierre n
## 1 22:00 103098
## 2 23:00 87506
## 3 21:00 10021
# install.packages("tidyverse")
library(tidyverse)
## ── Attaching packages
## ───────────────────────────────────────
## tidyverse 1.3.2 ──
## ✔ ggplot2 3.3.6 ✔ purrr 0.3.4
## ✔ tibble 3.1.8 ✔ stringr 1.4.1
## ✔ tidyr 1.2.1 ✔ forcats 0.5.2
## ✔ readr 2.1.2
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
tibble(bd)
## # A tibble: 200,625 × 22
## vcClaveTienda DescGiro Codig…¹ PLU Fecha Hora Marca Fabri…² Produ…³ Precio
## <chr> <chr> <dbl> <int> <chr> <chr> <chr> <chr> <chr> <dbl>
## 1 MX001 Abarrot… 7.50e12 NA 19/0… 08:1… NUTR… MEXILAC Nutri … 16
## 2 MX001 Abarrot… 7.50e12 NA 19/0… 08:2… DAN … DANONE… DANUP … 14
## 3 MX001 Abarrot… 7.50e12 NA 19/0… 08:2… BIMBO GRUPO … Rebana… 5
## 4 MX001 Abarrot… 7.50e12 NA 19/0… 08:2… PEPSI PEPSI-… Pepsi … 8
## 5 MX001 Abarrot… 7.50e12 NA 19/0… 08:2… BLAN… FABRIC… Deterg… 19.5
## 6 MX001 Abarrot… 7.50e12 NA 19/0… 08:1… NUTR… MEXILAC Nutri … 16
## 7 MX001 Abarrot… 7.50e12 NA 19/0… 08:2… DAN … DANONE… DANUP … 14
## 8 MX001 Abarrot… 7.50e12 NA 19/0… 08:2… BIMBO GRUPO … Rebana… 5
## 9 MX001 Abarrot… 7.50e12 NA 19/0… 08:2… PEPSI PEPSI-… Pepsi … 8
## 10 MX001 Abarrot… 7.50e12 NA 19/0… 08:2… BLAN… FABRIC… Deterg… 19.5
## # … with 200,615 more rows, 12 more variables: Ult.Costo <dbl>, Unidades <dbl>,
## # F.Ticket <int>, NombreDepartamento <chr>, NombreFamilia <chr>,
## # NombreCategoria <chr>, Estado <chr>, Mts.2 <int>, Tipo.ubicación <chr>,
## # Giro <chr>, Hora.inicio <chr>, Hora.cierre <chr>, and abbreviated variable
## # names ¹Codigo.Barras, ²Fabricante, ³Producto
str(bd)
## 'data.frame': 200625 obs. of 22 variables:
## $ vcClaveTienda : chr "MX001" "MX001" "MX001" "MX001" ...
## $ DescGiro : chr "Abarrotes" "Abarrotes" "Abarrotes" "Abarrotes" ...
## $ Codigo.Barras : num 7.5e+12 7.5e+12 7.5e+12 7.5e+12 7.5e+12 ...
## $ PLU : int NA NA NA NA NA NA NA NA NA NA ...
## $ Fecha : chr "19/06/2020" "19/06/2020" "19/06/2020" "19/06/2020" ...
## $ Hora : chr "08:16:21" "08:23:33" "08:24:33" "08:24:33" ...
## $ Marca : chr "NUTRI LECHE" "DAN UP" "BIMBO" "PEPSI" ...
## $ Fabricante : chr "MEXILAC" "DANONE DE MEXICO" "GRUPO BIMBO" "PEPSI-COLA MEXICANA" ...
## $ Producto : chr "Nutri Leche 1 Litro" "DANUP STRAWBERRY P/BEBER 350GR NAL" "Rebanadas Bimbo 2Pz" "Pepsi N.R. 400Ml" ...
## $ Precio : num 16 14 5 8 19.5 16 14 5 8 19.5 ...
## $ Ult.Costo : num 12.3 14 5 8 15 ...
## $ Unidades : num 1 1 1 1 1 1 1 1 1 1 ...
## $ F.Ticket : int 1 2 3 3 4 1 2 3 3 4 ...
## $ NombreDepartamento: chr "Abarrotes" "Abarrotes" "Abarrotes" "Abarrotes" ...
## $ NombreFamilia : chr "Lacteos y Refrigerados" "Lacteos y Refrigerados" "Pan y Tortilla" "Bebidas" ...
## $ NombreCategoria : chr "Leche" "Yogurt" "Pan Dulce Empaquetado" "Refrescos Plástico (N.R.)" ...
## $ Estado : chr "Nuevo León" "Nuevo León" "Nuevo León" "Nuevo León" ...
## $ Mts.2 : int 60 60 60 60 60 60 60 60 60 60 ...
## $ Tipo.ubicación : chr "Esquina" "Esquina" "Esquina" "Esquina" ...
## $ Giro : chr "Abarrotes" "Abarrotes" "Abarrotes" "Abarrotes" ...
## $ Hora.inicio : chr "08:00" "08:00" "08:00" "08:00" ...
## $ Hora.cierre : chr "22:00" "22:00" "22:00" "22:00" ...
head(bd)
## vcClaveTienda DescGiro Codigo.Barras PLU Fecha Hora
## 1 MX001 Abarrotes 7.501021e+12 NA 19/06/2020 08:16:21
## 2 MX001 Abarrotes 7.501032e+12 NA 19/06/2020 08:23:33
## 3 MX001 Abarrotes 7.501000e+12 NA 19/06/2020 08:24:33
## 4 MX001 Abarrotes 7.501031e+12 NA 19/06/2020 08:24:33
## 5 MX001 Abarrotes 7.501026e+12 NA 19/06/2020 08:26:28
## 6 MX001 Abarrotes 7.501021e+12 NA 19/06/2020 08:16:21
## Marca Fabricante
## 1 NUTRI LECHE MEXILAC
## 2 DAN UP DANONE DE MEXICO
## 3 BIMBO GRUPO BIMBO
## 4 PEPSI PEPSI-COLA MEXICANA
## 5 BLANCA NIEVES (DETERGENTE) FABRICA DE JABON LA CORONA
## 6 NUTRI LECHE MEXILAC
## Producto Precio Ult.Costo Unidades F.Ticket
## 1 Nutri Leche 1 Litro 16.0 12.31 1 1
## 2 DANUP STRAWBERRY P/BEBER 350GR NAL 14.0 14.00 1 2
## 3 Rebanadas Bimbo 2Pz 5.0 5.00 1 3
## 4 Pepsi N.R. 400Ml 8.0 8.00 1 3
## 5 Detergente Blanca Nieves 500G 19.5 15.00 1 4
## 6 Nutri Leche 1 Litro 16.0 12.31 1 1
## NombreDepartamento NombreFamilia NombreCategoria
## 1 Abarrotes Lacteos y Refrigerados Leche
## 2 Abarrotes Lacteos y Refrigerados Yogurt
## 3 Abarrotes Pan y Tortilla Pan Dulce Empaquetado
## 4 Abarrotes Bebidas Refrescos Plástico (N.R.)
## 5 Abarrotes Limpieza del Hogar Lavandería
## 6 Abarrotes Lacteos y Refrigerados Leche
## Estado Mts.2 Tipo.ubicación Giro Hora.inicio Hora.cierre
## 1 Nuevo León 60 Esquina Abarrotes 08:00 22:00
## 2 Nuevo León 60 Esquina Abarrotes 08:00 22:00
## 3 Nuevo León 60 Esquina Abarrotes 08:00 22:00
## 4 Nuevo León 60 Esquina Abarrotes 08:00 22:00
## 5 Nuevo León 60 Esquina Abarrotes 08:00 22:00
## 6 Nuevo León 60 Esquina Abarrotes 08:00 22:00
tail(bd)
## vcClaveTienda DescGiro Codigo.Barras PLU Fecha Hora
## 200620 MX005 Depósito 7.62221e+12 NA 12/07/2020 01:08:25
## 200621 MX005 Depósito 7.62221e+12 NA 23/10/2020 22:17:37
## 200622 MX005 Depósito 7.62221e+12 NA 10/10/2020 20:30:20
## 200623 MX005 Depósito 7.62221e+12 NA 10/10/2020 22:40:43
## 200624 MX005 Depósito 7.62221e+12 NA 27/06/2020 22:30:19
## 200625 MX005 Depósito 7.62221e+12 NA 26/06/2020 23:43:34
## Marca Fabricante Producto Precio
## 200620 TRIDENT XTRA CARE CADBURY ADAMS Trident Xtracare Freshmint 16.32G 9
## 200621 TRIDENT XTRA CARE CADBURY ADAMS Trident Xtracare Freshmint 16.32G 9
## 200622 TRIDENT XTRA CARE CADBURY ADAMS Trident Xtracare Freshmint 16.32G 9
## 200623 TRIDENT XTRA CARE CADBURY ADAMS Trident Xtracare Freshmint 16.32G 9
## 200624 TRIDENT XTRA CARE CADBURY ADAMS Trident Xtracare Freshmint 16.32G 9
## 200625 TRIDENT XTRA CARE CADBURY ADAMS Trident Xtracare Freshmint 16.32G 9
## Ult.Costo Unidades F.Ticket NombreDepartamento NombreFamilia
## 200620 6.92 1 103100 Abarrotes Dulcería
## 200621 6.92 1 116598 Abarrotes Dulcería
## 200622 6.92 1 114886 Abarrotes Dulcería
## 200623 6.92 1 114955 Abarrotes Dulcería
## 200624 6.92 1 101121 Abarrotes Dulcería
## 200625 6.92 1 100879 Abarrotes Dulcería
## NombreCategoria Estado Mts.2 Tipo.ubicación Giro Hora.inicio
## 200620 Gomas de Mazcar Quintana Roo 58 Esquina Mini súper 08:00
## 200621 Gomas de Mazcar Quintana Roo 58 Esquina Mini súper 08:00
## 200622 Gomas de Mazcar Quintana Roo 58 Esquina Mini súper 08:00
## 200623 Gomas de Mazcar Quintana Roo 58 Esquina Mini súper 08:00
## 200624 Gomas de Mazcar Quintana Roo 58 Esquina Mini súper 08:00
## 200625 Gomas de Mazcar Quintana Roo 58 Esquina Mini súper 08:00
## Hora.cierre
## 200620 21:00
## 200621 21:00
## 200622 21:00
## 200623 21:00
## 200624 21:00
## 200625 21:00
# install.packages("janitor")
library(janitor)
##
## Attaching package: 'janitor'
##
## The following objects are masked from 'package:stats':
##
## chisq.test, fisher.test
tabyl(bd,vcClaveTienda, NombreDepartamento)
## vcClaveTienda Abarrotes Bebes e Infantiles Carnes Farmacia Ferretería Mercería
## MX001 95415 515 1 147 245 28
## MX002 6590 21 0 4 10 0
## MX003 4026 15 0 2 8 0
## MX004 82234 932 0 102 114 16
## MX005 10014 0 0 0 0 0
## Papelería Productos a Eliminar Vinos y Licores
## 35 3 80
## 0 0 4
## 0 0 0
## 32 5 20
## 7 0 0
6. Hau unidades menores a 1
Tecnica 1. Remover valores irrelevantes
# Eliminar columnas PLU y Código de Barras
bd1 <- bd
bd1 <- subset(bd1, select = -c (PLU, Codigo.Barras))
# Eliminar renglones
bd2 <- bd1
bd2 <- bd2[bd2$NombreDepartamento != "Productos a Eliminar", ]
count(bd2, NombreDepartamento, sort = TRUE)
## NombreDepartamento n
## 1 Abarrotes 198279
## 2 Bebes e Infantiles 1483
## 3 Ferretería 377
## 4 Farmacia 255
## 5 Vinos y Licores 104
## 6 Papelería 74
## 7 Mercería 44
## 8 Carnes 1
Tecnica 2, quitar valores duplicados
bd1[duplicated(bd1),]
## vcClaveTienda DescGiro Fecha Hora Marca
## 6 MX001 Abarrotes 19/06/2020 08:16:21 NUTRI LECHE
## 7 MX001 Abarrotes 19/06/2020 08:23:33 DAN UP
## 8 MX001 Abarrotes 19/06/2020 08:24:33 BIMBO
## 9 MX001 Abarrotes 19/06/2020 08:24:33 PEPSI
## 10 MX001 Abarrotes 19/06/2020 08:26:28 BLANCA NIEVES (DETERGENTE)
## Fabricante Producto Precio
## 6 MEXILAC Nutri Leche 1 Litro 16.0
## 7 DANONE DE MEXICO DANUP STRAWBERRY P/BEBER 350GR NAL 14.0
## 8 GRUPO BIMBO Rebanadas Bimbo 2Pz 5.0
## 9 PEPSI-COLA MEXICANA Pepsi N.R. 400Ml 8.0
## 10 FABRICA DE JABON LA CORONA Detergente Blanca Nieves 500G 19.5
## Ult.Costo Unidades F.Ticket NombreDepartamento NombreFamilia
## 6 12.31 1 1 Abarrotes Lacteos y Refrigerados
## 7 14.00 1 2 Abarrotes Lacteos y Refrigerados
## 8 5.00 1 3 Abarrotes Pan y Tortilla
## 9 8.00 1 3 Abarrotes Bebidas
## 10 15.00 1 4 Abarrotes Limpieza del Hogar
## NombreCategoria Estado Mts.2 Tipo.ubicación Giro
## 6 Leche Nuevo León 60 Esquina Abarrotes
## 7 Yogurt Nuevo León 60 Esquina Abarrotes
## 8 Pan Dulce Empaquetado Nuevo León 60 Esquina Abarrotes
## 9 Refrescos Plástico (N.R.) Nuevo León 60 Esquina Abarrotes
## 10 Lavandería Nuevo León 60 Esquina Abarrotes
## Hora.inicio Hora.cierre
## 6 08:00 22:00
## 7 08:00 22:00
## 8 08:00 22:00
## 9 08:00 22:00
## 10 08:00 22:00
sum(duplicated(bd1))
## [1] 5
# Eliminar renglones duplicados
bd3 <- bd1
library(dplyr)
bd3 <- distinct(bd3)
# Tecnica 3, errores tipográficos y erroes similares
bd4 <- bd3
bd4$Precio <- abs(bd4$Precio)
summary(bd4)
## vcClaveTienda DescGiro Fecha Hora
## Length:200620 Length:200620 Length:200620 Length:200620
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
## Marca Fabricante Producto Precio
## Length:200620 Length:200620 Length:200620 Min. : 0.50
## Class :character Class :character Class :character 1st Qu.: 11.00
## Mode :character Mode :character Mode :character Median : 16.00
## Mean : 19.45
## 3rd Qu.: 25.00
## Max. :1000.00
## Ult.Costo Unidades F.Ticket NombreDepartamento
## Min. : 0.38 Min. : 0.200 Min. : 1 Length:200620
## 1st Qu.: 8.46 1st Qu.: 1.000 1st Qu.: 33967 Class :character
## Median : 12.31 Median : 1.000 Median :105996 Mode :character
## Mean : 15.31 Mean : 1.262 Mean :193994
## 3rd Qu.: 19.23 3rd Qu.: 1.000 3rd Qu.:383008
## Max. :769.23 Max. :96.000 Max. :450040
## NombreFamilia NombreCategoria Estado Mts.2
## Length:200620 Length:200620 Length:200620 Min. :47.0
## Class :character Class :character Class :character 1st Qu.:53.0
## Mode :character Mode :character Mode :character Median :60.0
## Mean :56.6
## 3rd Qu.:60.0
## Max. :62.0
## Tipo.ubicación Giro Hora.inicio Hora.cierre
## Length:200620 Length:200620 Length:200620 Length:200620
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
# Cantidad en enteros
bd5 <- bd4
bd5$Unidades <- ceiling(bd5$Unidades)
summary(bd5)
## vcClaveTienda DescGiro Fecha Hora
## Length:200620 Length:200620 Length:200620 Length:200620
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
## Marca Fabricante Producto Precio
## Length:200620 Length:200620 Length:200620 Min. : 0.50
## Class :character Class :character Class :character 1st Qu.: 11.00
## Mode :character Mode :character Mode :character Median : 16.00
## Mean : 19.45
## 3rd Qu.: 25.00
## Max. :1000.00
## Ult.Costo Unidades F.Ticket NombreDepartamento
## Min. : 0.38 Min. : 1.000 Min. : 1 Length:200620
## 1st Qu.: 8.46 1st Qu.: 1.000 1st Qu.: 33967 Class :character
## Median : 12.31 Median : 1.000 Median :105996 Mode :character
## Mean : 15.31 Mean : 1.262 Mean :193994
## 3rd Qu.: 19.23 3rd Qu.: 1.000 3rd Qu.:383008
## Max. :769.23 Max. :96.000 Max. :450040
## NombreFamilia NombreCategoria Estado Mts.2
## Length:200620 Length:200620 Length:200620 Min. :47.0
## Class :character Class :character Class :character 1st Qu.:53.0
## Mode :character Mode :character Mode :character Median :60.0
## Mean :56.6
## 3rd Qu.:60.0
## Max. :62.0
## Tipo.ubicación Giro Hora.inicio Hora.cierre
## Length:200620 Length:200620 Length:200620 Length:200620
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
Tecnica 4, convertir tipos de datos
# Convertir de caracter a fecha
bd6 <- bd5
bd6$Fecha <- as.Date(bd6$Fecha, format = "%d/%m/%Y")
tibble(bd6)
## # A tibble: 200,620 × 20
## vcCla…¹ DescG…² Fecha Hora Marca Fabri…³ Produ…⁴ Precio Ult.C…⁵ Unida…⁶
## <chr> <chr> <date> <chr> <chr> <chr> <chr> <dbl> <dbl> <dbl>
## 1 MX001 Abarro… 2020-06-19 08:1… NUTR… MEXILAC Nutri … 16 12.3 1
## 2 MX001 Abarro… 2020-06-19 08:2… DAN … DANONE… DANUP … 14 14 1
## 3 MX001 Abarro… 2020-06-19 08:2… BIMBO GRUPO … Rebana… 5 5 1
## 4 MX001 Abarro… 2020-06-19 08:2… PEPSI PEPSI-… Pepsi … 8 8 1
## 5 MX001 Abarro… 2020-06-19 08:2… BLAN… FABRIC… Deterg… 19.5 15 1
## 6 MX001 Abarro… 2020-06-19 08:2… FLASH ALEN Flash … 9.5 7.31 1
## 7 MX001 Abarro… 2020-06-19 08:2… VARI… DANONE… Danone… 11 11 1
## 8 MX001 Abarro… 2020-06-19 08:2… ZOTE FABRIC… Jabon … 9.5 7.31 1
## 9 MX001 Abarro… 2020-06-19 08:2… ALWA… PROCTE… T Feme… 23.5 18.1 1
## 10 MX001 Abarro… 2020-06-19 15:2… JUMEX JUMEX Jugo D… 12 12 1
## # … with 200,610 more rows, 10 more variables: F.Ticket <int>,
## # NombreDepartamento <chr>, NombreFamilia <chr>, NombreCategoria <chr>,
## # Estado <chr>, Mts.2 <int>, Tipo.ubicación <chr>, Giro <chr>,
## # Hora.inicio <chr>, Hora.cierre <chr>, and abbreviated variable names
## # ¹vcClaveTienda, ²DescGiro, ³Fabricante, ⁴Producto, ⁵Ult.Costo, ⁶Unidades
bd7 <- bd6
bd7$Hora <- substr(bd7$Hora, start = 1, stop = 2)
tibble(bd7)
## # A tibble: 200,620 × 20
## vcCla…¹ DescG…² Fecha Hora Marca Fabri…³ Produ…⁴ Precio Ult.C…⁵ Unida…⁶
## <chr> <chr> <date> <chr> <chr> <chr> <chr> <dbl> <dbl> <dbl>
## 1 MX001 Abarro… 2020-06-19 08 NUTR… MEXILAC Nutri … 16 12.3 1
## 2 MX001 Abarro… 2020-06-19 08 DAN … DANONE… DANUP … 14 14 1
## 3 MX001 Abarro… 2020-06-19 08 BIMBO GRUPO … Rebana… 5 5 1
## 4 MX001 Abarro… 2020-06-19 08 PEPSI PEPSI-… Pepsi … 8 8 1
## 5 MX001 Abarro… 2020-06-19 08 BLAN… FABRIC… Deterg… 19.5 15 1
## 6 MX001 Abarro… 2020-06-19 08 FLASH ALEN Flash … 9.5 7.31 1
## 7 MX001 Abarro… 2020-06-19 08 VARI… DANONE… Danone… 11 11 1
## 8 MX001 Abarro… 2020-06-19 08 ZOTE FABRIC… Jabon … 9.5 7.31 1
## 9 MX001 Abarro… 2020-06-19 08 ALWA… PROCTE… T Feme… 23.5 18.1 1
## 10 MX001 Abarro… 2020-06-19 15 JUMEX JUMEX Jugo D… 12 12 1
## # … with 200,610 more rows, 10 more variables: F.Ticket <int>,
## # NombreDepartamento <chr>, NombreFamilia <chr>, NombreCategoria <chr>,
## # Estado <chr>, Mts.2 <int>, Tipo.ubicación <chr>, Giro <chr>,
## # Hora.inicio <chr>, Hora.cierre <chr>, and abbreviated variable names
## # ¹vcClaveTienda, ²DescGiro, ³Fabricante, ⁴Producto, ⁵Ult.Costo, ⁶Unidades
bd7$Hora <- as.integer(bd7$Hora)
tibble(bd7)
## # A tibble: 200,620 × 20
## vcCla…¹ DescG…² Fecha Hora Marca Fabri…³ Produ…⁴ Precio Ult.C…⁵ Unida…⁶
## <chr> <chr> <date> <int> <chr> <chr> <chr> <dbl> <dbl> <dbl>
## 1 MX001 Abarro… 2020-06-19 8 NUTR… MEXILAC Nutri … 16 12.3 1
## 2 MX001 Abarro… 2020-06-19 8 DAN … DANONE… DANUP … 14 14 1
## 3 MX001 Abarro… 2020-06-19 8 BIMBO GRUPO … Rebana… 5 5 1
## 4 MX001 Abarro… 2020-06-19 8 PEPSI PEPSI-… Pepsi … 8 8 1
## 5 MX001 Abarro… 2020-06-19 8 BLAN… FABRIC… Deterg… 19.5 15 1
## 6 MX001 Abarro… 2020-06-19 8 FLASH ALEN Flash … 9.5 7.31 1
## 7 MX001 Abarro… 2020-06-19 8 VARI… DANONE… Danone… 11 11 1
## 8 MX001 Abarro… 2020-06-19 8 ZOTE FABRIC… Jabon … 9.5 7.31 1
## 9 MX001 Abarro… 2020-06-19 8 ALWA… PROCTE… T Feme… 23.5 18.1 1
## 10 MX001 Abarro… 2020-06-19 15 JUMEX JUMEX Jugo D… 12 12 1
## # … with 200,610 more rows, 10 more variables: F.Ticket <int>,
## # NombreDepartamento <chr>, NombreFamilia <chr>, NombreCategoria <chr>,
## # Estado <chr>, Mts.2 <int>, Tipo.ubicación <chr>, Giro <chr>,
## # Hora.inicio <chr>, Hora.cierre <chr>, and abbreviated variable names
## # ¹vcClaveTienda, ²DescGiro, ³Fabricante, ⁴Producto, ⁵Ult.Costo, ⁶Unidades
# Cuántos NA tengo en la bse de datos?
sum(is.na(bd7))
## [1] 0
sum(is.na(bd))
## [1] 199188
# Cuántos NA tengo por variable?
sapply(bd7, function(x) sum(is.na(x)))
## vcClaveTienda DescGiro Fecha Hora
## 0 0 0 0
## Marca Fabricante Producto Precio
## 0 0 0 0
## Ult.Costo Unidades F.Ticket NombreDepartamento
## 0 0 0 0
## NombreFamilia NombreCategoria Estado Mts.2
## 0 0 0 0
## Tipo.ubicación Giro Hora.inicio Hora.cierre
## 0 0 0 0
sapply(bd, function(x) sum(is.na(x)))
## vcClaveTienda DescGiro Codigo.Barras PLU
## 0 0 0 199188
## Fecha Hora Marca Fabricante
## 0 0 0 0
## Producto Precio Ult.Costo Unidades
## 0 0 0 0
## F.Ticket NombreDepartamento NombreFamilia NombreCategoria
## 0 0 0 0
## Estado Mts.2 Tipo.ubicación Giro
## 0 0 0 0
## Hora.inicio Hora.cierre
## 0 0
# Borrar todos los registros NA de una tabla
bd8 <- bd
bd8 <- na.omit(bd8)
summary(bd8)
## vcClaveTienda DescGiro Codigo.Barras PLU
## Length:1437 Length:1437 Min. :6.750e+08 Min. : 1.000
## Class :character Class :character 1st Qu.:6.750e+08 1st Qu.: 1.000
## Mode :character Mode :character Median :6.750e+08 Median : 1.000
## Mean :2.616e+11 Mean : 2.112
## 3rd Qu.:6.750e+08 3rd Qu.: 1.000
## Max. :7.501e+12 Max. :30.000
## Fecha Hora Marca Fabricante
## Length:1437 Length:1437 Length:1437 Length:1437
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
## Producto Precio Ult.Costo Unidades
## Length:1437 Min. :30.00 Min. : 1.00 Min. :1.000
## Class :character 1st Qu.:90.00 1st Qu.:64.62 1st Qu.:1.000
## Mode :character Median :90.00 Median :64.62 Median :1.000
## Mean :87.94 Mean :56.65 Mean :1.124
## 3rd Qu.:90.00 3rd Qu.:64.62 3rd Qu.:1.000
## Max. :90.00 Max. :64.62 Max. :7.000
## F.Ticket NombreDepartamento NombreFamilia NombreCategoria
## Min. : 772 Length:1437 Length:1437 Length:1437
## 1st Qu.: 99955 Class :character Class :character Class :character
## Median :102493 Mode :character Mode :character Mode :character
## Mean :100595
## 3rd Qu.:106546
## Max. :118356
## Estado Mts.2 Tipo.ubicación Giro
## Length:1437 Min. :58.00 Length:1437 Length:1437
## Class :character 1st Qu.:58.00 Class :character Class :character
## Mode :character Median :58.00 Mode :character Mode :character
## Mean :58.07
## 3rd Qu.:58.00
## Max. :60.00
## Hora.inicio Hora.cierre
## Length:1437 Length:1437
## Class :character Class :character
## Mode :character Mode :character
##
##
##
# Reemplazar NA con ceros
bd9 <- bd
bd9[is.na(bd9)]<-0
summary(bd9)
## vcClaveTienda DescGiro Codigo.Barras PLU
## Length:200625 Length:200625 Min. :8.347e+05 Min. : 0.00000
## Class :character Class :character 1st Qu.:7.501e+12 1st Qu.: 0.00000
## Mode :character Mode :character Median :7.501e+12 Median : 0.00000
## Mean :5.950e+12 Mean : 0.01513
## 3rd Qu.:7.501e+12 3rd Qu.: 0.00000
## Max. :1.750e+13 Max. :30.00000
## Fecha Hora Marca Fabricante
## Length:200625 Length:200625 Length:200625 Length:200625
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
## Producto Precio Ult.Costo Unidades
## Length:200625 Min. :-147.00 Min. : 0.38 Min. : 0.200
## Class :character 1st Qu.: 11.00 1st Qu.: 8.46 1st Qu.: 1.000
## Mode :character Median : 16.00 Median : 12.31 Median : 1.000
## Mean : 19.42 Mean : 15.31 Mean : 1.262
## 3rd Qu.: 25.00 3rd Qu.: 19.23 3rd Qu.: 1.000
## Max. :1000.00 Max. :769.23 Max. :96.000
## F.Ticket NombreDepartamento NombreFamilia NombreCategoria
## Min. : 1 Length:200625 Length:200625 Length:200625
## 1st Qu.: 33964 Class :character Class :character Class :character
## Median :105993 Mode :character Mode :character Mode :character
## Mean :193990
## 3rd Qu.:383005
## Max. :450040
## Estado Mts.2 Tipo.ubicación Giro
## Length:200625 Min. :47.0 Length:200625 Length:200625
## Class :character 1st Qu.:53.0 Class :character Class :character
## Mode :character Median :60.0 Mode :character Mode :character
## Mean :56.6
## 3rd Qu.:60.0
## Max. :62.0
## Hora.inicio Hora.cierre
## Length:200625 Length:200625
## Class :character Class :character
## Mode :character Mode :character
##
##
##
# Reemplazar NA con el Promedio
bd10 <- bd
bd10$PLU[is.na(bd10$PLU)]<-mean(bd10$PLU, na.rm = TRUE)
summary(bd10)
## vcClaveTienda DescGiro Codigo.Barras PLU
## Length:200625 Length:200625 Min. :8.347e+05 Min. : 1.000
## Class :character Class :character 1st Qu.:7.501e+12 1st Qu.: 2.112
## Mode :character Mode :character Median :7.501e+12 Median : 2.112
## Mean :5.950e+12 Mean : 2.112
## 3rd Qu.:7.501e+12 3rd Qu.: 2.112
## Max. :1.750e+13 Max. :30.000
## Fecha Hora Marca Fabricante
## Length:200625 Length:200625 Length:200625 Length:200625
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
## Producto Precio Ult.Costo Unidades
## Length:200625 Min. :-147.00 Min. : 0.38 Min. : 0.200
## Class :character 1st Qu.: 11.00 1st Qu.: 8.46 1st Qu.: 1.000
## Mode :character Median : 16.00 Median : 12.31 Median : 1.000
## Mean : 19.42 Mean : 15.31 Mean : 1.262
## 3rd Qu.: 25.00 3rd Qu.: 19.23 3rd Qu.: 1.000
## Max. :1000.00 Max. :769.23 Max. :96.000
## F.Ticket NombreDepartamento NombreFamilia NombreCategoria
## Min. : 1 Length:200625 Length:200625 Length:200625
## 1st Qu.: 33964 Class :character Class :character Class :character
## Median :105993 Mode :character Mode :character Mode :character
## Mean :193990
## 3rd Qu.:383005
## Max. :450040
## Estado Mts.2 Tipo.ubicación Giro
## Length:200625 Min. :47.0 Length:200625 Length:200625
## Class :character 1st Qu.:53.0 Class :character Class :character
## Mode :character Median :60.0 Mode :character Mode :character
## Mean :56.6
## 3rd Qu.:60.0
## Max. :62.0
## Hora.inicio Hora.cierre
## Length:200625 Length:200625
## Class :character Class :character
## Mode :character Mode :character
##
##
##
# Reemplazar negativos con cero
bd11 <- bd
bd11[bd11 < 0] <- 0
summary(bd11)
## vcClaveTienda DescGiro Codigo.Barras PLU
## Length:200625 Length:200625 Min. :8.347e+05 Min. : 1.00
## Class :character Class :character 1st Qu.:7.501e+12 1st Qu.: 1.00
## Mode :character Mode :character Median :7.501e+12 Median : 1.00
## Mean :5.950e+12 Mean : 2.11
## 3rd Qu.:7.501e+12 3rd Qu.: 1.00
## Max. :1.750e+13 Max. :30.00
## NA's :199188
## Fecha Hora Marca Fabricante
## Length:200625 Length:200625 Length:200625 Length:200625
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
##
## Producto Precio Ult.Costo Unidades
## Length:200625 Min. : 0.00 Min. : 0.38 Min. : 0.200
## Class :character 1st Qu.: 11.00 1st Qu.: 8.46 1st Qu.: 1.000
## Mode :character Median : 16.00 Median : 12.31 Median : 1.000
## Mean : 19.44 Mean : 15.31 Mean : 1.262
## 3rd Qu.: 25.00 3rd Qu.: 19.23 3rd Qu.: 1.000
## Max. :1000.00 Max. :769.23 Max. :96.000
##
## F.Ticket NombreDepartamento NombreFamilia NombreCategoria
## Min. : 1 Length:200625 Length:200625 Length:200625
## 1st Qu.: 33964 Class :character Class :character Class :character
## Median :105993 Mode :character Mode :character Mode :character
## Mean :193990
## 3rd Qu.:383005
## Max. :450040
##
## Estado Mts.2 Tipo.ubicación Giro
## Length:200625 Min. :47.0 Length:200625 Length:200625
## Class :character 1st Qu.:53.0 Class :character Class :character
## Mode :character Median :60.0 Mode :character Mode :character
## Mean :56.6
## 3rd Qu.:60.0
## Max. :62.0
##
## Hora.inicio Hora.cierre
## Length:200625 Length:200625
## Class :character Class :character
## Mode :character Mode :character
##
##
##
##
Técnica 6, Método estadistico
bd12 <- bd7
boxplot(bd12$Precio, horizontal = TRUE)

boxplot(bd12$Unidades, horizontal = TRUE)

Agregar columnas
#install.packages("lubridate")
library(lubridate)
##
## Attaching package: 'lubridate'
## The following objects are masked from 'package:base':
##
## date, intersect, setdiff, union
bd12$Dia_de_la_Semana <- wday(bd12$Fecha)
summary(bd12)
## vcClaveTienda DescGiro Fecha Hora
## Length:200620 Length:200620 Min. :2020-05-01 Min. : 0.00
## Class :character Class :character 1st Qu.:2020-06-06 1st Qu.:13.00
## Mode :character Mode :character Median :2020-07-11 Median :17.00
## Mean :2020-07-18 Mean :16.23
## 3rd Qu.:2020-08-29 3rd Qu.:20.00
## Max. :2020-11-11 Max. :23.00
## Marca Fabricante Producto Precio
## Length:200620 Length:200620 Length:200620 Min. : 0.50
## Class :character Class :character Class :character 1st Qu.: 11.00
## Mode :character Mode :character Mode :character Median : 16.00
## Mean : 19.45
## 3rd Qu.: 25.00
## Max. :1000.00
## Ult.Costo Unidades F.Ticket NombreDepartamento
## Min. : 0.38 Min. : 1.000 Min. : 1 Length:200620
## 1st Qu.: 8.46 1st Qu.: 1.000 1st Qu.: 33967 Class :character
## Median : 12.31 Median : 1.000 Median :105996 Mode :character
## Mean : 15.31 Mean : 1.262 Mean :193994
## 3rd Qu.: 19.23 3rd Qu.: 1.000 3rd Qu.:383008
## Max. :769.23 Max. :96.000 Max. :450040
## NombreFamilia NombreCategoria Estado Mts.2
## Length:200620 Length:200620 Length:200620 Min. :47.0
## Class :character Class :character Class :character 1st Qu.:53.0
## Mode :character Mode :character Mode :character Median :60.0
## Mean :56.6
## 3rd Qu.:60.0
## Max. :62.0
## Tipo.ubicación Giro Hora.inicio Hora.cierre
## Length:200620 Length:200620 Length:200620 Length:200620
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
## Dia_de_la_Semana
## Min. :1.000
## 1st Qu.:2.000
## Median :4.000
## Mean :3.912
## 3rd Qu.:6.000
## Max. :7.000
bd12$subtotal <- bd12$Precio * bd12$Unidades
summary(bd12)
## vcClaveTienda DescGiro Fecha Hora
## Length:200620 Length:200620 Min. :2020-05-01 Min. : 0.00
## Class :character Class :character 1st Qu.:2020-06-06 1st Qu.:13.00
## Mode :character Mode :character Median :2020-07-11 Median :17.00
## Mean :2020-07-18 Mean :16.23
## 3rd Qu.:2020-08-29 3rd Qu.:20.00
## Max. :2020-11-11 Max. :23.00
## Marca Fabricante Producto Precio
## Length:200620 Length:200620 Length:200620 Min. : 0.50
## Class :character Class :character Class :character 1st Qu.: 11.00
## Mode :character Mode :character Mode :character Median : 16.00
## Mean : 19.45
## 3rd Qu.: 25.00
## Max. :1000.00
## Ult.Costo Unidades F.Ticket NombreDepartamento
## Min. : 0.38 Min. : 1.000 Min. : 1 Length:200620
## 1st Qu.: 8.46 1st Qu.: 1.000 1st Qu.: 33967 Class :character
## Median : 12.31 Median : 1.000 Median :105996 Mode :character
## Mean : 15.31 Mean : 1.262 Mean :193994
## 3rd Qu.: 19.23 3rd Qu.: 1.000 3rd Qu.:383008
## Max. :769.23 Max. :96.000 Max. :450040
## NombreFamilia NombreCategoria Estado Mts.2
## Length:200620 Length:200620 Length:200620 Min. :47.0
## Class :character Class :character Class :character 1st Qu.:53.0
## Mode :character Mode :character Mode :character Median :60.0
## Mean :56.6
## 3rd Qu.:60.0
## Max. :62.0
## Tipo.ubicación Giro Hora.inicio Hora.cierre
## Length:200620 Length:200620 Length:200620 Length:200620
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
## Dia_de_la_Semana subtotal
## Min. :1.000 Min. : 1.00
## 1st Qu.:2.000 1st Qu.: 12.00
## Median :4.000 Median : 18.00
## Mean :3.912 Mean : 24.33
## 3rd Qu.:6.000 3rd Qu.: 27.00
## Max. :7.000 Max. :2496.00
bd12utilidad <- bd12$Precio - bd12$Ult.Costo
summary(bd12)
## vcClaveTienda DescGiro Fecha Hora
## Length:200620 Length:200620 Min. :2020-05-01 Min. : 0.00
## Class :character Class :character 1st Qu.:2020-06-06 1st Qu.:13.00
## Mode :character Mode :character Median :2020-07-11 Median :17.00
## Mean :2020-07-18 Mean :16.23
## 3rd Qu.:2020-08-29 3rd Qu.:20.00
## Max. :2020-11-11 Max. :23.00
## Marca Fabricante Producto Precio
## Length:200620 Length:200620 Length:200620 Min. : 0.50
## Class :character Class :character Class :character 1st Qu.: 11.00
## Mode :character Mode :character Mode :character Median : 16.00
## Mean : 19.45
## 3rd Qu.: 25.00
## Max. :1000.00
## Ult.Costo Unidades F.Ticket NombreDepartamento
## Min. : 0.38 Min. : 1.000 Min. : 1 Length:200620
## 1st Qu.: 8.46 1st Qu.: 1.000 1st Qu.: 33967 Class :character
## Median : 12.31 Median : 1.000 Median :105996 Mode :character
## Mean : 15.31 Mean : 1.262 Mean :193994
## 3rd Qu.: 19.23 3rd Qu.: 1.000 3rd Qu.:383008
## Max. :769.23 Max. :96.000 Max. :450040
## NombreFamilia NombreCategoria Estado Mts.2
## Length:200620 Length:200620 Length:200620 Min. :47.0
## Class :character Class :character Class :character 1st Qu.:53.0
## Mode :character Mode :character Mode :character Median :60.0
## Mean :56.6
## 3rd Qu.:60.0
## Max. :62.0
## Tipo.ubicación Giro Hora.inicio Hora.cierre
## Length:200620 Length:200620 Length:200620 Length:200620
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
## Dia_de_la_Semana subtotal
## Min. :1.000 Min. : 1.00
## 1st Qu.:2.000 1st Qu.: 12.00
## Median :4.000 Median : 18.00
## Mean :3.912 Mean : 24.33
## 3rd Qu.:6.000 3rd Qu.: 27.00
## Max. :7.000 Max. :2496.00
Exportar base de datos limpia
bd_limpia <- bd12
write.csv(bd_limpia, file="abarrotes_bd_limpia.csv", row.names = FALSE)