Vista de los datos y carga

V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 V11 V12 V13 V14 V15 V16 V17 V18
219 HOGAR 306 Bano 467 MULTIMARCA BV3 Toalla NR4 Manos TOALLA 40 X 70 BLANCO 001 2022 10 10/18/2022 1010800 170754 4 6630.252
219 HOGAR 306 Bano 467 MULTIMARCA BV3 Toalla NR4 Manos TOALLA 40 X 70 BLANCO 001 2022 6 06/03/2022 1010400 170754 1 6630.252
219 HOGAR 306 Bano 467 MULTIMARCA BV3 Toalla NR4 Manos TOALLA 40 X 70 BLANCO 001 2022 6 06/03/2022 1010400 170754 1 6630.252
219 HOGAR 306 Bano 467 MULTIMARCA BV3 Toalla NR4 Manos TOALLA 40 X 70 BLANCO 001 2022 6 06/03/2022 1010400 170754 1 6630.252
219 HOGAR 306 Bano 467 MULTIMARCA BV3 Toalla NR4 Manos TOALLA 40 X 70 BLANCO 001 2022 6 06/03/2022 1010400 170754 1 6630.252
219 HOGAR 306 Bano 467 MULTIMARCA BV3 Toalla NR4 Manos TOALLA 40 X 70 BLANCO 001 2022 6 06/03/2022 1010400 170754 1 6630.252

Filtrado de datos

Se calcula la dimención de los datos y se filtran para las ventas de 2023 con un total de 29.517

## [1] 90450    18
## [1] 29517    18

Prepración de los datos

Se renombran las variables y se applica tranformación a las fechas y se crea la variable total_venta, de igual forma se convierten a factor las variables cualitativas

descripcion_familia descripcion_tipo descripcion_grupo descripcion_subgrupo producto descripcion_detalle_subgrupo producto.1 Almacen dia mes cantidad_venta precio_venta total_venta
HOGAR Bano MULTIMARCA Toalla TOALLA 40 X 70 BLANCO 001 Manos TOALLA 40 X 70 BLANCO 001 1010800 29 1 6 6714.286 40285.714
HOGAR Bano MULTIMARCA Toalla TOALLA 40 X 70 BLANCO 001 Manos TOALLA 40 X 70 BLANCO 001 1010200 29 1 1 6714.286 6714.286
HOGAR Bano MULTIMARCA Toalla TOALLA 40 X 70 BLANCO 001 Manos TOALLA 40 X 70 BLANCO 001 1010300 29 1 8 6714.286 53714.286
HOGAR Bano MULTIMARCA Toalla TOALLA 40 X 70 BLANCO 001 Manos TOALLA 40 X 70 BLANCO 001 1010800 30 1 1 6714.286 6714.286
HOGAR Bano MULTIMARCA Toalla TOALLA 40 X 70 BLANCO 001 Manos TOALLA 40 X 70 BLANCO 001 1010800 30 1 1 6714.286 6714.286
HOGAR Bano MULTIMARCA Toalla TOALLA 40 X 70 BLANCO 001 Manos TOALLA 40 X 70 BLANCO 001 1014200 30 1 1 6714.286 6714.286

Análisis univariado y bivariado

Se obervan las categorias con más datos, y la distribución de la cantidad vendida y precio de venta

##                     descripcion_familia   descripcion_tipo
##  HOGAR                        :11607    Alcoba    :8703   
##  NAVIDAD                      :    7    Otros usos:5419   
##  SI HOTELS EXPRESS            : 2422    Cortineria:5005   
##  TELAS AGENCIA                :  777    Bano      :4364   
##  TELAS ALMACEN SI             : 9447    Top       :3860   
##  TELAS DECORACION ALMACENES SI: 5005    Bottom    :1197   
##  VESTUARIO EXTERIOR           :  252    (Other)   : 969   
##         descripcion_grupo   descripcion_subgrupo                   producto    
##  BASICO          :9127    Almohadas   :6005      TOALLA EDEN           : 2637  
##  MARCAS PROPIAS  :6219    Toalla      :5723      VELO SUIZO PLAIN VOILE: 2296  
##  MARCAS INVITADAS:4845    Dacrones    :4063      TARTAM                : 2117  
##  PESADAS         :2709    Chintz      :2429      DACRON WENDY          : 1559  
##  MULTIMARCA      :2485    Suizo       :2296      DACRON PC             : 1407  
##  VELOS           :2296    Dulceabrigos:2117      ALMOHADA UNICOLOR     : 1160  
##  (Other)         :1836    (Other)     :6884      (Other)               :18341  
##     descripcion_detalle_subgrupo  producto.1           Almacen    
##  Uso alcoba       :7177          Length:29517       1010100:9121  
##  Lisos            :4725          Class :character   1011000:3340  
##  Manos            :2797          Mode  :character   1014200:2910  
##  Tartan super     :2117                             1010300:2524  
##  Dacron wendy fino:1559                             1010200:2242  
##  Dacron medio bco :1407                             1011400:2238  
##  (Other)          :9735                             (Other):7142  
##       dia        mes      cantidad_venta     precio_venta     total_venta      
##  Min.   : 1.00   1:8118   Min.   :-200.00   Min.   :  1233   Min.   :-1443697  
##  1st Qu.: 7.00   2:8820   1st Qu.:   1.00   1st Qu.:  6882   1st Qu.:   11271  
##  Median :15.00   3:7687   Median :   1.50   Median : 10916   Median :   22664  
##  Mean   :15.01   4:4892   Mean   :   4.16   Mean   : 19506   Mean   :   50147  
##  3rd Qu.:22.00            3rd Qu.:   2.50   3rd Qu.: 21765   3rd Qu.:   44454  
##  Max.   :31.00            Max.   :1800.00   Max.   :268824   Max.   : 8304300  
## 

Modelo de regresión para verficar los supuesto del modelo

Validación de supuestos del modelo por medio de graficos

Media cero: Se cumple por defecto.

Varianza Constante: Se observa en la grafica 1 de residuales vs ajustados que el comportamiento no es aleatorio mostrando una leve curva hacia abajo, lo que indica que no existe varianza constante y no se cumple este supuesto, se debe relaizar tranformaciones al modelo.

Normalidad: Se observa en la grafica 2 que los datos se ajustan bien a la linea de normalidad en el qqplot

Independencia: Dado que estos registros no corresponden a datos en el tiempo no se tiene un orden temporal para realizar la validación de este supuesto.

Finalmente se seleccionan los mejores predictores para explicar el total de las ventas: formula = total_venta ~ descripcion_detalle_subgrupo + Almacen+dia+ cantidad_venta + precio_venta

## Start:  AIC=660133.1
## total_venta ~ descripcion_familia + descripcion_tipo + descripcion_grupo + 
##     descripcion_subgrupo + producto + descripcion_detalle_subgrupo + 
##     producto.1 + Almacen + dia + mes + cantidad_venta + precio_venta
## 
## 
## Step:  AIC=660133.1
## total_venta ~ descripcion_familia + descripcion_tipo + descripcion_grupo + 
##     descripcion_subgrupo + producto + descripcion_detalle_subgrupo + 
##     Almacen + dia + mes + cantidad_venta + precio_venta
## 
## 
## Step:  AIC=660133.1
## total_venta ~ descripcion_familia + descripcion_tipo + descripcion_grupo + 
##     producto + descripcion_detalle_subgrupo + Almacen + dia + 
##     mes + cantidad_venta + precio_venta
## 
## 
## Step:  AIC=660133.1
## total_venta ~ descripcion_familia + descripcion_tipo + producto + 
##     descripcion_detalle_subgrupo + Almacen + dia + mes + cantidad_venta + 
##     precio_venta
## 
## 
## Step:  AIC=660133.1
## total_venta ~ descripcion_familia + producto + descripcion_detalle_subgrupo + 
##     Almacen + dia + mes + cantidad_venta + precio_venta
## 
## 
## Step:  AIC=660133.1
## total_venta ~ producto + descripcion_detalle_subgrupo + Almacen + 
##     dia + mes + cantidad_venta + precio_venta
## 
##                                Df  Sum of Sq        RSS    AIC
## - dia                           1 4.0297e+09 1.5099e+14 660132
## - mes                           3 2.5954e+10 1.5101e+14 660132
## <none>                                       1.5099e+14 660133
## - descripcion_detalle_subgrupo  7 1.2254e+11 1.5111e+14 660143
## - producto                     79 9.6379e+11 1.5195e+14 660163
## - precio_venta                  1 2.8326e+11 1.5127e+14 660186
## - Almacen                      15 1.6676e+13 1.6766e+14 663195
## - cantidad_venta                1 5.2631e+14 6.7729e+14 704433
## 
## Step:  AIC=660131.9
## total_venta ~ producto + descripcion_detalle_subgrupo + Almacen + 
##     mes + cantidad_venta + precio_venta
## 
##                                Df  Sum of Sq        RSS    AIC
## - mes                           3 2.5578e+10 1.5102e+14 660131
## <none>                                       1.5099e+14 660132
## + dia                           1 4.0297e+09 1.5099e+14 660133
## - descripcion_detalle_subgrupo  7 1.2250e+11 1.5111e+14 660142
## - producto                     79 9.6160e+11 1.5195e+14 660161
## - precio_venta                  1 2.8405e+11 1.5128e+14 660185
## - Almacen                      15 1.6674e+13 1.6767e+14 663194
## - cantidad_venta                1 5.2651e+14 6.7750e+14 704441
## 
## Step:  AIC=660130.9
## total_venta ~ producto + descripcion_detalle_subgrupo + Almacen + 
##     cantidad_venta + precio_venta
## 
##                                Df  Sum of Sq        RSS    AIC
## <none>                                       1.5102e+14 660131
## + mes                           3 2.5578e+10 1.5099e+14 660132
## + dia                           1 3.6541e+09 1.5101e+14 660132
## - descripcion_detalle_subgrupo  7 1.1477e+11 1.5113e+14 660139
## - producto                     79 9.5067e+11 1.5197e+14 660158
## - precio_venta                  1 3.0639e+11 1.5132e+14 660189
## - Almacen                      15 1.6703e+13 1.6772e+14 663197
## - cantidad_venta                1 5.2670e+14 6.7771e+14 704444
## 
## Call:
## lm(formula = total_venta ~ producto + descripcion_detalle_subgrupo + 
##     Almacen + cantidad_venta + precio_venta, data = datosFinal)
## 
## Coefficients:
##                                                (Intercept)  
##                                                 -1.013e+04  
##                      productoALMOHADA BLANDA ELEGANCE AZUL  
##                                                  2.728e+04  
##                           productoALMOHADA CLASICA 60 X 40  
##                                                  5.288e+04  
##                           productoALMOHADA CONFORT 60 X 40  
##                                                  2.961e+04  
##                            productoALMOHADA ELEGANCE NEGRA  
##                                                  3.188e+04  
##                      productoALMOHADA FIRME ELEGANCE VERDE  
##                                                  3.029e+04  
##                              productoALMOHADA IN ROOMS ECO  
##                                                  1.962e+04  
##                       productoALMOHADA LENCERY BLANDA ROJA  
##                                                  1.245e+04  
##                     productoALMOHADA LENCY AZUL SILICONADA  
##                                                  1.708e+04  
##                     productoALMOHADA PROMOCION X 1 50 X 70  
##                                                  1.807e+04  
##                                  productoALMOHADA UNICOLOR  
##                                                  1.037e+04  
##                           productoBANDEJA DECOR 442-640132  
##                                                  8.127e+03  
##                              productoBATA DE BANO FEMENINA  
##                                                  6.662e+03  
##                       productoBLUSA MANGA CORTA ES3971 SPL  
##                                                  7.677e+03  
##                                          productoCLON MTZA  
##                                                  1.572e+04  
##                                              productoCLONE  
##                                                  1.974e+04  
##                                   productoCLONE AZ CELESTE  
##                                                  1.390e+04  
##                                       productoCLONE AZ REY  
##                                                  1.554e+04  
##                                      productoCLONE AZUL RQ  
##                                                  1.602e+04  
##                                         productoCLONE CAFE  
##                                                  8.425e+03  
##                                      productoCLONE CAFE CL  
##                                                  1.777e+04  
##                                       productoCLONE CAFE M  
##                                                  1.217e+04  
##                                        productoCLONE CORAL  
##                                                  1.154e+04  
##                                       productoCLONE FUCSIA  
##                                                  1.827e+04  
##                                         productoCLONE HBNO  
##                                                  1.697e+04  
##                                      productoCLONE HBNO CL  
##                                                  1.351e+04  
##                                         productoCLONE MTZA  
##                                                  2.024e+04  
##                                        productoCLONE NEGRO  
##                                                  2.139e+04  
##                                        productoCLONE NRNJA  
##                                                  1.049e+04  
##                                         productoCLONE ROJO  
##                                                  1.529e+04  
##                                         productoCLONE RSDO  
##                                                  1.230e+04  
##                                        productoCLONE TCOTA  
##                                                  1.530e+04  
##                                      productoCLONE V TINTO  
##                                                  1.566e+04  
##                                      productoCLONE VD CALI  
##                                                  2.005e+04  
##                                        productoCLONE VERDE  
##                                                  1.276e+04  
##                              productoCOBIJA FLANER NAVIDAD  
##                                                  5.084e+03  
##                                       productoCOBIJA SOFIA  
##                                                  1.522e+04  
##                                      productoCOJIN 45 X 45  
##                                                  1.959e+03  
##                                        productoCOJIN 45X45  
##                                                  1.299e+04  
##                                  productoCOJIN BRAZOS CUBA  
##                                                  6.167e+03  
##                              productoCOJIN IN ROOM APRODIS  
##                                                  1.699e+04  
##                              productoCOJIN RELLENO 50 X 50  
##                                                  1.718e+04  
##                                productoCOJIN RELLENO 70X70  
##                                                  1.952e+04  
##                                    productoCREPE GUCCI 205  
##                                                  7.204e+03  
##                                productoCUBRELECHO IN ROOMS  
##                                                 -1.790e+02  
##                                          productoDACRON PC  
##                                                  7.763e+03  
##                                       productoDACRON SUPER  
##                                                 -4.923e+03  
##                                       productoDACRON WENDY  
##                                                  1.989e+04  
##                                   productoDELANTAL KITCHEN  
##                                                  8.124e+03  
##                                          productoDRIL WORK  
##                                                  6.331e+04  
##                                   productoEDREDON JACQUARD  
##                                                 -1.180e+04  
##                                        productoFORRO COJIN  
##                                                  7.337e+03  
##                                productoFORRO COJIN SEATTLE  
##                                                  6.364e+03  
##                         productoFUNDA DOBLADILLO SEN OULET  
##                                                  4.965e+03  
##                              productoGUIPIURE FRANCES(GPR)  
##                                                  3.195e+04  
##                                productoINDIVIDUAL CASTILLA  
##                                                  1.165e+04  
##                               productoJACQUARD FABRIC ALBA  
##                                                  5.152e+04  
##                        productoJEAN BOTA AJUSTADA 102  OAZ  
##                                                  7.156e+03  
##                           productoJG CUBRELECHO MICROFIBRA  
##                                                  1.903e+04  
##                           productoJG POTES 2PZ 448-8210266  
##                                                  4.308e+03  
##                         productoJG SABANA ALGODON UNICOLOR  
##                                                  3.899e+04  
##                                 productoJG SABANA IN ROOMS  
##                                                  2.369e+04  
##                               productoJG SABANA MICROFIBRA  
##                                                  2.834e+03  
##                                productoJG SABANAS ELEGANCE  
##                                                  2.794e+04  
##                          productoJUEGO CUBRELECHO IN ROOMS  
##                                                 -2.920e+04  
##                             productoJUEGO DE FUNDAS PALOMA  
##                                                  1.360e+04  
##                            productoJUEGO SABANA LENCY AZUL  
##                                                  2.635e+04  
##                                 productoLEGGINS 290427 CFT  
##                                                  3.996e+03  
##                     productoORQUIDEA ARTIFICIAL  456-55193  
##                                                  9.341e+03  
##                                productoPEBETERO 462-091367  
##                                                  8.465e+03  
##                                  productoPLANTA 439-356856  
##                                                  8.060e+03  
##                         productoPLANTA CON POTE 592-380111  
##                                                  8.198e+03  
##                       productoPLANTA DECORATIVA 411-335322  
##                                                  6.487e+03  
##                       productoPOLO 0003 LHA 333- 823 MC TC  
##                                                  4.517e+03  
##                         productoPOLO MANGA CORTA BHA509 TC  
##                                                  6.852e+03  
##                       productoPORTARETRATO 8X10 420-563329  
##                                                  6.810e+03  
##                                productoPORTAVELA 567-56069  
##                                                  7.592e+03  
##                     productoPROTECTOR ALMOHADA TERMOSELLAD  
##                                                  2.175e+04  
##                     productoPROTECTOR COLCHON TERMOSELLADO  
##                                                 -4.320e+02  
##                          productoRELLENO PLUMON MICROFIBRA  
##                                                  2.127e+04  
##                                productoSABANA PLANA PALOMA  
##                                                  1.238e+05  
##                                    productoSAMANTA 60(RYN)  
##                                                  1.742e+04  
##                                productoSEMI JUEGO IN ROOMS  
##                                                  5.865e+03  
##                          productoSEMI JUEGO IN ROOMS COLOR  
##                                                 -4.074e+03  
##                       productoSEMI JUEGO SABANA LENCY AZUL  
##                                                  6.895e+03  
##                       productoSOBRECAMA VERSALLES IN ROOMS  
##                                                 -7.852e+04  
##                                             productoTARTAM  
##                                                  1.139e+03  
##                                         productoTELA PANAL  
##                                                  2.562e+03  
##                            productoTELA TOALLA BLANCO 0001  
##                                                  1.012e+04  
##                           productoTELA TOALLA HABANO 92005  
##                                                  9.457e+03  
##                             productoTELA TOALLA MICROFIBRA  
##                                                  2.676e+04  
##                          productoTOALLA 40 X 70 BLANCO 001  
##                                                  6.167e+03  
##                         productoTOALLA 50 X 100 BLANCO 001  
##                                                  1.705e+04  
##                                      productoTOALLA 500 GR  
##                                                  2.109e+04  
##                          productoTOALLA 500 GR TOR 50003 U  
##                                                  1.670e+04  
##                         productoTOALLA 60 X 120 BLANCO 001  
##                                                  5.294e+03  
##                         productoTOALLA 75 X 150 BLANCO 001  
##                                                  8.873e+02  
##                            productoTOALLA DIAMOND LOZENGES  
##                                                 -2.110e+03  
##                                        productoTOALLA EDEN  
##                                                  4.585e+03  
##                                  productoTOALLA FREE BIRDS  
##                                                  9.030e+03  
##                                         productoTOALLA LIA  
##                                                  4.952e+03  
##                                       productoTOALLA MALMO  
##                                                 -6.378e+03  
##                                      productoTOALLA PANAMA  
##                                                  9.605e+03  
##                             productoVELO SUIZO PLAIN VOILE  
##                                                  5.437e+03  
##                              productoWESTING CHAMBRAY(CHM)  
##                                                  1.730e+04  
##                  descripcion_detalle_subgrupoBota ajustada  
##                                                         NA  
##             descripcion_detalle_subgrupoChambrays unicolor  
##                                                         NA  
##                    descripcion_detalle_subgrupoCrepe gucci  
##                                                         NA  
##                         descripcion_detalle_subgrupoCuerpo  
##                                                  1.677e+04  
## descripcion_detalle_subgrupoDacron economico bco 168 hilos  
##                                                 -3.173e+03  
## descripcion_detalle_subgrupoDacron economico bco 186 hilos  
##                                                         NA  
##               descripcion_detalle_subgrupoDacron medio bco  
##                                                         NA  
##              descripcion_detalle_subgrupoDacron wendy fino  
##                                                         NA  
##                 descripcion_detalle_subgrupoDise?os varios  
##                                                         NA  
##                          descripcion_detalle_subgrupoDoble  
##                                                  1.681e+04  
##        descripcion_detalle_subgrupoDriles work polyalgodon  
##                                                         NA  
##                     descripcion_detalle_subgrupoEconomicos  
##                                                         NA  
##                    descripcion_detalle_subgrupoExtra doble  
##                                                  2.902e+03  
##                         descripcion_detalle_subgrupoFacial  
##                                                 -2.705e+03  
##                       descripcion_detalle_subgrupoJacquard  
##                                                         NA  
##                           descripcion_detalle_subgrupoKing  
##                                                 -1.954e+04  
##                          descripcion_detalle_subgrupoLisos  
##                                                         NA  
##                  descripcion_detalle_subgrupoLycra samanta  
##                                                         NA  
##                    descripcion_detalle_subgrupoManga corta  
##                                                         NA  
##                          descripcion_detalle_subgrupoManos  
##                                                         NA  
##                         descripcion_detalle_subgrupoNormal  
##                                                         NA  
##                    descripcion_detalle_subgrupoRectangular  
##                                                         NA  
##                      descripcion_detalle_subgrupoSemidoble  
##                                                  7.145e+02  
##                       descripcion_detalle_subgrupoSencillo  
##                                                         NA  
##                   descripcion_detalle_subgrupoTartan super  
##                                                         NA  
##                     descripcion_detalle_subgrupoTela panal  
##                                                         NA  
##           descripcion_detalle_subgrupoTela toalla 90 ancho  
##                                                         NA  
##         descripcion_detalle_subgrupoTela toalla microfibra  
##                                                         NA  
##                     descripcion_detalle_subgrupoUso alcoba  
##                                                         NA  
##                       descripcion_detalle_subgrupoUso bano  
##                                                         NA  
##                     descripcion_detalle_subgrupoUso cocina  
##                                                         NA  
##                       descripcion_detalle_subgrupoUso sala  
##                                                         NA  
##                                             Almacen1010200  
##                                                  2.311e+03  
##                                             Almacen1010300  
##                                                 -6.472e+02  
##                                             Almacen1010400  
##                                                 -3.173e+03  
##                                             Almacen1010500  
##                                                 -2.930e+03  
##                                             Almacen1010800  
##                                                 -2.460e+03  
##                                             Almacen1010900  
##                                                  6.294e+02  
##                                             Almacen1011000  
##                                                 -4.737e+03  
##                                             Almacen1011200  
##                                                  3.352e+05  
##                                             Almacen1011300  
##                                                  2.970e+04  
##                                             Almacen1011400  
##                                                  1.864e+02  
##                                             Almacen1012300  
##                                                 -1.287e+03  
##                                             Almacen1012400  
##                                                 -5.475e+04  
##                                             Almacen1012700  
##                                                  3.602e+05  
##                                             Almacen1013700  
##                                                 -3.742e+03  
##                                             Almacen1014200  
##                                                 -2.477e+03  
##                                             cantidad_venta  
##                                                  6.136e+03  
##                                               precio_venta  
##                                                  9.779e-01

Definición del set de entrenamiento y de pruebas

Los set de datos se definenen con una proporción de p=0,75

Tratamiendo de datos para el modelo

Variables con varianza próxima a cero

Entre los predictores incluidos en el modelo, no se detecta ninguno con varianza cero o próxima a cero

datosFinal %>% select(descripcion_detalle_subgrupo, Almacen, dia, cantidad_venta, precio_venta) %>%
          nearZeroVar(saveMetrics = TRUE)
freqRatio percentUnique zeroVar nzv
descripcion_detalle_subgrupo 1.518942 0.1118000 FALSE FALSE
Almacen 2.730838 0.0542061 FALSE FALSE
dia 1.126750 0.1050242 FALSE FALSE
cantidad_venta 1.810008 2.5442965 FALSE FALSE
precio_venta 1.454172 1.8836603 FALSE FALSE
objeto_recipe = objeto_recipe %>% step_nzv(all_predictors())

Estandarización y escalado

Binarización de variables cualitativas

Este proceso es fundamental para que los modelos sean más precisos y que todos los datos tengan la misma escala mejora las métricas para modelos sensibles como SVM y NNET

## Rows: 22,138
## Columns: 51
## $ dia                                                         <dbl> 1.607889, …
## $ cantidad_venta                                              <dbl> 0.06750114…
## $ precio_venta                                                <dbl> -0.542658,…
## $ total_venta                                                 <dbl> -0.0584877…
## $ descripcion_detalle_subgrupo_Bota.ajustada                  <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Chambrays.unicolor             <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Crepe.gucci                    <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Cuerpo                         <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Dacron.economico.bco.168.hilos <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Dacron.economico.bco.186.hilos <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Dacron.medio.bco               <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Dacron.wendy.fino              <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Dise.os.varios                 <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Doble                          <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Driles.work.polyalgodon        <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Economicos                     <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Extra.doble                    <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Facial                         <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Jacquard                       <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_King                           <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Lisos                          <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Lycra.samanta                  <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Manga.corta                    <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Manos                          <dbl> 1, 1, 1, 1…
## $ descripcion_detalle_subgrupo_Normal                         <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Rectangular                    <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Semidoble                      <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Sencillo                       <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Tartan.super                   <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Tela.panal                     <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Tela.toalla.90.ancho           <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Tela.toalla.microfibra         <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Uso.alcoba                     <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Uso.bano                       <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Uso.cocina                     <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Uso.sala                       <dbl> 0, 0, 0, 0…
## $ Almacen_X1010200                                            <dbl> 0, 1, 0, 0…
## $ Almacen_X1010300                                            <dbl> 0, 0, 0, 0…
## $ Almacen_X1010400                                            <dbl> 0, 0, 0, 0…
## $ Almacen_X1010500                                            <dbl> 0, 0, 0, 0…
## $ Almacen_X1010800                                            <dbl> 1, 0, 1, 0…
## $ Almacen_X1010900                                            <dbl> 0, 0, 0, 0…
## $ Almacen_X1011000                                            <dbl> 0, 0, 0, 0…
## $ Almacen_X1011200                                            <dbl> 0, 0, 0, 0…
## $ Almacen_X1011300                                            <dbl> 0, 0, 0, 0…
## $ Almacen_X1011400                                            <dbl> 0, 0, 0, 0…
## $ Almacen_X1012300                                            <dbl> 0, 0, 0, 0…
## $ Almacen_X1012400                                            <dbl> 0, 0, 0, 0…
## $ Almacen_X1012700                                            <dbl> 0, 0, 0, 0…
## $ Almacen_X1013700                                            <dbl> 0, 0, 0, 0…
## $ Almacen_X1014200                                            <dbl> 0, 0, 0, 1…

Entrenamiento del modelo

Regresión Lineal

## Linear Regression 
## 
## 22138 samples
##    50 predictor
## 
## No pre-processing
## Resampling: Bootstrapped (25 reps) 
## Summary of sample sizes: 22138, 22138, 22138, 22138, 22138, 22138, ... 
## Resampling results:
## 
##   RMSE       Rsquared   MAE      
##   0.4943807  0.8038637  0.1016595
## 
## Tuning parameter 'intercept' was held constant at a value of TRUE
Calculo del error
## RMSE: 0.226888
## MAE: -436.7635
## R^2: 0.8570761

svm lineal

Evaluación del modelo mediante resampling

## Support Vector Machines with Linear Kernel 
## 
## 22138 samples
##    50 predictor
## 
## No pre-processing
## Resampling: Cross-Validated (10 fold, repeated 5 times) 
## Summary of sample sizes: 19923, 19926, 19923, 19925, 19924, 19925, ... 
## Resampling results:
## 
##   RMSE       Rsquared   MAE      
##   0.4262451  0.8509922  0.1066923
## 
## Tuning parameter 'C' was held constant at a value of 1
## RMSE: 0.2206499
## MAE: -471.5812
## R^2: 0.8645805

Hiperparametros

Gradient Boosting

## Stochastic Gradient Boosting 
## 
## 22138 samples
##    50 predictor
## 
## No pre-processing
## Resampling: Cross-Validated (10 fold, repeated 5 times) 
## Summary of sample sizes: 19923, 19926, 19923, 19925, 19924, 19925, ... 
## Resampling results across tuning parameters:
## 
##   shrinkage  n.minobsinnode  n.trees  RMSE       Rsquared   MAE       
##   0.01       2               100      0.5928182  0.7737628  0.20336769
##   0.01       2               120      0.5541870  0.7844275  0.19504624
##   0.01       5               100      0.5962707  0.7742658  0.20354219
##   0.01       5               120      0.5585658  0.7832422  0.19523873
##   0.10       2               100      0.2767570  0.9297815  0.06123756
##   0.10       2               120      0.2662719  0.9355500  0.05526927
##   0.10       5               100      0.2787549  0.9259707  0.06050504
##   0.10       5               120      0.2708505  0.9303527  0.05551859
## 
## Tuning parameter 'interaction.depth' was held constant at a value of 2
## RMSE was used to select the optimal model using the smallest value.
## The final values used for the model were n.trees = 120, interaction.depth =
##  2, shrinkage = 0.1 and n.minobsinnode = 2.
## RMSE: 0.155049
## MAE: -259.457
## R^2: 0.9404131

Evalación de modelos

Root Mean Squared Error (RMSE), se oberva que los tres modelos no presentan una variación alta lo que significa que no existe un nivel alto de errores significativamente altos, de igual forma se presentan una variación de la magnitud de los errores, pero es poco probable la existencia de errores grandes.

El modelo que mejor ajuste tiene es boosting, seguido de la maquina de vector de soporte.

A nivel de R^2 Ajustado el mejor modelo es el bossting con 94%, seguido de 86% del SVM y finalmente la regresión lineal con 86%, esto significa que los modelos pueden explicar cerca de un 90% los datos.