| V1 | V2 | V3 | V4 | V5 | V6 | V7 | V8 | V9 | V10 | V11 | V12 | V13 | V14 | V15 | V16 | V17 | V18 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 219 | HOGAR | 306 | Bano | 467 | MULTIMARCA | BV3 | Toalla | NR4 | Manos | TOALLA 40 X 70 BLANCO 001 | 2022 | 10 | 10/18/2022 | 1010800 | 170754 | 4 | 6630.252 |
| 219 | HOGAR | 306 | Bano | 467 | MULTIMARCA | BV3 | Toalla | NR4 | Manos | TOALLA 40 X 70 BLANCO 001 | 2022 | 6 | 06/03/2022 | 1010400 | 170754 | 1 | 6630.252 |
| 219 | HOGAR | 306 | Bano | 467 | MULTIMARCA | BV3 | Toalla | NR4 | Manos | TOALLA 40 X 70 BLANCO 001 | 2022 | 6 | 06/03/2022 | 1010400 | 170754 | 1 | 6630.252 |
| 219 | HOGAR | 306 | Bano | 467 | MULTIMARCA | BV3 | Toalla | NR4 | Manos | TOALLA 40 X 70 BLANCO 001 | 2022 | 6 | 06/03/2022 | 1010400 | 170754 | 1 | 6630.252 |
| 219 | HOGAR | 306 | Bano | 467 | MULTIMARCA | BV3 | Toalla | NR4 | Manos | TOALLA 40 X 70 BLANCO 001 | 2022 | 6 | 06/03/2022 | 1010400 | 170754 | 1 | 6630.252 |
| 219 | HOGAR | 306 | Bano | 467 | MULTIMARCA | BV3 | Toalla | NR4 | Manos | TOALLA 40 X 70 BLANCO 001 | 2022 | 6 | 06/03/2022 | 1010400 | 170754 | 1 | 6630.252 |
Se calcula la dimención de los datos y se filtran para las ventas de 2023 con un total de 29.517
## [1] 90450 18
## [1] 29517 18
Se renombran las variables y se applica tranformación a las fechas y se crea la variable total_venta, de igual forma se convierten a factor las variables cualitativas
| descripcion_familia | descripcion_tipo | descripcion_grupo | descripcion_subgrupo | producto | descripcion_detalle_subgrupo | producto.1 | Almacen | dia | mes | cantidad_venta | precio_venta | total_venta |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| HOGAR | Bano | MULTIMARCA | Toalla | TOALLA 40 X 70 BLANCO 001 | Manos | TOALLA 40 X 70 BLANCO 001 | 1010800 | 29 | 1 | 6 | 6714.286 | 40285.714 |
| HOGAR | Bano | MULTIMARCA | Toalla | TOALLA 40 X 70 BLANCO 001 | Manos | TOALLA 40 X 70 BLANCO 001 | 1010200 | 29 | 1 | 1 | 6714.286 | 6714.286 |
| HOGAR | Bano | MULTIMARCA | Toalla | TOALLA 40 X 70 BLANCO 001 | Manos | TOALLA 40 X 70 BLANCO 001 | 1010300 | 29 | 1 | 8 | 6714.286 | 53714.286 |
| HOGAR | Bano | MULTIMARCA | Toalla | TOALLA 40 X 70 BLANCO 001 | Manos | TOALLA 40 X 70 BLANCO 001 | 1010800 | 30 | 1 | 1 | 6714.286 | 6714.286 |
| HOGAR | Bano | MULTIMARCA | Toalla | TOALLA 40 X 70 BLANCO 001 | Manos | TOALLA 40 X 70 BLANCO 001 | 1010800 | 30 | 1 | 1 | 6714.286 | 6714.286 |
| HOGAR | Bano | MULTIMARCA | Toalla | TOALLA 40 X 70 BLANCO 001 | Manos | TOALLA 40 X 70 BLANCO 001 | 1014200 | 30 | 1 | 1 | 6714.286 | 6714.286 |
Se obervan las categorias con más datos, y la distribución de la cantidad vendida y precio de venta
## descripcion_familia descripcion_tipo
## HOGAR :11607 Alcoba :8703
## NAVIDAD : 7 Otros usos:5419
## SI HOTELS EXPRESS : 2422 Cortineria:5005
## TELAS AGENCIA : 777 Bano :4364
## TELAS ALMACEN SI : 9447 Top :3860
## TELAS DECORACION ALMACENES SI: 5005 Bottom :1197
## VESTUARIO EXTERIOR : 252 (Other) : 969
## descripcion_grupo descripcion_subgrupo producto
## BASICO :9127 Almohadas :6005 TOALLA EDEN : 2637
## MARCAS PROPIAS :6219 Toalla :5723 VELO SUIZO PLAIN VOILE: 2296
## MARCAS INVITADAS:4845 Dacrones :4063 TARTAM : 2117
## PESADAS :2709 Chintz :2429 DACRON WENDY : 1559
## MULTIMARCA :2485 Suizo :2296 DACRON PC : 1407
## VELOS :2296 Dulceabrigos:2117 ALMOHADA UNICOLOR : 1160
## (Other) :1836 (Other) :6884 (Other) :18341
## descripcion_detalle_subgrupo producto.1 Almacen
## Uso alcoba :7177 Length:29517 1010100:9121
## Lisos :4725 Class :character 1011000:3340
## Manos :2797 Mode :character 1014200:2910
## Tartan super :2117 1010300:2524
## Dacron wendy fino:1559 1010200:2242
## Dacron medio bco :1407 1011400:2238
## (Other) :9735 (Other):7142
## dia mes cantidad_venta precio_venta total_venta
## Min. : 1.00 1:8118 Min. :-200.00 Min. : 1233 Min. :-1443697
## 1st Qu.: 7.00 2:8820 1st Qu.: 1.00 1st Qu.: 6882 1st Qu.: 11271
## Median :15.00 3:7687 Median : 1.50 Median : 10916 Median : 22664
## Mean :15.01 4:4892 Mean : 4.16 Mean : 19506 Mean : 50147
## 3rd Qu.:22.00 3rd Qu.: 2.50 3rd Qu.: 21765 3rd Qu.: 44454
## Max. :31.00 Max. :1800.00 Max. :268824 Max. : 8304300
##
Validación de supuestos del modelo por medio de graficos
Media cero: Se cumple por defecto.
Varianza Constante: Se observa en la grafica 1 de residuales vs ajustados que el comportamiento no es aleatorio mostrando una leve curva hacia abajo, lo que indica que no existe varianza constante y no se cumple este supuesto, se debe relaizar tranformaciones al modelo.
Normalidad: Se observa en la grafica 2 que los datos se ajustan bien a la linea de normalidad en el qqplot
Independencia: Dado que estos registros no corresponden a datos en el tiempo no se tiene un orden temporal para realizar la validación de este supuesto.
Finalmente se seleccionan los mejores predictores para explicar el total de las ventas: formula = total_venta ~ descripcion_detalle_subgrupo + Almacen+dia+ cantidad_venta + precio_venta
## Start: AIC=660133.1
## total_venta ~ descripcion_familia + descripcion_tipo + descripcion_grupo +
## descripcion_subgrupo + producto + descripcion_detalle_subgrupo +
## producto.1 + Almacen + dia + mes + cantidad_venta + precio_venta
##
##
## Step: AIC=660133.1
## total_venta ~ descripcion_familia + descripcion_tipo + descripcion_grupo +
## descripcion_subgrupo + producto + descripcion_detalle_subgrupo +
## Almacen + dia + mes + cantidad_venta + precio_venta
##
##
## Step: AIC=660133.1
## total_venta ~ descripcion_familia + descripcion_tipo + descripcion_grupo +
## producto + descripcion_detalle_subgrupo + Almacen + dia +
## mes + cantidad_venta + precio_venta
##
##
## Step: AIC=660133.1
## total_venta ~ descripcion_familia + descripcion_tipo + producto +
## descripcion_detalle_subgrupo + Almacen + dia + mes + cantidad_venta +
## precio_venta
##
##
## Step: AIC=660133.1
## total_venta ~ descripcion_familia + producto + descripcion_detalle_subgrupo +
## Almacen + dia + mes + cantidad_venta + precio_venta
##
##
## Step: AIC=660133.1
## total_venta ~ producto + descripcion_detalle_subgrupo + Almacen +
## dia + mes + cantidad_venta + precio_venta
##
## Df Sum of Sq RSS AIC
## - dia 1 4.0297e+09 1.5099e+14 660132
## - mes 3 2.5954e+10 1.5101e+14 660132
## <none> 1.5099e+14 660133
## - descripcion_detalle_subgrupo 7 1.2254e+11 1.5111e+14 660143
## - producto 79 9.6379e+11 1.5195e+14 660163
## - precio_venta 1 2.8326e+11 1.5127e+14 660186
## - Almacen 15 1.6676e+13 1.6766e+14 663195
## - cantidad_venta 1 5.2631e+14 6.7729e+14 704433
##
## Step: AIC=660131.9
## total_venta ~ producto + descripcion_detalle_subgrupo + Almacen +
## mes + cantidad_venta + precio_venta
##
## Df Sum of Sq RSS AIC
## - mes 3 2.5578e+10 1.5102e+14 660131
## <none> 1.5099e+14 660132
## + dia 1 4.0297e+09 1.5099e+14 660133
## - descripcion_detalle_subgrupo 7 1.2250e+11 1.5111e+14 660142
## - producto 79 9.6160e+11 1.5195e+14 660161
## - precio_venta 1 2.8405e+11 1.5128e+14 660185
## - Almacen 15 1.6674e+13 1.6767e+14 663194
## - cantidad_venta 1 5.2651e+14 6.7750e+14 704441
##
## Step: AIC=660130.9
## total_venta ~ producto + descripcion_detalle_subgrupo + Almacen +
## cantidad_venta + precio_venta
##
## Df Sum of Sq RSS AIC
## <none> 1.5102e+14 660131
## + mes 3 2.5578e+10 1.5099e+14 660132
## + dia 1 3.6541e+09 1.5101e+14 660132
## - descripcion_detalle_subgrupo 7 1.1477e+11 1.5113e+14 660139
## - producto 79 9.5067e+11 1.5197e+14 660158
## - precio_venta 1 3.0639e+11 1.5132e+14 660189
## - Almacen 15 1.6703e+13 1.6772e+14 663197
## - cantidad_venta 1 5.2670e+14 6.7771e+14 704444
##
## Call:
## lm(formula = total_venta ~ producto + descripcion_detalle_subgrupo +
## Almacen + cantidad_venta + precio_venta, data = datosFinal)
##
## Coefficients:
## (Intercept)
## -1.013e+04
## productoALMOHADA BLANDA ELEGANCE AZUL
## 2.728e+04
## productoALMOHADA CLASICA 60 X 40
## 5.288e+04
## productoALMOHADA CONFORT 60 X 40
## 2.961e+04
## productoALMOHADA ELEGANCE NEGRA
## 3.188e+04
## productoALMOHADA FIRME ELEGANCE VERDE
## 3.029e+04
## productoALMOHADA IN ROOMS ECO
## 1.962e+04
## productoALMOHADA LENCERY BLANDA ROJA
## 1.245e+04
## productoALMOHADA LENCY AZUL SILICONADA
## 1.708e+04
## productoALMOHADA PROMOCION X 1 50 X 70
## 1.807e+04
## productoALMOHADA UNICOLOR
## 1.037e+04
## productoBANDEJA DECOR 442-640132
## 8.127e+03
## productoBATA DE BANO FEMENINA
## 6.662e+03
## productoBLUSA MANGA CORTA ES3971 SPL
## 7.677e+03
## productoCLON MTZA
## 1.572e+04
## productoCLONE
## 1.974e+04
## productoCLONE AZ CELESTE
## 1.390e+04
## productoCLONE AZ REY
## 1.554e+04
## productoCLONE AZUL RQ
## 1.602e+04
## productoCLONE CAFE
## 8.425e+03
## productoCLONE CAFE CL
## 1.777e+04
## productoCLONE CAFE M
## 1.217e+04
## productoCLONE CORAL
## 1.154e+04
## productoCLONE FUCSIA
## 1.827e+04
## productoCLONE HBNO
## 1.697e+04
## productoCLONE HBNO CL
## 1.351e+04
## productoCLONE MTZA
## 2.024e+04
## productoCLONE NEGRO
## 2.139e+04
## productoCLONE NRNJA
## 1.049e+04
## productoCLONE ROJO
## 1.529e+04
## productoCLONE RSDO
## 1.230e+04
## productoCLONE TCOTA
## 1.530e+04
## productoCLONE V TINTO
## 1.566e+04
## productoCLONE VD CALI
## 2.005e+04
## productoCLONE VERDE
## 1.276e+04
## productoCOBIJA FLANER NAVIDAD
## 5.084e+03
## productoCOBIJA SOFIA
## 1.522e+04
## productoCOJIN 45 X 45
## 1.959e+03
## productoCOJIN 45X45
## 1.299e+04
## productoCOJIN BRAZOS CUBA
## 6.167e+03
## productoCOJIN IN ROOM APRODIS
## 1.699e+04
## productoCOJIN RELLENO 50 X 50
## 1.718e+04
## productoCOJIN RELLENO 70X70
## 1.952e+04
## productoCREPE GUCCI 205
## 7.204e+03
## productoCUBRELECHO IN ROOMS
## -1.790e+02
## productoDACRON PC
## 7.763e+03
## productoDACRON SUPER
## -4.923e+03
## productoDACRON WENDY
## 1.989e+04
## productoDELANTAL KITCHEN
## 8.124e+03
## productoDRIL WORK
## 6.331e+04
## productoEDREDON JACQUARD
## -1.180e+04
## productoFORRO COJIN
## 7.337e+03
## productoFORRO COJIN SEATTLE
## 6.364e+03
## productoFUNDA DOBLADILLO SEN OULET
## 4.965e+03
## productoGUIPIURE FRANCES(GPR)
## 3.195e+04
## productoINDIVIDUAL CASTILLA
## 1.165e+04
## productoJACQUARD FABRIC ALBA
## 5.152e+04
## productoJEAN BOTA AJUSTADA 102 OAZ
## 7.156e+03
## productoJG CUBRELECHO MICROFIBRA
## 1.903e+04
## productoJG POTES 2PZ 448-8210266
## 4.308e+03
## productoJG SABANA ALGODON UNICOLOR
## 3.899e+04
## productoJG SABANA IN ROOMS
## 2.369e+04
## productoJG SABANA MICROFIBRA
## 2.834e+03
## productoJG SABANAS ELEGANCE
## 2.794e+04
## productoJUEGO CUBRELECHO IN ROOMS
## -2.920e+04
## productoJUEGO DE FUNDAS PALOMA
## 1.360e+04
## productoJUEGO SABANA LENCY AZUL
## 2.635e+04
## productoLEGGINS 290427 CFT
## 3.996e+03
## productoORQUIDEA ARTIFICIAL 456-55193
## 9.341e+03
## productoPEBETERO 462-091367
## 8.465e+03
## productoPLANTA 439-356856
## 8.060e+03
## productoPLANTA CON POTE 592-380111
## 8.198e+03
## productoPLANTA DECORATIVA 411-335322
## 6.487e+03
## productoPOLO 0003 LHA 333- 823 MC TC
## 4.517e+03
## productoPOLO MANGA CORTA BHA509 TC
## 6.852e+03
## productoPORTARETRATO 8X10 420-563329
## 6.810e+03
## productoPORTAVELA 567-56069
## 7.592e+03
## productoPROTECTOR ALMOHADA TERMOSELLAD
## 2.175e+04
## productoPROTECTOR COLCHON TERMOSELLADO
## -4.320e+02
## productoRELLENO PLUMON MICROFIBRA
## 2.127e+04
## productoSABANA PLANA PALOMA
## 1.238e+05
## productoSAMANTA 60(RYN)
## 1.742e+04
## productoSEMI JUEGO IN ROOMS
## 5.865e+03
## productoSEMI JUEGO IN ROOMS COLOR
## -4.074e+03
## productoSEMI JUEGO SABANA LENCY AZUL
## 6.895e+03
## productoSOBRECAMA VERSALLES IN ROOMS
## -7.852e+04
## productoTARTAM
## 1.139e+03
## productoTELA PANAL
## 2.562e+03
## productoTELA TOALLA BLANCO 0001
## 1.012e+04
## productoTELA TOALLA HABANO 92005
## 9.457e+03
## productoTELA TOALLA MICROFIBRA
## 2.676e+04
## productoTOALLA 40 X 70 BLANCO 001
## 6.167e+03
## productoTOALLA 50 X 100 BLANCO 001
## 1.705e+04
## productoTOALLA 500 GR
## 2.109e+04
## productoTOALLA 500 GR TOR 50003 U
## 1.670e+04
## productoTOALLA 60 X 120 BLANCO 001
## 5.294e+03
## productoTOALLA 75 X 150 BLANCO 001
## 8.873e+02
## productoTOALLA DIAMOND LOZENGES
## -2.110e+03
## productoTOALLA EDEN
## 4.585e+03
## productoTOALLA FREE BIRDS
## 9.030e+03
## productoTOALLA LIA
## 4.952e+03
## productoTOALLA MALMO
## -6.378e+03
## productoTOALLA PANAMA
## 9.605e+03
## productoVELO SUIZO PLAIN VOILE
## 5.437e+03
## productoWESTING CHAMBRAY(CHM)
## 1.730e+04
## descripcion_detalle_subgrupoBota ajustada
## NA
## descripcion_detalle_subgrupoChambrays unicolor
## NA
## descripcion_detalle_subgrupoCrepe gucci
## NA
## descripcion_detalle_subgrupoCuerpo
## 1.677e+04
## descripcion_detalle_subgrupoDacron economico bco 168 hilos
## -3.173e+03
## descripcion_detalle_subgrupoDacron economico bco 186 hilos
## NA
## descripcion_detalle_subgrupoDacron medio bco
## NA
## descripcion_detalle_subgrupoDacron wendy fino
## NA
## descripcion_detalle_subgrupoDise?os varios
## NA
## descripcion_detalle_subgrupoDoble
## 1.681e+04
## descripcion_detalle_subgrupoDriles work polyalgodon
## NA
## descripcion_detalle_subgrupoEconomicos
## NA
## descripcion_detalle_subgrupoExtra doble
## 2.902e+03
## descripcion_detalle_subgrupoFacial
## -2.705e+03
## descripcion_detalle_subgrupoJacquard
## NA
## descripcion_detalle_subgrupoKing
## -1.954e+04
## descripcion_detalle_subgrupoLisos
## NA
## descripcion_detalle_subgrupoLycra samanta
## NA
## descripcion_detalle_subgrupoManga corta
## NA
## descripcion_detalle_subgrupoManos
## NA
## descripcion_detalle_subgrupoNormal
## NA
## descripcion_detalle_subgrupoRectangular
## NA
## descripcion_detalle_subgrupoSemidoble
## 7.145e+02
## descripcion_detalle_subgrupoSencillo
## NA
## descripcion_detalle_subgrupoTartan super
## NA
## descripcion_detalle_subgrupoTela panal
## NA
## descripcion_detalle_subgrupoTela toalla 90 ancho
## NA
## descripcion_detalle_subgrupoTela toalla microfibra
## NA
## descripcion_detalle_subgrupoUso alcoba
## NA
## descripcion_detalle_subgrupoUso bano
## NA
## descripcion_detalle_subgrupoUso cocina
## NA
## descripcion_detalle_subgrupoUso sala
## NA
## Almacen1010200
## 2.311e+03
## Almacen1010300
## -6.472e+02
## Almacen1010400
## -3.173e+03
## Almacen1010500
## -2.930e+03
## Almacen1010800
## -2.460e+03
## Almacen1010900
## 6.294e+02
## Almacen1011000
## -4.737e+03
## Almacen1011200
## 3.352e+05
## Almacen1011300
## 2.970e+04
## Almacen1011400
## 1.864e+02
## Almacen1012300
## -1.287e+03
## Almacen1012400
## -5.475e+04
## Almacen1012700
## 3.602e+05
## Almacen1013700
## -3.742e+03
## Almacen1014200
## -2.477e+03
## cantidad_venta
## 6.136e+03
## precio_venta
## 9.779e-01
Los set de datos se definenen con una proporción de p=0,75
Entre los predictores incluidos en el modelo, no se detecta ninguno con varianza cero o próxima a cero
datosFinal %>% select(descripcion_detalle_subgrupo, Almacen, dia, cantidad_venta, precio_venta) %>%
nearZeroVar(saveMetrics = TRUE)
| freqRatio | percentUnique | zeroVar | nzv | |
|---|---|---|---|---|
| descripcion_detalle_subgrupo | 1.518942 | 0.1118000 | FALSE | FALSE |
| Almacen | 2.730838 | 0.0542061 | FALSE | FALSE |
| dia | 1.126750 | 0.1050242 | FALSE | FALSE |
| cantidad_venta | 1.810008 | 2.5442965 | FALSE | FALSE |
| precio_venta | 1.454172 | 1.8836603 | FALSE | FALSE |
objeto_recipe = objeto_recipe %>% step_nzv(all_predictors())
Este proceso es fundamental para que los modelos sean más precisos y que todos los datos tengan la misma escala mejora las métricas para modelos sensibles como SVM y NNET
## Rows: 22,138
## Columns: 51
## $ dia <dbl> 1.607889, …
## $ cantidad_venta <dbl> 0.06750114…
## $ precio_venta <dbl> -0.542658,…
## $ total_venta <dbl> -0.0584877…
## $ descripcion_detalle_subgrupo_Bota.ajustada <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Chambrays.unicolor <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Crepe.gucci <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Cuerpo <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Dacron.economico.bco.168.hilos <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Dacron.economico.bco.186.hilos <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Dacron.medio.bco <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Dacron.wendy.fino <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Dise.os.varios <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Doble <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Driles.work.polyalgodon <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Economicos <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Extra.doble <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Facial <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Jacquard <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_King <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Lisos <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Lycra.samanta <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Manga.corta <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Manos <dbl> 1, 1, 1, 1…
## $ descripcion_detalle_subgrupo_Normal <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Rectangular <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Semidoble <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Sencillo <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Tartan.super <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Tela.panal <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Tela.toalla.90.ancho <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Tela.toalla.microfibra <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Uso.alcoba <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Uso.bano <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Uso.cocina <dbl> 0, 0, 0, 0…
## $ descripcion_detalle_subgrupo_Uso.sala <dbl> 0, 0, 0, 0…
## $ Almacen_X1010200 <dbl> 0, 1, 0, 0…
## $ Almacen_X1010300 <dbl> 0, 0, 0, 0…
## $ Almacen_X1010400 <dbl> 0, 0, 0, 0…
## $ Almacen_X1010500 <dbl> 0, 0, 0, 0…
## $ Almacen_X1010800 <dbl> 1, 0, 1, 0…
## $ Almacen_X1010900 <dbl> 0, 0, 0, 0…
## $ Almacen_X1011000 <dbl> 0, 0, 0, 0…
## $ Almacen_X1011200 <dbl> 0, 0, 0, 0…
## $ Almacen_X1011300 <dbl> 0, 0, 0, 0…
## $ Almacen_X1011400 <dbl> 0, 0, 0, 0…
## $ Almacen_X1012300 <dbl> 0, 0, 0, 0…
## $ Almacen_X1012400 <dbl> 0, 0, 0, 0…
## $ Almacen_X1012700 <dbl> 0, 0, 0, 0…
## $ Almacen_X1013700 <dbl> 0, 0, 0, 0…
## $ Almacen_X1014200 <dbl> 0, 0, 0, 1…
## Linear Regression
##
## 22138 samples
## 50 predictor
##
## No pre-processing
## Resampling: Bootstrapped (25 reps)
## Summary of sample sizes: 22138, 22138, 22138, 22138, 22138, 22138, ...
## Resampling results:
##
## RMSE Rsquared MAE
## 0.4943807 0.8038637 0.1016595
##
## Tuning parameter 'intercept' was held constant at a value of TRUE
## RMSE: 0.226888
## MAE: -436.7635
## R^2: 0.8570761
Evaluación del modelo mediante resampling
## Support Vector Machines with Linear Kernel
##
## 22138 samples
## 50 predictor
##
## No pre-processing
## Resampling: Cross-Validated (10 fold, repeated 5 times)
## Summary of sample sizes: 19923, 19926, 19923, 19925, 19924, 19925, ...
## Resampling results:
##
## RMSE Rsquared MAE
## 0.4262451 0.8509922 0.1066923
##
## Tuning parameter 'C' was held constant at a value of 1
## RMSE: 0.2206499
## MAE: -471.5812
## R^2: 0.8645805
## Stochastic Gradient Boosting
##
## 22138 samples
## 50 predictor
##
## No pre-processing
## Resampling: Cross-Validated (10 fold, repeated 5 times)
## Summary of sample sizes: 19923, 19926, 19923, 19925, 19924, 19925, ...
## Resampling results across tuning parameters:
##
## shrinkage n.minobsinnode n.trees RMSE Rsquared MAE
## 0.01 2 100 0.5928182 0.7737628 0.20336769
## 0.01 2 120 0.5541870 0.7844275 0.19504624
## 0.01 5 100 0.5962707 0.7742658 0.20354219
## 0.01 5 120 0.5585658 0.7832422 0.19523873
## 0.10 2 100 0.2767570 0.9297815 0.06123756
## 0.10 2 120 0.2662719 0.9355500 0.05526927
## 0.10 5 100 0.2787549 0.9259707 0.06050504
## 0.10 5 120 0.2708505 0.9303527 0.05551859
##
## Tuning parameter 'interaction.depth' was held constant at a value of 2
## RMSE was used to select the optimal model using the smallest value.
## The final values used for the model were n.trees = 120, interaction.depth =
## 2, shrinkage = 0.1 and n.minobsinnode = 2.
## RMSE: 0.155049
## MAE: -259.457
## R^2: 0.9404131
Root Mean Squared Error (RMSE), se oberva que los tres modelos no presentan una variación alta lo que significa que no existe un nivel alto de errores significativamente altos, de igual forma se presentan una variación de la magnitud de los errores, pero es poco probable la existencia de errores grandes.
El modelo que mejor ajuste tiene es boosting, seguido de la maquina de vector de soporte.
A nivel de R^2 Ajustado el mejor modelo es el bossting con 94%, seguido de 86% del SVM y finalmente la regresión lineal con 86%, esto significa que los modelos pueden explicar cerca de un 90% los datos.