## Warning: package 'RcmdrMisc' was built under R version 4.0.5
## Loading required package: car
## Loading required package: carData
## Loading required package: sandwich

MODELOS DE MANTENIMIENTO

PASO 1: ESTRUCTURAR BASE DE DATOS

Importamos las 4 bases de datos.

arbol <-c(23.81,    22.13,  22.64,  21.69,  23.58,  22.14,  18.73,  21.59,
          20.36,    20.53,  20.11,  20.34,  19.19,  22.92,  18.65,  20.6,
          19.83,    20.09,  19.43,  22.06,  21.15,  19.26,  18.08,  20.24,
          18.75,    20.69,  21.62,  23.69,  23.93,  23.19)

redn <-c(23.24, 20.08,  18.01,  23.28,  19.23,  21.22,  21.47,  20.6,
         21.11, 21.27,  21.03,  17.34,  22.8,   21.85,  17.85,  23.15,
         19.57, 19.56,  20.79,  18.04,  20.95,  21.83,  18.17,  22.66,
         18.29, 18.89,  19.49,  19.19,  26.47,  25.25)

regresion <-c(16.13,    17.84,  18.28,  15.61,  17.62,  16.12,  17.29,  16.13,
              16.64,    15.03,  18.16,  16.82,  17.44,  16.76,  17.26,  15.55,
              17.49,    18.42,  17.54,  17.13,  15.5,    16.8,  18.47,  18.42, 
              18.43,    15.56,  16.03,  15.39,  15.12, 17.77)

actual <-c(17.09,   15.77,  18.45,  16.55,  22.23,  22.11,  18.26,  18.04,  
           19.66,   19.76,  18.74,  19.02,  18.54,  16.7,   17.57,  19.89,
           19.06,   18.7,   19.39,  19.68,  19.2,   16.85,  19.91,  19.82,  18.08,
           19.38,   20.3,   21.6,   23.39,  19.33)

Estructuramos las cuatro tablas en una “data2”

(data2  <- data.frame(ÁrbolC =arbol, Red_N = redn, Regresion = regresion, SActual = actual))
##    ÁrbolC Red_N Regresion SActual
## 1   23.81 23.24     16.13   17.09
## 2   22.13 20.08     17.84   15.77
## 3   22.64 18.01     18.28   18.45
## 4   21.69 23.28     15.61   16.55
## 5   23.58 19.23     17.62   22.23
## 6   22.14 21.22     16.12   22.11
## 7   18.73 21.47     17.29   18.26
## 8   21.59 20.60     16.13   18.04
## 9   20.36 21.11     16.64   19.66
## 10  20.53 21.27     15.03   19.76
## 11  20.11 21.03     18.16   18.74
## 12  20.34 17.34     16.82   19.02
## 13  19.19 22.80     17.44   18.54
## 14  22.92 21.85     16.76   16.70
## 15  18.65 17.85     17.26   17.57
## 16  20.60 23.15     15.55   19.89
## 17  19.83 19.57     17.49   19.06
## 18  20.09 19.56     18.42   18.70
## 19  19.43 20.79     17.54   19.39
## 20  22.06 18.04     17.13   19.68
## 21  21.15 20.95     15.50   19.20
## 22  19.26 21.83     16.80   16.85
## 23  18.08 18.17     18.47   19.91
## 24  20.24 22.66     18.42   19.82
## 25  18.75 18.29     18.43   18.08
## 26  20.69 18.89     15.56   19.38
## 27  21.62 19.49     16.03   20.30
## 28  23.69 19.19     15.39   21.60
## 29  23.93 26.47     15.12   23.39
## 30  23.19 25.25     17.77   19.33
summary(data2)
##      ÁrbolC          Red_N         Regresion        SActual     
##  Min.   :18.08   Min.   :17.34   Min.   :15.03   Min.   :15.77  
##  1st Qu.:19.89   1st Qu.:19.20   1st Qu.:16.05   1st Qu.:18.12  
##  Median :20.64   Median :20.87   Median :16.98   Median :19.13  
##  Mean   :21.03   Mean   :20.76   Mean   :16.89   Mean   :19.10  
##  3rd Qu.:22.14   3rd Qu.:21.84   3rd Qu.:17.73   3rd Qu.:19.80  
##  Max.   :23.93   Max.   :26.47   Max.   :18.47   Max.   :23.39

A partir de “data2” apilamos las cuatro variables un una table de dos variables denominada: “DB_Mantto”

DB_Mantto <- stack(data2[, c("ÁrbolC","Red_N","Regresion","SActual")])
names(DB_Mantto) <- c("Data_Mantto", "Modelo_Mantto")

DB_Mantto
##     Data_Mantto Modelo_Mantto
## 1         23.81        ÁrbolC
## 2         22.13        ÁrbolC
## 3         22.64        ÁrbolC
## 4         21.69        ÁrbolC
## 5         23.58        ÁrbolC
## 6         22.14        ÁrbolC
## 7         18.73        ÁrbolC
## 8         21.59        ÁrbolC
## 9         20.36        ÁrbolC
## 10        20.53        ÁrbolC
## 11        20.11        ÁrbolC
## 12        20.34        ÁrbolC
## 13        19.19        ÁrbolC
## 14        22.92        ÁrbolC
## 15        18.65        ÁrbolC
## 16        20.60        ÁrbolC
## 17        19.83        ÁrbolC
## 18        20.09        ÁrbolC
## 19        19.43        ÁrbolC
## 20        22.06        ÁrbolC
## 21        21.15        ÁrbolC
## 22        19.26        ÁrbolC
## 23        18.08        ÁrbolC
## 24        20.24        ÁrbolC
## 25        18.75        ÁrbolC
## 26        20.69        ÁrbolC
## 27        21.62        ÁrbolC
## 28        23.69        ÁrbolC
## 29        23.93        ÁrbolC
## 30        23.19        ÁrbolC
## 31        23.24         Red_N
## 32        20.08         Red_N
## 33        18.01         Red_N
## 34        23.28         Red_N
## 35        19.23         Red_N
## 36        21.22         Red_N
## 37        21.47         Red_N
## 38        20.60         Red_N
## 39        21.11         Red_N
## 40        21.27         Red_N
## 41        21.03         Red_N
## 42        17.34         Red_N
## 43        22.80         Red_N
## 44        21.85         Red_N
## 45        17.85         Red_N
## 46        23.15         Red_N
## 47        19.57         Red_N
## 48        19.56         Red_N
## 49        20.79         Red_N
## 50        18.04         Red_N
## 51        20.95         Red_N
## 52        21.83         Red_N
## 53        18.17         Red_N
## 54        22.66         Red_N
## 55        18.29         Red_N
## 56        18.89         Red_N
## 57        19.49         Red_N
## 58        19.19         Red_N
## 59        26.47         Red_N
## 60        25.25         Red_N
## 61        16.13     Regresion
## 62        17.84     Regresion
## 63        18.28     Regresion
## 64        15.61     Regresion
## 65        17.62     Regresion
## 66        16.12     Regresion
## 67        17.29     Regresion
## 68        16.13     Regresion
## 69        16.64     Regresion
## 70        15.03     Regresion
## 71        18.16     Regresion
## 72        16.82     Regresion
## 73        17.44     Regresion
## 74        16.76     Regresion
## 75        17.26     Regresion
## 76        15.55     Regresion
## 77        17.49     Regresion
## 78        18.42     Regresion
## 79        17.54     Regresion
## 80        17.13     Regresion
## 81        15.50     Regresion
## 82        16.80     Regresion
## 83        18.47     Regresion
## 84        18.42     Regresion
## 85        18.43     Regresion
## 86        15.56     Regresion
## 87        16.03     Regresion
## 88        15.39     Regresion
## 89        15.12     Regresion
## 90        17.77     Regresion
## 91        17.09       SActual
## 92        15.77       SActual
## 93        18.45       SActual
## 94        16.55       SActual
## 95        22.23       SActual
## 96        22.11       SActual
## 97        18.26       SActual
## 98        18.04       SActual
## 99        19.66       SActual
## 100       19.76       SActual
## 101       18.74       SActual
## 102       19.02       SActual
## 103       18.54       SActual
## 104       16.70       SActual
## 105       17.57       SActual
## 106       19.89       SActual
## 107       19.06       SActual
## 108       18.70       SActual
## 109       19.39       SActual
## 110       19.68       SActual
## 111       19.20       SActual
## 112       16.85       SActual
## 113       19.91       SActual
## 114       19.82       SActual
## 115       18.08       SActual
## 116       19.38       SActual
## 117       20.30       SActual
## 118       21.60       SActual
## 119       23.39       SActual
## 120       19.33       SActual

PASO 2: ANALISIS DE LA BASE DE DATOS

Teniendo como base la data aplilada “DB_Mannto” se genera los diagramas de caja para el analisis de su media:

Boxplot(Data_Mantto~Modelo_Mantto, data=DB_Mantto, id=list(method="y"))

## [1] "59"  "119"
numSummary(DB_Mantto[,"Data_Mantto", drop=FALSE], groups=DB_Mantto$Modelo_Mantto, 
  statistics=c("mean", "sd", "IQR", "quantiles"), quantiles=c(0,.25,.5,.75,1))
##               mean       sd    IQR    0%     25%    50%     75%  100%
## ÁrbolC    21.03400 1.705609 2.2425 18.08 19.8950 20.645 22.1375 23.93
## Red_N     20.75600 2.224344 2.6450 17.34 19.2000 20.870 21.8450 26.47
## Regresion 16.89167 1.103312 1.6800 15.03 16.0525 16.975 17.7325 18.47
## SActual   19.10233 1.729648 1.6800 15.77 18.1250 19.130 19.8050 23.39
##           Data_Mantto:n
## ÁrbolC               30
## Red_N                30
## Regresion            30
## SActual              30

Al aplicar:

t.test(Data_Mantto~Modelo_Mantto, alternative=‘two.sided’, conf.level=.95, var.equal=FALSE, data=DB_Mantto)

Se obtiene el siguiente error:

Error in t.test.formula(Data_Mantto ~ Modelo_Mantto, alternative = “two.sided”, : grouping factor must have exactly 2 levels

POR LO TANTO, Dado que el test de t en R solo se puede hace para un máximo de dos variables independientes realizamos el analisis de 2 en 2 de las variables.

PASO 3: PRUEBA DE HIPOTESIS E INTERVALOS DE CONFIANZA

3.1 ARBOL DE CLASIFICACION VS SISTEMA ACTUAL

DB_ARBvsSAC<- stack(data2[, c("ÁrbolC","SActual")])
names(DB_ARBvsSAC) <- c("Data_ARBvsSAC", "Modelo_ARBvsSAC")

DB_ARBvsSAC
##    Data_ARBvsSAC Modelo_ARBvsSAC
## 1          23.81          ÁrbolC
## 2          22.13          ÁrbolC
## 3          22.64          ÁrbolC
## 4          21.69          ÁrbolC
## 5          23.58          ÁrbolC
## 6          22.14          ÁrbolC
## 7          18.73          ÁrbolC
## 8          21.59          ÁrbolC
## 9          20.36          ÁrbolC
## 10         20.53          ÁrbolC
## 11         20.11          ÁrbolC
## 12         20.34          ÁrbolC
## 13         19.19          ÁrbolC
## 14         22.92          ÁrbolC
## 15         18.65          ÁrbolC
## 16         20.60          ÁrbolC
## 17         19.83          ÁrbolC
## 18         20.09          ÁrbolC
## 19         19.43          ÁrbolC
## 20         22.06          ÁrbolC
## 21         21.15          ÁrbolC
## 22         19.26          ÁrbolC
## 23         18.08          ÁrbolC
## 24         20.24          ÁrbolC
## 25         18.75          ÁrbolC
## 26         20.69          ÁrbolC
## 27         21.62          ÁrbolC
## 28         23.69          ÁrbolC
## 29         23.93          ÁrbolC
## 30         23.19          ÁrbolC
## 31         17.09         SActual
## 32         15.77         SActual
## 33         18.45         SActual
## 34         16.55         SActual
## 35         22.23         SActual
## 36         22.11         SActual
## 37         18.26         SActual
## 38         18.04         SActual
## 39         19.66         SActual
## 40         19.76         SActual
## 41         18.74         SActual
## 42         19.02         SActual
## 43         18.54         SActual
## 44         16.70         SActual
## 45         17.57         SActual
## 46         19.89         SActual
## 47         19.06         SActual
## 48         18.70         SActual
## 49         19.39         SActual
## 50         19.68         SActual
## 51         19.20         SActual
## 52         16.85         SActual
## 53         19.91         SActual
## 54         19.82         SActual
## 55         18.08         SActual
## 56         19.38         SActual
## 57         20.30         SActual
## 58         21.60         SActual
## 59         23.39         SActual
## 60         19.33         SActual
t.test(Data_ARBvsSAC~Modelo_ARBvsSAC, alternative='two.sided', conf.level=.95, var.equal=FALSE, data=DB_ARBvsSAC)
## 
##  Welch Two Sample t-test
## 
## data:  Data_ARBvsSAC by Modelo_ARBvsSAC
## t = 4.3555, df = 57.989, p-value = 5.479e-05
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  1.043900 2.819433
## sample estimates:
##  mean in group ÁrbolC mean in group SActual 
##              21.03400              19.10233

DADO QUE EL “P-VALUE” ES MENOR QUE “ALFA”, RECHAZAMOS LA HIPOTESIS NULA. SE ENCUENTRA DIFERENCIAS SIGNIFICATIVAS ENTRE AMBOS MODELOS.

3.2 REDES NEURONALES VS SISTEMA ACTUAL

DB_RNEvsSAC<- stack(data2[, c("Red_N","SActual")])
names(DB_RNEvsSAC) <- c("Data_RNEvsSAC", "Modelo_RNEvsSAC")

DB_RNEvsSAC
##    Data_RNEvsSAC Modelo_RNEvsSAC
## 1          23.24           Red_N
## 2          20.08           Red_N
## 3          18.01           Red_N
## 4          23.28           Red_N
## 5          19.23           Red_N
## 6          21.22           Red_N
## 7          21.47           Red_N
## 8          20.60           Red_N
## 9          21.11           Red_N
## 10         21.27           Red_N
## 11         21.03           Red_N
## 12         17.34           Red_N
## 13         22.80           Red_N
## 14         21.85           Red_N
## 15         17.85           Red_N
## 16         23.15           Red_N
## 17         19.57           Red_N
## 18         19.56           Red_N
## 19         20.79           Red_N
## 20         18.04           Red_N
## 21         20.95           Red_N
## 22         21.83           Red_N
## 23         18.17           Red_N
## 24         22.66           Red_N
## 25         18.29           Red_N
## 26         18.89           Red_N
## 27         19.49           Red_N
## 28         19.19           Red_N
## 29         26.47           Red_N
## 30         25.25           Red_N
## 31         17.09         SActual
## 32         15.77         SActual
## 33         18.45         SActual
## 34         16.55         SActual
## 35         22.23         SActual
## 36         22.11         SActual
## 37         18.26         SActual
## 38         18.04         SActual
## 39         19.66         SActual
## 40         19.76         SActual
## 41         18.74         SActual
## 42         19.02         SActual
## 43         18.54         SActual
## 44         16.70         SActual
## 45         17.57         SActual
## 46         19.89         SActual
## 47         19.06         SActual
## 48         18.70         SActual
## 49         19.39         SActual
## 50         19.68         SActual
## 51         19.20         SActual
## 52         16.85         SActual
## 53         19.91         SActual
## 54         19.82         SActual
## 55         18.08         SActual
## 56         19.38         SActual
## 57         20.30         SActual
## 58         21.60         SActual
## 59         23.39         SActual
## 60         19.33         SActual
t.test(Data_RNEvsSAC~Modelo_RNEvsSAC, alternative='two.sided', conf.level=.95, var.equal=FALSE, data=DB_RNEvsSAC)
## 
##  Welch Two Sample t-test
## 
## data:  Data_RNEvsSAC by Modelo_RNEvsSAC
## t = 3.2145, df = 54.681, p-value = 0.002194
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  0.622575 2.684758
## sample estimates:
##   mean in group Red_N mean in group SActual 
##              20.75600              19.10233

DADO QUE EL “P-VALUE” ES MENOR QUE “ALFA”, RECHAZAMOS LA HIPOTESIS NULA. SE ENCUENTRA DIFERENCIAS SIGNIFICATIVAS ENTRE AMBOS MODELOS.

3.3 METODOS DE REGRESION VS SISTEMA ACTUAL

DB_REGvsSAC<- stack(data2[, c("Regresion","SActual")])
names(DB_REGvsSAC) <- c("Data_REGvsSAC", "Modelo_REGvsSAC")

DB_REGvsSAC
##    Data_REGvsSAC Modelo_REGvsSAC
## 1          16.13       Regresion
## 2          17.84       Regresion
## 3          18.28       Regresion
## 4          15.61       Regresion
## 5          17.62       Regresion
## 6          16.12       Regresion
## 7          17.29       Regresion
## 8          16.13       Regresion
## 9          16.64       Regresion
## 10         15.03       Regresion
## 11         18.16       Regresion
## 12         16.82       Regresion
## 13         17.44       Regresion
## 14         16.76       Regresion
## 15         17.26       Regresion
## 16         15.55       Regresion
## 17         17.49       Regresion
## 18         18.42       Regresion
## 19         17.54       Regresion
## 20         17.13       Regresion
## 21         15.50       Regresion
## 22         16.80       Regresion
## 23         18.47       Regresion
## 24         18.42       Regresion
## 25         18.43       Regresion
## 26         15.56       Regresion
## 27         16.03       Regresion
## 28         15.39       Regresion
## 29         15.12       Regresion
## 30         17.77       Regresion
## 31         17.09         SActual
## 32         15.77         SActual
## 33         18.45         SActual
## 34         16.55         SActual
## 35         22.23         SActual
## 36         22.11         SActual
## 37         18.26         SActual
## 38         18.04         SActual
## 39         19.66         SActual
## 40         19.76         SActual
## 41         18.74         SActual
## 42         19.02         SActual
## 43         18.54         SActual
## 44         16.70         SActual
## 45         17.57         SActual
## 46         19.89         SActual
## 47         19.06         SActual
## 48         18.70         SActual
## 49         19.39         SActual
## 50         19.68         SActual
## 51         19.20         SActual
## 52         16.85         SActual
## 53         19.91         SActual
## 54         19.82         SActual
## 55         18.08         SActual
## 56         19.38         SActual
## 57         20.30         SActual
## 58         21.60         SActual
## 59         23.39         SActual
## 60         19.33         SActual
t.test(Data_REGvsSAC~Modelo_REGvsSAC, alternative='two.sided', conf.level=.95, var.equal=FALSE, data=DB_REGvsSAC)
## 
##  Welch Two Sample t-test
## 
## data:  Data_REGvsSAC by Modelo_REGvsSAC
## t = -5.902, df = 49.248, p-value = 3.26e-07
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -2.963288 -1.458045
## sample estimates:
## mean in group Regresion   mean in group SActual 
##                16.89167                19.10233

DADO QUE EL “P-VALUE” ES MENOR QUE “ALFA”, RECHAZAMOS LA HIPOTESIS NULA. SE ENCUENTRA DIFERENCIAS SIGNIFICATIVAS ENTRE AMBOS MODELOS.

3.4 ARBOL DE CLASIFICACION VS REDES NEURONALES

DB_ARBvsRNE<- stack(data2[, c("ÁrbolC","Red_N")])
names(DB_ARBvsRNE) <- c("Data_ARBvsRNE", "Modelo_ARBvsRNE")

DB_ARBvsRNE
##    Data_ARBvsRNE Modelo_ARBvsRNE
## 1          23.81          ÁrbolC
## 2          22.13          ÁrbolC
## 3          22.64          ÁrbolC
## 4          21.69          ÁrbolC
## 5          23.58          ÁrbolC
## 6          22.14          ÁrbolC
## 7          18.73          ÁrbolC
## 8          21.59          ÁrbolC
## 9          20.36          ÁrbolC
## 10         20.53          ÁrbolC
## 11         20.11          ÁrbolC
## 12         20.34          ÁrbolC
## 13         19.19          ÁrbolC
## 14         22.92          ÁrbolC
## 15         18.65          ÁrbolC
## 16         20.60          ÁrbolC
## 17         19.83          ÁrbolC
## 18         20.09          ÁrbolC
## 19         19.43          ÁrbolC
## 20         22.06          ÁrbolC
## 21         21.15          ÁrbolC
## 22         19.26          ÁrbolC
## 23         18.08          ÁrbolC
## 24         20.24          ÁrbolC
## 25         18.75          ÁrbolC
## 26         20.69          ÁrbolC
## 27         21.62          ÁrbolC
## 28         23.69          ÁrbolC
## 29         23.93          ÁrbolC
## 30         23.19          ÁrbolC
## 31         23.24           Red_N
## 32         20.08           Red_N
## 33         18.01           Red_N
## 34         23.28           Red_N
## 35         19.23           Red_N
## 36         21.22           Red_N
## 37         21.47           Red_N
## 38         20.60           Red_N
## 39         21.11           Red_N
## 40         21.27           Red_N
## 41         21.03           Red_N
## 42         17.34           Red_N
## 43         22.80           Red_N
## 44         21.85           Red_N
## 45         17.85           Red_N
## 46         23.15           Red_N
## 47         19.57           Red_N
## 48         19.56           Red_N
## 49         20.79           Red_N
## 50         18.04           Red_N
## 51         20.95           Red_N
## 52         21.83           Red_N
## 53         18.17           Red_N
## 54         22.66           Red_N
## 55         18.29           Red_N
## 56         18.89           Red_N
## 57         19.49           Red_N
## 58         19.19           Red_N
## 59         26.47           Red_N
## 60         25.25           Red_N
t.test(Data_ARBvsRNE~Modelo_ARBvsRNE, alternative='two.sided', conf.level=.95, var.equal=FALSE, data=DB_ARBvsRNE)
## 
##  Welch Two Sample t-test
## 
## data:  Data_ARBvsRNE by Modelo_ARBvsRNE
## t = 0.54323, df = 54.341, p-value = 0.5892
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -0.7478602  1.3038602
## sample estimates:
## mean in group ÁrbolC  mean in group Red_N 
##               21.034               20.756

DADO QUE EL “P-VALUE” ES MAYOR QUE “ALFA”, NO RECHAZAMOS LA HIPOTESIS NULA. NO SE ENCUENTRA DIFERENCIAS SIGNIFICATIVAS ENTRE AMBOS MODELOS.

3.5 ARBOL DE CLASIFICACION VS METODOS DE REGRESION

DB_ARBvsREG<- stack(data2[, c("ÁrbolC","Regresion")])
names(DB_ARBvsREG) <- c("Data_ARBvsREG", "Modelo_ARBvsREG")

DB_ARBvsREG
##    Data_ARBvsREG Modelo_ARBvsREG
## 1          23.81          ÁrbolC
## 2          22.13          ÁrbolC
## 3          22.64          ÁrbolC
## 4          21.69          ÁrbolC
## 5          23.58          ÁrbolC
## 6          22.14          ÁrbolC
## 7          18.73          ÁrbolC
## 8          21.59          ÁrbolC
## 9          20.36          ÁrbolC
## 10         20.53          ÁrbolC
## 11         20.11          ÁrbolC
## 12         20.34          ÁrbolC
## 13         19.19          ÁrbolC
## 14         22.92          ÁrbolC
## 15         18.65          ÁrbolC
## 16         20.60          ÁrbolC
## 17         19.83          ÁrbolC
## 18         20.09          ÁrbolC
## 19         19.43          ÁrbolC
## 20         22.06          ÁrbolC
## 21         21.15          ÁrbolC
## 22         19.26          ÁrbolC
## 23         18.08          ÁrbolC
## 24         20.24          ÁrbolC
## 25         18.75          ÁrbolC
## 26         20.69          ÁrbolC
## 27         21.62          ÁrbolC
## 28         23.69          ÁrbolC
## 29         23.93          ÁrbolC
## 30         23.19          ÁrbolC
## 31         16.13       Regresion
## 32         17.84       Regresion
## 33         18.28       Regresion
## 34         15.61       Regresion
## 35         17.62       Regresion
## 36         16.12       Regresion
## 37         17.29       Regresion
## 38         16.13       Regresion
## 39         16.64       Regresion
## 40         15.03       Regresion
## 41         18.16       Regresion
## 42         16.82       Regresion
## 43         17.44       Regresion
## 44         16.76       Regresion
## 45         17.26       Regresion
## 46         15.55       Regresion
## 47         17.49       Regresion
## 48         18.42       Regresion
## 49         17.54       Regresion
## 50         17.13       Regresion
## 51         15.50       Regresion
## 52         16.80       Regresion
## 53         18.47       Regresion
## 54         18.42       Regresion
## 55         18.43       Regresion
## 56         15.56       Regresion
## 57         16.03       Regresion
## 58         15.39       Regresion
## 59         15.12       Regresion
## 60         17.77       Regresion
t.test(Data_ARBvsREG~Modelo_ARBvsREG, alternative='two.sided', conf.level=.95, var.equal=FALSE, data=DB_ARBvsREG)
## 
##  Welch Two Sample t-test
## 
## data:  Data_ARBvsREG by Modelo_ARBvsREG
## t = 11.169, df = 49.653, p-value = 3.764e-15
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  3.397285 4.887382
## sample estimates:
##    mean in group ÁrbolC mean in group Regresion 
##                21.03400                16.89167

DADO QUE EL “P-VALUE” ES MENOR QUE “ALFA”, RECHAZAMOS LA HIPOTESIS NULA. SE ENCUENTRA DIFERENCIAS SIGNIFICATIVAS ENTRE AMBOS MODELOS.

3.6 REDES NEURONALES VS METODOS DE REGRESION

DB_RNEvsREG<- stack(data2[, c("Red_N","Regresion")])
names(DB_RNEvsREG) <- c("Data_RNEvsREG", "Modelo_RNEvsREG")

DB_RNEvsREG
##    Data_RNEvsREG Modelo_RNEvsREG
## 1          23.24           Red_N
## 2          20.08           Red_N
## 3          18.01           Red_N
## 4          23.28           Red_N
## 5          19.23           Red_N
## 6          21.22           Red_N
## 7          21.47           Red_N
## 8          20.60           Red_N
## 9          21.11           Red_N
## 10         21.27           Red_N
## 11         21.03           Red_N
## 12         17.34           Red_N
## 13         22.80           Red_N
## 14         21.85           Red_N
## 15         17.85           Red_N
## 16         23.15           Red_N
## 17         19.57           Red_N
## 18         19.56           Red_N
## 19         20.79           Red_N
## 20         18.04           Red_N
## 21         20.95           Red_N
## 22         21.83           Red_N
## 23         18.17           Red_N
## 24         22.66           Red_N
## 25         18.29           Red_N
## 26         18.89           Red_N
## 27         19.49           Red_N
## 28         19.19           Red_N
## 29         26.47           Red_N
## 30         25.25           Red_N
## 31         16.13       Regresion
## 32         17.84       Regresion
## 33         18.28       Regresion
## 34         15.61       Regresion
## 35         17.62       Regresion
## 36         16.12       Regresion
## 37         17.29       Regresion
## 38         16.13       Regresion
## 39         16.64       Regresion
## 40         15.03       Regresion
## 41         18.16       Regresion
## 42         16.82       Regresion
## 43         17.44       Regresion
## 44         16.76       Regresion
## 45         17.26       Regresion
## 46         15.55       Regresion
## 47         17.49       Regresion
## 48         18.42       Regresion
## 49         17.54       Regresion
## 50         17.13       Regresion
## 51         15.50       Regresion
## 52         16.80       Regresion
## 53         18.47       Regresion
## 54         18.42       Regresion
## 55         18.43       Regresion
## 56         15.56       Regresion
## 57         16.03       Regresion
## 58         15.39       Regresion
## 59         15.12       Regresion
## 60         17.77       Regresion
t.test(Data_RNEvsREG~Modelo_RNEvsREG, alternative='two.sided', conf.level=.95, var.equal=FALSE, data=DB_RNEvsREG)
## 
##  Welch Two Sample t-test
## 
## data:  Data_RNEvsREG by Modelo_RNEvsREG
## t = 8.5245, df = 42.455, p-value = 9.625e-11
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  2.949785 4.778882
## sample estimates:
##     mean in group Red_N mean in group Regresion 
##                20.75600                16.89167

DADO QUE EL “P-VALUE” ES MENOR QUE “ALFA”, RECHAZAMOS LA HIPOTESIS NULA. SE ENCUENTRA DIFERENCIAS SIGNIFICATIVAS ENTRE AMBOS MODELOS.

PASO 4: CONCLUSIONES

Generando nuevamente los diagramas de caja para las cuatro variables:

Boxplot(Data_Mantto~Modelo_Mantto, data=DB_Mantto, id=list(method="y"))

## [1] "59"  "119"
numSummary(DB_Mantto[,"Data_Mantto", drop=FALSE], groups=DB_Mantto$Modelo_Mantto, 
  statistics=c("mean", "sd", "IQR", "quantiles"), quantiles=c(0,.25,.5,.75,1))
##               mean       sd    IQR    0%     25%    50%     75%  100%
## ÁrbolC    21.03400 1.705609 2.2425 18.08 19.8950 20.645 22.1375 23.93
## Red_N     20.75600 2.224344 2.6450 17.34 19.2000 20.870 21.8450 26.47
## Regresion 16.89167 1.103312 1.6800 15.03 16.0525 16.975 17.7325 18.47
## SActual   19.10233 1.729648 1.6800 15.77 18.1250 19.130 19.8050 23.39
##           Data_Mantto:n
## ÁrbolC               30
## Red_N                30
## Regresion            30
## SActual              30

Y a partir del analisis se observa que: Dado que “Data_Mantto” representa el tiempo de fallas de las máquinas de un proceso de elaboración de galletas. Es claro que a MENOR TIEMPO DE FALLA SE ESTARÁ OPTIMIZANDO EL PROCESO.

Así, de la prueba de hipotesis se concluye que entre EL SISTEMA ACTUAL y los tres modelos propuestos se ENCUENTRAN DIFERENCIAS SIGNIFICATIVAS en relación al tiempo de fallaS de las maquinas. Es decir en cualquiera de los casos se está impactando significativamente el tiempo de falla actual de una maquina.

Sin embargo, del análisis previo se concluye también que entre los MODELOS DE ARBOL Y REDES NEURONALES NO SE ENCUENTRAN DIFERENCIAS SIGNIFICATIVAS, por lo cual cualquiera de estos modelos podría ser el adecuado. NO OBSTANTE, ambos modelos incrementan significativamente el tiempo de falla de una maquina en relación al sistema actual por lo cual ambos casos no serían viables.

Finalmente, el MODELO DE REGRESIÓN es SIGNIFICATIVMENTE DIFERENTE QUE EL SISTEMA ACTUAL, pero en este caso se reduce el tiempo de falla de una máquina en promedio a 16.89. POR LO TANTO DEBERÍA IMPLEMENTARSE ESTE MODELO.

———- FIN