Un Data scientest ha diseñado un modelo de analítica prescriptiva para reducir el tiempo de fallas de las máquinas de un proceso de elaboración de galletas. El científico ha validado efectivamente su modelo de analítica contra la información del sistema de mantenimiento empleado en el centro de atención por lo que ahora se encuentra concentrado en probar tres alternativas de mejora que ha diseñado para concluir cuál de ellas debería implementar. En la tabla siguiente se muestran 30 réplicas tanto del modelo de mantenimiento actual y las tres diferentes propuestas de mejora que ha logrado proponer. Con base en esta información y mostrando todo el procedimiento respectivo que sustente su respuesta indique cual debe ser la conclusión del científico. ¿Qué propuesta debería implementarse? (Considere un nivel de significancia de 5%). Se muestran a continuación los datos:

arbol <-c(23.81,    22.13,  22.64,  21.69,  23.58,  22.14,  18.73,  21.59,
          20.36,    20.53,  20.11,  20.34,  19.19,  22.92,  18.65,  20.6,
          19.83,    20.09,  19.43,  22.06,  21.15,  19.26,  18.08,  20.24,
          18.75,    20.69,  21.62,  23.69,  23.93,  23.19)

redn <-c(23.24, 20.08,  18.01,  23.28,  19.23,  21.22,  21.47,  20.6,
         21.11, 21.27,  21.03,  17.34,  22.8,   21.85,  17.85,  23.15,
         19.57, 19.56,  20.79,  18.04,  20.95,  21.83,  18.17,  22.66,
         18.29, 18.89,  19.49,  19.19,  26.47,  25.25)

regresion <-c(16.13,    17.84,  18.28,  15.61,  17.62,  16.12,  17.29,  16.13,
              16.64,    15.03,  18.16,  16.82,  17.44,  16.76,  17.26,  15.55,
              17.49,    18.42,  17.54,  17.13,  15.5,    16.8,  18.47,  18.42, 
              18.43,    15.56,  16.03,  15.39,  15.12, 17.77)

actual <-c(17.09,   15.77,  18.45,  16.55,  22.23,  22.11,  18.26,  18.04,  
           19.66,   19.76,  18.74,  19.02,  18.54,  16.7,   17.57,  19.89,
           19.06,   18.7,   19.39,  19.68,  19.2,   16.85,  19.91,  19.82,  18.08,
           19.38,   20.3,   21.6,   23.39,  19.33)

valores <- c(arbol, redn, regresion, actual)
grupo <- rep(c("Arbol", "Redn", "Regresion", "Actual"), each = 30)

boxplot(valores ~ grupo,
        main = "Boxplot Comparativo",
        xlab = "Grupo",
        ylab = "Valores",
        col = c("lightblue", "lightgreen", "lightpink", "lightgray"),
        border = "black")

Mediante gráficos BOXPLOT se observa que los valores más bajos pertenecen a la propuesta de regresión.Sin embargo, se realizarán los análisis de Intervalos de confianza necesarios. También se realiza en análisis estadístico de cada variable.

summary(arbol)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   18.08   19.89   20.64   21.03   22.14   23.93
summary(redn)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   17.34   19.20   20.87   20.76   21.84   26.47
summary(regresion)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   15.03   16.05   16.98   16.89   17.73   18.47
summary(actual)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   15.77   18.12   19.13   19.10   19.80   23.39

Se observa que la regresión tiene tiempos de falla más bajos en mediana y media.

Datos para análisis.

Paso 1: Parámetros de interés

Tiempos de falla en minutos de las máquinas.

Paso 2: Establecer la hipótesis nula

Los tiempos de falla de las propuestas son similares a los tiempos actuales.

Paso 3: Establecer la hipótesis alternativa

Existe alguna mejora (disminución) en los tiempos de falla de las maquinas en alguna de las 3 propuestas.

Paso 4: Nivel de significación

5%

t.test(arbol, actual, conf.level = 0.95,alternative = "less")
## 
##  Welch Two Sample t-test
## 
## data:  arbol and actual
## t = 4.3555, df = 57.989, p-value = 1
## alternative hypothesis: true difference in means is less than 0
## 95 percent confidence interval:
##      -Inf 2.673004
## sample estimates:
## mean of x mean of y 
##  21.03400  19.10233
t.test(redn, actual, conf.level = 0.95,alternative = "less")
## 
##  Welch Two Sample t-test
## 
## data:  redn and actual
## t = 3.2145, df = 54.681, p-value = 0.9989
## alternative hypothesis: true difference in means is less than 0
## 95 percent confidence interval:
##      -Inf 2.514425
## sample estimates:
## mean of x mean of y 
##  20.75600  19.10233
t.test(regresion, actual, conf.level = 0.95,alternative = "less")
## 
##  Welch Two Sample t-test
## 
## data:  regresion and actual
## t = -5.902, df = 49.248, p-value = 1.63e-07
## alternative hypothesis: true difference in means is less than 0
## 95 percent confidence interval:
##      -Inf -1.58275
## sample estimates:
## mean of x mean of y 
##  16.89167  19.10233

Análisis de p-value:

Arbol vs Actual

p-value = 1

Red neuronal vs Actual

p-value = 0.9989

Regresion vs Actual

p-value = 1.63e-07

Debido a que se observa que el p valor es mayor al nivel de significación (5%). Se acepta H0, es decir se acepta que que las 2 propuestas no tienen diferencias de tiempos con la situación actual. Y debido a que el nivel de significancia de la Regresión es menor a 5%, se concluye que los tiempos de regresión son menores a los tiempos actuales.

Tambien se observa una disminución de tiempos en la propuesta de regresión luego de analizar los intervalos de confianza resultantes.

<-Inf, 2.673004] Arbol

<-Inf, 2.514425] Red neuronal

<-Inf, -1.58275] Regresión

EN CONCLUSIÓN SE ELIGE EL METODO DE REGRESIÓN PARA LA DISMINUCIÓN DE TIEMPOS DE FALLAS DE MÁQUINAS.