Se busca evaluar tres modelos alternativos para reducir el tiempo de fallas de máquinas en una línea de producción de galletas. El objetivo es determinar si alguno de estos modelos reduce significativamente el tiempo de falla comparado con el sistema actual de mantenimiento.
Modelos evaluados:
Árbol de Clasificación.
Redes Neuronales.
Métodos de Regresión.
Sistema Actual (base comparativa).
Nivel de significancia: α = 0.05
#1. Cargamos y evaluamos la data recogida
##Definimos las variables a evaluar con sus respectivos datos
arbol <-c(23.81, 22.13, 22.64, 21.69, 23.58, 22.14, 18.73, 21.59,
20.36, 20.53, 20.11, 20.34, 19.19, 22.92, 18.65, 20.6,
19.83, 20.09, 19.43, 22.06, 21.15, 19.26, 18.08, 20.24,
18.75, 20.69, 21.62, 23.69, 23.93, 23.19)
redn <-c(23.24, 20.08, 18.01, 23.28, 19.23, 21.22, 21.47, 20.6,
21.11, 21.27, 21.03, 17.34, 22.8, 21.85, 17.85, 23.15,
19.57, 19.56, 20.79, 18.04, 20.95, 21.83, 18.17, 22.66,
18.29, 18.89, 19.49, 19.19, 26.47, 25.25)
regresion <-c(16.13, 17.84, 18.28, 15.61, 17.62, 16.12, 17.29, 16.13,
16.64, 15.03, 18.16, 16.82, 17.44, 16.76, 17.26, 15.55,
17.49, 18.42, 17.54, 17.13, 15.5, 16.8, 18.47, 18.42,
18.43, 15.56, 16.03, 15.39, 15.12, 17.77)
actual <-c(17.09, 15.77, 18.45, 16.55, 22.23, 22.11, 18.26, 18.04,
19.66, 19.76, 18.74, 19.02, 18.54, 16.7, 17.57, 19.89,
19.06, 18.7, 19.39, 19.68, 19.2, 16.85, 19.91, 19.82, 18.08,
19.38, 20.3, 21.6, 23.39, 19.33)
data2 <- data.frame(ÁrbolC =arbol, Red_N = redn, Regresion = regresion, SActual = actual)
## Determinamos las estadísticas descriptivas de las modelos revisados.
summary(data2)
## ÁrbolC Red_N Regresion SActual
## Min. :18.08 Min. :17.34 Min. :15.03 Min. :15.77
## 1st Qu.:19.89 1st Qu.:19.20 1st Qu.:16.05 1st Qu.:18.12
## Median :20.64 Median :20.87 Median :16.98 Median :19.13
## Mean :21.03 Mean :20.76 Mean :16.89 Mean :19.10
## 3rd Qu.:22.14 3rd Qu.:21.84 3rd Qu.:17.73 3rd Qu.:19.80
## Max. :23.93 Max. :26.47 Max. :18.47 Max. :23.39
## Validamos los tipos de varibles.
str(data2)
## 'data.frame': 30 obs. of 4 variables:
## $ ÁrbolC : num 23.8 22.1 22.6 21.7 23.6 ...
## $ Red_N : num 23.2 20.1 18 23.3 19.2 ...
## $ Regresion: num 16.1 17.8 18.3 15.6 17.6 ...
## $ SActual : num 17.1 15.8 18.4 16.6 22.2 ...
## Evaluamos previamente las medias de cada modelo vs el modelo actual, para tener una primera impresión de las medias.
boxplot(arbol,redn,regresion,actual,col=c(5,2,3,4),names=c("arbol","redn","regresion","actual"))
De manera preliminar, observamos en el Boxplot que la media de la regresión es menor a los otros modelos, realizaremos las validaciones para afirmar o rechazar esta premisa.
##
## Shapiro-Wilk normality test
##
## data: arbol
## W = 0.9581, p-value = 0.2768
##
## Shapiro-Wilk normality test
##
## data: redn
## W = 0.95783, p-value = 0.2723
##
## Shapiro-Wilk normality test
##
## data: regresion
## W = 0.93501, p-value = 0.0668
##
## Shapiro-Wilk normality test
##
## data: actual
## W = 0.96408, p-value = 0.3921
Como los valores de p-value son mayores a p>0.05, usamos la prueba t para valores independientes.
Dado a que el objetivo es reducir el tiempo de fallas del sistema actual, evaluaremos cada modelo propuesto vs el modelo actual.
##Hipotesis nula¨
##Ho: uArbol - uActual=0
##vs
##Hipotesis alternativa:
#Ha: uArbol - uActual <0
t.test(arbol, actual, alternative = "less", var.equal = TRUE)
##
## Two Sample t-test
##
## data: arbol and actual
## t = 4.3555, df = 58, p-value = 1
## alternative hypothesis: true difference in means is less than 0
## 95 percent confidence interval:
## -Inf 2.673001
## sample estimates:
## mean of x mean of y
## 21.03400 19.10233
##Hipotesis nula¨
##Ho: uRedNl - uActual=0
##vs
##Hipotesis alternativa:
#Ha: uRedN - uActual <0
t.test(redn, actual, alternative = "less", var.equal = TRUE)
##
## Two Sample t-test
##
## data: redn and actual
## t = 3.2145, df = 58, p-value = 0.9989
## alternative hypothesis: true difference in means is less than 0
## 95 percent confidence interval:
## -Inf 2.513577
## sample estimates:
## mean of x mean of y
## 20.75600 19.10233
##Hipotesis nula¨
##Ho: uRegresion - uActual=0
##vs
##Hipotesis alternativa:
#Ha: uRegresion - uActual <0
t.test(regresion, actual, alternative = "less", var.equal = TRUE)
##
## Two Sample t-test
##
## data: regresion and actual
## t = -5.902, df = 58, p-value = 9.883e-08
## alternative hypothesis: true difference in means is less than 0
## 95 percent confidence interval:
## -Inf -1.584561
## sample estimates:
## mean of x mean of y
## 16.89167 19.10233
Como p-value<0.05, se puede rechazar Ho, indicando que hay suficiente evidencia para decir que el modelo de Regresión reduce significativamente el tiempo de falla vs el modelo actual.
Diferencia: -2.31 min (mejora).
P - Valor < 0.001 -> Mejora estadísticamente significativa.
Dados los resultados obtenidos en las pruebas de Hipotesis vs el modelo Actual, obtenemos:
Árbol de Clasificación: p > 0.05 → no hay mejora significativa.
Redes Neuronales: p > 0.05 → no hay mejora significativa.
Regresión: p < 0.05 → Existe mejora significativa.
El método de regresión demostró un menor tiempo promedio de fallas (de 19.03min a 16.72min) con una reducción de 2.31min y la mayor consistencia (desviación estándar = 1.10).
→ Se recomienda implementar el modelo de Regresión, pues se obtiene un menor tiempo de falla.
→ El modelo de Regresión lineal tiene una distribución más concentrada y centrada en valores bajos, con menor dispersión. Esto se traduce en menores costos operativos, mayor tiempo útil de los equipos y una gestión más eficiente del mantenimiento preventivo o predictivo.