Caso Grupal 2 - Tiempo de fallo Máquina Galletas

Integrantes

Del Aguila Adrianzen, Manuel Alcibiades

Díaz Bojorquez, Manuel Augusto

Espinoza Huillca, Gerardo Ilich

Huamán Lazo, Kenedic Eduardo

Huaman Rodriguez, Paul Isaac

1.Planteamiento del problema

Se busca evaluar tres modelos alternativos para reducir el tiempo de fallas de máquinas en una línea de producción de galletas. El objetivo es determinar si alguno de estos modelos reduce significativamente el tiempo de falla comparado con el sistema actual de mantenimiento.

Modelos evaluados:

Árbol de Clasificación.
Redes Neuronales.
Métodos de Regresión.
Sistema Actual (base comparativa).

Nivel de significancia: α = 0.05

#1. Cargamos y evaluamos la data recogida

##Definimos las variables a evaluar con sus respectivos datos

arbol <-c(23.81,    22.13,  22.64,  21.69,  23.58,  22.14,  18.73,  21.59,
          20.36,    20.53,  20.11,  20.34,  19.19,  22.92,  18.65,  20.6,
          19.83,    20.09,  19.43,  22.06,  21.15,  19.26,  18.08,  20.24,
          18.75,    20.69,  21.62,  23.69,  23.93,  23.19)

redn <-c(23.24, 20.08,  18.01,  23.28,  19.23,  21.22,  21.47,  20.6,
         21.11, 21.27,  21.03,  17.34,  22.8,   21.85,  17.85,  23.15,
         19.57, 19.56,  20.79,  18.04,  20.95,  21.83,  18.17,  22.66,
         18.29, 18.89,  19.49,  19.19,  26.47,  25.25)

regresion <-c(16.13,    17.84,  18.28,  15.61,  17.62,  16.12,  17.29,  16.13,
              16.64,    15.03,  18.16,  16.82,  17.44,  16.76,  17.26,  15.55,
              17.49,    18.42,  17.54,  17.13,  15.5,    16.8,  18.47,  18.42, 
              18.43,    15.56,  16.03,  15.39,  15.12, 17.77)

actual <-c(17.09,   15.77,  18.45,  16.55,  22.23,  22.11,  18.26,  18.04,  
           19.66,   19.76,  18.74,  19.02,  18.54,  16.7,   17.57,  19.89,
           19.06,   18.7,   19.39,  19.68,  19.2,   16.85,  19.91,  19.82,  18.08,
           19.38,   20.3,   21.6,   23.39,  19.33)


data2  <- data.frame(ÁrbolC =arbol, Red_N = redn, Regresion = regresion, SActual = actual)

1.a Análisis Exploratorio

## Determinamos las estadísticas descriptivas de las modelos revisados.

summary(data2)

##      ÁrbolC          Red_N         Regresion        SActual     
##  Min.   :18.08   Min.   :17.34   Min.   :15.03   Min.   :15.77  
##  1st Qu.:19.89   1st Qu.:19.20   1st Qu.:16.05   1st Qu.:18.12  
##  Median :20.64   Median :20.87   Median :16.98   Median :19.13  
##  Mean   :21.03   Mean   :20.76   Mean   :16.89   Mean   :19.10  
##  3rd Qu.:22.14   3rd Qu.:21.84   3rd Qu.:17.73   3rd Qu.:19.80  
##  Max.   :23.93   Max.   :26.47   Max.   :18.47   Max.   :23.39

## Validamos los tipos de varibles.
str(data2)

## 'data.frame':    30 obs. of  4 variables:
##  $ ÁrbolC   : num  23.8 22.1 22.6 21.7 23.6 ...
##  $ Red_N    : num  23.2 20.1 18 23.3 19.2 ...
##  $ Regresion: num  16.1 17.8 18.3 15.6 17.6 ...
##  $ SActual  : num  17.1 15.8 18.4 16.6 22.2 ...

## Evaluamos previamente las medias de cada modelo vs el modelo actual, para tener una primera impresión de las medias.
boxplot(arbol,redn,regresion,actual,col=c(5,2,3,4),names=c("arbol","redn","regresion","actual"))

De manera preliminar, observamos en el Boxplot que la media de la regresión es menor a los otros modelos, realizaremos las validaciones para afirmar o rechazar esta premisa.

1.b Realizamos un Test de Normalidad para evaluar los modelos

## 
##  Shapiro-Wilk normality test
## 
## data:  arbol
## W = 0.9581, p-value = 0.2768

## 
##  Shapiro-Wilk normality test
## 
## data:  redn
## W = 0.95783, p-value = 0.2723

## 
##  Shapiro-Wilk normality test
## 
## data:  regresion
## W = 0.93501, p-value = 0.0668

## 
##  Shapiro-Wilk normality test
## 
## data:  actual
## W = 0.96408, p-value = 0.3921

Como los valores de p-value son mayores a p>0.05, usamos la prueba t para valores independientes.

2. Pruebas de Hipótesis

Dado a que el objetivo es reducir el tiempo de fallas del sistema actual, evaluaremos cada modelo propuesto vs el modelo actual.

2.a Arbol de Clasificación vs Sistema Actual

##Hipotesis nula¨
##Ho: uArbol - uActual=0
##vs
##Hipotesis alternativa:
#Ha: uArbol - uActual <0

t.test(arbol, actual, alternative = "less", var.equal = TRUE)

## 
##  Two Sample t-test
## 
## data:  arbol and actual
## t = 4.3555, df = 58, p-value = 1
## alternative hypothesis: true difference in means is less than 0
## 95 percent confidence interval:
##      -Inf 2.673001
## sample estimates:
## mean of x mean of y 
##  21.03400  19.10233

Como p-value>0.05, no se puede rechazar Ho, no hay evidencia suficiente para decir que el modelo Arbol reduce significativamente el tiempo de falla.

2.b Redes Neuronales vs Sistema Actual

##Hipotesis nula¨
##Ho: uRedNl - uActual=0
##vs
##Hipotesis alternativa:
#Ha: uRedN - uActual <0

t.test(redn, actual, alternative = "less", var.equal = TRUE)

## 
##  Two Sample t-test
## 
## data:  redn and actual
## t = 3.2145, df = 58, p-value = 0.9989
## alternative hypothesis: true difference in means is less than 0
## 95 percent confidence interval:
##      -Inf 2.513577
## sample estimates:
## mean of x mean of y 
##  20.75600  19.10233

Como p-value>0.05, no se puede rechazar Ho, no hay evidencia suficiente para decir que el modelo Redes Neuronales reduce significativamente el tiempo de falla.

2.c Regresión vs Sistema Actual

##Hipotesis nula¨
##Ho: uRegresion - uActual=0
##vs
##Hipotesis alternativa:
#Ha: uRegresion - uActual <0

t.test(regresion, actual, alternative = "less", var.equal = TRUE)

## 
##  Two Sample t-test
## 
## data:  regresion and actual
## t = -5.902, df = 58, p-value = 9.883e-08
## alternative hypothesis: true difference in means is less than 0
## 95 percent confidence interval:
##       -Inf -1.584561
## sample estimates:
## mean of x mean of y 
##  16.89167  19.10233

Como p-value<0.05, se puede rechazar Ho, indicando que hay suficiente evidencia para decir que el modelo de Regresión reduce significativamente el tiempo de falla vs el modelo actual.
Diferencia: -2.31 min (mejora).
P - Valor < 0.001 -> Mejora estadísticamente significativa.

3. Conclusiones:

Dados los resultados obtenidos en las pruebas de Hipotesis vs el modelo Actual, obtenemos:

Árbol de Clasificación: p > 0.05 → no hay mejora significativa.
Redes Neuronales: p > 0.05 → no hay mejora significativa.
Regresión: p < 0.05 → Existe mejora significativa.

El método de regresión demostró un menor tiempo promedio de fallas (de 19.03min a 16.72min) con una reducción de 2.31min y la mayor consistencia (desviación estándar = 1.10).

4. Recomendaciones:

→ Se recomienda implementar el modelo de Regresión, pues se obtiene un menor tiempo de falla.

→ El modelo de Regresión lineal tiene una distribución más concentrada y centrada en valores bajos, con menor dispersión. Esto se traduce en menores costos operativos, mayor tiempo útil de los equipos y una gestión más eficiente del mantenimiento preventivo o predictivo.

Monitorear continuamente el desempeño post-implemetación para validar que este se mantenga en lo estimado y proponer el método en otros proceso de la compañía.