Caso Grupal 2

Integrante:

 - Yamelin Reyes Inche

2025-05-19

Un Data scientist ha diseñado un modelo de analítica prescriptiva para reducir el tiempo de fallas de las máquinas de un proceso de elaboración de galletas. El científico ha validado efectivamente su modelo de analítica contra la información del sistema de mantenimiento empleado en el centro de atención por lo que ahora se encuentra concentrado en probar tres alternativas de mejora que ha diseñado para concluir cuál de ellas debería implementar. En la tabla siguiente se muestran 30 réplicas tanto del modelo de mantenimiento actual y las tres diferentes propuestas de mejora que ha logrado proponer. Con base en esta información y mostrando todo el procedimiento respectivo que sustente su respuesta indique cual debe ser la conclusión del científico. ¿Qué propuesta debería implementarse? (Considere un nivel de significancia de 5%)

## Warning: package 'Rcmdr' was built under R version 4.4.3
## Cargando paquete requerido: splines
## Cargando paquete requerido: RcmdrMisc
## Warning: package 'RcmdrMisc' was built under R version 4.4.3
## Cargando paquete requerido: car
## Warning: package 'car' was built under R version 4.4.3
## Cargando paquete requerido: carData
## Warning: package 'carData' was built under R version 4.4.3
## Cargando paquete requerido: sandwich
## Warning: package 'sandwich' was built under R version 4.4.3
## Cargando paquete requerido: effects
## Warning: package 'effects' was built under R version 4.4.3
## lattice theme set by effectsTheme()
## See ?effectsTheme for details.
## La interfaz R-Commander sólo funciona en sesiones interactivas
## 
## Adjuntando el paquete: 'Rcmdr'
## The following object is masked from 'package:base':
## 
##     errorCondition
> Dataset <- readXL("C:/Users/yamel/Downloads/Caso Grupal 2.xlsx", rownames=FALSE, header=TRUE, na="", sheet="data", 
+   stringsAsFactors=TRUE)
> library(abind, pos=16)
> library(e1071, pos=17)
Warning: package 'e1071' was built under R version 4.4.3

Resúmenes numéricos Sistema Actual:

> numSummary(Dataset[,"Sistema.actual", drop=FALSE], statistics=c("mean", "sd", "IQR", "quantiles"), quantiles=c(0,
+   .25,.5,.75,1))
     mean       sd  IQR    0%    25%   50%    75%  100%  n
 19.10233 1.729648 1.68 15.77 18.125 19.13 19.805 23.39 30

Resúmenes numéricos Arbol de clasificacion:

> numSummary(Dataset[,"Árbol.de.clasificación", drop=FALSE], statistics=c("mean", "sd", "IQR", "quantiles"), 
+   quantiles=c(0,.25,.5,.75,1))
   mean       sd    IQR    0%    25%    50%     75%  100%  n
 21.034 1.705609 2.2425 18.08 19.895 20.645 22.1375 23.93 30

Resúmenes numéricos Redes Neuronales:

> numSummary(Dataset[,"Redes.neuronales", drop=FALSE], statistics=c("mean", "sd", "IQR", "quantiles"), quantiles=c(0,
+   .25,.5,.75,1))
   mean       sd   IQR    0%  25%   50%    75%  100%  n
 20.756 2.224344 2.645 17.34 19.2 20.87 21.845 26.47 30

Resúmenes numéricos Metodos de Regresion:

> numSummary(Dataset[,"Métodos.de.regresión", drop=FALSE], statistics=c("mean", "sd", "IQR", "quantiles"), 
+   quantiles=c(0,.25,.5,.75,1))
     mean       sd  IQR    0%     25%    50%     75%  100%  n
 16.89167 1.103312 1.68 15.03 16.0525 16.975 17.7325 18.47 30

Test t para una muestra: Árbol.de.clasificación

> with(Dataset, (t.test(Árbol.de.clasificación, alternative='two.sided', mu=19, conf.level=.95)))

    One Sample t-test

data:  Árbol.de.clasificación
t = 6.5318, df = 29, p-value = 3.745e-07
alternative hypothesis: true mean is not equal to 19
95 percent confidence interval:
 20.39712 21.67088
sample estimates:
mean of x 
   21.034 

#El Pi Value es menor que 5% por lo tanto se rechaza la hipotesis nula. El arbol de clasificación difiere del promedio de mantenimiento de 19.

Test t para una muestra: Árbol.de.clasificación

> with(Dataset, (t.test(Árbol.de.clasificación, alternative='less', mu=19, conf.level=.95)))

    One Sample t-test

data:  Árbol.de.clasificación
t = 6.5318, df = 29, p-value = 1
alternative hypothesis: true mean is less than 19
95 percent confidence interval:
     -Inf 21.56311
sample estimates:
mean of x 
   21.034 

#El Pi Value es mayor que 5% por lo tanto no hay evidencia para rechazar la hipotesis nula pero se rechaza por el analisis anterior.

Test t para una muestra: Árbol.de.clasificación

> with(Dataset, (t.test(Árbol.de.clasificación, alternative='greater', mu=19, conf.level=.95)))

    One Sample t-test

data:  Árbol.de.clasificación
t = 6.5318, df = 29, p-value = 1.872e-07
alternative hypothesis: true mean is greater than 19
95 percent confidence interval:
 20.50489      Inf
sample estimates:
mean of x 
   21.034 

#El Pi Value es menor que 5% por lo tanto se rechaza la hipotesis nula y se acepta que promedio de mantenimiento es mayor que 19.

Test t para una muestra: Redes.neuronales

> with(Dataset, (t.test(Redes.neuronales, alternative='two.sided', mu=19, conf.level=.95)))

    One Sample t-test

data:  Redes.neuronales
t = 4.324, df = 29, p-value = 0.000165
alternative hypothesis: true mean is not equal to 19
95 percent confidence interval:
 19.92542 21.58658
sample estimates:
mean of x 
   20.756 

#El Pi Value es menor 5% se rechaza la hipotesis nula. El promedio de mantenimiento de redes neuronales es diferente de 19

Test t para una muestra: Redes.neuronales

> with(Dataset, (t.test(Redes.neuronales, alternative='less', mu=19, conf.level=.95)))

    One Sample t-test

data:  Redes.neuronales
t = 4.324, df = 29, p-value = 0.9999
alternative hypothesis: true mean is less than 19
95 percent confidence interval:
     -Inf 21.44603
sample estimates:
mean of x 
   20.756 

#El pi value es mayor a 5%, sin embargo, sí tenemos evidencia para rechazar que el promedio de mantenimiento de redes neuronales sea igual a 19.

Test t para una muestra: Redes.neuronales

> with(Dataset, (t.test(Redes.neuronales, alternative='greater', mu=19, conf.level=.95)))

    One Sample t-test

data:  Redes.neuronales
t = 4.324, df = 29, p-value = 8.249e-05
alternative hypothesis: true mean is greater than 19
95 percent confidence interval:
 20.06597      Inf
sample estimates:
mean of x 
   20.756 

#El Pi Value es menor 5% se rechaza la hipotesis nula. El promedio de mantenimiento de redes neuronales es mayor a 19.

Test t para una muestra: Métodos.de.regresión

> with(Dataset, (t.test(Métodos.de.regresión, alternative='two.sided', mu=19, conf.level=.95)))

    One Sample t-test

data:  Métodos.de.regresión
t = -10.467, df = 29, p-value = 2.322e-11
alternative hypothesis: true mean is not equal to 19
95 percent confidence interval:
 16.47968 17.30365
sample estimates:
mean of x 
 16.89167 

#El Pi Value es menor a 5% por lo que se rechaza la hipotesis nula. El promedio de mantenimiento de metodos de regresion difiere de 19.

Test t para una muestra: Métodos.de.regresión

> with(Dataset, (t.test(Métodos.de.regresión, alternative='less', mu=19, conf.level=.95)))

    One Sample t-test

data:  Métodos.de.regresión
t = -10.467, df = 29, p-value = 1.161e-11
alternative hypothesis: true mean is less than 19
95 percent confidence interval:
     -Inf 17.23393
sample estimates:
mean of x 
 16.89167 

#El Pi Value es menor a 5% por lo que se rechaza la hipotesis nula. El promedio de mantenimiento de metodos de regresion es menor que 19.

Test t para una muestra: Métodos.de.regresión

> with(Dataset, (t.test(Métodos.de.regresión, alternative='less', mu=19, conf.level=.95)))

    One Sample t-test

data:  Métodos.de.regresión
t = -10.467, df = 29, p-value = 1.161e-11
alternative hypothesis: true mean is less than 19
95 percent confidence interval:
     -Inf 17.23393
sample estimates:
mean of x 
 16.89167 

#El Pi Value es mayor a 5%, sin embargo tenemos evidencia de que el metodo de regresión no es igual a 19 por lo que lo rechazamos

Diagrama de caja: ~ Árbol.de.clasificación + Métodos.de.regresión + Redes.neuronales + Sistema.actual

> Boxplot( ~ Árbol.de.clasificación + Métodos.de.regresión + Redes.neuronales + Sistema.actual, data=Dataset, 
+   id=list(method="y"))

[1] "29" "29"

Conclusión

De acuerdo a la evaluación de todas las propuestas se concluye que Se debe implementar la propuesta de Métodos de regresión ya que es la única que tiene un promedio de mantenimiento menor a la del sistema actual (promedio de mantenimiento 19) Lo que indica un mejor desempeño en el mantenimiento actual para reducir el tiempo de fallas de las máquinas del proceso de elaboración de galletas.