CONTROL 2 - GRUPO 7

Un Data scientest ha diseñado un modelo de analítica prescriptiva para reducir el tiempo de fallas de las máquinas de un proceso de elaboración de galletas. El científico ha validado efectivamente su modelo de analítica contra la información del sistema de mantenimiento empleado en el centro de atención por lo que ahora se encuentra concentrado en probar tres alternativas de mejora que ha diseñado para concluir cuál de ellas debería implementar. En la tabla siguiente se muestran 30 réplicas tanto del modelo de mantenimiento actual y las tres diferentes propuestas de mejora que ha logrado proponer. Con base en esta información y mostrando todo el procedimiento respectivo que sustente su respuesta indique cual debe ser la conclusión del científico. ¿Qué propuesta debería implementarse? (Considere un nivel de significancia de 5%)

##Tiempos de fallas por cada alternativa

arbol <-c(23.81,    22.13,  22.64,  21.69,  23.58,  22.14,  18.73,  21.59,
          20.36,    20.53,  20.11,  20.34,  19.19,  22.92,  18.65,  20.6,
          19.83,    20.09,  19.43,  22.06,  21.15,  19.26,  18.08,  20.24,
          18.75,    20.69,  21.62,  23.69,  23.93,  23.19)

redn <-c(23.24, 20.08,  18.01,  23.28,  19.23,  21.22,  21.47,  20.6,
         21.11, 21.27,  21.03,  17.34,  22.8,   21.85,  17.85,  23.15,
         19.57, 19.56,  20.79,  18.04,  20.95,  21.83,  18.17,  22.66,
         18.29, 18.89,  19.49,  19.19,  26.47,  25.25)

regresion <-c(16.13,    17.84,  18.28,  15.61,  17.62,  16.12,  17.29,  16.13,
              16.64,    15.03,  18.16,  16.82,  17.44,  16.76,  17.26,  15.55,
              17.49,    18.42,  17.54,  17.13,  15.5,    16.8,  18.47,  18.42, 
              18.43,    15.56,  16.03,  15.39,  15.12, 17.77)

actual <-c(17.09,   15.77,  18.45,  16.55,  22.23,  22.11,  18.26,  18.04,  
           19.66,   19.76,  18.74,  19.02,  18.54,  16.7,   17.57,  19.89,
           19.06,   18.7,   19.39,  19.68,  19.2,   16.85,  19.91,  19.82,  18.08,
           19.38,   20.3,   21.6,   23.39,  19.33)

#Crear un data.frame

data2  <- data.frame(ÁrbolC =arbol, Red_N = redn, Regresion = regresion, SActual = actual)

#Estadisticas descriptivas

summary(data2)
##      ÁrbolC          Red_N         Regresion        SActual     
##  Min.   :18.08   Min.   :17.34   Min.   :15.03   Min.   :15.77  
##  1st Qu.:19.89   1st Qu.:19.20   1st Qu.:16.05   1st Qu.:18.12  
##  Median :20.64   Median :20.87   Median :16.98   Median :19.13  
##  Mean   :21.03   Mean   :20.76   Mean   :16.89   Mean   :19.10  
##  3rd Qu.:22.14   3rd Qu.:21.84   3rd Qu.:17.73   3rd Qu.:19.80  
##  Max.   :23.93   Max.   :26.47   Max.   :18.47   Max.   :23.39
#Creación de boxplot para visualización de los grupos

boxplot(data2, main = "Diagrama de BoxPlot de Sistema Actual y Alternativas de mejoras", col = c("purple", "blue", "red", "green"), ylab = "Tiempos de fallas")
legend("topright", legend = c("SActual", "Arbolc" , "Red_N", "Regresion"), col = c("purple", "blue", "red", "green"), pch = 18)

################################################

#COMPARATIVO 1: SActual vs Arbolc

mean(data2$SActual)
## [1] 19.10233
mean(data2$ÁrbolC)
## [1] 21.034
##Media de Arbolc es mayor a SActual

#Se realiza la prueba de comparación de varianzas
#H0:VAR.SActual=VAR.Arbolc
#HA:VAR.SActual=/VAR.Arbolc

var.test(data2$SActual,data2$ÁrbolC)
## 
##  F test to compare two variances
## 
## data:  data2$SActual and data2$ÁrbolC
## F = 1.0284, num df = 29, denom df = 29, p-value = 0.9404
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##  0.4894759 2.1606362
## sample estimates:
## ratio of variances 
##           1.028387
## Pvalue: 0.94>0.05 => No se rechaza la H0, las varianzas son iguales

##Comparamos las medias
#Hipotesis nula:
#H0: Las dos medias son iguales   VS
#Hipotesis alternativa:
#Ha: La media de Sactual es menor que la media de Arbolc

t.test(data2$SActual,data2$ÁrbolC,var.equal = TRUE,alternative = "less")
## 
##  Two Sample t-test
## 
## data:  data2$SActual and data2$ÁrbolC
## t = -4.3555, df = 58, p-value = 2.739e-05
## alternative hypothesis: true difference in means is less than 0
## 95 percent confidence interval:
##       -Inf -1.190332
## sample estimates:
## mean of x mean of y 
##  19.10233  21.03400
#CONCLUSION SACTUAL VS ARBOLC
#pvalue es 2.739e-05 < 0.05, se rechaza la hipotesis nula, la media de SActual es menor que la media de Arbolc.



##########################################
#COMPARATIVO 2: SActual vs Red_N
mean(data2$SActual)
## [1] 19.10233
mean(data2$Red_N)
## [1] 20.756
##Media de Red_N es mayor a SActual

#Se realiza la prueba de comparación de varianzas
#H0:VAR.SActual=VAR.Red_N
#HA:VAR.SActual=/VAR.Red_N

var.test(data2$SActual,data2$Red_N)
## 
##  F test to compare two variances
## 
## data:  data2$SActual and data2$Red_N
## F = 0.60466, num df = 29, denom df = 29, p-value = 0.1815
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##  0.2877968 1.2703880
## sample estimates:
## ratio of variances 
##          0.6046599
## Pvalue: 0.1815>0.05 => No se rechaza la H0, las varianzas son iguales

##Comparamos las medias
#Hipotesis nula:
#H0: Las dos medias son iguales   VS
#Hipotesis alternativa:
#Ha: La media de Sactual es menor que la media de Red_N

t.test(data2$SActual,data2$Red_N,var.equal = TRUE,alternative = "less")
## 
##  Two Sample t-test
## 
## data:  data2$SActual and data2$Red_N
## t = -3.2145, df = 58, p-value = 0.001068
## alternative hypothesis: true difference in means is less than 0
## 95 percent confidence interval:
##        -Inf -0.7937567
## sample estimates:
## mean of x mean of y 
##  19.10233  20.75600
#CONCLUSION SACTUAL VS RED_N

#pvalue es 0.001068 < 0.05, se rechaza la hipotesis nula, la media de SActual es menor que la media de RedN.


##########################################

#COMPARATIVO 3: SActual vs Regresion
mean(data2$SActual)
## [1] 19.10233
mean(data2$Regresion)
## [1] 16.89167
##Media de SActual es mayor a Regresion

#Se realiza la prueba de comparación de varianzas
#H0:VAR.SActual=VAR.Regresion
#HA:VAR.SActual=/VAR.Regresion

var.test(data2$SActual,data2$Regresion)
## 
##  F test to compare two variances
## 
## data:  data2$SActual and data2$Regresion
## F = 2.4576, num df = 29, denom df = 29, p-value = 0.01817
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##  1.169751 5.163496
## sample estimates:
## ratio of variances 
##           2.457642
## Pvalue: 0.01817<0.05 => Se rechaza la H0, las varianzas no son iguales

##Comparamos las medias
#Hipotesis nula:
#H0: Las dos medias son iguales   VS
#Hipotesis alternativa:
#Ha: La media de Sactual es mayor que la media de Regresion

t.test(data2$SActual,data2$Regresion,var.equal = FALSE ,alternative = "greater")
## 
##  Welch Two Sample t-test
## 
## data:  data2$SActual and data2$Regresion
## t = 5.902, df = 49.248, p-value = 1.63e-07
## alternative hypothesis: true difference in means is greater than 0
## 95 percent confidence interval:
##  1.58275     Inf
## sample estimates:
## mean of x mean of y 
##  19.10233  16.89167
#CONCLUSION SACTUAL VS REGRESION
#pvalue es  1.63e-07 < 0.05, se rechaza la hipotesis nula, la media de SActual es mayor que la media de Regresion

CONCLUSIONES FINALES

#CONCLUSION SACTUAL VS ARBOLC

pvalue es 2.739e-05 < 0.05, se rechaza la hipotesis nula, la media de SActual es menor que la media de Arbolc.

#CONCLUSION SACTUAL VS RED_N

pvalue es 0.001068 < 0.05, se rechaza la hipotesis nula, la media de SActual es menor que la media de RedN.

#CONCLUSION SACTUAL VS REGRESION

pvalue es 1.63e-07 < 0.05, se rechaza la hipotesis nula, la media de SActual es mayor que la media de Regresion

Despues de realizar la comparativas, se puede concluir que la mejora de Regresion tendrian los menores tiempos de fallas que SActual y seria la mejor opción.