Un Data scientest ha diseñado un modelo de analítica prescriptiva para reducir el tiempo de fallas de las máquinas de un proceso de elaboración de galletas. El científico ha validado efectivamente su modelo de analítica contra la información del sistema de mantenimiento empleado en el centro de atención por lo que ahora se encuentra concentrado en probar tres alternativas de mejora que ha diseñado para concluir cuál de ellas debería implementar. En la tabla siguiente se muestran 30 réplicas tanto del modelo de mantenimiento actual y las tres diferentes propuestas de mejora que ha logrado proponer. Con base en esta información y mostrando todo el procedimiento respectivo que sustente su respuesta indique cual debe ser la conclusión del científico. ¿Qué propuesta debería implementarse? (Considere un nivel de significancia de 5%)
arbol <-c(23.81, 22.13, 22.64, 21.69, 23.58, 22.14, 18.73, 21.59,
20.36, 20.53, 20.11, 20.34, 19.19, 22.92, 18.65, 20.6,
19.83, 20.09, 19.43, 22.06, 21.15, 19.26, 18.08, 20.24,
18.75, 20.69, 21.62, 23.69, 23.93, 23.19)
redn <-c(23.24, 20.08, 18.01, 23.28, 19.23, 21.22, 21.47, 20.6,
21.11, 21.27, 21.03, 17.34, 22.8, 21.85, 17.85, 23.15,
19.57, 19.56, 20.79, 18.04, 20.95, 21.83, 18.17, 22.66,
18.29, 18.89, 19.49, 19.19, 26.47, 25.25)
regresion <-c(16.13, 17.84, 18.28, 15.61, 17.62, 16.12, 17.29, 16.13,
16.64, 15.03, 18.16, 16.82, 17.44, 16.76, 17.26, 15.55,
17.49, 18.42, 17.54, 17.13, 15.5, 16.8, 18.47, 18.42,
18.43, 15.56, 16.03, 15.39, 15.12, 17.77)
actual <-c(17.09, 15.77, 18.45, 16.55, 22.23, 22.11, 18.26, 18.04,
19.66, 19.76, 18.74, 19.02, 18.54, 16.7, 17.57, 19.89,
19.06, 18.7, 19.39, 19.68, 19.2, 16.85, 19.91, 19.82, 18.08,
19.38, 20.3, 21.6, 23.39, 19.33)
data2 <- data.frame(ÁrbolC =arbol, Red_N = redn, Regresion = regresion, SActual = actual)
summary(data2)
## ÁrbolC Red_N Regresion SActual
## Min. :18.08 Min. :17.34 Min. :15.03 Min. :15.77
## 1st Qu.:19.89 1st Qu.:19.20 1st Qu.:16.05 1st Qu.:18.12
## Median :20.64 Median :20.87 Median :16.98 Median :19.13
## Mean :21.03 Mean :20.76 Mean :16.89 Mean :19.10
## 3rd Qu.:22.14 3rd Qu.:21.84 3rd Qu.:17.73 3rd Qu.:19.80
## Max. :23.93 Max. :26.47 Max. :18.47 Max. :23.39
En este caso el parámetro de interés es el “Tiempo de mantenimiento de los diferentes modelos” Acontinuación, se mostrará una grafica de BoxPlot para hacer un analísis visual de los datos de cada modelo
boxplot(data2, main = "Diagrama de BoxPlot", col = c("blue", "red", "green", "orange"), ylab = "Valores")
legend("topright", legend = c("ÁrbolC", "Red_N", "Regresion", "SActual"), col = c("blue", "red", "green", "orange"), pch = 15)
m1: media SActual m2:media de los demás modelos (Arbol,RedN y Regresión)
m1: media SActual m2:media de los demás modelos (Arbol,RedN y Regresión)
Para este caso nos indican usar un nivel de significancia 5%
alfa <- 0.05
Donde: x1 = media actual x2 = media de regresión m1 - m2 = 0 sigma1 = desviación estandar 1 sigma2= desviación estandar 2, sigma3 = desviacion estandar 3 sigma4= desviacion estandar 4 n(1,2,3 y 4) = total de muestra =30
# Limite Superior = qnorm(alfa/2)
ls <- qnorm(alfa/2)
# Limite Inferior = qnorm(q-alfa/2)
li <- qnorm(1-alfa/2)
x1 <- mean(actual)
x1
## [1] 19.10233
x2 <- mean(regresion)
x2
## [1] 16.89167
x3 <- mean(arbol)
x3
## [1] 21.034
x4 <- mean(redn)
x4
## [1] 20.756
n1 <- length(actual)
n1
## [1] 30
n2 <- length(regresion)
n2
## [1] 30
n3 <- length(arbol)
n3
## [1] 30
n4 <- length(redn)
n4
## [1] 30
sigma1 <-sd(actual)
sigma1
## [1] 1.729648
sigma2 <-sd(regresion)
sigma2
## [1] 1.103312
sigma3 <-sd(arbol)
sigma3
## [1] 1.705609
sigma4 <-sd(redn)
sigma4
## [1] 2.224344
Zo <- (x1-x2)/sqrt(((sigma1*sigma1)/n1)+((sigma2*sigma2)/n2))
Zo
## [1] 5.901951
Z1 <- (x1-x3)/sqrt(((sigma1*sigma1)/n1)+((sigma3*sigma3)/n2))
Z1
## [1] -4.3555
Z2 <- (x1-x4)/sqrt(((sigma1*sigma1)/n1)+((sigma4*sigma4)/n2))
Z2
## [1] -3.214512
En este caso para todos los modelos que son de regresion Zo(5.901951), arbol Z1(-4.3555) y RedN Z2(-3.214512) si rechazamos la hipotesis nula.