Taller 2

Un Data scientest ha diseñado un modelo de analítica prescriptiva para reducir el tiempo de fallas de las máquinas de un proceso de elaboración de galletas. El científico ha validado efectivamente su modelo de analítica contra la información del sistema de mantenimiento empleado en el centro de atención por lo que ahora se encuentra concentrado en probar tres alternativas de mejora que ha diseñado para concluir cuál de ellas debería implementar. En la tabla siguiente se muestran 30 réplicas tanto del modelo de mantenimiento actual y las tres diferentes propuestas de mejora que ha logrado proponer. Con base en esta información y mostrando todo el procedimiento respectivo que sustente su respuesta indique cual debe ser la conclusión del científico. ¿Qué propuesta debería implementarse? (Considere un nivel de significancia de 5%)

arbol <-c(23.81,    22.13,  22.64,  21.69,  23.58,  22.14,  18.73,  21.59,
          20.36,    20.53,  20.11,  20.34,  19.19,  22.92,  18.65,  20.6,
          19.83,    20.09,  19.43,  22.06,  21.15,  19.26,  18.08,  20.24,
          18.75,    20.69,  21.62,  23.69,  23.93,  23.19)

redn <-c(23.24, 20.08,  18.01,  23.28,  19.23,  21.22,  21.47,  20.6,
         21.11, 21.27,  21.03,  17.34,  22.8,   21.85,  17.85,  23.15,
         19.57, 19.56,  20.79,  18.04,  20.95,  21.83,  18.17,  22.66,
         18.29, 18.89,  19.49,  19.19,  26.47,  25.25)

regresion <-c(16.13,    17.84,  18.28,  15.61,  17.62,  16.12,  17.29,  16.13,
              16.64,    15.03,  18.16,  16.82,  17.44,  16.76,  17.26,  15.55,
              17.49,    18.42,  17.54,  17.13,  15.5,    16.8,  18.47,  18.42, 
              18.43,    15.56,  16.03,  15.39,  15.12, 17.77)

actual <-c(17.09,   15.77,  18.45,  16.55,  22.23,  22.11,  18.26,  18.04,  
           19.66,   19.76,  18.74,  19.02,  18.54,  16.7,   17.57,  19.89,
           19.06,   18.7,   19.39,  19.68,  19.2,   16.85,  19.91,  19.82,  18.08,
           19.38,   20.3,   21.6,   23.39,  19.33)


data2  <- data.frame(ÁrbolC =arbol, Red_N = redn, Regresion = regresion, SActual = actual)

summary(data2)
##      ÁrbolC          Red_N         Regresion        SActual     
##  Min.   :18.08   Min.   :17.34   Min.   :15.03   Min.   :15.77  
##  1st Qu.:19.89   1st Qu.:19.20   1st Qu.:16.05   1st Qu.:18.12  
##  Median :20.64   Median :20.87   Median :16.98   Median :19.13  
##  Mean   :21.03   Mean   :20.76   Mean   :16.89   Mean   :19.10  
##  3rd Qu.:22.14   3rd Qu.:21.84   3rd Qu.:17.73   3rd Qu.:19.80  
##  Max.   :23.93   Max.   :26.47   Max.   :18.47   Max.   :23.39

Paso 1 : Identificar el parámetro de interés

En este caso el parámetro de interés es el “Tiempo de mantenimiento de los diferentes modelos” Acontinuación, se mostrará una grafica de BoxPlot para hacer un analísis visual de los datos de cada modelo

boxplot(data2, main = "Diagrama de BoxPlot", col = c("blue", "red", "green", "orange"), ylab = "Valores")
legend("topright", legend = c("ÁrbolC", "Red_N", "Regresion", "SActual"), col = c("blue", "red", "green", "orange"), pch = 15)

Paso 2: Establecer la hipotesis nula Ho

Ho=m1-m2 = 0

m1: media SActual m2:media de los demás modelos (Arbol,RedN y Regresión)

Paso 3: Establecer la hipotesis alternativa H1

H1=m1-m2 ≠ 0

m1: media SActual m2:media de los demás modelos (Arbol,RedN y Regresión)

Paso 4: Elegir el nivel de significación

Para este caso nos indican usar un nivel de significancia 5%

alfa <- 0.05

Paso 5: Estadistico de prueba adecuado

Zo = ((x1-x2)-(m1-m2))/sqtr(((sigma12)/n1)+((sigma22)/n2)) (SActual vs Regresion)

Z1 = (x1-x3)-(m1-m2))/sqtr(((sigma12)/n1)+((sigma32)/n3)) (SActual vs Arbol)

Z3 = ((x1-x4)-(m1-m2))/sqtr(((sigma12)/n1)+((sigma42)/n4)) (SActual vs RedN)

Donde: x1 = media actual x2 = media de regresión m1 - m2 = 0 sigma1 = desviación estandar 1 sigma2= desviación estandar 2, sigma3 = desviacion estandar 3 sigma4= desviacion estandar 4 n(1,2,3 y 4) = total de muestra =30

Paso 6: Establecer la región de rechazo del estadístico

# Limite Superior = qnorm(alfa/2)
ls <- qnorm(alfa/2)
# Limite Inferior = qnorm(q-alfa/2)
li <- qnorm(1-alfa/2)

Paso 7: Valores muestrales para el cálculo de nuestro modelo

x1 <- mean(actual)
x1
## [1] 19.10233
x2 <- mean(regresion)
x2
## [1] 16.89167
x3 <- mean(arbol)
x3
## [1] 21.034
x4 <- mean(redn)
x4
## [1] 20.756
n1 <- length(actual)
n1
## [1] 30
n2 <- length(regresion)
n2
## [1] 30
n3 <- length(arbol)
n3
## [1] 30
n4 <- length(redn)
n4
## [1] 30
sigma1 <-sd(actual)
sigma1
## [1] 1.729648
sigma2 <-sd(regresion)
sigma2
## [1] 1.103312
sigma3 <-sd(arbol)
sigma3
## [1] 1.705609
sigma4 <-sd(redn)
sigma4
## [1] 2.224344

Paso 8: Resultados de cada valor estadistico Z

Zo <- (x1-x2)/sqrt(((sigma1*sigma1)/n1)+((sigma2*sigma2)/n2))
Zo
## [1] 5.901951
Z1 <- (x1-x3)/sqrt(((sigma1*sigma1)/n1)+((sigma3*sigma3)/n2))
Z1
## [1] -4.3555
Z2 <- (x1-x4)/sqrt(((sigma1*sigma1)/n1)+((sigma4*sigma4)/n2))
Z2
## [1] -3.214512

Paso 9: Decidir si Aceptas o Rechazas la Ho

En este caso para todos los modelos que son de regresion Zo(5.901951), arbol Z1(-4.3555) y RedN Z2(-3.214512) si rechazamos la hipotesis nula.