Un Data scientest ha diseñado un modelo de analítica prescriptiva para reducir el tiempo de fallas de las máquinas de un proceso de elaboración de galletas. El científico ha validado efectivamente su modelo de analítica contra la información del sistema de mantenimiento empleado en el centro de atención por lo que ahora se encuentra concentrado en probar tres alternativas de mejora que ha diseñado para concluir cuál de ellas debería implementar. En la tabla siguiente se muestran 30 réplicas tanto del modelo de mantenimiento actual y las tres diferentes propuestas de mejora que ha logrado proponer. Con base en esta información y mostrando todo el procedimiento respectivo que sustente su respuesta indique cual debe ser la conclusión del científico. ¿Qué propuesta debería implementarse? (Considere un nivel de significancia de 5%)

Agregamos los datos:

arbol <-c(23.81,    22.13,  22.64,  21.69,  23.58,  22.14,  18.73,  21.59,
          20.36,    20.53,  20.11,  20.34,  19.19,  22.92,  18.65,  20.6,
          19.83,    20.09,  19.43,  22.06,  21.15,  19.26,  18.08,  20.24,
          18.75,    20.69,  21.62,  23.69,  23.93,  23.19)

redn <-c(23.24, 20.08,  18.01,  23.28,  19.23,  21.22,  21.47,  20.6,
         21.11, 21.27,  21.03,  17.34,  22.8,   21.85,  17.85,  23.15,
         19.57, 19.56,  20.79,  18.04,  20.95,  21.83,  18.17,  22.66,
         18.29, 18.89,  19.49,  19.19,  26.47,  25.25)

regresion <-c(16.13,    17.84,  18.28,  15.61,  17.62,  16.12,  17.29,  16.13,
              16.64,    15.03,  18.16,  16.82,  17.44,  16.76,  17.26,  15.55,
              17.49,    18.42,  17.54,  17.13,  15.5,    16.8,  18.47,  18.42, 
              18.43,    15.56,  16.03,  15.39,  15.12, 17.77)

actual <-c(17.09,   15.77,  18.45,  16.55,  22.23,  22.11,  18.26,  18.04,  
           19.66,   19.76,  18.74,  19.02,  18.54,  16.7,   17.57,  19.89,
           19.06,   18.7,   19.39,  19.68,  19.2,   16.85,  19.91,  19.82,  18.08,
           19.38,   20.3,   21.6,   23.39,  19.33)

data2  <- data.frame(ÁrbolC =arbol, Red_N = redn, Regresion = regresion, SActual = actual)

Calculamos los estadisticos

Media

mean_actual <- mean(actual)
mean_arbol <- mean(arbol)
mean_redn <- mean(redn)
mean_regresion <- mean(regresion)

cat("Media Actual: ", round(mean_actual, 2), "\n")
## Media Actual:  19.1
cat("Media Árbol: ", round(mean_arbol, 2), "\n")
## Media Árbol:  21.03
cat("Media Red Neuronal: ", round(mean_redn, 2), "\n")
## Media Red Neuronal:  20.76
cat("Media Regresión: ", round(mean_regresion, 2), "\n")
## Media Regresión:  16.89

Varianza

var_actual <- var(actual)
var_arbol <- var(arbol)
var_redn <- var(redn)
var_regresion <- var(regresion)

cat("Varianza Actual:    ", round(var_actual, 4), "\n")
## Varianza Actual:     2.9917
cat("Varianza Árbol:     ", round(var_arbol, 4), "\n")
## Varianza Árbol:      2.9091
cat("Varianza Red_N:     ", round(var_redn, 4), "\n")
## Varianza Red_N:      4.9477
cat("Varianza Regresión: ", round(var_regresion, 4), "\n")
## Varianza Regresión:  1.2173

Determinamos el valor de Z

cuando α = 0.05

z_der <- qnorm(1 - 0.05/2)
z_izq  <- qnorm(0.05/2)
cat("Valor Z: ", round(z_der, 5), "\n") 
## Valor Z:  1.95996
cat("Valor Z: ", round(z_izq, 5))
## Valor Z:  -1.95996

si el valor z calculado está por fuera del rango -1.96 a 1.96, rechazamos h0

Comparacion del Actual y Regresion

# Cálculo de z
z <- (mean_actual - mean_regresion) / sqrt((var_actual/30) + (var_regresion/30))
z
## [1] 5.901951

Como z = 5.901951 > 1.96, rechazamos h0. Por lo tanto, existe evidencia suficiente para rechazar la hipótesis nula y concluir que la media del método de regresión es significativamente menor que la del modelo actual.

Comparacion del Actual y Arbol

# Cálculo de z
z <- (mean_actual - mean_arbol) / sqrt((var_actual/30) + (var_arbol/30))
z
## [1] -4.3555

Como z = -4.3555 > -1.96, rechazamos h0. Por lo tanto, existe evidencia suficiente para rechazar la hipótesis nula y concluir que la media del método de arbol es significativamente menor que la del modelo actual.

Comparacion del Actual y Redn

# Cálculo de z
z <- (mean_actual - mean_redn) / sqrt((var_actual/30) + (var_redn/30))
z
## [1] -3.214512

Como z = 3.214512 > -1.96, rechazamos h0. Por lo tanto, existe evidencia suficiente para rechazar la hipótesis nula y concluir que la media del método de redn es significativamente menor que la del modelo actual.

Recomendacion

Para implementar una propuesta estadistica no solo depende de la diferencia estadistica, tambien evaluar cual tiene mejor rendimiento respecto a la media.

Por tanto, la propuesta de regresión tiene:

La media más baja (~16.81).

Varianza más baja (consistente).

Y diferencia estadísticamente significativa respecto al modelo actual.