Un Data scientest ha diseñado un modelo de analítica prescriptiva para reducir el tiempo de fallas de las máquinas de un proceso de elaboración de galletas. El científico ha validado efectivamente su modelo de analítica contra la información del sistema de mantenimiento empleado en el centro de atención por lo que ahora se encuentra concentrado en probar tres alternativas de mejora que ha diseñado para concluir cuál de ellas debería implementar.

En la tabla siguiente se muestran 30 réplicas tanto del modelo de mantenimiento actual y las tres diferentes propuestas de mejora que ha logrado proponer. Con base en esta información y mostrando todo el procedimiento respectivo que sustente su respuesta indique cual debe ser la conclusión del científico. ¿Qué propuesta debería implementarse? (Considere un nivel de significancia de 5%)

Base de datos

##    ÁrbolC Red_N Regresion SActual
## 1   23.81 23.24     16.13   17.09
## 2   22.13 20.08     17.84   15.77
## 3   22.64 18.01     18.28   18.45
## 4   21.69 23.28     15.61   16.55
## 5   23.58 19.23     17.62   22.23
## 6   22.14 21.22     16.12   22.11
## 7   18.73 21.47     17.29   18.26
## 8   21.59 20.60     16.13   18.04
## 9   20.36 21.11     16.64   19.66
## 10  20.53 21.27     15.03   19.76
## 11  20.11 21.03     18.16   18.74
## 12  20.34 17.34     16.82   19.02
## 13  19.19 22.80     17.44   18.54
## 14  22.92 21.85     16.76   16.70
## 15  18.65 17.85     17.26   17.57
## 16  20.60 23.15     15.55   19.89
## 17  19.83 19.57     17.49   19.06
## 18  20.09 19.56     18.42   18.70
## 19  19.43 20.79     17.54   19.39
## 20  22.06 18.04     17.13   19.68
## 21  21.15 20.95     15.50   19.20
## 22  19.26 21.83     16.80   16.85
## 23  18.08 18.17     18.47   19.91
## 24  20.24 22.66     18.42   19.82
## 25  18.75 18.29     18.43   18.08
## 26  20.69 18.89     15.56   19.38
## 27  21.62 19.49     16.03   20.30
## 28  23.69 19.19     15.39   21.60
## 29  23.93 26.47     15.12   23.39
## 30  23.19 25.25     17.77   19.33

boxplot

Como se aprecia en el Grafico no se toman los metodos de Regresion y Sistema Actual ya que tienen menos valores. Por lo tanto nos centraremos en los metodos de Árbol de clasificación y Redes neuronales.

Prueba de hipotesis

Paso 1: Parametro de interes
media del nivel precision de los metodos

Paso 2: Establecer la hipótesis nula H0
µRL - µRN = 0

Paso 3: Especificar la hipótesis alternativa H1
µRL - µRN ≠ 0

Paso 4: Elegir el nivel de significación
α = 5%

Paso 5: Establecer un estadístico de la prueba apropiado

𝑍_𝑜=((𝑥 ̅1−𝑥2)−(𝜇1−𝑢2))/((𝜎1/𝑛1+𝜎2/𝑛2)^0.5)

Paso 6: Establecer la región de rechazo del estadístico

Zα/2 = -1.95996

Z1-α/2 = 1.95996

Paso 7: Calcular las cantidades muestrales necesarias, sustituirlas en la ecuación del estadístico de prueba, y calcular ese valor

X1 = 21.03400 X2 = 20.7560

S1 = 1.70561 S2 = 2.2243

n1 = 30 n2 = 30

Zo = 0.768089362

Paso 8: Decidir si deberá rechazarse o no H0 y contextualizar

Se acepta la hipotesis nula H0. Por lo tanto la propuesta de Arbol de clasificacion es semejante a la propuesta de Red neuronal.