R Markdown

Autores: - BRUNO STEFFANO JIMENEZ GALINDO - CARLOS HUMBERTO DE LA CRUZ CHAVEZ - DIEGO FARID ENCISO SAMAME - CARLOS ABAD VASQUEZ - FABRICIO DANIEL RAMOS MARIÑO

Un Data scientest ha diseñado un modelo de analítica prescriptiva para reducir el tiempo de fallas de las máquinas de un proceso de elaboración de galletas. El científico ha validado efectivamente su modelo de analítica contra la información del sistema de mantenimiento empleado en el centro de atención por lo que ahora se encuentra concentrado en probar tres alternativas de mejora que ha diseñado para concluir cuál de ellas debería implementar. En la tabla siguiente se muestran 30 réplicas tanto del modelo de mantenimiento actual y las tres diferentes propuestas de mejora que ha logrado proponer. Con base en esta información y mostrando todo el procedimiento respectivo que sustente su respuesta indique cual debe ser la conclusión del científico. ¿Qué propuesta debería implementarse? (Considere un nivel de significancia de 5%)

##    ÁrbolC Red_N Regresion SActual
## 1   23.81 23.24     16.13   17.09
## 2   22.13 20.08     17.84   15.77
## 3   22.64 18.01     18.28   18.45
## 4   21.69 23.28     15.61   16.55
## 5   23.58 19.23     17.62   22.23
## 6   22.14 21.22     16.12   22.11
## 7   18.73 21.47     17.29   18.26
## 8   21.59 20.60     16.13   18.04
## 9   20.36 21.11     16.64   19.66
## 10  20.53 21.27     15.03   19.76
## 11  20.11 21.03     18.16   18.74
## 12  20.34 17.34     16.82   19.02
## 13  19.19 22.80     17.44   18.54
## 14  22.92 21.85     16.76   16.70
## 15  18.65 17.85     17.26   17.57
## 16  20.60 23.15     15.55   19.89
## 17  19.83 19.57     17.49   19.06
## 18  20.09 19.56     18.42   18.70
## 19  19.43 20.79     17.54   19.39
## 20  22.06 18.04     17.13   19.68
## 21  21.15 20.95     15.50   19.20
## 22  19.26 21.83     16.80   16.85
## 23  18.08 18.17     18.47   19.91
## 24  20.24 22.66     18.42   19.82
## 25  18.75 18.29     18.43   18.08
## 26  20.69 18.89     15.56   19.38
## 27  21.62 19.49     16.03   20.30
## 28  23.69 19.19     15.39   21.60
## 29  23.93 26.47     15.12   23.39
## 30  23.19 25.25     17.77   19.33

En el gráfico de boxplot se observa que las variables ÁrbolC y Red_N presentan medias superiores a las del algoritmo actual. En contraste, el algoritmo de Regresión muestra una media inferior a la del algoritmo vigente.

Por este motivo, se considerará como variables de estudio únicamente ÁrbolC y Red_N, al evidenciar un mejor desempeño comparativo.

##      ÁrbolC          Red_N         Regresion        SActual     
##  Min.   :18.08   Min.   :17.34   Min.   :15.03   Min.   :15.77  
##  1st Qu.:19.89   1st Qu.:19.20   1st Qu.:16.05   1st Qu.:18.12  
##  Median :20.64   Median :20.87   Median :16.98   Median :19.13  
##  Mean   :21.03   Mean   :20.76   Mean   :16.89   Mean   :19.10  
##  3rd Qu.:22.14   3rd Qu.:21.84   3rd Qu.:17.73   3rd Qu.:19.80  
##  Max.   :23.93   Max.   :26.47   Max.   :18.47   Max.   :23.39

En ese contexto, se plantea como hipótesis nula que la media de la algoritmo Arbol_C(μ₁) es igual a la media del algoritmo Red_N (μ₀), y como hipótesis alternativa que la media de la algoritmo Arbol_C es mayor que la media del algoritmo Red_N

Se formulan las siguientes hipótesis:

H₀: μ₁ = μ₀

H₁: μ₁ > μ₀

Se obtiene la desviación estándar de las variables de estudio, dado que se trabaja con una muestra reducida de 30 datos para cada una el cual es igual a la población. En este contexto, la varianza muestral es igual a la varianza poblacional, por lo que se asume la desviación estandar se utilizaria para este caso

##   ÁrbolC 
## 1.705609

Se determina el valor muestral de cada una de las variables en estudio.

## [1] 0.879897

Graficamos la región de rechazo y marcamos en el gráfico los valores muestrales calculados de cada variable de estudio.

Se observa que el valor muestral se encuentran dentro de la zona de no rechazo, por lo que se deduce que no se rechazaría la hipótesis nula, es decir, no existe diferencia significativa entre las medias de ambos algoritmos.

## ÁrbolC  Red_N 
## 21.034 20.756

La media del algoritmo ÁrbolC es superior a la media del algoritmo Red_N.

CONCLUSIÓN:

No se encontraron evidencias estadísticamente significativas para rechazar la hipótesis nula, lo que indica que las diferencias observadas entre los algoritmos Árbol_C y Red-N podrían considerarse desempeño promedio similar. Sin embargo, desde una perspectiva descriptiva, el algoritmo Árbol_C presentó una media superior a la de Red-N, por lo que se recomendaría su implementación en este caso.