1. Introducción

En la tabla siguiente se muestran 30 réplicas del modelo de mantenimiento actual y de las tres diferentes propuestas de mejora. Con base en esta información y mostrando todo el procedimiento respectivo que sustente su respuesta indique cual debe ser la conclusión del científico. ¿Qué propuesta debería implementarse? (considere un nivel de significancia de 5%).

2. Datos

arbol <-c(23.81,    22.13,  22.64,  21.69,  23.58,  22.14,  18.73,  21.59,
          20.36,    20.53,  20.11,  20.34,  19.19,  22.92,  18.65,  20.6,
          19.83,    20.09,  19.43,  22.06,  21.15,  19.26,  18.08,  20.24,
          18.75,    20.69,  21.62,  23.69,  23.93,  23.19)

redn <-c(23.24, 20.08,  18.01,  23.28,  19.23,  21.22,  21.47,  20.6,
         21.11, 21.27,  21.03,  17.34,  22.8,   21.85,  17.85,  23.15,
         19.57, 19.56,  20.79,  18.04,  20.95,  21.83,  18.17,  22.66,
         18.29, 18.89,  19.49,  19.19,  26.47,  25.25)

regresion <-c(16.13,    17.84,  18.28,  15.61,  17.62,  16.12,  17.29,  16.13,
              16.64,    15.03,  18.16,  16.82,  17.44,  16.76,  17.26,  15.55,
              17.49,    18.42,  17.54,  17.13,  15.5,    16.8,  18.47,  18.42, 
              18.43,    15.56,  16.03,  15.39,  15.12, 17.77)

actual <-c(17.09,   15.77,  18.45,  16.55,  22.23,  22.11,  18.26,  18.04,  
           19.66,   19.76,  18.74,  19.02,  18.54,  16.7,   17.57,  19.89,
           19.06,   18.7,   19.39,  19.68,  19.2,   16.85,  19.91,  19.82,  18.08,
           19.38,   20.3,   21.6,   23.39,  19.33)

data  <- data.frame(AClasificacion=arbol, RNeuronal=redn, Regresion=regresion, SActual=actual)

print(data)
##    AClasificacion RNeuronal Regresion SActual
## 1           23.81     23.24     16.13   17.09
## 2           22.13     20.08     17.84   15.77
## 3           22.64     18.01     18.28   18.45
## 4           21.69     23.28     15.61   16.55
## 5           23.58     19.23     17.62   22.23
## 6           22.14     21.22     16.12   22.11
## 7           18.73     21.47     17.29   18.26
## 8           21.59     20.60     16.13   18.04
## 9           20.36     21.11     16.64   19.66
## 10          20.53     21.27     15.03   19.76
## 11          20.11     21.03     18.16   18.74
## 12          20.34     17.34     16.82   19.02
## 13          19.19     22.80     17.44   18.54
## 14          22.92     21.85     16.76   16.70
## 15          18.65     17.85     17.26   17.57
## 16          20.60     23.15     15.55   19.89
## 17          19.83     19.57     17.49   19.06
## 18          20.09     19.56     18.42   18.70
## 19          19.43     20.79     17.54   19.39
## 20          22.06     18.04     17.13   19.68
## 21          21.15     20.95     15.50   19.20
## 22          19.26     21.83     16.80   16.85
## 23          18.08     18.17     18.47   19.91
## 24          20.24     22.66     18.42   19.82
## 25          18.75     18.29     18.43   18.08
## 26          20.69     18.89     15.56   19.38
## 27          21.62     19.49     16.03   20.30
## 28          23.69     19.19     15.39   21.60
## 29          23.93     26.47     15.12   23.39
## 30          23.19     25.25     17.77   19.33

3. Análisis exploratorio de los datos

3.1. Media de los datos

sapply(data, mean, na.rm=TRUE)
## AClasificacion      RNeuronal      Regresion        SActual 
##       21.03400       20.75600       16.89167       19.10233

3.2. Boxplot de los datos

boxplot(data)

  • Se observa que la media del modelo de Regresión es menor que la media del Sistema Actual.
  • Además, se observa que las medias de los modelos de Árbol de Clasificación y Redes neuronales son parecidas.

4. Inferencia sobre la diferencia de medias

4.1. Sistema actual vs. Árbol de clasificación

4.1.1 Identificar parámetros de interés

  • Variable de interés: Media del tiempo de fallo de las máquinas de un proceso de elaboración de galletas.

4.1.2. Establecer la hipótesis nula

H0 <- 0
  • H0: mu(Sistema actual) - mu(Árbol de clasificación) = 0
  • Las medias de los modelos son iguales.

4.1.3. Establecer la hipótesis alternativa

  • H1: mu(Sistema actual) - mu(Árbol de clasificación) ≠ 0
  • Las medias de los modelos son distintas.

4.1.4. Elegir el nivel de significancia

alfa <- 0.05
  • Un nivel de significancia de 5%.

4.1.5. Calcular las cantidades muestrales necesarias y sustituirlas en la ecuación del estadístico de prueba

estat <- function(data1,data2,H0,alfa){
  x1 <- mean(data1)
  s1 <- var(data1)^.5
  n1 <- length(data1)

  x2 <- mean(data2)
  s2 <- var(data2)^.5
  n2 <- length(data2)

  Z0 <- ((x1-x2)-(H0))/((s1/n1+s2/n2)^.5)
  
  LI <- qnorm(alfa/2)
  LS <- qnorm(1-alfa/2)
  
  if(Z0 <= LS & Z0>=LI)
  {
    print(paste("No existe evidencia suficiente para rechazar la hipótesis nula H0: mu(Modelo 1) - mu(Modelo 2) =",H0))
  } else
  {
    print(paste("Se rechaza la hipótesis nula H0: mu(Modelo 1) - mu(Modelo 2) =",H0))
  }
  
}

estat(data$SActual,data$AClasificacion,H0,alfa)
## [1] "Se rechaza la hipótesis nula H0: mu(Modelo 1) - mu(Modelo 2) = 0"

4.2. Sistema actual vs. Redes neuronales

4.2.1 Identificar parámetros de interés

  • Variable de interés: Media del tiempo de fallo de las máquinas de un proceso de elaboración de galletas.

4.2.2. Establecer la hipótesis nula

H0 <- 0
  • H0: mu(Sistema actual) - mu(Redes neuronales) = 0
  • Las medias de los modelos son iguales.

4.2.3. Establecer la hipótesis alternativa

  • H1: mu(Sistema actual) - mu(Redes neuronales) ≠ 0
  • Las medias de los modelos son distintas.

4.2.4. Elegir el nivel de significancia

alfa <- 0.05
  • Un nivel de significancia de 5%.

4.2.5. Calcular las cantidades muestrales necesarias y sustituirlas en la ecuación del estadístico de prueba

estat(data$SActual,data$RNeuronal,H0,alfa)
## [1] "Se rechaza la hipótesis nula H0: mu(Modelo 1) - mu(Modelo 2) = 0"

4.3. Sistema actual vs. Regresión

4.3.1 Identificar parámetros de interés

  • Variable de interés: Media del tiempo de fallo de las máquinas de un proceso de elaboración de galletas.

4.3.2. Establecer la hipótesis nula

H0 <- 0
  • H0: mu(Sistema actual) - mu(Regresión) = 0
  • Las medias de los modelos son iguales.

4.3.3. Establecer la hipótesis alternativa

  • H1: mu(Sistema actual) - mu(Regresión) ≠ 0
  • Las medias de los modelos son distintas.

4.3.4. Elegir el nivel de significancia

alfa <- 0.05
  • Un nivel de significancia de 5%.

4.3.5. Calcular las cantidades muestrales necesarias y sustituirlas en la ecuación del estadístico de prueba

estat(data$SActual,data$Regresion,H0,alfa)
## [1] "Se rechaza la hipótesis nula H0: mu(Modelo 1) - mu(Modelo 2) = 0"

4.4. Árbol de clasificación vs. Redes neuronales

4.4.1 Identificar parámetros de interés

  • Variable de interés: Media del tiempo de fallo de las máquinas de un proceso de elaboración de galletas.

4.4.2. Establecer la hipótesis nula

H0 <- 0
  • H0: mu(Árbol de clasificación) - mu(Redes neuronales) = 0
  • Las medias de los modelos son iguales.

4.4.3. Establecer la hipótesis alternativa

  • H1: mu(Árbol de clasificación) - mu(Redes neuronales) ≠ 0
  • Las medias de los modelos son distintas.

4.4.4. Elegir el nivel de significancia

alfa <- 0.05
  • Un nivel de significancia de 5%.

4.4.5. Calcular las cantidades muestrales necesarias y sustituirlas en la ecuación del estadístico de prueba

estat(data$AClasificacion,data$RNeuronal,H0,alfa)
## [1] "No existe evidencia suficiente para rechazar la hipótesis nula H0: mu(Modelo 1) - mu(Modelo 2) = 0"

5. Conclusiones