Diseño y análisis de experimentos

Ejercicio 14

En una empresa de manufactura se propone un tratamiento para reducir el porcentaje de productos defectuosos. Para validar esta propuesta se diseñó un experimento en el que se producía con o sin la propuesta de mejora. Cada corrida experimental consistió en producir un lote y la variable de respuesta es el porcentaje de producto defectuoso. Se hicieron 25 réplicas para cada tratamiento. Los datos obtenidos se muestran a continuación1:

Con tratamiento 5.3 4.0 4.0 4.0 2.6 2.1 5.1 4.1 4.1 3.2 5.1 2.2 4.1
2.2 1.1 2.0 3.0 3.1 2.1 1.2 3.3 2.1 4.0 2.0 3.0
—— —— —– —– —– —– —– —– —– —– —– —– —– ——
Sin tratamiento 8.0 13.2 7.2 8.2 9.1 6.7 12.2 16.3 9.2 6.4 7.2 17.2 12.3
8.7 11.2 4.5 6.6 9.2 10.2 10.6 13.3 5.2 6.2 8.0 4.8
  1. ¿Las diferencias son significativas estadísticamente?

  2. ¿Cuál es el porcentaje de defectos que se espera con el nuevo tratamiento?

  3. Cuantifique el nivel de reducción que se logró con el tratamiento propuesto.

Solución

  1. ¿Las diferencias son significativas estadísticamente?

Para responder a esta pregunta, se realizará una prueba de hipótesis para comparar las medias de ambos tratamientos. La hipótesis nula es que las medias son iguales y la hipótesis alternativa es que las medias son diferentes. Se utilizará una prueba t para muestras independientes.

Primero, formulamos las hipotesis nula y alternativa:

  • Hipótesis nula: \(H_0: \mu_1 = \mu_2\) (las medias son iguales).
  • Hipótesis alternativa: \(H_1: \mu_1 \neq \mu_2\) (las medias son diferentes).

Donde \(\mu_1\) es la media del porcentaje de productos defectuosos con tratamiento y \(\mu_2\) es la media del porcentaje de productos defectuosos sin tratamiento.

A continuación, se realiza la prueba de hipótesis:

# Datos
con_tratamiento <- c(5.3, 4.0, 4.0, 4.0, 2.6, 2.1, 5.1, 4.1, 4.1, 3.2, 
                     5.1, 2.2, 4.1, 2.2, 1.1, 2.0, 3.0, 3.1, 2.1, 1.2, 
                     3.3, 2.1, 4.0, 2.0, 3.0)
sin_tratamiento <- c(8.0, 13.2, 7.2, 8.2, 9.1, 6.7, 12.2, 16.3, 9.2, 
                     6.4, 7.2, 17.2, 12.3, 8.7, 11.2, 4.5, 6.6, 9.2, 
                     10.2, 10.6, 13.3, 5.2, 6.2, 8.0, 4.8)

# Prueba de hipótesis
t.test(con_tratamiento, sin_tratamiento, var.equal = TRUE)
## 
##  Two Sample t-test
## 
## data:  con_tratamiento and sin_tratamiento
## t = -8.5519, df = 48, p-value = 3.269e-11
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -7.544055 -4.671945
## sample estimates:
## mean of x mean of y 
##     3.160     9.268

El resultado de la prueba de hipótesis es el siguiente:

  • Con base en el valor p extremadamente bajo (3.269e-11), hay evidencia estadística significativa para concluir que hay una diferencia significativa en el porcentaje de productos defectuosos entre los grupos con tratamiento y sin tratamiento.
  • El intervalo de confianza del 95% para la diferencia en medias no incluye cero, lo que respalda la evidencia en contra de la hipótesis nula.
  • Las medias estimadas sugieren que, en promedio, el grupo con tratamiento tiene un porcentaje de productos defectuosos significativamente más bajo que el grupo sin tratamiento.
  1. ¿Cuál es el porcentaje de defectos que se espera con el nuevo tratamiento?

Para estimar el porcentaje de defectos que se espera con el nuevo tratamiento, se calcula la media de los porcentajes de productos defectuosos con tratamiento.

# Media del porcentaje de productos defectuosos con tratamiento
mean(con_tratamiento)
## [1] 3.16

El porcentaje de defectos que se espera con el nuevo tratamiento es aproximadamente 3.16%.

  1. Cuantifique el nivel de reducción que se logró con el tratamiento propuesto.

Para cuantificar el nivel de reducción que se logró con el tratamiento propuesto, se calcula la diferencia entre las medias de los porcentajes de productos defectuosos con y sin tratamiento.

# Diferencia en medias
nivel_reduct<-mean(sin_tratamiento) - mean(con_tratamiento)
nivel_reduct
## [1] 6.108

El nivel de reducción que se logró con el tratamiento propuesto es aproximadamente 6.108 %. Esta es una reducción significativa en el porcentaje de productos defectuosos.

Gráficos

# Gráfico de cajas y bigotes
boxplot(con_tratamiento, sin_tratamiento, 
        names = c("Con tratamiento", "Sin tratamiento"), 
        col = c("lightblue", "lightgreen"), 
        ylab = "Porcentaje de productos defectuosos", 
        main = "Porcentaje de productos defectuosos con y sin tratamiento")

# Histograma

# Definir la función
plot_histograms <- function(con_tratamiento, sin_tratamiento) {
  # Crear una ventana de gráficos con dos columnas
  par(mfrow = c(1, 2))

  # Histograma con tratamiento
  hist(con_tratamiento, col = "lightblue", 
       main = "Con Tratamiento", 
       xlab = "Porcentaje de productos defectuosos", 
       ylab = "Frecuencia")

  # Histograma sin tratamiento
  hist(sin_tratamiento, col = "lightgreen", 
       main = "Sin Tratamiento", 
       xlab = "Porcentaje de productos defectuosos", 
       ylab = "Frecuencia")

  # Restaurar configuración original
  par(mfrow = c(1, 1))
}

# Llamar a la función con tus datos
plot_histograms(con_tratamiento, sin_tratamiento)

Los gráficos muestran que el porcentaje de productos defectuosos con tratamiento es significativamente más bajo que el porcentaje de productos defectuosos sin tratamiento. El histograma y el gráfico de cajas y bigotes también ilustran claramente esta diferencia.


  1. Ejercicio extraido del libro Análisis y diseño de experimentos.

    Gutiérrez Pulido, H., & Vara Salazar, R. d. l. (2012). Análisis y diseño de experimentos (3a. ed. --.). México D.F.: McGrawHill.↩︎