En una empresa de manufactura se propone un tratamiento para reducir el porcentaje de productos defectuosos. Para validar esta propuesta se diseñó un experimento en el que se producía con o sin la propuesta de mejora. Cada corrida experimental consistió en producir un lote y la variable de respuesta es el porcentaje de producto defectuoso. Se hicieron 25 réplicas para cada tratamiento. Los datos obtenidos se muestran a continuación1:
| Con tratamiento | 5.3 | 4.0 | 4.0 | 4.0 | 2.6 | 2.1 | 5.1 | 4.1 | 4.1 | 3.2 | 5.1 | 2.2 | 4.1 |
| 2.2 | 1.1 | 2.0 | 3.0 | 3.1 | 2.1 | 1.2 | 3.3 | 2.1 | 4.0 | 2.0 | 3.0 | ||
| —— | —— | —– | —– | —– | —– | —– | —– | —– | —– | —– | —– | —– | —— |
| Sin tratamiento | 8.0 | 13.2 | 7.2 | 8.2 | 9.1 | 6.7 | 12.2 | 16.3 | 9.2 | 6.4 | 7.2 | 17.2 | 12.3 |
| 8.7 | 11.2 | 4.5 | 6.6 | 9.2 | 10.2 | 10.6 | 13.3 | 5.2 | 6.2 | 8.0 | 4.8 |
¿Las diferencias son significativas estadísticamente?
¿Cuál es el porcentaje de defectos que se espera con el nuevo tratamiento?
Cuantifique el nivel de reducción que se logró con el tratamiento propuesto.
Para responder a esta pregunta, se realizará una prueba de hipótesis para comparar las medias de ambos tratamientos. La hipótesis nula es que las medias son iguales y la hipótesis alternativa es que las medias son diferentes. Se utilizará una prueba t para muestras independientes.
Primero, formulamos las hipotesis nula y alternativa:
Donde \(\mu_1\) es la media del porcentaje de productos defectuosos con tratamiento y \(\mu_2\) es la media del porcentaje de productos defectuosos sin tratamiento.
A continuación, se realiza la prueba de hipótesis:
# Datos
con_tratamiento <- c(5.3, 4.0, 4.0, 4.0, 2.6, 2.1, 5.1, 4.1, 4.1, 3.2,
5.1, 2.2, 4.1, 2.2, 1.1, 2.0, 3.0, 3.1, 2.1, 1.2,
3.3, 2.1, 4.0, 2.0, 3.0)
sin_tratamiento <- c(8.0, 13.2, 7.2, 8.2, 9.1, 6.7, 12.2, 16.3, 9.2,
6.4, 7.2, 17.2, 12.3, 8.7, 11.2, 4.5, 6.6, 9.2,
10.2, 10.6, 13.3, 5.2, 6.2, 8.0, 4.8)
# Prueba de hipótesis
t.test(con_tratamiento, sin_tratamiento, var.equal = TRUE)
##
## Two Sample t-test
##
## data: con_tratamiento and sin_tratamiento
## t = -8.5519, df = 48, p-value = 3.269e-11
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -7.544055 -4.671945
## sample estimates:
## mean of x mean of y
## 3.160 9.268
El resultado de la prueba de hipótesis es el siguiente:
Para estimar el porcentaje de defectos que se espera con el nuevo tratamiento, se calcula la media de los porcentajes de productos defectuosos con tratamiento.
# Media del porcentaje de productos defectuosos con tratamiento
mean(con_tratamiento)
## [1] 3.16
El porcentaje de defectos que se espera con el nuevo tratamiento es aproximadamente 3.16%.
Para cuantificar el nivel de reducción que se logró con el tratamiento propuesto, se calcula la diferencia entre las medias de los porcentajes de productos defectuosos con y sin tratamiento.
# Diferencia en medias
nivel_reduct<-mean(sin_tratamiento) - mean(con_tratamiento)
nivel_reduct
## [1] 6.108
El nivel de reducción que se logró con el tratamiento propuesto es aproximadamente 6.108 %. Esta es una reducción significativa en el porcentaje de productos defectuosos.
# Gráfico de cajas y bigotes
boxplot(con_tratamiento, sin_tratamiento,
names = c("Con tratamiento", "Sin tratamiento"),
col = c("lightblue", "lightgreen"),
ylab = "Porcentaje de productos defectuosos",
main = "Porcentaje de productos defectuosos con y sin tratamiento")
# Histograma
# Definir la función
plot_histograms <- function(con_tratamiento, sin_tratamiento) {
# Crear una ventana de gráficos con dos columnas
par(mfrow = c(1, 2))
# Histograma con tratamiento
hist(con_tratamiento, col = "lightblue",
main = "Con Tratamiento",
xlab = "Porcentaje de productos defectuosos",
ylab = "Frecuencia")
# Histograma sin tratamiento
hist(sin_tratamiento, col = "lightgreen",
main = "Sin Tratamiento",
xlab = "Porcentaje de productos defectuosos",
ylab = "Frecuencia")
# Restaurar configuración original
par(mfrow = c(1, 1))
}
# Llamar a la función con tus datos
plot_histograms(con_tratamiento, sin_tratamiento)
Los gráficos muestran que el porcentaje de productos defectuosos con tratamiento es significativamente más bajo que el porcentaje de productos defectuosos sin tratamiento. El histograma y el gráfico de cajas y bigotes también ilustran claramente esta diferencia.
Ejercicio extraido del libro Análisis y diseño de experimentos.
Gutiérrez Pulido, H., & Vara Salazar, R. d. l. (2012). Análisis y diseño de experimentos (3a. ed. --.). México D.F.: McGrawHill.↩︎