Una característica clave en la calidad de las pinturas es su densidad, y un componente que influye en ésta es la cantidad de arenas que se utilizan en su elaboración. La cantidad de arena en la formulación de un lote se controla por medio del número de costales, que según el proveedor contienen 20 kg. Sin embargo, continuamente se tienen problemas en la densidad de la pintura que es necesario corregir con retrabajo y reprocesos adicionales. En este contexto se decide investigar cuánta arena contienen en realidad los costales. Para ello, se toma una muestra aleatoria de 30 costales de cada lote o pedido (500 costales). Los pesos obtenidos en las muestras de los últimos tres lotes se muestran adelante. Las especificaciones iniciales que se establecen para el peso de los costales de arena son de 20 ± 0.8 kg.
Lote | Peso de costales de la muestra |
---|---|
1 | 18.6 19.2 19.5 19.2 18.9 19.4 19.0 20.0 19.3 20.0 19.1 18.6 19.4 18.7 21.0 19.8 19.0 18.6 19.6 19.0 19.6 19.4 19.8 19.1 20.0 20.4 18.8 19.3 19.1 19.1 |
2 | 18.6 19.9 18.8 18.4 19.0 20.1 19.7 19.3 20.7 19.6 19.5 19.1 18.5 19.6 19.4 19.6 20.3 18.8 19.2 20.6 20.0 18.4 18.9 19.7 17.8 19.4 18.9 18.4 19.0 19.7 |
3 | 20.1 20.2 21.0 19.7 20.1 20.0 19.1 20.4 19.6 20.6 20.0 19.7 20.8 19.7 19.7 20.4 19.8 20.5 20.0 20.0 20.2 19.7 20.0 19.6 19.7 19.8 19.9 20.3 20.4 20.2 |
Los códigos que se utilizan son:
lote <- rep (1:3,each=30)
l1 <- c(18.6, 19.2, 19.5, 19.2, 18.9, 19.4, 19.0, 20.0, 19.3, 20.0, 19.1, 18.6, 19.4, 18.7, 21.0, 19.8, 19.0, 18.6, 19.6, 19.0, 19.6, 19.4, 19.8, 19.1, 20.0, 20.4, 18.8, 19.3, 19.1, 19.1)
l2 <- c(18.6, 19.9, 18.8, 18.4, 19.0, 20.1, 19.7, 19.3, 20.7, 19.6, 19.5, 19.1, 18.5, 19.6, 19.4, 19.6, 20.3, 18.8, 19.2, 20.6, 20.0, 18.4, 18.9, 19.7, 17.8, 19.4, 18.9, 18.4, 19.0, 19.7)
l3 <- c(20.1, 20.2, 21.0, 19.7, 20.1, 20.0, 19.1, 20.4, 19.6, 20.6, 20.0, 19.7, 20.8, 19.7, 19.7, 20.4, 19.8, 20.5, 20.0, 20.0, 20.2, 19.7, 20.0, 19.6, 19.7, 19.8, 19.9, 20.3, 20.4, 20.2)
pesos <- c(l1,l2,l3)
df <- data.frame (lote,pesos)
media <- tapply(pesos, INDEX=lote, mean)
des <- tapply (pesos, INDEX=lote, sd)
n <- rep (30,3)
a <- des/sqrt(30)
dfdes <- round(rbind(media,des,n,a), 2)
rownames(dfdes) <- c("Media","Desviación","Tamaño","Precisión")
Para analizar el centrado del proceso, comparemos el gráfico de la distribución de los datos con las especificaciones, las cuales son:
\[ [EI, ES] = [20-0.8,20+0.8] = [19.2,20.8] \] El siguiente gráfico es un histograma de los 90 datos agrupados. Las líneas rojas representan las especificaciones inferior y superior.
hist(pesos, xlab="Pesos", ylab="Frecuencia", col="#CEF6F5")
abline(v=19.2, col="red", lwd='2')
abline(v=20.8, col="red", lwd='2')
Se puede observar que el proceso está descentrado hacia la izquierda. Por lo tanto el centrado del proceso no es adecuado. Ahora se presentan algunos datos sobre cada lote:
dfdes
## 1 2 3
## Media 19.35 19.30 20.04
## Desviación 0.56 0.69 0.40
## Tamaño 30.00 30.00 30.00
## Precisión 0.10 0.13 0.07
Con esto podemos analizar el centrado para cada uno de los lotes. Por la regla empírica, sabemos que el 99.7% de los datos se encuentran en: \[ [\bar{x}-3s,\bar{x}+3s] \] Así, tenemos que el 99.7% de los datos del lote 1 están en el intervalo:
\[ [\bar{x}_1-3s_1,\bar{x}_1+3s_1] = [19.35-3(0.56),19.35+3(0.56)] = [17.32, 20.68] \] Así, como el óptimo es 20, entonces podemos ver que para el lote 1 el proceso está descentrado.
Ahora, realicemos un proceso similar para los 90 datos. Calulculemos la media y desviación estándar de todas las observaciones
mean(pesos)
## [1] 19.56222
sd(pesos)
## [1] 0.6511145
Calculando el intervalo del 99.7% de la regla empírica, tenemos que: \[ [\bar{x}-3s,\bar{x}+3s] = [19.56-3(0.65),19.56+3(0.65)] = [17.61, 21.51] \] Por lo tanto se llega a la conclusión de que el proceso está ligeramente descentrado hacia la izquierda.
Tenemos que el coeficiente de variación es:
\[ CV = \frac{s}{\bar{x}}*(100)\]
\[ CV = \frac{0.65}{19,56}*(100) = 3,32 \] Ahora, comparemos la amplitud de las especificaciones con el rango del proceso. Para esto, calculemos el dato mayor y menor de los 90 datos.
max(pesos)
## [1] 21
min(pesos)
## [1] 17.8
Por tanto el rango del proceso es:
\[ Rango = 21-17.8 = 3.2\]
Ahora, notemos que la amplitud de las especificaciones es \[ AE = 20.8-19.2 = 1.6 \]
Como \[ AE < Rango \] entonces el ancho del histograma no cabe en las especificaciones, por lo tanto, los datos presentan mucha variabilidad.
hist(pesos, xlab="Pesos", ylab="Frecuencia",col="#CEF6F5")
abline(v=19.2, col="red", lwd='2')
abline(v=20.8, col="red", lwd='2')
Del histograma podemos interpretar que:
Además, tenemos que:
\[ C_p = \frac{ES-EI}{6 \sigma} = \frac{20.8-19.2}{6*0.65} = 0.41\]
\[ C_{p_{k}} = min \left( \frac{ES-\mu}{3 \sigma}, \frac{\mu - EI}{3\sigma}\right) = min \left( \frac{20.8-19.56}{3*0.65},\frac{19.56-19.2}{3*0.65}\right) = 0.18 \]
Por tanto:
Del histograma expuesto, podemos ver que los pesos de los costales no cumplen con las especificaciones, pues hay una cantidad considerable de estos que tienen un peso inferior a 19.2 kg, lo que ocasionaría una gran variación en la densidad de las pinturas, ya que la cantidad de arena es una característica de calidad clave en la elaboración de las pinturas.
Realicemos el análisis de los procesos de cada lote, identificando sus medidas de tendecia central, de dispersión, la forma de la distribución; para así, poder comparar de mejor manera los tres lotes:
round(c("Media" = mean(l1),"Mediana"= median(l1) , "Des. Est." = sd(l1), "Mínimo" = min(l1), "Máximo" = max(l1) ),2)
## Media Mediana Des. Est. Mínimo Máximo
## 19.35 19.25 0.56 18.60 21.00
hist(l1,xlab = "Pesos",ylab = "Frecuencia",main = "Histograma Lote 1",freq = F,col = "#F3F781")
lines(density(l1),col = "red")
abline(v=19.2, col="purple",lwd='3')
abline(v=20.8, col="purple",lwd='3')
round(c("Media" = mean(l2),"Mediana"= median(l2) , "Des. Est." = sd(l2), "Mínimo" = min(l2), "Máximo" = max(l2) ),2)
## Media Mediana Des. Est. Mínimo Máximo
## 19.30 19.35 0.69 17.80 20.70
hist(l2,xlab = "Pesos",ylab = "Frecuencia",main = "Histograma Lote 2",freq = F,col = "#FA8258")
lines(density(l2),col = "blue")
abline(v=19.2, col="purple",lwd='3')
abline(v=20.8, col="purple",lwd='3')
round(c("Media" = mean(l3),"Mediana"= median(l3) , "Des. Est." = sd(l3), "Mínimo" = min(l3), "Máximo" = max(l3) ),2)
## Media Mediana Des. Est. Mínimo Máximo
## 20.04 20.00 0.40 19.10 21.00
hist(l3,xlab = "Pesos",ylab = "Frecuencia",main = "Histograma Lote 3",freq = F,col = "#81F781")
lines(density(l3),col = "black")
abline(v=19.2, col="purple",lwd='3')
abline(v=20.8, col="purple",lwd='3')
Con los resultados obtenidos y, con las especificaciones señaladas, vemos que existen varias diferencias de lote a lote, esto se ve debido a que las medias, desviaciones estándares y, sobre todo, las gráficas son bastantes dispersas, siendo que ninguna de estas cumplen con las especificaciones; por lo tanto, no es adecuado seleccionar en cualquiera de los lotes, aunque cabe notar que, el lote 3 es más cercano a las especificaciones requeridas y es un poco más centrado.
Se presentan algunas otras características observadas:
– Las medias de los lotes 1 y 2 son similares, a lo cual, observando los gráficos de densidades, notamos que prácticamente están descentradas a la izquierda en el mismo punto, por tanto estos lotes no cumplen las especificaciones mínimas.
– Las medias de los lotes 2 y 3 son distintas; así, mediante el gráfico de densidades, observamos que el lote 2 está descentrado a la izquierda, mientras que el lote 3 está centrada, por tanto el lote 3 cumple con las especificaciones de calidad.
– La desviación estándar del lote 3 es más pequeña que los otras desviaciones, es decir, hay menos variabilidad entre los datos y la media.
Encontremos las mismas medidas usadas en el literal anterior y grafiquemos la función densidad al considerar los 3 lotes para la muestra
round(c("Media" = mean(pesos),"Mediana"= median(pesos) , "Des. Est." = sd(pesos), "Mínimo" = min(pesos), "Máximo" = max(pesos) ),2)
## Media Mediana Des. Est. Mínimo Máximo
## 19.56 19.60 0.65 17.80 21.00
hist(pesos,xlab = "Pesos",ylab = "Frecuencia",main = "Histograma Lote 3",freq = F,col = "#81F7F3")
lines(density(pesos),col = "red")
abline(v=19.2, col="blue",lwd='3')
abline(v=20.8, col="blue",lwd='3')
Así, las medidas encontradas son variadas a la delos tres lotes, incluso, en este caso, la variación es un tanto grande respecto a los datos; además, notamos que el centrado en la distribución de los datos no es el adecuado e inclusive presenta un sesgo significativo hacia la izquierda; por otro lado, se observan datos hacia la derecha del limite de especificación inferior, es decir, que existen varios costales que no cumplen con la calidad mínima, de la misma manera observamos que existen datos hacia la izquierda exceden del limite superior de especificación, por tanto se podría decir que si los 90 datos no cumplen las especificaciones en su totalidad, los lotes tenderían a presentar un comportamiento anormal, y esto se verifica mediante el análisis hecho en el inciso c.
par(mfrow=c(3,1))
boxplot(l1,horizontal = T,col = "yellow")
boxplot(l2, horizontal = T, col = "blue")
boxplot(l3, horizontal = T, col = "red")
En el primer lote tenemos la presencia de un dato atípico o aberrante, en este caso sobrepasa el valor de la barrera interior derecha del diagrama de caja para el primer lote, a diferencia del diagrama de caja para el lote 2 y 3.
Por un análisis visto anteriormente, podemos ver que el lote 3 es el más centrado, es decir, el más adecuado de los tres lotes; esto puede, justificarse incluso calculando el sesgo de los tres grupos de datos.