1 Descripción del problema

La característica de calidad analizada es el porcentaje de humedad de un producto alimenticio (avena). El incumplimiento de las especificaciones tiene consecuencias directas para el consumidor:

  • Humedad > 12%: el tiempo de cocción sugerido resulta insuficiente y el consumidor probablemente recibirá avena cruda.
  • Humedad < 6%: el tiempo de cocción sugerido es excesivo, lo que degrada las propiedades proteínicas del producto.
Límite Valor
LIE (Límite Inferior de Especificación) 6%
LSE (Límite Superior de Especificación) 12%

2 Parámetros del proceso

Los parámetros utilizados en este taller provienen de los subgrupos que quedaron bajo control estadístico en el Taller 5 (carta \(\bar{X}\)-R con \(\alpha = 0.0027\)), luego de eliminar los puntos fuera de control.

library(ggplot2)
library(patchwork)
library(readxl)

datos <- read_excel("Datos2 - Porcentaje de humedad de un producto alimenticio.xls")

knitr::kable(
  head(datos, 10),
  caption = "Primeras 10 observaciones de la base de datos"
)
Primeras 10 observaciones de la base de datos
Muestra X1 X2 X3 X4 XMedia Rango
1 9.759814 10.104303 10.361062 9.398791 9.905993 0.9622709
2 8.977854 9.716616 9.646849 9.150366 9.372921 0.7387625
3 10.195406 11.929526 10.708613 9.068135 10.475420 2.8613904
4 11.021179 9.350442 9.786002 9.336473 9.873524 1.6847061
5 10.958680 10.924549 11.160759 10.624019 10.917002 0.5367401
6 11.386506 10.004620 10.942684 9.941105 10.568729 1.4454017
7 8.253130 9.994584 10.426990 11.307049 9.995438 3.0539195
8 9.812655 9.008916 10.362825 11.186611 10.092752 2.1776941
9 10.876018 9.672908 9.921140 8.952999 9.855766 1.9230192
10 9.130639 9.782194 9.886370 10.390793 9.797499 1.2601531
# Constantes para n = 4
n  <- 4
d2 <- 2.059
A2 <- 0.729
D3 <- 0
D4 <- 2.282

# Límites de especificación
LSE <- 12
LIE <- 6
T   <- (LSE + LIE) / 2  # Centro nominal = 9%

# Límites de control (datos completos)
Xbar_total <- mean(datos$XMedia)
Rbar_total <- mean(datos$Rango)

LCS_x <- Xbar_total + A2 * Rbar_total
LCI_x <- Xbar_total - A2 * Rbar_total
LCS_R <- D4 * Rbar_total
LCI_R <- D3 * Rbar_total

# Datos limpios (subgrupos bajo control)
datos_ok <- datos[
  datos$XMedia >= LCI_x & datos$XMedia <= LCS_x &
  datos$Rango  >= LCI_R & datos$Rango  <= LCS_R, ]

# Parámetros del proceso estable
Xbar     <- mean(datos_ok$XMedia)
Rbar     <- mean(datos_ok$Rango)
sigma_cp <- Rbar / d2
Resumen de parámetros del proceso
Indicador Valor
Centramiento (X̄) 9.9934 %
Rango promedio (R̄) 1.7163
σ (corto plazo) 0.8336 %

3 Punto a – ¿Qué porcentaje de unidades no cumple con las especificaciones?

Asumiendo que el porcentaje de humedad sigue una distribución normal con los parámetros estimados del proceso, se estandarizan los límites y se calculan las áreas en las colas de la curva normal:

\[Z_{LSE} = \frac{LSE - \bar{X}}{\hat{\sigma}} \qquad Z_{LIE} = \frac{LIE - \bar{X}}{\hat{\sigma}}\]

Z_LSE <- (LSE - Xbar) / sigma_cp
Z_LIE <- (LIE - Xbar) / sigma_cp

p_sup   <- pnorm(Z_LSE, lower.tail = FALSE)
p_inf   <- pnorm(Z_LIE, lower.tail = TRUE)
p_total <- p_sup + p_inf
Métrica Valor PPM
Z_LSE 2.4072 -
Z_LIE -4.7908 -
P(X > LSE) 0.8038% 8038
P(X < LIE) 1e-04% 1
Total fuera 0.8039% 8039

Unidades fuera de especificación
Zona Condición % Unidades PPM
Por encima del LSE (> 12%) Avena cruda 0.8038 8038
Por debajo del LIE (< 6%) Sobrecocción 0.0001 1
Total 0.8039 8039

El porcentaje de unidades que no cumple con las especificaciones es 0.8039%, equivalente a aproximadamente 8039 PPM. La mayoría de las no conformidades se presentan por encima del límite superior de especificación (12% de humedad), mientras que las unidades por debajo del límite inferior (6%) son prácticamente inexistentes.


4 Punto b – ¿Qué porcentaje de usuarios consume avena cruda?

Los usuarios consumen avena cruda cuando el porcentaje de humedad del producto supera el límite superior de especificación (LSE = 12%). Para estimar la probabilidad de que esto ocurra, se calcula el área bajo la curva normal a la derecha de dicho límite, utilizando la media μ y la desviación estándar σ estimadas a partir de los datos del proceso:

\[ P(X>LSE) = 1 - P(X<LSE) \]

4.1 Parámetros del proceso

mu    <- Xbar      # Media del proceso (ya calculada con datos limpios)
sigma <- sigma_cp  # Desviación estándar estimada (ya calculada)

Dado que el proceso sigue una distribución normal con media μ y desviación estándar σ estimadas, estandarizamos el proceso para obtener:

\[ P(X>LSE) = 1 - P(Z< \frac{LSE - \mu}{\sigma}) \]

Calculamos z:

z_sub <- (LSE - mu) / sigma
z_sub
## [1] 2.407173

Calculamos la probabilidad:

prob_crudas <- 1 - pnorm(z_sub)
prob_crudas
## [1] 0.008038274
# En porcentaje:
prob_crudas * 100
## [1] 0.8038274

Se obtiene que la probabilidad de que una avena supere el 12% de humedad es de 0.008, lo que equivale a un 0.8% de la producción. Es decir, aproximadamente 1 de cada 1000 usuarios podrían consumir una avena cruda. Teniendo en cuenta el contexto del problema (sector de alimentos), y a pesar de obtener un porcentaje pequeño, resulta preocupante este valor ya que afecta directamente la experiencia del consumidor y puede generar inconformidades.


5 Punto c – Índices de capacidad a corto plazo

Los índices de capacidad potencial se calculan con la variabilidad instantánea (\(\hat{\sigma}_{cp} = \bar{R}/d_2\)), que captura únicamente la variabilidad dentro de los subgrupos. Para un proceso con dos límites de especificación, los índices relevantes son:

\[C_p = \frac{LSE - LIE}{6\hat{\sigma}} \qquad C_{pu} = \frac{LSE - \bar{X}}{3\hat{\sigma}} \qquad C_{pl} = \frac{\bar{X} - LIE}{3\hat{\sigma}} \qquad C_{pk} = \min(C_{pu},\, C_{pl})\]

Cp  <- (LSE - LIE) / (6 * sigma_cp)
Cpu <- (LSE - Xbar) / (3 * sigma_cp)
Cpl <- (Xbar - LIE) / (3 * sigma_cp)
Cpk <- min(Cpu, Cpl)
Índice de Capacidad Valor
Cp 1.1997
Cpu 0.8024
Cpl 1.5969
Cpk 0.8024

Resumen de índices de capacidad a corto plazo
Indice Valor Interpretacion
Cp 1.1997 Capacidad potencial (asume proceso centrado)
Cpu 0.8024 Margen respecto al LSE - lado crítico
Cpl 1.5969 Margen respecto al LIE - amplio margen
Cpk 0.8024 Capacidad real considerando descentramiento
  • Cp = 1.1997: la variabilidad del proceso cabe dentro de las especificaciones, aunque requiere vigilancia (1 < Cp < 1.33, según Juran, 1974). Sin embargo, este índice asume que el proceso está centrado.
  • Cpu = 0.8024: margen insuficiente hacia el LSE. La cercanía al límite superior es el principal problema del proceso.
  • Cpl = 1.5969: existe un amplio margen respecto al LIE; no hay riesgo de sobrecocción.
  • Cpk = 0.8024: al ser menor que 1, confirma que el proceso genera unidades no conformes. Siempre refleja el peor de los dos márgenes (Cpu o Cpl), por lo que es el índice más informativo cuando el proceso no está centrado.

El índice recomendado para este caso es el Cpk, ya que el proceso no está centrado. Usar solo el Cp llevaría a sobreestimar la capacidad real.


6 Punto d – ¿Es posible asegurar que el proceso es capaz a corto plazo?

No es posible asegurar que el proceso sea capaz a corto plazo.

Aunque el Cp = 1.1997 indica que la variabilidad del proceso cabe dentro de las especificaciones, este índice asume que el proceso está centrado, condición que no se cumple. El Cpk = 0.8024 < 1 revela que el proceso está desplazado hacia el LSE: la media estimada (9.9934%) es superior al centro nominal de las especificaciones (9%). Esto se confirma al comparar Cpu = 0.8024 contra Cpl = 1.5969.

En consecuencia, no es posible asegurar que el proceso sea capaz a corto plazo, ya que se generan unidades no conformes. Se recomienda realizar ajustes que permitan centrar mejor la media del proceso respecto a las especificaciones y, de esta manera, reducir la cantidad de unidades fuera de especificación.

Además, Según los criterios de capacidad vistos en clase, un valor de Cpk menor que 1 indica que el proceso genera unidades no conformes, lo cual coincide con el porcentaje de productos fuera de especificación encontrado en el punto a.