12 de enero de 2019

Definiciones Previas

Capacidad del proceso

Consiste en conocer la amplitud de la variación natural del proceso para una característica de calidad dada, ya que esto permitirá saber en qué medida tal característica de calidad es satisfactoria (cumple especificaciones)

Índices de capacidad del proceso (ICP)

Los índices de capacidad del proceso miden cuánta variación natural experimenta un proceso en relación con sus límites de especificación y permitecomparar procesos con respecto a qué tan bien lo controla una organización.

Este índice juega un papel fundamental en las plantas de producción a la hora de demostrar que un proceso es fiable y está bajo control.

Criterios para evaluar ICP`S

Se basa en los siguientes tres criterios:

  1. Variabilidad en el proceso

  2. El grado de salida de la media del proceso del valor objetivo

  3. Ubicación de la media del proceso en el intervalo (LSL, USL)

Nota

Cuanto mayor sea el valor del índice de capacidad para un proceso, más capaz será el proceso

ICP`S de datos normales

Vannman (1995) definió una clase de índices de capacidad , dependiendo de dos parámetros \(\rho ,\upsilon\). \[C_p(\rho ,\upsilon)=\frac{d-\rho|\mu-m^*|}{3 \sqrt{\sigma^2+\upsilon (\mu -T)^2} }\]

  • \(\mu\) media del proceso

  • \(\sigma\) desviación estándar del proceso

  • \(d=\frac{USL-LSL}{2}\)

  • \(m^*=\frac{USL+LSL}{2}\) centro del límite de especificaciones

  • \(T\) target

Recordemos

Para el caso de que la muestra provenga de una distribución normal consideramos como variación real \(6\sigma\), esto se deduce de las propiedades de la distribución normal, en donde se asegura que entre \(\mu±3\sigma\) se encuentra \(99.73\%\) de los valores de la variables,lo que es equivalente a decir que la probabilidad de que el proceso esté fuera de los límites de \(± 3\sigma\) del valor promedio sea \(0.27\%\)

Índices de capacidad para datos no normales \(^{[1]}\)

Zwick y Schneider (1995) fueron los primeros quienes proporcionaron índices de capacidad para cualquier distribución (normal o no normal), sin embargo no se evaluaron sus resultados.

Más tarde Chen y Pearn (1997), Tong y Chen (1998) propusieron generalizaciones de \(C_p(\rho, \upsilon)\), basándose en el método del percentil, para cualquier distribución de la siguiente manera:

\[C_{Np}(\rho,\upsilon)=\frac{d-\rho |M-m^*|}{3\sqrt{\left(\frac{F_{0.99865}-F_{0.00135}}{6}\right)^2+\upsilon(M-T)^2}}\]

Donde

  • \(F_{0.99865}\) es el percentil 99.865 y \(F_{0.00135}\) el percentil 0.135 de la distribución de la característica de calidad

  • \(M\) es la mediana

¿Por qué la elección de \(F_{0.99865}\) y \(F_{0.00135}\)?

Para imitar la propiedad de una distribución normal de que la probabilidad de que el proceso esté fuera de los límites de \(± 3\sigma\) del valor promedio sea igual a \(0.27\%\).

Bajo estos supuestos se obtienen los siguientes índices de capacidad para procesos no normales

\[C_{Np}=\frac{USL-LSL}{F_{99.865}-F_{0.135}}\]

\[C_{Npk}=\frac{min\{USL-M,M-LSL\}}{\left(\frac{F_{99.865}-F_{0.135}}{2}\right)}\]

\[C_{Npm}=\frac{USL-LSL}{6\sqrt{\left(\frac{F_{99.865}-F_{0.135}}{6}\right)^2+(M-T)^2}}\]

\[C_{Npmk}=\frac{min\{USL-M,M-LSL\}}{3\sqrt{\left(\frac{F_{99.865}-F_{0.135}}{6}\right)^2+(M-T)^2}}\]

En la práctica encontrar la función de distribución de la muestra resulta difícil, es por esto que se trabaja con valores estimados (método percentil propuesto por Chan y Lu 1994)\(^{[2]}\). Así

  • \(\hat{M}=m_1=x_k+\left(\frac{m+1}{2}-k\right)(x_{k+1}-x_k)\)

  • \(\hat{F}_{99.865}=U_p=X_{k_2}+\left(\frac{99.865m+0.135}{100}-k_2\right)(x_{k_2+1}-x_{k_2})\)

  • \(\hat{F}_{0.135}=L_p=X_{k_1}+\left(\frac{0.135m+99.865}{100}-k_1\right)(x_{k_1+1}-x_{k_1})\)

Donde

\(m\) tamaño de la muestra

\(k\in \mathbb{Z^+}, k\leq \frac{m+1}{2}\)

\(k_1=\left(\frac{0.135m+99.865}{100}\right)\)

\(k_2=\left(\frac{99.865m+0.135}{100}\right)\)

De acuerdo a los criterios para evaluar los IPC`s, se tiene que:

  • \(C_{Np}\) tiene en cuenta únicamente el criterio 1

  • \(C_{Npk}\) los criterios 1 y 3

  • \(C_{Npm}\) los criterios 1 y 2

  • \(C_{Npmk}\) los criterios 1, 2 y 3

Un nuevo índice \(S_{pmk}^{[1]}\)

Con el objetivo de tomar en cuenta la variabilidad del proceso, la desviación de la media del proceso del valor objetivo y la proporción de no conformidad para cualquier distribución; Ding y Chen (2000) proponen un nuevo índice de capacidad de proceso \(S_{pmk}\)

\[S_{pmk}=\frac{\Phi^{-1}\left(\frac{1+F(USL)-F(LSL)}{2}\right)}{3\sqrt{1+\left(\frac{\mu-T}{\sigma}\right)^2}}\]

Donde \(F(x)\) es la función de distribución del proceso y \(\Phi(x)\) es la función de distribución de la normal estándar.

Una estimación para \(S_{pmk}\) está dada por \[\hat{S}_{pmk}=\frac{\Phi^{-1}\left(\frac{1+\hat{F}(USL)-\hat{F}(LSL)}{2}\right)}{3\sqrt{1+\left(\frac{\bar{X}-T}{S}\right)^2}}\] Donde

\(\hat{F}(USL)\) denota la proporción muestral de aquellos menores o iguales a USL, \(\hat{F}(LSL)\) la proporción muestral de aquellos menores que LSL

¿Cómo se genera una muestra boostrap?\(^{[5]}\)

El método Bootstrap es un método basado en computadora para estimar el error estándar (precisión) de un estadístico.

Sea \(X\) una muestra de un proceso , es decir una sucesión de variables aleatorias independientes idénticamente distribuidas (i.i.d) \(x_1, x_2, ..., x_n\); una muestra Bootstrap \(X^*\) denotada por \(x_1^*, x_2 ^*,., x_B ^*\) es una muestra de tamaño \(B\) extraída con el reemplazo de la muestra original \(X\). Para cada una de las \(n^n\) muestras obtenemos una estimación de los índices de capacidad no normales \(\hat{C}^*\).

Debido a que el muestreo por boostrap es equivalente al muestreo con reemplazo de la función de distribución de probabilidad empírica, entonces las distribuciones de Bootstrap de \(\hat{C}^*\) son la estimación de la distribución de \(\hat{C}\).

Según Efron y Tibshirani (1986) en la práctica se necesita un mínimo de 1000 muestras Bootstrap ordenadas para calcular estimaciones de intervalos de confianza precisas .

Intervalos de Confianza

Se han desarrollado varios tipos de método Bootstrap para construir intervalos de confianza:

(1) el método estándar (SB)

Consiste en calcular la media y desviación estandar de la muestra boostrap, con lo cual el intervalo de confianza al \((1-\alpha)\%\) confianza es

\[[\bar{C}^*-Z_\alpha S_{C^*},\bar{C}^*+Z_\alpha S_{C^*}]\]

(2) el método del percentil (PB)

\[[\hat{C}^*(\alpha B), \hat{C}^* ((1-\alpha )B )]\]

(3) el método del percentil con corrección de sesgo (BCPB)

Con el objetivo de corregir el sesgo producido por el muestreo por Boostrap, de la distribución ordenada de \(\hat{C}^*\) se calcula \[PL=\phi(2Z_0-Z_\alpha)\quad \quad PU=\phi(2Z_0+Z_\alpha)\] donde \(Z_0=\phi^{-1}(P_o)\) y \(P_o=P(C^*_i<\hat{C})\) , así

\[[\hat{C}^*(P_LB),\hat{C}^*(P_UB)]\]

(4) el método del percentil-t.

Se calcula \(Z^*_i=\frac{C^*_i-\hat{C}}{se_i^*}\),\(\forall i=1,...B\) donde \(\hat{C}_i^*\) es la estimación de C basada en el muestreo boostrap y \(sc_i^*\) es la estimación de error estándar de \(\bar{C}^*\). El \(\alpha\) quantil de Z es estimado por \(\hat{t}(\alpha)\), el cual se calcula de la expresión siguiente \[\sum_{i=1}^B[Z^*(i)\leq \hat{t}(\alpha)=\alpha B]\] y \(Z^*(i)\) es la i-ésimo valor más pequeño de \(Z^*_i\).

Debido a la complejidad para hallar la desviación estándar del estadístico, se estima este valor calculando una estimación bootstrap del error estándar por cada remuestreo de Bootstrap de tamaño 25 \(({X_1^*, X_2^*,., X_{25}^*})\). Así calculamos

\[ \bar{C}_i^*=\sum_{j=1}^{25}\hat{C}^*_{ij}\quad\hat{s}e_i^*=\sqrt{\frac{\sum_{j=1}^{25}(\hat{C}^*_{ij}-\bar{C}^*_i)^2}{25}}\] Finalmente obtenemos el intervalo de confianza al \(100(1-2\alpha)\%\) \[[\hat{C}+\hat{t}(\alpha)S_C^* , \hat{C}+\hat{t}(1-\alpha)S_C^*]\]

Algoritmos

1.- Índices de Capacidad

Entrada: n (tamaño de la muestra), m (número de observaciones de la muestra), LSL-USL (límites de especificación inferior y superior respectivamente), tar (Valor Objetivo)

Salida: matriz que contiene lo valores de los índices de capacidad \(M \in \mathbb{R}^{mxn}\)

  1. for i=1 to n 1.1. Generar una muestra \(X_i\) de tamaño m

1.2. Calcular \(CNp_{i}(\rho,\upsilon)\)

  1. \(\hat{C}Np(\rho,\upsilon)=\frac{1}{n}\sum_{i=1}^nCNp_i(\rho,\upsilon)\)

  1. Intervalos de confianza

Entrada:Índices de capacidad, nivel de confianza \((\alpha)\)

Salida: Intervalo de Confianza

  1. Para cada elemento de la muestra de los índices de capacidad \(\hat{C}\) generar B muestras boostrap \(\hat{C}^*\)

  2. Para cada elemento de la muestra boostrap \(\hat{C}^*\), calcular \(Z^*_i\) y con ello \(\hat{t}(\alpha)\)
  3. Para cada remuestreo Bootstrap de tamaño 25 calcular \(\bar{C}_i^*\) y \(\hat{s}e_i^*\)
  4. Calcular \[[\hat{C}+\hat{t}(\alpha)S_C^* , \hat{C}+\hat{t}(1-\alpha)S_C^*]\]

Simulaciones

Para ilustrar las diferencias entre los ICP`s no normales y la proporción de no conformidad usaremos la simulación con las siguientes distribuciones:

\(U(17,25.8)\)

##       Valor   ICI   ICS
## CNp   1.781 1.780 1.782
## CNpk  0.952 0.943 0.962
## CNpm  0.665 0.658 0.672
## CNpmk 0.356 0.349 0.363
## Spk   0.442 0.435 0.450

\(\chi_3^2+14.8\)

##       Valor   ICI   ICS
## CNp   1.054 1.020 1.078
## CNpk  0.967 0.938 0.992
## CNpm  1.019 0.988 1.043
## CNpmk 0.935 0.909 0.957
## Spk   0.823 0.810 0.834

\(\Gamma(6,3)\)

##       Valor   ICI   ICS
## CNp   0.362 0.355 0.369
## CNpk  0.323 0.316 0.330
## CNpm  0.359 0.352 0.367
## CNpmk 0.321 0.314 0.328
## Spk   0.367 0.364 0.371

Ejemplo

Se ha tomado los datos proporcionados por Tung Pei Industrial Co. Ltd, un fabricante de rodamientos en Taiwán. Esta fábrica produce alrededor de diez millones de rodamientos, los cuales constan de un anillo exterior, un anillo interior, el cuerpo rodante y el retenedor. Para decidir si un rodamiento es de calidad se evalua la variación de tamaño, dimensión y tolerancia de rotación. Se analiza el diámetro interior para los rodamiento.

Este proceso tiene como valor objetivo 60 mm, USL de 60.004 mm y LSL de 59.981 mm, el tamaño de la muestra es 100.

Realizamos un histograma de los datos

Mediante la prueba de Shapiro-Wilk determinamos que los datos no provienen de una distribución normal pues el p-valor asociado es menor que 0.05

## 
##  Shapiro-Wilk normality test
## 
## data:  data
## W = 0.88339, p-value = 2.532e-07

Por lo cual aplicamos los índices de capacidad no normales, obteniendo

## [1] "Ìndices de Capacidad no Normales"
##       CNp      CNpk      CNpm     CNpmk      Spmk 
## 0.8603695 0.5237032 0.8557598 0.5181213 0.3688522

Referencias

[1] A new process capability index for non-normal distributions

[2] PCI calculations for any shape of distribution with percentile

[3] PROCESS PERFORMANCE ANALYSIS FOR NON-NORMAL DATA DISTRIBUTION

[4] Re-evaluating the process capability indices for non-normal distributions

[5]A Bootstrap Confidence Limit for Process Capability Indices