Proyecto de Control de Calidad

Facultad de Ciencias, Ingeniería Matemática, Universidad Politécnica Nacional.

RESUMEN

Este trabajo presenta información acerca de Análisis de capacidad multivariado de procesos enfocado al control estadístico utilizando el paquete en Rstudio mpcv con sus respectivas datas.

1. INTRODUCCIÓN

Los índices de capacidad de proceso (PCI) proporcionan medidas numéricas de comparar la salida de un proceso en control con los límites de especificación. Esta comparación se realiza formando una relación entre la propagación de las especifiaciones del proceso y los valores del mismo. Es decir, los PCI miden el grado en que un proceso produce una salida para cumplir las especificaciones que se piden. Los PCI univariados son muy utilizados en muchos procesos, sin embargo, existen muchos procesos industriales que tienen más de una característica de calidad por lo que la evalución de procesos multivariables se vuelven cada vez más importantes. Las características de calidad de los procesos de producción podrían estar distribuidos normalmente o no distribuidos normalmente, además que las características pueden ser independientes o depender unas de otras puesto que podrían verse afectadas o que sus valores esen relacionados. El caso más simple de las características de un proceso están normalmente distribuidas y no correlacionadas. En la práctica, las características de calidad están correlacionadas y a menudo no se distribuyen normalamente. Idependientemente del enfoque aplicado de la construcción de los PCI multivariables (MPCI), en la mayoría de los casos se asume que las distribuciones de las características de calidad son normales. Por lo tantto, los MPCI utilizan una forma elíptica como la región de proceso y comparan el área de proceso definida con el área del área de especificación. Cuando la distribución normal de los datos no se puede cumplir, se lleva a cabo luna transformación para obtener las variables distribuidas normalmente. Muchos autores también proponen una modificación de los límites de la especificación original. Hay dos proposiciones importantes: la modificación de los límites de especificación para una región de tolerancia “elíptica” o “rectangular”. Al analizar diferentes métodos ppara el cálculo de MPCI, se pueden identificar algunas limitaciones relacionadas con todos ellos:

  1. El supuesto de que todas las características de calidad están normalmente distribuidas.
  2. La limitación respecto al tamaño de la muestra, pues debe ser lo suficientemente grande como para garantizar la estimación adecuada de la matriz de covarianza.
  3. La complejidad de la metodología para evaluar MPCIs.

Teniendo en cuenta las limitaciones mencionadas anteriormente, se propone un nuevo enfoque apra medir la capacidad de un proceso multivariado. La principal diferencia conr especto a los enfoques mencionados anteriormente es la definició del área del proceso, que tiene una forma elíptica, pero se define utilizando modelos unilaterales de la forma de un polinomio de segundo grado. En el presente documento se presentará el análisis de los índices de capacidad multivariante además de su aplicación en R con el paquete “mpcv” propuesto por Krzysztof Ciupke.

Keywords:

Capacidad de proceso, Índice de capacidad de procesos, Análisis Multivariante, Gráficos de control Multivariante, Vector de capacidad de proceso multivariado, Control de procesos Multivariado, Análisis de Capacidad de Proceso, región de tolerancia, mpcv.

Definiciones:

-Capacidad de proceso: Es el grado de aptitud que tiene un proceso para cumplir con las especificaciones técnicas deseadas.
-Índice de capacidad de procesos:Los índices de capacidad son relaciones de la dispersión del proceso y la dispersión de especificación. Son valores sin unidades, por lo que se pueden utilizar para comparar la capacidad de procesos diferentes.
-Análisis Multivariante:El Análisis Multivariante es el conjunto de métodos estadísticos cuya finalidad es analizar simultáneamente conjuntos de datos multivariantes en el sentido de que hay varias variables medidas para cada individuo u objeto estudiado. Su razón de ser radica en un mejor entendimiento del fenómeno objeto de estudio obteniendo información que los métodos estadísticos univariantes y bivariantes son incapaces de conseguir.
-Gráficos de control Multivariante: La idea general de un gráfico de control multivariante consiste en la cuantificación de una forma cuadrática capaz de resumir en un escalar la información proveniente de diferentes características, de tal manera que este escalar resume de manera integral las características de centramiento y variabilidad del proceso.
-Vector de capacidad de proceso multivariado: metodología propuesta por Shariari Hubele y Lawrence la cual está compuesta por tres componentes. El primero de ellos se define como el cociente de áreas (p=2) o volúmenes (p>2) de la zona de tolerancia y la zona de control. El problema con este índice radica en que estas dos zonas presentan formas geométricas diferentes, ya que la zona de tolerancias regularmente está conformada por una región rectangular, mientras que la zona de control conforma una región elíptica.
-mpcv:Análisis de capacidad de proceso multivariado utilizando el vector de capacidad de proceso multivariado. Permite analizar un proceso multivariado con distribución normal y no normal y también con características de calidad dependientes e independientes.
-Control de procesos Multivariado:
-Análisis de Capacidad de Proceso:


2.Resumen de los índices de capacidad de proceso multivariado

Definimos los siguientes términos:

\(v\) -> Número de variables (característica de calidad de un proceso)
\(norte\) -> Número de observaciones(muestras)
\(X ={x:}\) -> Matriz que contiene datos de proceso recopilados, es decir, valores de variables \(x_{i} ,i=1,...,v\)|
\(USL^{T}=USL_{I}\) -> valores vectoriales de límites de especificación superiores.
\(LSL^{T}=LSL_{I}\) -> Valores vectoriales de límites de especificación inferiores.
\(T^{t}=T_{i}\) -> Vector de valores objetivo
\(R_{T}\) -> Una región de tolerancia
\(R_{p}\) -> Una región de proceso
\(a\) -> La proporción de productos no conformes.

Para calcular los MPCI existen dos enfoques :

-Basado en la proporción esperada de elementos no conformes
-Basado en la función de pérdida

Por otro lado se pueden distinguir los MPCIs construidos usando

-La relación del volumen de una región de tolerancia al volumen de una región de proceso:
-El análisis de componentes principales.

La evaluación de la capacidad del proceso multivariante se puede obtener de:

  1. La probabilidad de elementos no conformes utilizando la distribución del proceso multivariado.

  2. La relación de una región de tolerancia a una región de proceso.

  3. Diferentes enfoques utilizando funciones de pérdida.

  4. Enfoque de distancia geométrica que involucra el análisis de componentes principales

El proceso propuesto se refiere al enfasis sobre la base de la relación entre una región de tolerancia y una región de proceso. Además se introudcen los MPCIs que se construyen de manera similar.

Shahriari propuso un vector que consiste de tres componenetes \((C_{pM},PV,LI)\).
Taam propuso el índice de capacidad multivariante \(MC_{pm}\)
Pan y Lee propusieron el índice \(NMC_{pm}\)

2.1 Vector de capacidad multivariable de Shahriari

Este vector consiste en tres componentes \[(C_{pM},PV,LI)\] Donde \(C_{pM}\) es una relación de dos volúmenes(volumen definido por la región de tolerancia indicado como \(R_{T}\) y volumen de una región de proceso modificada denotada como \(R_{p}\) , definida como la región más pequeña similar en forma a la región de tolerancia . En particular, si los datos del proceso son multivariables normales R2 es una región elíptica. la región de proceso modificada y la región de tolerancia modificada se muestran en la figura 1 en los anexos.La región de tolerancia modificada se define como el elipsoide más grande que se centra en el objetivo completamente ubicado dentro de la región de tolerancia de ingenierìa original \[C_{pm}=(\frac{Vol.(R1)}{Vol.(R2)}\] El vomunen de la regiòn de tolerancia de ingeniería y la región de proceso modificada están dados por: \[vol(R_{T})=\prod_{i=1}^{v}(ULS_{I}-LSL_{I})\] y \[vol(R_{p})=\prod_{i=1}^{v}(UPL_{I}-LPL_{I})\] Para un proceso normal bivariado la regiòn del proceso es un contorno elìptico. La regiòn de tolerancia modificada es el rectángulo más pequeño alrededor de una elipse. Los bordes de la regiòn de proceso modificado se definen como los límites de proceso \(LPL_{i}\) inferior y \(UPL_{i}\) superior y están dados por \[UPL_{i}=\mu {i} +\sqrt{\frac{x^{2}{v,a}det(\sum_{i}^{-1})}{\sum_{i}^{-1}}}\] \[LPL_{i}=\mu {i} -\sqrt{\frac{x^{2}{v,a}det(\sum_{i}^{-1})}{\sum_{i}^{-1}}}\] donde \(i=1,...,v,x^{2}{v,a}\) es el 100% superior de una distribución de \(x^{2}\) con \(v\) grados de liberta, \(det(\sum{i}^{-1})\) es el determinante de una matriz obtenida de la matriz de covarianza inversa \(\sum^{-1}\)al eliminar la fila y la comulmna \(i-th\).El segundo componente (\(PV\)) del vector propuesto se basa en el supuesto de que el centro de los límites de especificación denota la media del proceso. Este componente se define como: \[PV=P(T^{2}\geq \frac{v(n-1)}{n-v}F_{(v,n-v)})\] donde \[T^{2}=n(\bar{X}-\mu_{0})S^{-1}(\bar{X}-\mu_{0})\] \(F(v,nÀv)\) denota el valor de la distribuciòn F de Snedecor con \(v\)y \(n\) \(À\) \(v\) grados de libertad. Cabe destacar que los valores grandes de \(PV\) indican la proximidad del centro del proceso al valor objetivo preespecificado. El tercer componente del vector, que se conoce como índice de ubicación (LI), compara la ubicación de la región del proceso modificado con la tolerancia. Este índice tiene valor de uno si toda la región de proceso modificada está contenida dentro de la región de tolerancia indicando que todos los productos manufacturados cumplen con los límites de especificación; de lo contrario, tomará un valor de cero: Así: \[LI=\Big\{{1 \text{si }R_{p} \text{ esta contenido dentro de} R_{T} \\ \text{0 caso contrario} }\]
R Users Group - Ecuador

2.2 Ìndice de capacidad multivariante de Taam

\(MC_{pm}\) se define como una relaciòn de dos volumenes nuevamente \[MC_{pm}=\frac{vol(R_{T})}{vol(R_{p})}\]

donde \(vol(R_{T})\) es el volumen de la región de tolerancia modificada \(vol(R_{p})\) es el volumen de la región de proceso escalada 99.73%. Bajo la hipótesis de normalidad multivariable, \(R_{p}\) es una región de proceso elipsoidal, mientras que la región de tolerancia modificada R T es el elipsoide más grande que está centrado en el objetivo completamente dentro de la región de tolerancia original. Un volumen de un hiperelipsoide de \(v\) características de la la región \(R_{T}\) está dada por

\[vol(R_{T})=\frac{2*\pi^{v/2}\prod_{i=1}^{v}}{v(\frac{v}{2})}\] donde \(a_{i}(i=1,...,v)\) son las longitudes de los semiejes. Un volumen de la región de proceso escalada de 99.73% R P se puede expresar como

\[vol(R_{p})=\sum ^{1/2}(\pi k)^{v/2}(T(v/2+1))^{-1}(1+(\mu-T)^{T}\sum ^{-1}(\mu -T))^{1/2}\] donde \(\sum\) es una matriz de covarianza y \(\mu\) es un vector promedio de una distribución normal multivariable de la matriz \(X\) de mediciones. T es un vector de valores objetivo, y \(K\) es un percentil 99.73 de \(X^{2}\) con \(v\) grados de libertad. En la práctica, cuando una muestra aleatoria de \(n\) Se dan mediciones para cada una de las variables \(v\) , la estimación para \(MC_{pm}\) se calcula como

\[\hat{MC_{PM}}=\frac{\hat{C_{p}}}{\hat{D}}\] Donde \(\hat{C_{p}},\hat{D}\) son definidos de cierta forma.

2.3 Índice de NMC de Pan y Lee

En general, un producto industrial tiene más de una característica de calidad. Con el fin de establecer medidas de desempeño para la evaluación. la capacidad de un proceso de fabricación multivariado, varios \(MPCI\) se han desarrollado en los últimos años. Entre ellos, Los índices \(MC_{p}\) y \(MC_{pm}\) de Taam tienen el inconveniente de la sobreestimación. Los índices mencionados anteriormente tienen el inconveniente de la sobreestimación cuando las características de calidad no son independientes. Eso es por qué Pan y Lee propusieron el índice \(NMC_{pm}\) con la región de tolerancia de ingeniería revisada

R Users Group - Ecuador

3. Vector de capacidad de proceso multivariante propuesto basado en modelos de una cara

Se propone un vector de capacidad de proceso multivariado que consta de tres componentes que corresponden a los componentes de Shahriari. La principal diferencia, y al mismo tiempo la principal ventaja del enfoque propuesto, es que podría aplicarse a los datos distribuidos normalmente y no normalmente, y también a los datos correlacionados y no correlacionados. Estas suposiciones significan que la transformación de los límites de especificación es difícil (o casi imposible) de definir. Por eso, en la metodología propuesta, se utilizan los límites de especificación originales. Por otro lado, el uso de los límites de especificación originales hace que los resultados obtenidos sean mucho más fáciles de interpretar. Como se mencionó anteriormente, la metodología propuesta utiliza los modelos de un solo lado para definir el área de proceso. Por eso, al principio, se presenta una breve introducción a la teoría de los modelos unilaterales. A continuación, se definen los componentes del vector de capacidad multivariable propuesto, y se muestra la metodología de cálculo de los valores de esos componentes.

3.1 Modelos de una cara

Para explicar que significa un modelo de una sola cara vamor a tomar una variable independendiente \(x_1\) y una variable dependiente \(x_2\)

R Users Group - Ecuador

4. Ejemplos de aplicaciones de datos reales

A continuación , consideraremos ejemplos numéricos para demostrar cómo se pueden aplicar las MPCIs en procesos con múltiples características.

Analizamos cada una de las datas

Estructuración del objeto mpcv
Argumentos

X->Una matriz numérica que contiene los datos (características de calidad).
indepvar-> un número o un nombre de la variable independiente necesaria para la construcción de un solo lado modelos
LSL-> Un vector de límites de especificación inferiores definidos para cada variable.
USL-> Un vector de límites de especificación superiores definidos para cada variable.
Objetivo-> Un vector de destino del proceso definido para cada variable.
alfa-> La proporción de productos no conformes.
distancia la medida de distancia que se utilizará para eliminar los elementos no conformes. Esta debe ser uno de “mahalanobis” (predeterminado), “euclidean”, “maximum”, “manhattan”, “Canberra”, “binario” o “minkowski”. Cualquier subcadena no ambigua puede ser dado.
n.integr-> una serie de intervalos de integración
coef.up -> un vector de valores mínimos de coeficientes iniciales para modelos “superiores” de una cara. El valor dado para indepvar se omite (podría ser NA).
coef.lo -> un vector de valores mínimos de coeficientes iniciales para modelos “inferiores” de una cara. Se omite el valor para indepvar (podría ser NA).'

Valores
Un mpcv.object es una lista que contiene los siguientes elementos

CpV-> El valor porcentual del componente de medición de capacidad.
PD-> El valor porcentual del componente de cambio de proceso.
PSvar-> El nombre de la variable que más influye en el proceso de cambio.
PD-> El valor porcentual del componente de distancia de proceso.
PDvar-> El nombre de la variable que tiene la mayor influencia negativa en el valor de El componente de distancia de proceso.
coef.lo-> un vector con nombre de coeficientes principales de modelos “inferiores” de una cara; para los in se devuelve la variable dependiente NA.
coef.up-> un vector con nombre de coeficientes principales de modelos “superiores” de una cara; Para el Se devuelve la variable independiente NA.

industrial
Descripción= Medidas de un producto industrial con dos características de calidad: Dureza brinell “H” y resistencia a la tracción “S”

R Users Group - Ecuador

Automotive
Descripción=El conjunto de datos que describe el problema de atornillar automáticamente las ruedas del coche. Dos caracteristicas son observado: el torque T de apretar un tornillo, y el ángulo de rotación A del tornillo hasta que sea necesario Se adquiere el valor del par.

R Users Group - Ecuador

Sleeves
Descripción=Conjunto de datos que contiene medidas de tres diámetros identificables de manguitos cilíndricos referidos como A, B y C.

R Users Group - Ecuador

5.Conclusiones

Este documento nos brinda información acerca de la evaluación de una capacidad de proceso con el enfoque a la utilización de un vector de capacidad de proceso multivariado de tres componentes. El primer componente \(C_{pV}\) , el segundo \(PS\) y el tercero \(PD\) Describimos las distinciones entre los índices propuestos por algunos autores y se realizó un análisis a partir de ejemplos de aplicaciones con cuatro datas distintas, tres de ellas provenientes del paquete \(mpcv\) y la otra del paquete %%%%%%%%%%%%%%. Donde los resultados mostraron %%%%%%%%%%%%