Proyecto de Control de Calidad
Facultad de Ciencias, Ingeniería Matemática, Universidad Politécnica Nacional.
Este trabajo presenta información acerca de Análisis de capacidad multivariado de procesos enfocado al control estadístico utilizando el paquete en Rstudio mpcv con sus respectivas datas.
Los índices de capacidad de proceso (PCI) proporcionan medidas numéricas de comparar la salida de un proceso en control con los límites de especificación. Esta comparación se realiza formando una relación entre la propagación de las especifiaciones del proceso y los valores del mismo. Es decir, los PCI miden el grado en que un proceso produce una salida para cumplir las especificaciones que se piden. Los PCI univariados son muy utilizados en muchos procesos, sin embargo, existen muchos procesos industriales que tienen más de una característica de calidad por lo que la evalución de procesos multivariables se vuelven cada vez más importantes. Las características de calidad de los procesos de producción podrían estar distribuidos normalmente o no distribuidos normalmente, además que las características pueden ser independientes o depender unas de otras puesto que podrían verse afectadas o que sus valores esen relacionados. El caso más simple de las características de un proceso están normalmente distribuidas y no correlacionadas. En la práctica, las características de calidad están correlacionadas y a menudo no se distribuyen normalamente. Idependientemente del enfoque aplicado de la construcción de los PCI multivariables (MPCI), en la mayoría de los casos se asume que las distribuciones de las características de calidad son normales. Por lo tantto, los MPCI utilizan una forma elíptica como la región de proceso y comparan el área de proceso definida con el área del área de especificación. Cuando la distribución normal de los datos no se puede cumplir, se lleva a cabo luna transformación para obtener las variables distribuidas normalmente. Muchos autores también proponen una modificación de los límites de la especificación original. Hay dos proposiciones importantes: la modificación de los límites de especificación para una región de tolerancia “elíptica” o “rectangular”. Al analizar diferentes métodos ppara el cálculo de MPCI, se pueden identificar algunas limitaciones relacionadas con todos ellos:
Teniendo en cuenta las limitaciones mencionadas anteriormente, se propone un nuevo enfoque apra medir la capacidad de un proceso multivariado. La principal diferencia conr especto a los enfoques mencionados anteriormente es la definició del área del proceso, que tiene una forma elíptica, pero se define utilizando modelos unilaterales de la forma de un polinomio de segundo grado. En el presente documento se presentará el análisis de los índices de capacidad multivariante además de su aplicación en R con el paquete “mpcv” propuesto por Krzysztof Ciupke.
Capacidad de proceso, Índice de capacidad de procesos, Análisis Multivariante, Gráficos de control Multivariante, Vector de capacidad de proceso multivariado, Control de procesos Multivariado, Análisis de Capacidad de Proceso, región de tolerancia, mpcv.
-Capacidad de proceso: Es el grado de aptitud que tiene un proceso para cumplir con las especificaciones técnicas deseadas.
-Índice de capacidad de procesos:Los índices de capacidad son relaciones de la dispersión del proceso y la dispersión de especificación. Son valores sin unidades, por lo que se pueden utilizar para comparar la capacidad de procesos diferentes.
-Análisis Multivariante:El Análisis Multivariante es el conjunto de métodos estadísticos cuya finalidad es analizar simultáneamente conjuntos de datos multivariantes en el sentido de que hay varias variables medidas para cada individuo u objeto estudiado. Su razón de ser radica en un mejor entendimiento del fenómeno objeto de estudio obteniendo información que los métodos estadísticos univariantes y bivariantes son incapaces de conseguir.
-Gráficos de control Multivariante: La idea general de un gráfico de control multivariante consiste en la cuantificación de una forma cuadrática capaz de resumir en un escalar la información proveniente de diferentes características, de tal manera que este escalar resume de manera integral las características de centramiento y variabilidad del proceso.
-Vector de capacidad de proceso multivariado: metodología propuesta por Shariari Hubele y Lawrence la cual está compuesta por tres componentes. El primero de ellos se define como el cociente de áreas (p=2) o volúmenes (p>2) de la zona de tolerancia y la zona de control. El problema con este índice radica en que estas dos zonas presentan formas geométricas diferentes, ya que la zona de tolerancias regularmente está conformada por una región rectangular, mientras que la zona de control conforma una región elíptica.
-mpcv:Análisis de capacidad de proceso multivariado utilizando el vector de capacidad de proceso multivariado. Permite analizar un proceso multivariado con distribución normal y no normal y también con características de calidad dependientes e independientes.
-Control de procesos Multivariado:
-Análisis de Capacidad de Proceso:
Definimos los siguientes términos:
\(v\) -> Número de variables (característica de calidad de un proceso)
\(norte\) -> Número de observaciones(muestras)
\(X ={x:}\) -> Matriz que contiene datos de proceso recopilados, es decir, valores de variables \(x_{i} ,i=1,...,v\)|
\(USL^{T}=USL_{I}\) -> valores vectoriales de límites de especificación superiores.
\(LSL^{T}=LSL_{I}\) -> Valores vectoriales de límites de especificación inferiores.
\(T^{t}=T_{i}\) -> Vector de valores objetivo
\(R_{T}\) -> Una región de tolerancia
\(R_{p}\) -> Una región de proceso
\(a\) -> La proporción de productos no conformes.
Para calcular los MPCI existen dos enfoques :
-Basado en la proporción esperada de elementos no conformes
-Basado en la función de pérdida
Por otro lado se pueden distinguir los MPCIs construidos usando
-La relación del volumen de una región de tolerancia al volumen de una región de proceso:
-El análisis de componentes principales.
La evaluación de la capacidad del proceso multivariante se puede obtener de:
La probabilidad de elementos no conformes utilizando la distribución del proceso multivariado.
La relación de una región de tolerancia a una región de proceso.
Diferentes enfoques utilizando funciones de pérdida.
Enfoque de distancia geométrica que involucra el análisis de componentes principales
El proceso propuesto se refiere al enfasis sobre la base de la relación entre una región de tolerancia y una región de proceso. Además se introudcen los MPCIs que se construyen de manera similar.
Shahriari propuso un vector que consiste de tres componenetes \((C_{pM},PV,LI)\).
Taam propuso el índice de capacidad multivariante \(MC_{pm}\)
Pan y Lee propusieron el índice \(NMC_{pm}\)
\(MC_{pm}\) se define como una relaciòn de dos volumenes nuevamente \[MC_{pm}=\frac{vol(R_{T})}{vol(R_{p})}\]
donde \(vol(R_{T})\) es el volumen de la región de tolerancia modificada \(vol(R_{p})\) es el volumen de la región de proceso escalada 99.73%. Bajo la hipótesis de normalidad multivariable, \(R_{p}\) es una región de proceso elipsoidal, mientras que la región de tolerancia modificada R T es el elipsoide más grande que está centrado en el objetivo completamente dentro de la región de tolerancia original. Un volumen de un hiperelipsoide de \(v\) características de la la región \(R_{T}\) está dada por
\[vol(R_{T})=\frac{2*\pi^{v/2}\prod_{i=1}^{v}}{v(\frac{v}{2})}\] donde \(a_{i}(i=1,...,v)\) son las longitudes de los semiejes. Un volumen de la región de proceso escalada de 99.73% R P se puede expresar como
\[vol(R_{p})=\sum ^{1/2}(\pi k)^{v/2}(T(v/2+1))^{-1}(1+(\mu-T)^{T}\sum ^{-1}(\mu -T))^{1/2}\] donde \(\sum\) es una matriz de covarianza y \(\mu\) es un vector promedio de una distribución normal multivariable de la matriz \(X\) de mediciones. T es un vector de valores objetivo, y \(K\) es un percentil 99.73 de \(X^{2}\) con \(v\) grados de libertad. En la práctica, cuando una muestra aleatoria de \(n\) Se dan mediciones para cada una de las variables \(v\) , la estimación para \(MC_{pm}\) se calcula como
\[\hat{MC_{PM}}=\frac{\hat{C_{p}}}{\hat{D}}\] Donde \(\hat{C_{p}},\hat{D}\) son definidos de cierta forma.
En general, un producto industrial tiene más de una característica de calidad. Con el fin de establecer medidas de desempeño para la evaluación. la capacidad de un proceso de fabricación multivariado, varios \(MPCI\) se han desarrollado en los últimos años. Entre ellos, Los índices \(MC_{p}\) y \(MC_{pm}\) de Taam tienen el inconveniente de la sobreestimación. Los índices mencionados anteriormente tienen el inconveniente de la sobreestimación cuando las características de calidad no son independientes. Eso es por qué Pan y Lee propusieron el índice \(NMC_{pm}\) con la región de tolerancia de ingeniería revisada
En este informe se propone un vector de capacidad de proceso multivariado el cual consta de tres componentes . La ventaja de este planteamiento propuesto es que podría aplicarse tanto a los datos distribuidos normalmente como a los no distribuido, y también a los datos correlacionados y no correlacionados lo que implica que definir las transformaciones de los límites de especificación se complica es por esto que utilizamos límites de la especificación original de tal modo que nos resulta sencilla su interpretación. A continuación, definimos los componentes del vector de capacidad multivariable propuesto y se muestra la metodología de cálculo de los valores de esos componentes.
Este vector consta de tres componentes \[C_{pV},PS,PD\] Dónde \(C_{pV},PS,PD\) definidas posteriormente.
El primer componente \(C_{pV}\) es la medición de la capacidad y puede interpretarse como una descripción de una variación de los datos. Cuánto menor sea la variación , menor será el valor \(C_{pV}\) y viceversa.
La capacidad del proceso se define como la relación de los volúmenes de \(RT\) y \(RP\) expresada como la relación de porcentaje: \[C_{pV}=\frac{vol(R_{T})}{vol(R_{p})}^{1/v}*100%\] donde los volumenes se definen como en 2.1 , mientras que la región de proceso R, se define sobre la base de modelos unilaterales del proceso.
Para definir la región de proceso utilizando el par. de los modelos de una cara, se asumen las siguientes afirmaciones:
Del conjunto de variables las cuales son las características de calidad \(x_{i}(i=1,...,v)\) se escoge una como independiente de acuerdo con el conocimiento del proceso de los datos.
Se adquiere un conjunto de pares de modelos unilaterales.
Para \(v=2\) , un volumen de proceso \(vol(R_{p})\) se puede calcular analíticamente, pero si \(v>2\), el cálculo del volumen de proceso no es tan fácil y se calcula por medio de integración numérica llegando como resultado a una forma aproximada.
Es difícil imaginar que el valor de \(C_{pV}\) sea igual a \(0%\). Sin embargo, cuanto menor sea el valor, mejor.\(C_{pV} = 100\%\) significa que el El volumen de la región de proceso es igual al volumen de la región de tolerancia dada. El segundo componente \(PS\) del vector propuesto representa un cambio de proceso.
Si los datos considerados se distribuyen normalmente, una media Se toma el valor para calcular el cambio de proceso potencial.
Si queremos aplicar la metodología también para datos no distribuidos normalmente, el El valor medio no es apropiado. Por eso, en lugar del valor medio, se considera una mediana marginal \(m\) la cual, para una distribución normal , es igul a la media. De igual forma la distancia entre la mediana marginal \(m\) y el target \(T\)se calculan como :
\[PS=max_{i=1,...,v}(\frac{|T_{i}-m_{i}|}{D_{i}})*100\%\]
Dónde \(D_{i}\) está definido de cierta forma.\ Cuando el proceso está centrado, el valor de \(PS\) es igual a \(0%\), mientras que el valor $100% significa que la mediana del proceso es igual a uno de límites de especificación.
DSos procesos pueden tener los mismos valores de volumen de proceso (el mismo valor de \(C _{pV}\) ), y ambos pueden tener El mismo valor de \(PS\) , pero pueden tener diferentes variaciones. Por eso se introdujo el tercer componente \(PD\) definido de cierta forma. El valor de \(PD\) igual al$ 0%$ solo es posible si \(C _{pV}\) = \(0\%\). Los valores inferiores al \(100\%\) significan que la región de proceso está contenida dentro de la región de especificación (que corresponde LI de Shahriari = 1). Cuando \(PD > 100\%\), la región del proceso no está contenida dentro de los límites de especificación ( LI = 0 de Shahriari). En la práctica, Los valores cercanos al \(100\%\) deben ser una señal cuando el proceso analizado no es capaz.
A continuación , consideraremos ejemplos numéricos para demostrar cómo se puede aplicar el mpcv en procesos con múltiples características.
Estructuración del objeto mpcv
Argumentos
X->Una matriz numérica que contiene los datos (características de calidad).
indepvar-> un número o un nombre de la variable independiente necesaria para la construcción de un solo lado modelos
LSL-> Un vector de límites de especificación inferiores definidos para cada variable.
USL-> Un vector de límites de especificación superiores definidos para cada variable.
Objetivo-> Un vector de destino del proceso definido para cada variable.
alfa-> La proporción de productos no conformes.
distancia la medida de distancia que se utilizará para eliminar los elementos no conformes. Esta debe ser uno de “mahalanobis” (predeterminado), “euclidean”, “maximum”, “manhattan”, “Canberra”, “binario” o “minkowski”. Cualquier subcadena no ambigua puede ser dado.
n.integr-> una serie de intervalos de integración
coef.up -> un vector de valores mínimos de coeficientes iniciales para modelos “superiores” de una cara. El valor dado para indepvar se omite (podría ser NA).
coef.lo -> un vector de valores mínimos de coeficientes iniciales para modelos “inferiores” de una cara. Se omite el valor para indepvar (podría ser NA).' Funciones
coef.mpcv -> coef es una función genérica que extrae los coeficientes principales del modelo de una región de proceso; los coeficientes se extraen del objeto de la clase “mpcv”.
coef.mpcv ->La forma de la región del proceso se define principalmente por los coeficientes principales de los modelos de proceso (aquí modelos de una cara ale aplicada). Para mantener una forma similar de la región del proceso en el proceso futuro Análisis, se requieren valores mínimos de los coeficientes principales. Esta función permite extraer el Coeficientes principales del objeto.
mpcv.object -> estrucutra del objeto mpcv
plot.mpcv -> Esta función presenta gráficamente el conjunto de datos, la región de tolerancia dada (límites de especificación), la región de proceso identificada, el objetivo y la mediana marginal para todos los pares de un carácter de proceso.
print.mpcv ->Esta función imprime valores de los tres componentes: CpV, PS y PD con nombres de variable que influye en los valores de los componentes más.
Valores
Un mpcv.object es una lista que contiene los siguientes elementos
CpV-> El valor porcentual del componente de medición de capacidad.Es la relación del volumen de la región de tolerancia al volumen de la región de proceso
PS-> El valor porcentual del componente de cambio de proceso.Cuando el proceso está centrado, el valor de PS es igual a 0%, mientras que el valor 100% significa que la mediana del proceso es igual a uno de límites de especificación.
PSvar-> El nombre de la variable que más influye en el proceso de cambio.
PD-> El valor porcentual del componente de distancia de proceso.Cuando PD> 100%, la región del proceso no está contenida dentro de los límites de especificación. En la práctica,Los valores cercanos al 100% deben ser una señal cuando el proceso analizado no es capaz.
PDvar-> El nombre de la variable que tiene la mayor influencia negativa en el valor de El componente de distancia de proceso.
coef.lo-> un vector con nombre de coeficientes principales de modelos “inferiores” de una cara; para los in se devuelve la variable dependiente NA.
coef.up-> un vector con nombre de coeficientes principales de modelos “superiores” de una cara; Para el Se devuelve la variable independiente NA.
industrial
Descripción= Medidas de un producto industrial con dos características de calidad: Dureza brinell “H” y resistencia a la tracción “S”
RESULTADOS: A partir de 25 mediciones para estas 2 característica de calidad de un producto industrial, usando el método obtenemos: Cpv de 31% es decir que el radio del volumen de la región de tolerancia es el 31% al volumen de la región de proceso.
PS es de 5% nos indica que el valor de la mediana del proceso está cerca de nuestro Target según el gráfico.
PD es de 59% lo que nos quiere decir que existe una distancia relativa mínima entre la región del proceso y los límites de especificación. de otra forma como es < al 100% la región del proceso está contenida dentro de los límites de especificación. Por lo que el proceso se lo considera capaz.
Automotive
Descripción=El conjunto de datos que describe el problema de atornillar automáticamente las ruedas del coche. Dos caracteristicas son observado: el torque T de apretar un tornillo, y el ángulo de rotación A del tornillo hasta que sea necesario Se adquiere el valor del par.
RESULTADOS: Cpv=63% es decir que el radio del volumen de la región de tolerancia es el 63% al volumen de la región de proceso.
Ps=60% el porcentaje es alto, nos indica que la mediana del proceso no se acerca a nuestro valor objetivo.
PD=90% como el valor se acerca al 100% nos señala que la región de proceso esta contenida dentro de la región de especificación aún así el proceso no es capaz.
Sleeves
Descripción=Conjunto de datos que contiene medidas de tres diámetros identificables de manguitos cilíndricos referidos como A, B y C.
RESULTADOS: Cpv= 36%es decir que el radio del volumen de la región de tolerancia es el 36% al volumen de la región de proceso, como se puede observar en los dos gráficos de relación de las medidas.
PS= 8% el porcentaje es bajo, nos indica que la mediana del proceso está cerca a nuestro valor objetivo.
PD=75% como el valor no está cerca al 100% nos señala que la región de proceso esta contenida dentro de la región de especificación y se podría considerar un proceso capaz.
vamos a tomar 4 datas para poder compararlas siendo sus Límites de especificación, Target el mismo de datos no correlacionados así comparar el desempeño de la propuesta los conjuntos de datos se encuentran en el código adjunto con variables x1 y x2, y se asume que DS1 es básica, DS2 y DS3 representan un cabio creciente de la variación, finalmente DS4 representa una situación en la que se observa un cambio del valor de la mediana con variaciÓn reducida.
RESULTADOS:
DS1
Cpv=32%es decir que el radio del volumen de la región de tolerancia es el 32% al volumen de la región de proceso.
Ps=10% el porcentaje es bajo, por lo que nos indica que la mediana del proceso está bastante cerca a nuestro valor objetivo.
PD=50% como el valor no está cerca al 100% nos señala que la región de proceso esta contenida dentro de la región de especificación y se podría considerar un proceso capaz.
DS2
Cpv=32%es decir que el radio del volumen de la región de tolerancia es el 32% al volumen de la región de proceso.
Ps=20% el porcentaje es bajo, por lo que nos indica que la mediana del proceso se acerca a nuestro valor objetivo.
PD=70% como el valor está cerca al 100% nos señala que la región de proceso no esta contenida dentro de la región de especificación y se podría considerar un proceso no capaz.
DS3
Cpv=32%es decir que el radio del volumen de la región de tolerancia es el 32% al volumen de la región de proceso.
Ps=40$ el porcentaje es alto, por lo que nos indica que la mediana del proceso no está cerca a nuestro valor objetivo.
PD=90% como el valor está relativamente cerca al 100% nos señala que la región de proceso no esta contenida dentro de la región de especificación y se podría considerar un proceso no capaz.
DS4
Cpv=22% es decir que el radio del volumen de la región de tolerancia es el 22% al volumen de la región de proceso.
Ps=10%el porcentaje es bajo, por lo que nos indica que la mediana del proceso bastante cerca a nuestro valor objetivo.
PD=45%como el valor no está cerca al 100% nos señala que la región de proceso esta contenida dentro de la región de especificación y se podría considerar un proceso capaz.
Por los valores presentados y comparados podemos observar las gráficas (respectivamente) pues tenemos una mejor visualización para poder escoger la mejor opción para un buen proceso. en este caso DS4 y DS1 serían consideradas como un proceso capaz.