Realiza un análisis Gage R&R por equipos con los datos generados con la aplicación Catapulta Virtual y, plantead y contestad varias preguntas a resolver relativas al objetivo del análisis Gage en base a los resultados obtenidos del análisis.
Previo a comenzar a trabajar, cargamos las librerías que utilizaremos a lo largo del trabajo.
library(readxl)
library(SixSigma)
library(tidyverse)
Inicialmente, cargamos la base de datos con los datos de todos los compañeros con los 15 intentos de cada uno, cinco por cada configuración preestablecida. Cada configuración presenta cinco distintos elementos o condiciones de tiro. A partir de ella, generamos una subtabla con los datos que nos interesan: elemento, herramienta (operario) y output, en este caso, la distancia.
catapulta=read_excel("catapulta2020.xlsx",sheet=2)
#str(catapulta)
datos=catapulta[,c(2,8,9,10,11)]
datos$ELEMENTO=factor(datos$ELEMENTO)
datos$OPERARIO=factor(datos$OPERARIO)
str(datos)
## Classes 'tbl_df', 'tbl' and 'data.frame': 345 obs. of 5 variables:
## $ EQUIPO : chr "CAC" "CAC" "CAC" "CAC" ...
## $ OPERARIO : Factor w/ 23 levels "Alberto","Alejandro",..: 4 4 4 4 4 6 6 6 6 6 ...
## $ DISTANCIA: num 509 505 516 510 515 510 512 513 513 515 ...
## $ TIRO : chr "1" "2" "3" "4" ...
## $ ELEMENTO : Factor w/ 3 levels "185113300169185",..: 1 1 1 1 1 1 1 1 1 1 ...
#summary(datos)
Comprobamos que cada operario presenta 15 tiros respectivamente.
table(datos$OPERARIO,datos$ELEMENTO)
##
## 185113300169185 185120300200200 185135270200200
## Alberto 5 5 5
## Alejandro 5 5 5
## Alexandro 5 5 5
## Alicia 5 5 5
## Andrea 5 5 5
## Christian 5 5 5
## Cristina 5 5 5
## Diego 5 5 5
## Dimitar 5 5 5
## Esther 5 5 5
## Francisco 5 5 5
## Gurwinder 5 5 5
## Javier 5 5 5
## Jose 5 5 5
## Juan 5 5 5
## Lorena 5 5 5
## Mireia 5 5 5
## Miriam 5 5 5
## Pablo 5 5 5
## Perez 5 5 5
## Sandy 5 5 5
## Sukhwinder 5 5 5
## Victor 5 5 5
Efectivamente, presentamos número igual de intentos para todos los operarios. Procedemos a
datos$TIRO=as.factor(datos$TIRO)
datos$DISTANCIA=as.numeric(datos$DISTANCIA)
my.rr = ss.rr(var = DISTANCIA, part = ELEMENTO, appr = OPERARIO, data = datos, main = "Six Sigma Gage R&R Measure", sub = "Catapulta Project MSA")
## Complete model (with interaction):
##
## Df Sum Sq Mean Sq F value Pr(>F)
## ELEMENTO 2 2451004 1225502 212.915 <2e-16
## OPERARIO 22 114695 5213 0.906 0.588
## ELEMENTO:OPERARIO 44 253257 5756 7.356 <2e-16
## Repeatability 276 215955 782
## Total 344 3034910
##
## alpha for removing interaction: 0.05
##
## Gage R&R
##
## VarComp %Contrib
## Total Gage R&R 1777.1228 14.35
## Repeatability 782.4442 6.32
## Reproducibility 994.6786 8.03
## OPERARIO 0.0000 0.00
## ELEMENTO:OPERARIO 994.6786 8.03
## Part-To-Part 10606.4872 85.65
## Total Variation 12383.6100 100.00
##
## StdDev StudyVar %StudyVar
## Total Gage R&R 42.15593 252.9356 37.88
## Repeatability 27.97220 167.8332 25.14
## Reproducibility 31.53853 189.2312 28.34
## OPERARIO 0.00000 0.0000 0.00
## ELEMENTO:OPERARIO 31.53853 189.2312 28.34
## Part-To-Part 102.98780 617.9268 92.55
## Total Variation 111.28167 667.6900 100.00
##
## Number of Distinct Categories = 3
Existen diferencias significativas entre los elementos y la interacción entre ellos con los operarios. Sin embargo, no se afirma estadísticamente que haya diferencias entre operarios.
El sistema de medida tiene una varianza total contenida del 14.35%. De esa cifra, un 6.32% proviene de la repetitividad en los intentos del mismo operario. Destacar la gran variabilidad que presenta Part-To-Part o elemento a elemento (85.65%).
Por su parte, la variación de estudio tiene un 37.88%, del cual un 25.14% es de la repetitividad. Sumado a esto, el número de conjuntos de elementos que la herramienta de medición puede distinguir a partir de los datos es de 3, indicando que el sistema de medida puede discriminar entre ciertos elementos (que recordemos presentaban diferencias significativas).
A modo conclusión, nos encontramos en un sistema de medida crítico, el cual no detecta ni controla 1 de cada 4 errores, ocasionados por la repetitividad. Según el costo de dicho sistema, incluidas las técnicas que utiliza, podríamos estudiar su continuidad.
En el gráfico de Componentes de variación, se ve claramente cómo tanto la mayor variabilidad proviene de las relaciones elemento a elemento, como ya intuíamos en el análisis analítico.
El gráfico Distancia por Elemento muestra que, a pesar de que las mediciones del elemento central son las más altas, el elemento derecho es el que presenta la mayor variabilidad de los tres, muy por encima del izquierdo, que se encuentra más agrupado. Los elementos no se han medido de forma similar, en promedio.
Hay cinco operarios de los ventitrés en total que presentan una variabilidad mucho más superior que el resto, teniendo importantes problemas en su repetitividad. En general, el promedio se mantiene estable para todos. Las diferencias entre operarios son patentes, sobre todo, en esos cinco mencionados anteriormente.
No todos los operarios miden igual, hay uno de ellos (Diego, color azul) que mide de forma más estable los tres elementos que el resto; sin embargo, la tendencia general es que el elemento central, aquel que presenta mayor magnitud, sea el que mayor homogenidad de medición presenta entre todos los operarios.
En el Gráfico R, cinco operarios muestran mediciones de 1 de 3 elementos (generalmente el derecho) muy alejados del cero medio buscado para indicar medidas consistentes sin repetitividad. Al contrario, la variabilidad es muy pronunciada en el elemento de la derecha, mientras que el izquierdo es más preciso en la medición. No todos los elementos se han medido de forma similar.
El último gráfico, el X Chart, es el que indica la magnitud media por cada operador cuando mide diferentes elementos, y las diferencias entre éstos últimos. Vemos cómo hay una secuencia de triángulo: las medias del primero se encuentran alrededor de 500, para pasar a medias casi siempre superiores en el segundo elemento y, acabar con un descenso en el promedio del elemento derecho. Todo esto indica variabilidad entre elementos del proceso. También encontramos problemas de reproducibilidad en el tercer elemento, ya que los puntos para él son muy dispares entre los diferentes operadores, tendremos un problema de reproducibilidad.
En conclusión, habría que revisar las condiciones del elemento 185135270200200 (a la derecha en los gráficos), pues presenta mucha variabilidad, y eso que no es el que mayores magnitudes presenta. Para hacerlo más fiable, sería conveniente rediseñarlo con condiciones parecidas a los otros elementos y valorar posteriormente si la variabilidad provenía del mismo o del propio sistema.
Este trabajo se ha realizado para la asignatura “Mejora de procesos”, impartida por la docente María Asunción Martínez Mayoral, de la Universidad Miguel Hernández de Elche (España).