Contexto y objetivos

El general de las Reales Tropas de Catapultas quiere derribar el castillo enemigo en la próxima batalla, posicionando las catapultas a 120um del castillo, para no ser detectado por los vigías. La plaza del castillo es básicamente circular, con un diámetro de 16um.

Para garantizar el éxito en el combate, acude al gran mago Dator, (data scientist de la época), para que le proporcione un ajuste óptimo de la catapulta con el que destruir el castillo con un mínimo derroche de proyectiles. En la Figura 1 está representada la plaza del castillo y el posicionamiento deseado de la catapulta.

Figura 1: Posicionamiento de la catapulta y del castillo objetivo

Figura 1: Posicionamiento de la catapulta y del castillo objetivo

Para conseguir mediciones con las que poder concluir sobre los objetivos, Dator propone un diseño de experimentos y realizar tiros con la catapulta representada en la Figura 2, cuyos elementos de variación se describen también en dicha figura.

Figura 2: Elementos de la catapulta y variables controlables.

Figura 2: Elementos de la catapulta y variables controlables.

Una versión virtual de esta catapulta viene dada en catapulta virtual, con similares elementos de variación:

Figura 3: Elementos de la catapulta virtual y variables controlables.

Figura 3: Elementos de la catapulta virtual y variables controlables.

Puesto que en la batalla es más fácil ajustar exclusivamente el ángulo de lanzamiento (RA) y el enganche del brazo (BP), Dator propone hacer las pruebas fijando el resto de configuraciones de la catapulta (FA, PE=100 y CE), y planteando un diseño del experimento sobre sendas configuraciones de RA y BP.

Explicitado esto como un problema de mejora, los requisitos de calidad (CTQ) conciernen a:

El objetivo de este estudio es llevar a cabo un diseño de experimentos para inferir sobre cuál es la configuración óptima para la que con cierta confianza se pueden asegurar los requisitos de calidad propuestos por el general.

Información disponible

Se realiza un diseño de experimentos con la catapulta virtual, fijando FA=90, PE=100, CE=300. Se consideran dos configuraciones posibles para RA (100 y 150), y para BP (150 y 200), generando todos los posibles cruces entre ellas. La variable RA la consideramos de tipo continuo, y la variable BP de tipo categórico. En cada cruce se realizan 5 repeticiones y se recopilan las distancias alcanzadas por el proyectil, con una precisión máxima de cinco décimas (\(xx.0\) o \(xx.5\)).

Con el fin de asegurar la independencia entre las observaciones, aleatorizamos todos los cruces y realizamos las mediciones en función de dicha aleatorización.

Cargamos los datos, disponibles en Github.

Resultados

Descriptivos

Realizamos el análisis descriptivo diferenciando por BP, y superponemos una línea recta (de regresión) en cada nube de puntos, con la que predecir el alcance (y) en función del ángulo de lanzamiento (RA).

Representamos en la Figura 4 solo los datos observados para los RA extremos y un suavizado lineal. En la Figura 5 se representan todos los datos con dos tipos de suavizado (libre y lineal).

Figura 4: Diagrama de dispersión de RA y alcance, en función de BP. Descriptivo con solo dos valores de RA.

Figura 4: Diagrama de dispersión de RA y alcance, en función de BP. Descriptivo con solo dos valores de RA.

Figura 5. Diagrama de dispersión de RA y alcance, en función de BP. Descriptivo con todos los valores de RA. Suavizado sin restricción (izquierda) y suavizado lineal (derecha)

Figura 5. Diagrama de dispersión de RA y alcance, en función de BP. Descriptivo con todos los valores de RA. Suavizado sin restricción (izquierda) y suavizado lineal (derecha)

Ajuste del modelo y predicción

Modelo lineal

Ajustamos un modelo lineal con el predictor continuo RA, el factor BP, y la interacción entre ambos.

Observations 40
Dependent variable y
Type OLS linear regression
F(3,36) 585.68
0.98
Adj. R² 0.98
Est. S.E. t val. p
(Intercept) -149.79 9.35 -16.01 0.00
ra 2.00 0.07 27.58 0.00
bp200 -13.11 13.23 -0.99 0.33
ra:bp200 0.22 0.10 2.12 0.04
Standard errors: OLS

Se proporcionan a continuación las predicciones del modelo cuadrático para un grid de ángulos de lanzamiento, y se muestran solo los que consiguen alcances próximos al objetivo. En las configuraciones con alcances próximos a 120, el intervalo de predicción claramente rebasa la plaza del castillo (radio de 8). En la Figura 6 se presenta el ajuste del modelo lineal (interactivo).

Predicción con el modelo lineal (más próxima al objetivo)
bp ra fit lwr upr
6935 150 134.67 119.9089 107.5795 132.2384
5474 200 127.36 119.9141 107.6300 132.1983
6937 150 134.68 119.9290 107.5994 132.2585
5476 200 127.37 119.9363 107.6522 132.2205
6939 150 134.69 119.9490 107.6193 132.2787
5478 200 127.38 119.9585 107.6744 132.2427
6941 150 134.70 119.9690 107.6392 132.2988
5480 200 127.39 119.9807 107.6966 132.2649
6943 150 134.71 119.9890 107.6591 132.3190
5482 200 127.40 120.0029 107.7188 132.2871
6945 150 134.72 120.0091 107.6790 132.3391
5484 200 127.41 120.0251 107.7410 132.3093
6947 150 134.73 120.0291 107.6989 132.3593
5486 200 127.42 120.0474 107.7632 132.3315
6949 150 134.74 120.0491 107.7188 132.3794
6951 150 134.75 120.0692 107.7387 132.3996
5488 200 127.43 120.0696 107.7854 132.3537
6953 150 134.76 120.0892 107.7586 132.4197
5490 200 127.44 120.0918 107.8076 132.3759

Figura 6: Ajuste del modelo lineal y propuestas de mejora

Modelo cuadrático

Ajustamos ahora un modelo cuadrático con los predictores continuos \(RA\) y \(RA^2\) , el factor BP, y la interacción entre el factor y cada uno de los predictores continuos.

Observations 40
Dependent variable y
Type OLS linear regression
F(5,34) 4333.65
1.00
Adj. R² 1.00
Est. S.E. t val. p
(Intercept) -383.66 20.06 -19.13 0.00
ra 5.86 0.33 17.84 0.00
I(ra^2) -0.02 0.00 -11.77 0.00
bp200 -101.78 28.37 -3.59 0.00
ra:bp200 1.68 0.46 3.62 0.00
I(ra^2):bp200 -0.01 0.00 -3.15 0.00
Standard errors: OLS

Se proporcionan a continuación las predicciones del modelo cuadrático para un grid de ángulos de lanzamiento, y se muestran solo los que consiguen alcances próximos al objetivo. En la Figura 7 se presenta el ajuste del modelo cuadrático (interactivo).

Predicción con el modelo cuadrático (más próxima al objetivo)
bp ra fit lwr upr
653 150 132.6 119.9659 116.3476 123.5842
484 200 124.1 120.0170 116.3585 123.6755
655 150 132.7 120.1397 116.5220 123.7573

Figura 7: Ajuste del modelo cuadrático y propuestas de mejora

Propuestas de mejora

Utilizamos los modelos ajustados, el cuadrático en particular, por dar un mejor ajuste a los datos, para proponer varias soluciones que cumplan con el requisito de distancia al castillo.

  • BP=200 –> RA=124,1 –> Alcance=120.02
  • BP=150 –> RA=132,6 –> Alcance=119.96

A continuación hacemos pruebas piloto con estas dos soluciones de mejora. Repetimos 10 lanzamientos con cada configuración, y llevamos a cabo un análisis de capacidad, para verificar el nivel de aseguramiento a la hora de cumplir con los objetivos de alcance. Resolvemos las siguientes cuestiones para cada una de las dos soluciones de mejora:

  1. ¿Qué porcentaje de tiros caen en el IC?
  2. ¿Y qué porcentaje impactan en la plaza del castillo?
  3. ¿Cuál es el rendimiento de esta configuración? ¿Y el nivel sigma (consulta la tabla de conversión)?
  4. ¿Qué índice de capacidad elegir y cuál es su valor?
  5. Capacidad de esta configuración para derribar el castillo.

En la Figura 8 se presenta el análisis de capacidad para la prueba piloto con la solución de mejora vinculada a BP=150.

## Para BP=150, con el modelo, predecimos  119.9659 116.3476 123.5842
## El rendimiento es:  1
## La proporción de tiros en el intervalo de predicción es:  1
Figura 8: Análisis de capacidad con la configuración óptima para BP=150

Figura 8: Análisis de capacidad con la configuración óptima para BP=150

En la Figura 9 se presenta el análisis de capacidad para la prueba piloto con la solución de mejora vinculada a BP=200.

## Para BP=200, con el modelo, predecimos  120.017 116.3585 123.6755
## El rendimiento es:  1
## La proporción de tiros en el intervalo de predicción es:  0.9
Figura 9: Análisis de capacidad con la configuración óptima para BP=200

Figura 9: Análisis de capacidad con la configuración óptima para BP=200

Conclusiones