Resumen

En este trabajo se plantea la resolución de un análisis causal a partir de un ejemplo basado en la instalación de microcemento. Identificadas cinco variables categóricas como causas potenciales a la hora de producir una instalación con un mayor o menor espesor del microcemento, se plantea un modelo lineal normal para discernir si realmente son calificables como causas y describir el modo en que afectan al espesor del microcemento. Finalmente el modelo es utilizado para predecir el espesor en la instalación y así poder seleccionar configuraciones que producen espesores conformes con los estándares de calidad, que están entre 2.5mm y 3.5mm.

Palabras clave

Causa-efecto, instalación de microcemento, modelo lineal, predicción.

Contexto

La instalación de microcemento para generar superficies lisas está en auge para eliminar juntas en suelos, paredes, cuartos de baño, cocinas, etc. No obstante, su instalación es laboriosa y requiere de varios procesos para dejar una superficie totalmente lisa y con un espesor de microcemento de tan solo 3mm. Requiere pues de profesionales experimentados que apliquen unos protocolos precisos de instalación.

Una empresa instaladora de microcemento está preocupada por dar máxima calidad en todos sus servicios de revestimiento, y quiere garantizar a sus clientes una cobertura lisa y homogénea óptima de 3mm, con un rango de tolerancia de tan solo 0.5mm.

El proceso de instalación del microcemento requiere de varios subprocesos: una nivelación adecuada del terreno y limpieza, una imprimación tapa poros, la instalación de una malla de vidrio, una primera capa de microcemento, seguida de lijado y limpieza, una segunda capa de cobertura con pigmento, el sellado, y por último el barnizado. El mapa del proceso se muestra en la Figura 1.

Figura 1: Mapa del proceso de instalación del microcemento

La empresa tiene claros ciertos parámetros de calidad que ha fijado en todas sus instalaciones durante el pasado año, pero sobre otros tiene dudas a la hora de concluir cómo influyen en la calidad de la instalación. De hecho, ha identificado todos los elementos que intervienen en la instalación, diferenciando los métodos, el personal, los métodos y los útiles, que se muestran en el gráfico de causa-efecto en las Figuras 2 (categorizadas según Personal, Métodos, Materiales y Útiles), y 3 (categorizadas según los subprocesos). Todas las espinas contienen factores potenciales que influyen en la calidad de la instalación de microcemento.

Figura 2. Gráfico de espinas para identificar los factores involucrados en la instalación del microcemento. Categorización por tipologías.

Figura 2. Gráfico de espinas para identificar los factores involucrados en la instalación del microcemento. Categorización por tipologías.

Figura 3. Gráfico de espinas para identificar los factores involucrados en la instalación del microcemento. Categorización por subprocesos.

Figura 3. Gráfico de espinas para identificar los factores involucrados en la instalación del microcemento. Categorización por subprocesos.

En su propósito de descubrir qué factores son los que más influyen a la hora de conseguir una buena instalación de microcemento, durante el pasado año fijó ciertas técnicas y materiales pero varió diferentes parámetros en las instalaciones que llevó a cabo, referidos al uso de:

Objetivos

Con los datos recopilados relativos al espesor del microcemento en dichas instalaciones, la empresa propone que descubramos cuáles de estas cinco variables afectan a la instalación del microcemento y cómo: tipo de imprimación, tipo de malla, técnica de aplicación del microcemento, técnica de sellado y tipo de barniz; interpretarlo y utilizarlo para recomendar. El objetivo básico del estudio es pues:

Para resolver esta cuestión planteamos como primer objetivo específico:

Una vez identificadas las causas, la empresa tendrá información para discriminar qué configuraciones de técnicas y materiales utilizar en sus instalaciones para conseguir los objetivos de calidad relativos al espesor óptimo. Un segundo objetivo específico del estudio será pues:

Información disponible

Se nos han proporcionado los datos relativos a las instalaciones realizadas durante el pasado año, considerando alternativas para las variables tipo de imprimación, tipo de malla, técnica de aplicación del microcemento, técnica de sellado y tipo de barniz, de manera que se dispone de las variables categóricas:

Además, se llevaron a cabo 5 mediciones de microcemento en cada una de las instalaciones, que se recopilaron con su valor numérico en milímetros, en la variable y=espesor.

Esto implica un total de 48 instalaciones distintas, 5 mediciones de microcemento en cada una de ellas y una base de datos con 240 registros.

Los datos están disponibles online para descarga en el enlace (https://bit.ly/3Tmf11u).

Metodología

Procesado

No ha sido preciso procesado alguno, puesto que los datos venían depurados, sin valores faltantes ni atípicos. Básicamente se procedió a verificar los tipos de las variables disponibles (categóricas para las variables controladas en la instalación y numérica para la variable espesor del microcemento).

Con el fin de identificar las 48 instalaciones en la base de datos (cada una con una configuración distinta de las variables de control), se ha creado una nueva variable categórica denominada ‘instalación’.

Análisis estadístico

El análisis de los datos se ha resuelto a través de una descripción gráfica inicial de la base de datos, seguida de una modelización estadística posterior para verificar estadísticamente las relaciones existentes, y un análisis predictivo para proporcionar recomendaciones.

El análisis descriptivo gráfico se ha resuelto de modo univariante para la variable objetivo, espesor, a través de un histograma con el que mostrar su distribución global, y gráficos de cajas por instalación, para mostrar el espesor conseguido en cada una de las configuraciones utilizadas.

Para visualizar las interrelaciones entre las variables potencialmente causales (todas ellas categóricas) y el espesor del microcemento, se han utilizado gráficos de cajas condicionados con los que llegar a poder interpretar posibles interacciones de orden 3. Esto implica la realización de un total de diez gráficos de cajas para el espesor, considerando tres variables condicionantes.

A la hora de verificar las relaciones entre las variables factor y el espesor, planteamos un modelo lineal normal, en el que partimos como modelo más complejo de aquel que incluye todas las interacciones de orden 3 entre los factores explicativos. No se han considerado interacciones de orden mayor, básicamente por principios de parsimonia y para facilitar la interpretabilidad de los resultados). La discriminación de efectos causales en el modelo, esto es, la selección de variables, se resuelve a través del criterio AIC, basado en maximizar la verosimilitud del modelo con el menor número posible de efectos o parámetros (y se resuelve automáticamente con la función step).

Se concluye a continuación sobre la bondad del ajuste con el estadístico F de Fisher y su p-valor, y con los coeficientes de determinación usual y ajustado, \(R^2\) y \(R^2_{ajustado}\). La validación de las hipótesis del modelo referidas a normalidad y homocedasticidad las corroboramos sobre los residuos a través de un análisis gráfico con gráficos qqplot y de confrontación de residuos frente a valores ajustados, para identificar algún tipo de tendencia que haya quedado sin explicar por el modelo; también se utilizan gráficos para detectar valores influyentes basados en distancias de Cook.

El análisis predictivo se resuelve sobre todas las configuraciones posibles de las variables explicativas, con valores predichos e intervalos de predicción al nivel de confianza del 95%. A partir de él, se identificarán las configuraciones para las que se predicen espesores más acordes con los objetivos de calidad, esto es, entre los límites de especificación 2.5mm y 3.5 mm., y con ellas se dará alguna recomendación a la empresa sobre cómo llevar a cabo la instalación de microcemento.

Software y hardware

Se ha utilizado el lenguaje de programación R (version 4.3.1 (2023-06-16)) y el interfaz RStudio (version 2023.09.1 Build 494). Las librerías utilizadas han sido:

  • ggplot2 vs 3.4.4 (Wickham, 2016), para la realización de gráficos,
  • qcc vs 2.7 (Scrucca, 2004), para diagramas de flujo y de causa-efecto,
  • gridExtra vs 2.3 (Auguie, 2017), para la disposición de los gráficos en las ventanas.
  • tidyverse vs 2.0.0 (Wickham et al, 2019) para la manipulación de datos
  • sjPlot vs 2.8.15 (Lüdecke, 2023) para la visualización del ajuste de modelos
  • jtools vs 2.2.2 (Long, 2022) para la presentación de los resultados de modelos

El hardware utilizado es un iMac 3GHz Intel core i5 de 6 núcleos, memoria de 16GB, macOS Sonoma 14.1.2. El software utilizado no tiene requerimientos especiales respecto al hardware a emplear.

Resultados

Análisis descriptivo

Centramos el análisis descriptivo en mostrar la información disponible sobre el espesor del microcemento, en global y para las diferentes instalaciones, y en investigar las posibles interacciones de orden 3 sobre dicho espesor, a través de gráficos de cajas cuatrivariantes (con el espesor como única variable numérica).

En la Figura 4 se ha representado, a través de un histograma, la distribución de las mediciones del espesor del microcemento en todas las instalaciones realizadas. Se aprecia cierta multimodalidad, posiblemente generada por diferencias entre las instalaciones.

Figura 4. Distribución del espesor del microcemento en todas las instalaciones. Histograma

Figura 4. Distribución del espesor del microcemento en todas las instalaciones. Histograma

Indagamos pues las diferencias en el espesor entre las diferentes instalaciones mediante diagramas de cajas. En la Figura 5 se muestra la distribución del espesor del microcemento en cada una de las distintas instalaciones (cada caja corresponde a una instalación). Se aprecia claramente la gran diversidad de espesores, e incluso el hecho de que solo en algunas instalaciones se han conseguido mediciones dentro de los rangos de especificación de calidad marcados por las líneas discontinuas rojas. El objetivo de calidad viene identificado por la línea continua roja.

Figura 5. Distribución del espesor del microcemento en cada una de las instalaciones.

Figura 5. Distribución del espesor del microcemento en cada una de las instalaciones.

En las Figuras 6-10 se muestran todos los gráficos de cajas que se generan al combinar tres factores potencialmente relacionados con el espesor del microcemento, con el fin de investigar visualmente las interrelaciones entre ellos al provocar un espesor mayor o menor en el microcemento instalado.

Figura 6. Interacciones de orden tres para explicar el espesor del microcemento: (imprimación:malla: aplicación) e (imprimación:malla: sellado)

Figura 6. Interacciones de orden tres para explicar el espesor del microcemento: (imprimación:malla: aplicación) e (imprimación:malla: sellado)

Figura 7. Interacciones de orden tres para explicar el espesor del microcemento: (imprimación:malla: barniz) e (imprimación:aplicación: sellado)

Figura 7. Interacciones de orden tres para explicar el espesor del microcemento: (imprimación:malla: barniz) e (imprimación:aplicación: sellado)

Figura 8. Interacciones de orden tres para explicar el espesor del microcemento:  (imprimación:aplicación:barniz) e (imprimación:sellado:barniz)

Figura 8. Interacciones de orden tres para explicar el espesor del microcemento: (imprimación:aplicación:barniz) e (imprimación:sellado:barniz)

Figura 9. Interacciones de orden tres para explicar el espesor del microcemento:  (malla:aplicación :sellado) y (malla:aplicación:barniz)

Figura 9. Interacciones de orden tres para explicar el espesor del microcemento: (malla:aplicación :sellado) y (malla:aplicación:barniz)

Figura 10. Interacciones de orden tres para explicar el espesor del microcemento:  (malla:sellado:barniz) y (aplicación:sellado:barniz)

Figura 10. Interacciones de orden tres para explicar el espesor del microcemento: (malla:sellado:barniz) y (aplicación:sellado:barniz)

A la vista de estos descriptivos en las Figuras 6-10 y de modo ordenado conforme se muestran los sucesivos gráficos, extraemos una serie de conclusiones que exponemos en la Tabla 1 a continuación. La primera columna identifica la figura; las siguientes tres, Factor x, las tres variables condicionales que aparecen en cada figura; y la última columna contiene la interpretación extraída de la visualización de los gráficos.

Figura Factor 1 Factor 2 Factor 3 Conclusión
6(1) imprimación malla aplicación en la aplicación a3 la malla m2 genera espesores claramente superiores a la malla m1 para la imprimación i1; también en la aplicación a3 las diferencias entre m1 y m2 con la imprimación i2 son más severas que con el resto de aplicaciones
6(2) imprimación malla sellado las diferencias de aplicar malla m1 o m2 son algo más severas en imprimación i1 para el sellado s1, y en imprimación s2 para la imprimación i2, si bien la tendencia es similar y los rangos de variación se solapan
7(1) imprimación malla barniz en imprimación i1 la malla m1 genera un espesor similar a la malla 2 con el barniz b1, y algo superior con el b2, si bien los rangos de variación están solapados; no se aprecia una diferenciación clara
7(2) imprimación aplicación sellado en la imprimación i2 las aplicaciones a1 y a2 funcionan diferente cuando varía el sellado; para el sellado s2 y con imprimación i2, la aplicación a1 genera espesores claramente inferiores a las otras, mientras que en sellado s1 es la aplicación a2 la que genera el menor espesor
8(1) imprimación aplicación barniz en la imprimación i1 la aplicación a3 se comporta diferente cuando varía el barniz; en la imprimación i2 es la aplicación a1 la que genera un comportamiento distinto por el hecho de aplicar barniz b1 o b2
8(2) imprimación sellado barniz en la imprimación i1 el sellado s2 genera espesores claramente superiores al s1 cuando se usa el barniz b1, y sin embargo los espesores son similares cuando se usa b2; en la imprimación i2 también varía el espesor con diferentes sellados según se aplique el barniz b1 o b2, si bien los rangos de variación están contenidos en un mismo rango
9(1) malla aplicación sellado para la malla m2 las aplicaciones a1 y a2 se comportan diferente cuando varía el sellado
9(2) malla aplicación barniz con la malla m1 la aplicación a1 se comporta diferente cuando varía el barniz; con la malla m2 el espesor que se consigue con la aplicación a3 es claramente superior con el barniz b2 al que se consigue con las otras aplicaciones
10(1) malla sellado barniz con cualquiera de las dos mallas, el efecto del sellado es distinto cuando varía el barniz
10(2) aplicación sellado barniz no se aprecia variación alguna en la relación entre aplicación y sellado cuando varía el barniz; sin embargo al utilizar la técnica a2 el efecto del sellado es claro para generar espesores distintos

A modo de conclusión, a partir de las interpretaciones anteriores, los efectos de interacción triple menos claros aparecen en las Figuras 6(2) -imprimación:malla:sellado- y 7(1) -imprimación:malla:barniz-. El resto de interacciones triples parece actuar claramente generando espesores mayores o menores. En cualquier caso, la verificación de qué efectos de interacción son relevantes para explicar la variación del espesor del microcemento al instalarlo, nos la dará el análisis inferencial a continuación.

Análisis inferencial

Para identificar estadísticamente cuáles de las cinco variables involucradas afectan al espesor del microcemento y cómo, procedemos con el ajuste de un modelo lineal normal con interacciones a lo sumo de orden 3 para facilitar la interpretación. En principio podemos asumir normalidad de la variable que contiene el espesor del microcemento, a pesar de su multimodalidad patente en la Figura 4, que puede venir explicada por el tipo de instalación; tras ajustar el modelo, verificaremos esta hipótesis sobre los residuos.

Para ajustar el modelo excluyendo efectos poco relevantes, procedemos con una selección automática de variables por el criterio AIC. El modelo resultante viene dado por los términos que aparecen en la fórmula a continuación:

## Y ~ imprim + malla + aplic + sellado + barniz + imprim:malla + 
##     imprim:aplic + imprim:sellado + imprim:barniz + malla:aplic + 
##     malla:sellado + malla:barniz + aplic:sellado + aplic:barniz + 
##     sellado:barniz + imprim:malla:aplic + imprim:malla:sellado + 
##     imprim:aplic:sellado + imprim:aplic:barniz + imprim:sellado:barniz + 
##     malla:aplic:sellado + malla:aplic:barniz + malla:sellado:barniz + 
##     aplic:sellado:barniz

La única interacción de orden 3 excluida del modelo es la de imprim:malla:barniz, que ya en el descriptivo se mostraba poco relevante. Al quedar incluidas en el modelo todas las interacciones de orden tres salvo una, quedan por defecto incluidas todas las interacciones de orden 2 y efectos principales.

Resulta pues, que todas las variables consideradas afectan al espesor del microcemento (todas son verificadas como causas), y además interaccionan entre ellas, esto es, no actúan de modo independiente para dar un espesor mayor o menor en la instalación de microcemento, sino de uno u otro modo en función de qué configuraciones se contemplan para el resto.

En la Figura 11 se muestran los coeficientes estimados para los términos en el modelo, junto con sus intervalos de confianza. En azul se muestran los efectos que influyen positivamente en el espesor del cemento, y en rojo los que afectan negativamente. La estimación del efecto global de interceptación es 2.57.

Figura 11. Coeficientes estimados en el modelo y sus intervalos de confianza

Figura 11. Coeficientes estimados en el modelo y sus intervalos de confianza

En la Tabla 1 se muestra la tabla de Anova del ajuste, donde se aprecia que todas las interacciones de orden 3, aun habiendo sido incluidas en el modelo por el criterio AIC, resultan significativas al 5%.

Tabla 1. Tabla de Anova para el modelo ajustado.
Df Sum Sq Mean Sq F value Pr(>F)
imprim 1 17.95 17.95 14.79 0.00
malla 1 0.01 0.01 0.01 0.94
aplic 2 38.12 19.06 15.70 0.00
sellado 1 1.42 1.42 1.17 0.28
barniz 1 12.56 12.56 10.34 0.00
imprim:malla 1 8.23 8.23 6.78 0.01
imprim:aplic 2 42.07 21.04 17.33 0.00
imprim:sellado 1 8.73 8.73 7.19 0.01
imprim:barniz 1 0.05 0.05 0.04 0.83
malla:aplic 2 3.94 1.97 1.62 0.20
malla:sellado 1 12.71 12.71 10.47 0.00
malla:barniz 1 11.63 11.63 9.58 0.00
aplic:sellado 2 32.58 16.29 13.42 0.00
aplic:barniz 2 5.88 2.94 2.42 0.09
sellado:barniz 1 4.00 4.00 3.30 0.07
imprim:malla:aplic 2 21.74 10.87 8.95 0.00
imprim:malla:sellado 1 10.44 10.44 8.60 0.00
imprim:aplic:sellado 2 5.72 2.86 2.36 0.10
imprim:aplic:barniz 2 18.21 9.11 7.50 0.00
imprim:sellado:barniz 1 11.23 11.23 9.25 0.00
malla:aplic:sellado 2 16.64 8.32 6.85 0.00
malla:aplic:barniz 2 55.28 27.64 22.77 0.00
malla:sellado:barniz 1 32.41 32.41 26.70 0.00
aplic:sellado:barniz 2 9.21 4.61 3.79 0.02
Residuals 204 247.64 1.21 NA NA

La bondad del ajuste dada por el p-valor asociado al estadístico \(F\) es buena (con un p-valor\(< 2.2e^{-16}\)), si bien el estadístico \(R^2\) tan solo llega a explicar un 60.59% de la variabilidad en los datos, y el \(R^2_{ajustado}\) el 53.83%%. El AIC del modelo ajustado es de 762.61 frente a un 764.6 que daba incluyendo la interacción finalmente excluída.

F(35,204) 8.96
0.61
Adj. R² 0.54

Para validar el modelo procedemos con el graficado de los residuos, en la Figura 12. Observamos que los residuos varían aleatoriamente y sin tendencias en torno al cero (Residuals vs Fitted y Scale-Location) y no se aprecian indicios de heterocedasticidad (varianzas distintas). Respecto a la normalidad (Q-Q residuals) se aprecia cierta divergencia de normalidad en ambas colas, si bien los residuos centrales se acomodan razonablemente bien a la diagonal. Respecto a valores influyentes (Constant Leverage), tan solo se identifica un valor, pero queda integrado en el rango de variación global de los residuos, por lo que no diferenciamos ningún registro como atípico.

Se dan pues por validadas todas las hipótesis del modelo ajustado, y probada así su fiabilidad para proporcionar conclusiones.

Figura 12: Gráficos de los residuos para la validación del modelo.

Figura 12: Gráficos de los residuos para la validación del modelo.

Predicción y recomendación

Una vez ajustado el modelo, lo utilizamos para predecir el espesor esperado bajo cada una de las configuraciones de las cinco variables predictoras. Los resultados se presentan en la Tabla 2, restringidos para aquellas combinaciones en las que el valor de la predicción se encuentra entre los límites de especificación, esto es, (2.5,3.5).

Tabla 2. Predicción del espesor, (columna fit) con su intervalo de confianza (lwr,upr), para las combinaciones cuya predicción está entre los límites de especificación (2.5,3.5).
imprim malla aplic sellado barniz fit lwr upr
3 i1 m2 a1 s1 b1 2.53 0.20 4.86
1 i1 m1 a1 s1 b1 2.57 0.24 4.90
21 i1 m1 a3 s2 b1 2.66 0.34 4.99
13 i1 m1 a1 s2 b1 2.68 0.35 5.01
42 i2 m1 a2 s2 b2 2.72 0.39 5.05
18 i2 m1 a2 s2 b1 2.75 0.42 5.08
25 i1 m1 a1 s1 b2 2.77 0.44 5.10
19 i1 m2 a2 s2 b1 2.78 0.45 5.11
24 i2 m2 a3 s2 b1 2.80 0.47 5.13
38 i2 m1 a1 s2 b2 2.83 0.50 5.16
47 i1 m2 a3 s2 b2 2.83 0.50 5.16
37 i1 m1 a1 s2 b2 2.95 0.62 5.28
23 i1 m2 a3 s2 b1 2.97 0.64 5.30
12 i2 m2 a3 s1 b1 3.10 0.77 5.43
6 i2 m1 a2 s1 b1 3.12 0.79 5.45
4 i2 m2 a1 s1 b1 3.31 0.98 5.64
46 i2 m1 a3 s2 b2 3.45 1.12 5.78
28 i2 m2 a1 s1 b2 3.49 1.16 5.82

Como apreciamos en la Tabla 2, la variabilidad de la predicción proporcionada por el modelo ajustado con toda la información es tan alta, que en ningún caso permite garantizar que el espesor del cemento vaya a cumplir con las especificaciones de calidad: todos los intervalos de predicción exceden notoriamente el límite superior de especificación de 3.5mm y quedan muy por debajo del límite inferior de especificación de 2.5mm. Con todo, a la vista de estos resultados, las configuraciones que generan un espesor más centrado en torno al objetivo de espesor de 3mm, y que se recomiendan a la empresa son:

  • imprimación i1 - malla m2 - aplicación a3 - sellado s2 - barniz b1, con una estimación de 2.97mm
  • imprimación i2 - malla m2 - aplicación a3 - sellado s1 - barniz b1, con una estimación de 3.10mm.

Un nuevo diseño del experimento y análisis de datos con unas pocas configuraciones (de entre las que proporcionan mejores resultados en la Tabla 2) podría proporcionarnos predicciones más ajustadas, y por lo tanto recomendaciones más precisas para la empresa.

Conclusiones

Preocupados por conseguir una instalación de microcemento según los estándares de calidad, \(3mm \pm 0.5\), la empresa instaladora probó durante el pasado año, en sus instalaciones, distintas configuraciones para las variables: tipo de imprimación, tipo de malla, técnica de aplicación del microcemento, técnica de sellado y tipo de barniz. Tras realizar un análisis estadístico completo, descriptivo e inferencial mediante el ajuste de un modelo lineal normal, se obtiene que todas estas variables afectan al espesor del microcemento, y además lo hacen interaccionando entre ellas, con interacciones hasta de orden 3, salvo la dada por la combinación de imprimación con malla y con barniz. Interacciones de orden mayor no se contemplaron por las dificultades en su interpretación. Todas las variables consideradas, por lo tanto, se identifican como causas que afectan al espesor del cemento, si bien no actúan de modo independiente, sino combinadas (distintas configuraciones de unas afectan de forma diferente según las configuraciones de las otras).

El modelo es validado convenientemente y utilizado a continuación para predecir el espesor bajo las distintas configuraciones posibles. Son seleccionadas aquellas que producen espesores dentro de los límites de especificación, dando un par de recomendaciones que, si bien producen estimaciones centradas en el objetivo de calidad, su intervalo de predicción rebasa con creces los límites de especificación. La gran variabilidad en la base de datos considerada impide obtener predicciones más precisas y por lo tanto que den mayores garantías sobre el cumplimiento de los requisitos de calidad. No obstante, cabría considerar un rediseño de las pruebas y el subsecuente análisis de datos, seleccionando exclusivamente las configuraciones que proporcionan espesores más acordes con los objetivos de calidad.

Se da respuesta así a los objetivos planteados en el estudio: todas las variables consideradas se pueden considerar causas para producir espesores mayores o menores, y afectan interaccionando entre sí. Las recomendaciones dadas son utilizar las combinaciones i1-m2-a3-s2-b1 o i2-m2-a3-s1-b1 para imprimación, malla, aplicación, sellado y barnizado.

Bibliografía

Auguie B (2017). gridExtra: Miscellaneous Functions for “Grid” Graphics. R package version 2.3, https://CRAN.R-project.org/package=gridExtra.

Long JA (2022). jtools: Analysis and Presentation of Social Scientific Data. R package version 2.2.0, https://cran.r-project.org/package=jtools.

Lüdecke D (2023). sjPlot: Data Visualization for Statistics in Social Science. R package version 2.8.15, https://CRAN.R-project.org/package=sjPlot.

Scrucca L (2004). “qcc: an R package for quality control charting and statistical process control.” R News, 4/1, 11–17. https://cran.r-project.org/doc/Rnews/.

Wickham H (2016). ggplot2: Elegant Graphics for Data Analysis. Springer-Verlag New York. ISBN 978-3-319-24277-4, https://ggplot2.tidyverse.org.

Wickham H, Averick M, Bryan J, Chang W, McGowan LD, François R, Grolemund G, Hayes A, Henry L, Hester J, Kuhn M, Pedersen TL, Miller E, Bache SM, Müller K, Ooms J, Robinson D, Seidel DP, Spinu V, Takahashi K, Vaughan D, Wilke C, Woo K, Yutani H (2019). “Welcome to the tidyverse.” Journal of Open Source Software, 4(43), 1686. doi:10.21105/joss.01686 https://doi.org/10.21105/joss.01686.

Zhu H (2021). kableExtra: Construct Complex Table with ‘kable’ and Pipe Syntax. R package version 1.3.4, https://CRAN.R-project.org/package=kableExtra.

Anexo. Código

# Lectura de los datos
setwd("~/Dropbox/DOCUMENTOS_ASUN/SIXSIGMA/CURSO 23-24")
datos = read.csv("datos_a8.csv")
datos= as.tibble(datos)
instalaciones=unique(datos[,2:6])
datos$instalacion=0

# Creación de la variable 'instalación'
for(i in 1:nrow(datos)){
  for(j in 1:nrow(instalaciones)){
  if(mean(datos[i,2:6] == instalaciones[j,])==1)
    datos$instalacion[i]=paste0("instal",j)
  }
}

# Especificaciones de calidad
target=3
tol=0.5

# Distribución del espesor del microcemento 
# en cada una de las instalaciones
ggplot(datos,aes(x=instalacion,y=Y))+
  geom_boxplot()+
  scale_x_discrete(labels=1:48)+
  labs(x="Instalación",y="Espesor microcemento")+
  geom_hline(yintercept=target,color="red")+
  geom_hline(yintercept=c(target-tol,target+tol),color="red",linetype="dashed")+
  theme(axis.text.x = element_text(angle = 90))
  
# Distribución del espesor del microcemento en todas las 
# instalaciones. Histograma
ggplot(datos, aes(x=Y))+
geom_histogram(bins=12,fill="steelblue",color="yellow")+
  labs(x="Espesor del microcemento",y="")
  
  
# Gráficos de cajas condicionados cuatrivariados
g=list()
nombres=colnames(datos)
variables=c("id","Imprimación","Tipo de malla","Aplicación","Sellado","Barnizado","Espesor")
m=1
for(i in 2:4){
  for(j in (i+1):5){
    for(k in (j+1):6){
  g[[m]]=ggplot(datos,aes(x=.data[[nombres[i]]],y=Y))+
  geom_boxplot(aes(color=.data[[nombres[j]]]))+
  facet_wrap(vars(.data[[nombres[k]]]))+
  labs(x=variables[i],y=variables[7],
       title=variables[k],color=variables[j])
       m=m+1
    }
  }
}

# Visualización de los gráficos condicionados
for(i in c(1,3,5,7,9)){
grid.arrange(g[[i]], g[[i+1]],ncol=1)
}


# Ajuste del modelo
fit=lm(Y~(imprim+malla+aplic+sellado+barniz)^3,data=datos)
# selección automática por el AIC
fit.fit=step(fit)

# Mostramos la ecuación del modelo resultante
get_formula(fit.fit)

# Gráfico con los Coeficientes estimados en el modelo 
# y sus intervalos de confianza
plot_model(fit.fit,type="est")


# Tabla de Anova del modelo
kbl(anova(fit.fit),digits=2,caption="Tabla 1. Tabla de Anova para el modelo ajustado.") %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed"),font_size=12,fixed_thead = T)
  
# Bondad del ajuste
summ(fit.fit,model.info=F,model.coefs=F)
summary(fit.fit)$r.squared
summary(fit.fit)$adj.r.squared


# validación del modelo con los residuos
par(mfrow=c(2,2))
plot(fit.fit)
par(mfrow=c(1,1))

#predicción para todas las configuraciones
newdata=expand.grid(imprim=unique(datos$imprim), malla=unique(datos$malla),                   aplic=unique(datos$aplic),sellado=unique(datos$sellado),
                    barniz=unique(datos$barniz))
pred=predict(fit.fit,newdata,se.fit=F,interval="prediction")
sol=cbind(newdata,pred)

# Selección de predicciones en intervalo especificación 
# y ordenación
sol %>%
  filter(fit<3.5 & fit>2.5) %>%
  arrange(fit) %>%
kbl(digits=2,caption="Tabla 2. Predicción del espesor, (columna fit) con su intervalo de confianza (lwr,upr), para las combinaciones cuya predicción está entre los límites de especificación.") %>%
  kable_styling(bootstrap_options = c("striped", "hover", "condensed"),fixed_thead = T)