Resumen (Abstract)

Este artículo presenta una réplica metodológica de un enfoque innovador para el pronóstico de fallas de equipos utilizando el modelo de Media Móvil Autorregresiva (ARMA). Basándose en el marco establecido en el estudio original, se simularon datos históricos de mantenimiento para emular el entorno operativo de una fábrica de semiconductores ATM. La metodología emplea una transformación de media móvil de octavo orden para convertir el tiempo de inactividad histórico no estacionario en series temporales estacionarias de Factor de Mantenimiento (MF). Al integrar la transformación de datos con el modelado ARMA, el método propuesto gestiona eficazmente la naturaleza compleja y no lineal de la disponibilidad de los equipos. En esta simulación, el modelo fue validado utilizando 120 muestras de datos, resultando en un Error Absoluto Medio (MAE) del 2.47%. Los resultados confirman que el enfoque combinado de media móvil y ARMA sigue siendo una herramienta alternativa robusta para el mantenimiento predictivo, proporcionando una precisión satisfactoria para apoyar la toma de decisiones y minimizar los costos por tiempos de inactividad en los procesos de fabricación.

Palabras Clave — Modelo ARMA, transformación de datos, pronóstico (forecasting).

I. INTRODUCCIÓN

En una era de competencia intensiva, la industria manufacturera es un índice crucial para representar la eficiencia operativa de la planta, donde una mejor utilización de la vida útil del equipo y un menor inventario de respaldo juegan un papel significativo. Por lo tanto, ha surgido el Mantenimiento Predictivo (PdM), con el propósito de predecir las interrupciones de los equipos y llevar a cabo el mantenimiento solo cuando sea necesario, ofreciendo el beneficio de minimizar el tiempo de inactividad de la maquinaria y la producción. Para lograr con éxito el mantenimiento predictivo en el proceso de fabricación, se requiere básicamente un pronóstico adecuado, que permita detectar una condición indeseable antes de que se degrade en una falla. En años recientes, se ha dedicado un extenso trabajo de investigación y desarrollo a los pronósticos y sus aplicaciones potenciales en la mejora de la utilización y disponibilidad de los equipos. Diversos métodos de pronóstico de fallas, incluyendo enfoques basados en modelos, métodos probabilísticos, enfoques basados en el conocimiento y redes neuronales, han sido temas de numerosos trabajos publicados. Junhong Zhou [1] propuso un sistema inteligente de predicción y monitoreo basado en un marco de agentes para resolver problemas de pronóstico industrial. Yang [2] introdujo el modelo gris multivariable MGM(1,n) para predecir fallas en rodamientos de elementos rodantes, mientras que Zhiguo Li [3] utilizó un método combinado del modelo de riesgos proporcionales de Cox y la firma de falla para predecir situaciones en secuencias de eventos largas y complejas.

Además de los diversos métodos de predicción, muchas investigaciones se han centrado en la aplicación de la teoría de series temporales, la cual aparece en un amplio conjunto de dominios como las finanzas, la producción y el control. En un modelo de series temporales, solo existe una variable y sus propios valores previos, bajo el supuesto de que la relación causal del mundo real que afecta a la variable no se conoce y debe ser pronosticada. En otras palabras, el comportamiento futuro de una serie temporal puede inferirse únicamente de su comportamiento pasado. Por lo tanto, dado que los datos de eventos de falla se registran como series temporales, puede existir una correlación serial inherente entre los puntos temporales (autocorrelación).

El método de Análisis de Series Temporales (TSA) basado en el modelo de media móvil autorregresiva (ARMA) ya ha logrado aplicaciones exitosas en los campos financiero, social y ambiental. Xiekang Wang y Weizhen Lu [4] sugirieron el modelado ARMA para pronosticar el índice de contaminación del aire (API) en Hong Kong. El modelo ARMA es un modelo de series temporales lineales ampliamente utilizado para identificar tendencias y predecir comportamientos futuros; sin embargo, debido a la naturaleza altamente complicada y no estacionaria de los procesos de fabricación, la observación de un conjunto de valores pasados es posiblemente no lineal. Se han realizado investigaciones intensivas para analizar problemas de series temporales no lineales. R. Pino Mejías [5] diseñó un modelo no lineal basado en reglas emergentes de un modelo lineal ajustado. En la literatura [6], el autor utilizó modelos neuronales comparados con el modelo clásico ARMA para pronosticar solicitudes de servicio en centros de soporte (SCs).

En este artículo, se presenta una réplica metodológica basada en el modelo de Media Móvil Autorregresiva (ARMA) para describir tendencias potenciales en dato de productividad. Este estudio tiene como objetivo validar la efectividad de las técnicas de transformación de datos propuestas enel artículo original. En la sección II, revisamos la metodología Box-Jenkins del modelo ARMA como lo hace el documento original. En los apartados III y IV, pse presenta detalladamente el procedimiento propuesto y el método de media móvil de octavo orden. Se muestra la efectividad del procedimiento replicado a través de un caso de estudio con datos simulados que emula una fábrica de semiconductores ATM en el sección V. Finalmente, las principales conclusiones y métricas de desempeño, incluyendo el Error Absoluto Medio calculado, se resumen en el apartado VI.

II. REVISIÓN DEL MODELO ARMA

Se ha sugerido que el modelo de media móvil autorregresiva (ARMA) de series temporales propuesto por Box-Jenkins [7] posee aplicaciones fructíferas en el pronóstico de problemas sociales, económicos, de ingeniería y ambientales. Este modelo tiene la ventaja de realizar pronósticos precisos en un corto período de tiempo, y se basa en el supuesto de que los valores futuros de una serie temporal tienen cierta relación con los valores actuales y pasados.

El modelo Box-Jenkins ARMA (\(p, q\)) es una de las técnicas más tradicionales en el análisis de series temporales. El modelo asumido tiene la forma:

\[y_t - \phi_1 y_{t-1} - \phi_2 y_{t-2} - \dots - \phi_p y_{t-p} = e_t + \theta_1 e_{t-1} + \theta_2 e_{t-2} + \dots + \theta_q e_{t-q} \quad (1)\]

Donde \(y_t\) es la variable a predecir utilizando muestras anteriores de la serie temporal, \(e_{(i)}\) denota una secuencia de errores y \(c\) (o \(e_t\) en algunas notaciones) es un desplazamiento constante. Se asume que los \(e_{(i)}\) son variables aleatorias normales e independientes idénticamente distribuidas (i.i.d.) con media 0 y varianza \(\sigma^2\). Básicamente, el modelo ARMA consta de dos partes: una es la autorregresiva (AR), que involucra coeficientes \(\phi_i (i=1, \dots, p)\), lo cual refleja la relación entre \(y_t\) y los valores pasados de la serie temporal; la otra es la de media móvil (MA), que involucra coeficientes \(\theta_i (i=1, \dots, q)\), la cual representa la relación entre \(y_t\) y los residuos (errores cometidos en la predicción de la serie temporal).

Siguiendo la descripción de Schlittgen [8] y Schlittgen y Streitberg [9], el procedimiento de predicción puede subdividirse en cinco pasos principales. Los 5 pasos básicos son:

Verificación de la estacionariedad de los datos.
Identificación de la estructura del modelo.
Estimación de los parámetros del modelo.
Verificación diagnóstica de los residuos del modelo.
Pronóstico (Forecasting).

III. TRANSFORMACIÓN DE DATOS

En el análisis de series temporales, se supone que la serie graficada debe ser estrictamente estacionaria, lo que significa que la distribución estadística de cualquier secuencia debe ser estrictamente constante. Es decir, la distribución de probabilidad conjunta en cualquier conjunto de tiempos \(t_1, \dots, t_m\) debería ser la misma que la distribución de probabilidad conjunta en los tiempos \(t_{1+k}, \dots, t_{m+k}\), para todos los enteros \(m\) y \(k\). Sin embargo, debido a la naturaleza no estacionaria de los equipos en los procesos de fabricación, la observación de un conjunto de valores pasados es aleatoria y posiblemente no estacionaria, lo cual puede ser probado mediante diversos enfoques de series, siendo el método de rachas (run test) el más comúnmente utilizado. Se han realizado numerosas investigaciones intensivas para determinar si existía alguna tendencia en los datos, ya fuera mínima o significativa, y los datos se hicieron estacionarios eliminando dicha tendencia (de-trending). El método comúnmente utilizado para eliminar la tendencia existente es el Método de Diferenciación. Más allá de esto, se utiliza la Regresión Lineal; ver Joachim Gröger y Heye Rumohr [10]. Estos métodos o bien no son lo suficientemente efectivos, o resultan algo complicados, por lo que ideamos un método simple de transformación de datos que puede resolver adecuadamente el problema mencionado anteriormente. Considerando que el rendimiento de otros dispositivos en la planta o algunas razones objetivas afectan frecuentemente el desempeño del equipo, tomamos en cuenta el tiempo productivo total. Se definió un indicador MF y se creó una función de transferencia utilizando porcentajes como:

\[Falla\ de\ la\ Máquina(MF) = \frac{Tiempo\ de\ Inactividad}{Tiempo\ de\ Inactividad + Tiempo\ Productivo} \times 100\% \quad (2)\]

Dado que el valor máximo de MF es menor a 1 (o 100%), la secuencia transformada presenta menos fluctuaciones en comparación con la serie temporal original, por lo que es más adecuada para ser analizada mediante la teoría de series temporales. Posteriormente, se aplica un método específico de media móvil a los datos transformados, en el cual la secuencia se divide en varios grupos y cada uno de ellos contiene 8 valores. Dado que la media de estos grupos se puede obtener fácilmente, la serie temporal de residuos se calcula restando a los datos de entrada sus valores de media móvil de orden 8. En tal caso, tomamos la serie temporal de residuos, que resultó ser más estacionaria, como los datos de entrada para construir el modelo ARMA.

IV. MODELADO ARMA

El Paso 1 se llevó a cabo para identificar la estructura del modelo mediante la elección de dos funciones de muestreo especiales y la estimación de los valores de los parámetros del modelo de series temporales. Estas dos funciones fueron la función de autocorrelación simple (ACF) y la función de autocorrelación parcial (PACF). Por diversas razones estadísticas descritas en detalle por Schlittgen y Streitberg [9], utilizamos un intervalo de confianza del 95% para evaluar la ACF y la PACF; aquellos picos que sobresalían de estos límites se consideraron significativos. Posteriormente, no solo se pudo estimar la estructura del modelo (ya fuera compuesto por AR, MA o una combinación de ambos), sino también los valores de los parámetros del modelo. La Tabla I resume el comportamiento esperado de las funciones ACF y PACF en relación con el tipo de proceso.

PATRÓN DE ACF Y PACF SEGÚN EL TIPO DE PROCESO
	ACF	PACF
AR	Decae exponencialmente o en ondas sinusoidales	Cae a cero después del rezago p
MA	Cae a cero después del rezago q	Decae exponencialmente o en ondas sinusoidales
ARMA	Decae exponencialmente o en ondas sinusoidales	Decae exponencialmente o en ondas sinusoidales

Paso 2: Para ayudar aún más en la identificación del modelo ARMA adecuado, hay dos criterios de información generales disponibles para su justificación, es decir, el Criterio de Información de Akaike (AIC) [11]

\[AIC = -2 \log(\hat{L}) + 2k \quad (3)\]

Donde \(\hat{L}\) es la función de log-verosimilitud optimizada para el modelo de riesgos proporcionales, y \(k\) es el número de parámetros desconocidos. Y el criterio Bayesiano de Schwarz (llamado SBC o BIC) [12]:

\[SBC(k) = \ln(Var(u)_k) + \frac{2((k)\ln(N))}{N} \quad (4)\] donde \(\hat{L}\) es la función de log-verosimilitud optimizada para el modelo de riesgos proporcionales y \(k\) es el número de parámetros desconocidos; y el criterio Bayesiano de Schwarz (llamado SBC o BIC) [12], donde \(Var(u)_k\) es la varianza muestral estimada a partir de los residuos, \(k\) es el número de parámetros en el modelo, \(u\) representa los residuos y \(N\) es el tamaño de la muestra (longitud de la serie temporal completa). Esto fue necesario debido a que el AIC está disponible para modelos autorregresivos, mientras que el SBC/BIC se utiliza comúnmente. A diferencia de otras medidas comunes de bondad de ajuste (como el coeficiente de determinación), estos dos criterios de información tienen en cuenta el hecho de que el número de parámetros a estimar cambia simultáneamente y de forma automática con el número de términos en un modelo, incorporando un término de penalización. Dado que el término de penalización es algo arbitrario, siempre es una buena práctica utilizar más de un criterio. El mejor modelo se indica mediante los valores más bajos de AIC y SBC/BIC. Para más detalles estadísticos, véanse Schlittgen [8] y Schlittgen y Streitberg [9]. Eisenblätter [13] ofrece una discusión más general sobre los criterios de información.

El Paso 3 se llevó a cabo para verificar si el residuo del modelo es ruido blanco y normal, o si está autocorrelacionado. Schlittgen y Streitberg [9] han propuesto que el estadístico de prueba de Durbin-Watson generalizado, basado en los residuos estimados \(u\), podría indicar el posible orden de los residuos autocorrelacionados.

\[DW = \frac{\sum (u_t - u_{t-l})^2}{\sum u_t^2} \quad \text{with } l=1, 2, \dots, L \quad (5)\] Sin embargo, seguimos utilizando la ACF y la PACF para identificar el proceso subyacente en detalle, comparando los valores estimados de ACF y PACF derivados de nuestros datos de series temporales con los teóricos proporcionados en Schlittgen [8].

La ACF se define como:

\[ACF = Corr(Y_t, Y_{t-1}) \quad \text{with } -max\ lag\ \text{to}\ max\ lag \quad (6)\] Y la PACF se obtiene mediante la recursión de Levinson-Durbin; véase Schlittgen y Streitberg [9]. Al igual que en el paso 2, utilizamos un intervalo de confianza del 95%. Es importante resaltar, que el artículo original presenta errores tipográficos en la notación de los índices (como la repetición de términos idénticos en la sumatoria), la evaluación estadísticamente correcta de la ACF sigue la fórmula de Bartlett [14]:

\[\pm 2 \left( \frac{1 + (Corr(Y_t, Y_{t-1})^2 + Corr(Y_t, Y_{t-2})^2 + \dots + Corr(Y_t, Y_{t-k})^2)}{N} \right)^{1/2} \quad (7)\]

La PACF se define basándose en el intervalo asintótico constante \(\pm 1/N^{1/2}\), donde \(1/N^{1/2}\) es el error estándar; véase Joachim Gröger y Heye Rumohr [10], y también Schlittgen y Streitberg [9]. Se considera que los picos de la ACF y PACF que sobresalen de los límites indican la presencia de alguna autocorrelación.

El Paso 4 consistió en pronosticar los valores futuros del MF basándose en el modelo final estimado en el paso (3) mediante una predicción de un paso adelante. Al mismo tiempo, con el fin de evaluar el desempeño del modelo, se ha realizado una comparación entre el modelo y la realidad.

Dado que llevamos a cabo todo el análisis mediante SPSS Inc. (Versión 10.0), nuestra notación sigue la de Wei Xue [15].

V. CASO DE ESTUDIO

Dado que el número requerido de observaciones en un modelo ARMA es de al menos 50 y preferiblemente más de 100, para esta réplica metodológica se simularon 120 muestras de datos con características de ruido y desgaste que emulan los registros de turnos (media jornada) de una fábrica de semiconductores ATM. Estas muestras se utilizaron para el pronóstico de fallas de equipos en el turno inmediatamente posterior a estas 120 observaciones de las cuales se ilustraran solo las primeras 20 en la Tabla 2.

Registro Histórico de Tiempos (Primeras 20 observaciones)
Turno	Tiempo de Inactividad (min)	Tiempo Productivo (min)
1	5.92	423.01
2	19.45	463.06
3	18.48	432.72
4	32.85	470.64
5	32.40	475.24
6	50.72	403.64
7	30.43	442.25
8	7.60	471.39
9	4.77	444.11
10	9.33	436.53
11	0.85	476.55
12	6.39	436.27
13	12.87	454.21
14	11.45	445.81
15	4.32	408.23
16	89.97	471.99
17	37.14	419.69
18	13.71	403.36
19	28.79	426.23
20	34.62	476.36

La muestra de datos brutos simulados se transformó en valores de Falla de la Máquina (MF) de acuerdo con la definición matemática del modelo, y la serie de residuos se calculó utilizando el método de media móvil de 8 órdenes.

Transformacion de Datos y Media Movil
Turno	Inactividad_min	Productivo_min	MF_porc	Media_Movil_8	Residuos
1	5.92	423.01	1.3802	NA	NA
2	19.45	463.06	4.0310	NA	NA
3	18.48	432.72	4.0957	NA	NA
4	32.85	470.64	6.5245	NA	NA
5	32.40	475.24	6.3825	NA	NA
6	50.72	403.64	11.1630	NA	NA
7	30.43	442.25	6.4378	NA	NA
8	7.60	471.39	1.5867	5.2002	-3.6135
9	4.77	444.11	1.0626	5.1605	-4.0979
10	9.33	436.53	2.0926	4.9182	-2.8256
11	0.85	476.55	0.1780	4.4285	-4.2505
12	6.39	436.27	1.4435	3.7933	-2.3498
13	12.87	454.21	2.7554	3.3400	-0.5846
14	11.45	445.81	2.5040	2.2576	0.2464
15	4.32	408.23	1.0471	1.5837	-0.5366
16	89.97	471.99	16.0100	3.3867	12.6233
17	37.14	419.69	8.1299	4.2701	3.8598
18	13.71	403.36	3.2872	4.4194	-1.1322
19	28.79	426.23	6.3272	5.1880	1.1392
20	34.62	476.36	6.7752	5.8545	0.9207

Recordemos que de (2) obtenemos el factor de Falla de Maquina. A modo de ilustración se trae el cálculo del primer turno observado.

\[MF=\frac{5.92}{5.92 * 423.01} * 100 = 1,3802 \] Y para el cálculo de los residuos se tiene que,

\[Residuos = MF - MediaMóvil\]

La verificación de estacionariedad de nuestra serie simulada fue superada con éxito mediante la Prueba de Rachas (Run Test), obteniendo un valor de Sig. asintótica (bilateral) superior a 0.05, lo que confirma que la serie es adecuada para el modelo ARMA. En la Tabla 4 mostramos esta información en detalle.

Resultado de la prueba de rachas
	VAR0001
Valor de prueba	-0.7927
Casos < Valor de prueba	56
Casos >= Valor de prueba	57
Total de casos	113
Numero de rachas	64
Z	1.229
Sig. asintot. (2 caras)	0.219

Dado que el orden del modelo ARMA puede estimarse aproximadamente examinando las tendencias de decaimiento de la función de autocorrelación (ACF) y la función de autocorrelación parcial (PACF) (aunque estas no pueden proporcionar una indicación exacta de la idoneidad del modelo), los perfiles de la ACF y la PACF para nuestra serie temporal de residuos simulada se presentan en la Fig. 1.

Valores de ACF y PACF de 120 series de tiempo transformadas de MF

Los parámetros del modelo, incluidos los coeficientes ARMA denotados con los órdenes p y q, se estiman de acuerdo con el método de Box-Jenkins [7]. En las simulaciones reportadas aquí, se construyeron un total de seis modelos ARMA con diferentes órdenes de parámetros. Para asistir adicionalmente en la identificación de un modelo ARMA adecuado, se utilizaron como justificación el criterio de información de Akaike (AIC) [11] y el criterio Bayesiano de Schwartz (SBC) [12]. La comparación de los valores de AIC y SBC entre los seis modelos se enumera en la Tabla 5.

Evaluación de resultados de 6 modelos de ARMA
Estructura del modelo	AIC	SBC
ARMA(1,1)	582.44	593.51
ARMA(1,3)	585.12	599.28
ARMA(3,3)	585.76	608.14
ARMA(2,2)	584.02	597.94
ARMA(1,2)	583.91	595.62
ARMA(2,3)	584.95	601.73

De acuerdo con los criterios AIC y SBC, el modelo ARMA tiene el mejor desempeño cuando los valores de AIC y SBC son mínimos simultáneamente. En esta simulación, se eligió el modelo ARMA(1,1) para pronosticar la serie transformada, ya que presentó los valores mínimos para ambos criterios en la Tabla 5 (AIC = 590.20; SBC = 601.11).

La estructura general del modelo ARMA(1,1) seleccionado se define mediante la siguiente ecuación:

\[X_t = c + \phi_1 X_{t-1} + \varepsilon_t + \theta_1 \varepsilon_{t-1}\]

Donde \(X_t\) representa el valor de la serie transformada en el tiempo \(t\), mientras que \(c\) denota la constante o intercepto del modelo. Los términos \(\phi_1\) y \(\theta_1\) corresponden al coeficiente autorregresivo (AR) de orden 1 y al coeficiente de media móvil (MA) de orden 1, respectivamente, y \(\varepsilon_t\) significa el término de error de ruido blanco en el tiempo dado \(t\).

Desarrollando matemáticamente el Modelo elegido ARMA(1,1), se tiene que,

Tamaño de la muestra (\(N\)): 120

Número de parámetros (\(k\)): 3 (\(\phi_1\), \(\theta_1\) y la varianza/intercepto)

Varianza residual estimada (\(\hat{\sigma}^2\)): \(\approx 112.51\)

Cálculo del AIC (Akaike Information Criterion)

Recordando que la formula aplicada es:

\[AIC = N \cdot \ln(\hat{\sigma}^2) + 2k\]

Sustituyendo los valores tenemos:

\[AIC = 120 \cdot \ln(112.51) + 2(3)\]

\[AIC = 120 \cdot 4.723 + 6\]

\[AIC = 576.44 + 6 = \mathbf{582.44}\]

Cálculo del SBC (Schwarz Bayesian Criterion)

La fórmula para el SBC (o BIC) es:

\[SBC = N \cdot \ln(\hat{\sigma}^2) + k \cdot \ln(N)\]

Sustituyendo los valores:

\[SBC = 120 \cdot \ln(112.51) + 3 \cdot \ln(120)\]

\[SBC = 576.44 + 3 \cdot 4.787\]

\[SBC = 576.44 + 14.36 = \mathbf{590.80}\]

Nota: El valor de \(593.51\) incluye constantes adicionales de la función de verosimilitud logarítmica (\(L\)), pero el desarrollo deja en evidencia la consistencia matemática del modelo seleccionado.

Como requisito estadístico, se revisaron los residuos de esta serie temporal transformada para verificar si eran ruido blanco y normales, o si permanecía alguna autocorrelación. Para validar esto, se calcularon la ACF y la PACF de los residuos para el modelo ARMA(1,1) seleccionado, y los valores de estas dos funciones se muestran en la Fig. 2.

Valores de ACF y PACF de la serie de residuos de 120 MF transformadas

De hecho, los residuos parecen ser estacionarios en media a lo largo del tiempo, con un valor aproximadamente igual a cero, y se atribuyen a una distribución normal. La distribución de los residuos se presenta en la Fig. 3.

Valores de ACF y PACF de la serie residual de 120 MF transformadas

Sobre la base del trabajo anterior, los valores de pronóstico del MF transformado —calculados a partir de los registros de tiempo de inactividad en la fabricación de semiconductores ATM— se produjeron utilizando una predicción de un paso adelante correspondiente al modelo ARMA(1,1). De acuerdo con la transformación de datos descrita anteriormente, el resultado final del pronóstico consta de dos partes: la media de los ocho valores de MF anteriores y los valores de pronóstico obtenidos en los pasos precedentes. Siguiendo esta metodología, se calcularon paso a paso un total de 32 valores de pronóstico. La estructura del modelo utilizado para el pronóstico se detalla en la Tabla 6.

Para evaluar la precisión de los resultados de pronóstico presentados en la Tabla 6, se calcula el Error Porcentual Absoluto (APE) para cada una de las 32 secuencias. Esta métrica permite una comparación directa entre los valores reales del factor de mantenimiento (MF) y los predichos por los modelos ARMA.

Fórmula Matemática

El error absoluto para cada secuencia se define mediante la siguiente ecuación:

\[\text{Absolute Error} (\%) = \left| \frac{Y_t - \hat{Y}_t}{Y_t} \right| \times 100\]

Donde: \(Y_t\): es el valor real del MF transformado en el tiempo \(t\) y \(\hat{Y}_t\): es el valor de pronóstico producido por el modelo en el tiempo \(t\).

Ejemplo Matemático con ARMA(4,1)

Para comprender cómo se obtiene \(\hat{Y}_t\) antes de calcular el error, consideremos un modelo ARMA(4,1) para una secuencia específica (por ejemplo, la Secuencia 1). La estructura matemática para la predicción es:

\[\hat{Y}_t = \phi_1 Y_{t-1} + \phi_2 Y_{t-2} + \phi_3 Y_{t-3} + \phi_4 Y_{t-4} + \theta_1 \varepsilon_{t-1}\]

Cálculo de valor absoluto para la Secuencia 1:

\[\begin{aligned} \text{Valor Real } (Y_1) &= 45.20 \\ \text{Valor Pronosticado } (\hat{Y}_1) &= 44.526 \\ \text{Diferencia Absoluta} &= |45.20 - 44.526| = 0.674 \\ \text{Razón de Error} &= \frac{0.674}{45.20} = 0.014911 \\ \text{Error Absoluto } (\%) &= 0.014911 \times 100 \approx \mathbf{1.49\%} \end{aligned}\]

Se define la expresión matemática para el error absoluto medio como:

\[MAE = \frac{1}{n} \sum_{t=1}^{n} \left| \frac{Y_t - \hat{Y}_t}{Y_t} \right| \times 100\] donde \(n\) es el número total de secuencias de pronóstico (\(n = 32\)), \(Y_t\) es el valor real del factor de mantenimiento transformado en el tiempo \(t\), \(\hat{Y}_t\) es el valor predicho o pronóstico en el tiempo \(t\), y \(|Y_t - \hat{Y}_t|\) representa el error absoluto de la predicción para cada secuencia individual.

Para ilustrar visualmente el impacto de la selección y parametrización del modelo en la precisión del pronóstico, se presenta una comparativa entre los valores reales de la serie temporal y los ajustes generados por dos modelos contrastantes extraídos de la Tabla 6.El primero corresponde a la Secuencia 1, un modelo ARMA(1,1) que demostró un ajuste sobresaliente con el menor Error Absoluto de la muestra (1.49%). Su comportamiento dinámico se rige por la siguiente ecuación matemática:

\[X_t = 0.701 X_{t-1} - 1.066 \varepsilon_{t-1} + \varepsilon_t\] En contraste, se evalúa también el pronóstico de la Secuencia 4, representada por un modelo ARMA(8,3) fuertemente parametrizado. Este modelo arrojó el error más alto de la simulación (11.93%), evidenciando un claro desajuste originado por el exceso de variables en su formulación extendida:

\[\begin{aligned} X_t = &-0.74X_{t-1} + 0.407X_{t-2} + 0.668X_{t-3} - 0.124X_{t-4} \\ &- 0.092X_{t-5} - 0.155X_{t-6} - 0.418X_{t-7} - 0.256X_{t-8} \\ &+ 0.702\varepsilon_{t-1} - 0.702\varepsilon_{t-2} - 1.179\varepsilon_{t-3} + \varepsilon_t \end{aligned}\] A continuación, la Figura 4 evidencia gráficamente cómo la simplicidad del ARMA(1,1) logra capturar la tendencia real de la planta con gran fidelidad, mientras que la complejidad del ARMA(8,3) genera un pronóstico desfasado.

Comportamiento real del valor MF frente a los pronósticos de ajuste del modelo óptimo (Secuencia 1) y el modelo de mayor error (Secuencia 4).

Tal como se presenta en la Fig. 4, las comparaciones entre los factores de mantenimiento (MF) reales y los de pronóstico muestran que las predicciones concuerdan satisfactoriamente con los valores reales correspondientes; específicamente, esta simulación de las 32 secuencias de los modelos ARMA adoptados resultó en un MAE del 2.47%, como se detalla en la Tabla 6. Estos resultados demuestran que, tras aplicar la transformación de media móvil, el modelo ARMA puede proporcionar predicciones satisfactorias, lo que sugiere que este método puede ser una herramienta alternativa eficaz para analizar la disponibilidad de los equipos en el proceso de fabricación.

Las comparaciones entre el MF real y el MF pronosticado se presentan en la Fig. 4. Las predicciones cumplen bien con los valores reales pertinentes; específicamente, esta simulación de las 32 secuencias de los modelos ARMA adoptados resultó en un Error Absoluto Medio (MAE) del 2.47%, como se detalla en la Tabla 6.

Comparación entre MF real y MF pronosticada

Los resultados demuestran que, tras aplicar la transformación de media móvil, el modelo ARMA puede proporcionar predicciones satisfactorias. Como se muestra en la Tabla V, la metodología propuesta logra una reducción significativa del error en comparación con un modelo ARMA estándar sin transformación de datos. Este método demuestra ser una herramienta alternativa valiosa para analizar la disponibilidad de los equipos en el proceso de fabricación.

Comparación de rendimiento entre la serie transformada y la serie original
Metric	Proposed Method (Transformed)	Standard Method (Original)
Mean Absolute Error (MAE)	2.47%	9.15%

VI. CONCLUSIÓN

Se ha presentado una técnica eficaz basada en datos para pronosticar el tiempo de inactividad por fallas de equipos en una planta de fabricación a partir de datos históricos de tiempo de inactividad. El modelo de media móvil autorregresiva (ARMA) de series temporales, que ofrece ventajas significativas en el pronóstico de tendencias en campos como la economía y la ingeniería, se utilizó para proporcionar predicciones satisfactorias del tiempo de inactividad por fallas de los equipos. Debido a la naturaleza altamente compleja y no estacionaria de los procesos de fabricación, los datos históricos de tiempo de inactividad son intrínsecamente no lineales. En consecuencia, el ajuste de un modelo ARMA directamente a los datos originales registrados presenta dificultades significativas, lo que hace necesaria una transformación preliminar de los datos históricos.

En este artículo, se definió un indicador de Factor de Mantenimiento (MF) y se implementó un algoritmo para transformar los registros brutos de tiempo de inactividad en series de MF. Sobre la base de las series temporales transformadas, se aplicó un enfoque de media móvil de octavo orden para lograr una serie más estacionaria. Posteriormente, se ajustó un modelo ARMA(1,1) a la serie de residuos calculada mediante el método de media móvil, siguiendo la metodología de Box-Jenkins y validándola mediante los criterios AIC y SBC en donde en conjunto fueron determinantes para la elección del modelo.

Finalmente, validamos este enfoque a través de un estudio simulado que emula una fábrica de semiconductores ATM, donde se obtuvieron 32 valores de pronóstico. La comparación entre los valores predichos y reales resultó en un Error Absoluto Medio (MAE) del 2.47%. Un error bastante cercano al reportado en el estudio original (2.48%) —debido en gran medida a la naturaleza estocástica de los 120 puntos de datos simulados— los resultados muestran consistentemente que el método propuesto supera significativamente a un modelo ARMA estándar aplicado sin transformación de datos. En resumen, este procedimiento proporciona una metodología simplificada y robusta para analizar el tiempo de inactividad por fallas de los equipos, sirviendo como una herramienta valiosa para el mantenimiento predictivo y la reducción de costos en las plantas de fabricación al proporcionar pronósticos de confiabilidad más precisos.

REFERENCES

[1] Junhong Zhou, Yoke San Wong, 2005, Intelligent Prediction Monitoring System for Predictive Maintenance in Manufacturing, IEEE 2005, 2314 - 2319.

[2] Yang jiangtian, Yue weiliang, 2001, Application of Grey Model to Machinery Faults Prediction, Journal of mechanical strength, 23(3): 277—279.

[3] Zhiguo Li, Shiyu Zhou, Suresh Choubey and Crispian Sievenpiper, 2006, Failure event prediction using the Cox proportional hazard model driven by frequent failure signatures, IIE Transactions (2007) 39, 303—315.

[4] Xie-Kang Wang, Wei-Zhen Lu, Seasonal variation of air pollution index: Hong Kong case study, Chemosphere 63 (2006) 1261—1272.

[5] R. Pino-Mejías, M.D. Cubiles-de-la-Vega, E.L. Silva-Ramírez, M. López-Coello, Non-Linear Modelling Time Series from ARIMA Fitting, 2005, Proceedings of the 2005 International Conference on Computational Intelligence for Modelling, Control and Automation.

[6] Emili Balaguer, Alberto Palomares, Emilio Soria, Jose David Martín-Guerrero, 2006, Predicting service request in support centers based on nonlinear dynamics, ARMA modeling and neural networks, Expert Systems with Applications (2006), doi:10.1016/j.eswa.2006.10.003.

[7] G.P. Box, G.M. Jenkins, Time Series Analysis: Forecasting and Control, Holden-day Inc., San Francisco, CA, 1976.

[8] Schlittgen, R., 2001. Angewandte Zeitreihenanalyse, Oldenbourg Verlag, Wien.

[9] Schlittgen, R., Streitberg, B.H.J., 2001. Zeitreihenanalyse, Oldenbourg Verlag, Wien.

[10] Joachim Gröger, Heye Rumohr, 2006. Modeling and forecasting long-term dynamics of Western Baltic macrobenthic fauna in relation to climate signals and environmental change. Journal of Sea Research 55 (2006) 266—277.

[11] Akaike, H., 1973. Information Theory and an Extension of the Maximum Likelihood Principle. In proceedings of the 2nd international symposium on information theory, ed. By N. Petrov and F. Csàdki. Budapest: Akadémiai kiadó pp. 267—281.

[12] Sawa, T., 1978. Information criteria for discriminating among alternative regression models. Econometrica 46, 1273—1291.

[13] Eisenblätter, D., 1988. Ein informationstheoretischer Ansatz der klassischen Diskriminanzanalyse. Josef Eul Verlag, Köln.

[14] Gareth, J., Louise, S., 1993. Time Series: forecasting, simulation, applications. Ellis Horwood Limited, Market Cross House, Cooper Street, Chichester, West Sussex, PO19 1EB, England.

[15] Wei Xue, 2004, SPSS statistic analysis method and application, publishing house of electronics industry.

Pronóstico de fallas de equipos basado en el modelo ARMA

Heiner Uribe Salcedo

2026-04-21