RESUMEN La comprensión cuantitativa precisa y el monitoreo de la temperatura son indispensables debido a su enorme impacto en casi todos los aspectos de nuestras vidas. Este trabajo investiga las capacidades de predicción de dos técnicas de aprendizaje automático, a saber, el modelo autorregresivo integrado de media móvil estacional (SARIMA) y la memoria a largo y corto plazo (LSTM), y los compara en la predicción de datos de series temporales de temperatura media mensual para una estación meteorológica en Ankara, Turquía, desde enero de 2010 hasta marzo de 2023.

La comparación del rendimiento de los pronósticos se basó en el error cuadrático medio (MSE), la raíz del error cuadrático medio (RMSE) y el error absoluto medio (MAE). Los resultados mostraron que ambos modelos pueden capturar las variaciones de los datos de series temporales. Ambos modelos presentaron un desempeño razonablemente bueno en la predicción de la temperatura media mensual; sin embargo, el modelo ARIMA presentó el menor error de pronóstico en comparación con el modelo LSTM.

Predicción de series temporales de temperatura utilizando modelos ARIMA y LSTM.

Debido a la gran importancia de la temperatura del aire en casi todos los ámbitos de la vida humana, su comprensión y seguimiento cuantitativo resultan sumamente esenciales. En este estudio, se utilizaron datos de observación obtenidos de una estación meteorológica en Ankara entre enero de 2010 y marzo de 2023 para estimar la temperatura media mensual mediante los métodos de aprendizaje automático SARIMA (Modelo Autorregresivo Integrado de Media Móvil Estacional) y LSTM (Memoria a Largo y Corto Plazo), y se analizó comparativamente el desempeño de estos métodos en la predicción de la temperatura.

El rendimiento de los modelos se evaluó utilizando métricas de desempeño como el Error Cuadrático Medio (ECM), la Raíz del Error Cuadrático Medio (RECM) y el Error Absoluto Medio (EAM). Como resultado de la investigación, se observó que ambos métodos presentan un buen desempeño en la estimación de la temperatura media mensual. No obstante, se determinó que el modelo ARIMA presenta tasas de error más bajas en las tres métricas consideradas (ECM, RECM, EAM) en comparación con el modelo LSTM, lo que indica un mejor rendimiento.

1. Introducción

La temperatura es uno de los parámetrosclimatológicos más importantes, ya que tiene efectos directos e indirectos sobre los seres humanos, los animales y las plantas. Debido al cambio climático, resultado de las emisiones de gases de efecto invernadero generadas por las actividades humanas en la Tierra, se observan cambios a largo plazo en las temperaturas y en los patrones climáticos. Como consecuencia, se presentan fenómenos meteorológicos más severos y frecuentes, como tormentas, inundaciones repentinas, así como el aumento de sequías, el calentamiento de los océanos, el incremento del nivel del mar, la escasez de alimentos, la pobreza y el desplazamiento de poblaciones.

Existen muchas áreas en las que la temperatura ambiente es un factor clave, incluyendo la agricultura, la energía, la gestión de los recursos hídricos y la energía solar. Las variaciones en la temperatura generan una mayor demanda de energía, lo que puede ocasionar una fuerte presión sobre las redes eléctricas. Asimismo, la temperatura ambiente influye directamente en el crecimiento de los cultivos, el rendimiento agrícola y la demanda de agua en la agricultura. Temperaturas no adecuadas para el desarrollo de los cultivos pueden provocar bajos rendimientos y pérdidas en la productividad.

Por lo tanto, la importancia de la temperatura sigue siendo un tema relevante para los investigadores. Este estudio tiene como objetivo predecir los valores mensuales de temperatura a partir de datos históricos de una estación meteorológica ubicada en la ciudad de Ankara, Turquía, desde enero de 2010 hasta marzo de 2023, utilizando dos metodologías de predicción de series temporales: el modelo SARIMA (Promedio Móvil Integrado Autorregresivo Estacional) y el modelo LSTM (Memoria a Largo y Corto Plazo), y comparar sus desempeños predictivos.

Los modelos ARIMA (y su extensión SARIMA, que considera la estacionalidad en los datos) y LSTM han ganado una creciente popularidad entre los investigadores para el análisis de series temporales en diversas áreas (por ejemplo, ver [1, 2, 3, 4, 5]). Por ello, estas dos metodologías fueron seleccionadas en este estudio con el fin de evaluar y comparar el rendimiento de métodos populares de análisis y pronóstico de series temporales.

Los métodos de pronóstico de series temporales utilizan datos históricos y los analizan para encontrar patrones recurrentes presentes en ellos. Los datos que presentan ciertas características periódicas se emplean luego para predecir eventos y ocurrencias futuras. El modelo Autorregresivo Integrado de Media Móvil (ARIMA), de naturaleza estocástica, ha ganado gran popularidad como modelo de pronóstico de series temporales. Un modelo ARIMA puede considerarse como un tipo de modelo de análisis de regresión que estima las relaciones entre una variable dependiente y variables independientes.

Los modelos LSTM ofrecen otro enfoque para el pronóstico de series temporales y son ampliamente utilizados en diversas áreas. Las redes LSTM son una variante de las redes neuronales recurrentes (RNN) y se emplean en el campo del aprendizaje profundo. Una de las principales desventajas de las redes RNN es su memoria a corto plazo para retener información previa en la neurona actual. Para solucionar esto, se desarrollaron los modelos LSTM con el fin de poder conservar información durante períodos más largos [1], [4], [6], [7], [8].

Tanto los métodos ARIMA como LSTM han sido aplicados con éxito en numerosos estudios por diversos investigadores para predecir parámetros meteorológicos, incluyendo valores de temperatura diaria y mensual. En [9] se observaron cambios en la temperatura media a escala regional en Turquía entre 1950 y 1994 mediante análisis de series temporales. Se encontró una tendencia de enfriamiento estadísticamente significativa en 21 estaciones, una tendencia de calentamiento en una estación y ausencia de tendencia en 36 estaciones. En [10] se aplicó el modelo ARIMA a datos de cuatro estaciones meteorológicas para el período de 1990 a 2011 en Irak. En [11] se analizó la temperatura media mensual en Nanjing, China, utilizando datos desde 1951 hasta 2014 como conjunto de entrenamiento y datos entre 2015 y 2017 como conjunto de prueba, desarrollando un modelo ARIMA para dicho estudio.

En [7] se utilizaron tanto redes neuronales recurrentes (RNN) como metodologías LSTM para predecir la temperatura diaria y clasificarla en cinco categorías: “Frío”, “Fresco”, “Normal”, “Cálido” y “Caluroso”, utilizando datos desde 2000 hasta 2019.

En [1] se realizó un estudio de pronóstico y modelado de la temperatura diaria para cuatro sitios europeos con diferentes zonas climáticas, basado en datos de 1980 a 2010. Se emplearon modelos SARIMA y ARIMA con regresores externos, demostrando que el modelo desarrollado era capaz de representar la serie de datos y podía utilizarse para la predicción de valores futuros de temperatura diaria.

En [12] se utilizó un modelo SARIMA para pronosticar la temperatura media en la ciudad de Gujarat, India, empleando datos históricos del período 1984–2015. Se probaron varios modelos y se seleccionó el mejor modelo SARIMA (1, 0, 1) (1, 1, 1) (12) con base en el Criterio de Información de Akaike (AIC). La adecuación del modelo fue evaluada mediante diagnósticos, los cuales mostraron que era confiable para la predicción de temperaturas medias mensuales.

En [13] se pronosticó la temperatura máxima diaria utilizando tres métodos diferentes: ARIMA, SARIMA y el modelo Autorregresivo Fraccionalmente Integrado de Media Móvil (ARFIMA), para cuatro regiones distintas en Kerala, India, con datos desde enero de 2019 hasta diciembre de 2020. Posteriormente, ellos Compararon el desempeño de los tres métodos utilizando métricas como el error cuadrático medio (MSE), el error cuadrático medio (MSE) y la precisión porcentual (PA). Según los resultados, todos los modelos mostraron un buen desempeño, y el modelo ARFIMA presentó mejores resultados que los modelos ARIMA y SARIMA.

En [14] se desarrolló un modelo LSTM para predecir los atributos meteorológicos más significativos, como la precipitación y la temperatura, para una estación meteorológica en Sri Lanka. Para evaluar el rendimiento del modelo, se utilizaron métricas como la raíz del error cuadrático medio (RMSE) y el error absoluto medio (MAE). Como resultado, se demostró que los modelos LSTM desarrollados para la predicción de precipitación y temperatura tuvieron un buen desempeño y pueden emplearse para realizar predicciones precisas.

En [15] se desarrolló un modelo SARIMA utilizando series temporales de temperatura diaria para Memphis, Tennessee, basado en datos de 2016 a 2019. Se analizaron los datos de temperatura de ese período para identificar tendencias y variaciones transitorias en el tiempo. Se utilizó la prueba de Mann-Kendall (M-K) como una técnica no paramétrica para detectar patrones en el análisis de series temporales. El estudio reveló una tendencia creciente de 0.003 °F en la temperatura para casi todos los días. También se realizó un pronóstico utilizando el método SARIMA, estimando los valores de temperatura para los siguientes 50 días, el cual mostró igualmente una tendencia creciente para esa ubicación.

En [16] se predijeron las temperaturas medias mensuales mínimas y máximas para la cuenca del río Bhagirathi en India mediante un modelo ARIMA estacional, utilizando datos del período comprendido entre 2001 y 2020. Los resultados mostraron que los datos pronosticados se ajustan bien a la tendencia observada en los datos.

En [17] se desarrolló un modelo SARIMA para la predicción de series temporales de temperatura en Pune, India, utilizando un conjunto de datos del período 2009 a 2020. Se emplearon la función de autocorrelación, la función de autocorrelación parcial, así como los residuos estandarizados, con el fin de encontrar el mejor ajuste para la serie temporal del estudio, obteniéndose el modelo SARIMA (1, 1, 1) (1, 1, 1) (12), el cual representó de mejor manera los datos. Se realizaron diagnósticos del modelo y se encontró que este tenía un buen desempeño en la predicción de valores de temperatura.

En [18] se desarrolló e implementó un modelo LSTM en la plataforma de aprendizaje automático AWS. Se observó que el modelo LSTM ofreció resultados significativos con alta precisión en comparación con otras técnicas de pronóstico meteorológico.

2. Métodos En este estudio se utilizó un enfoque de series temporales para predecir los valores de temperatura media mensual de una estación meteorológica en Ankara, Turquía. Una serie temporal es una secuencia de datos que ocurren en orden sucesivo a lo largo del tiempo, como por hora, semanal, mensual o anual.

El enfoque de series temporales permite desarrollar un modelo adecuado que describe las estructuras inherentes de la serie mediante el análisis riguroso y el procesamiento de los datos de observaciones pasadas. Esto hace posible realizar predicciones futuras, así como tareas de monitoreo y control utilizando el modelo desarrollado [1].

2.1. Área de estudio y preprocesamiento de datos Los datos utilizados en este estudio pertenecen a la Estación Automática de Observación Meteorológica (AWOS), número 17130, que opera como parte de la Red de Observación del Servicio Meteorológico de Turquía y está ubicada cerca de la sede del Servicio Meteorológico Turco en Ankara, Turquía. La ubicación de la estación meteorológica se muestra en la Figura 1. Esta estación se encuentra en las coordenadas geográficas 39°58’21.0” N y 32°51’50.0” E, con una altitud de 883 m.

Dado que los datos originales provienen de Turquía y el presente estudio se desarrolla en un contexto geográfico distinto, no fue posible acceder directamente a la base de datos oficial de la estación AWOS 17130. En consecuencia, para efectos de este análisis se emplearon datos simulados, los cuales fueron generados de manera que conservan características similares a las observadas en registros meteorológicos reales. Estos datos se presentan a continuación y serán utilizados como base para el desarrollo del estudio.

La estación está equipada con sensores que miden diversos parámetros meteorológicos, como temperatura, humedad, precipitación y presión del aire, a intervalos específicos (cada segundo, minuto, hora o día, entre otros). La serie temporal utilizada en este estudio consiste en registros de temperatura media mensual obtenidos desde el 1 de enero de 2000 hasta marzo de 2023, y se considera representativa de las condiciones climáticas locales de Ankara.

Tabla 1. Estadísticas descriptivas de los datos de temperatura utilizados en el estudio.

   Media Std Err Median Moda Std Dev. Curtosis Skewness   Mín   Máx
    12.8     0.5  12.93 2.71     8.38    -1.34    -0.01 -2.95 27.34

Los datos se obtuvieron en un archivo de Excel con formato “.xlsx” y contienen un total de 279 mediciones de temperatura media mensual correspondientes a cada mes entre enero de 2020 y marzo de 2023. La Tabla 1 muestra algunas de las estadísticas descriptivas del conjunto de datos de temperatura utilizado en el estudio.

Los valores mínimo y máximo de temperatura media del conjunto de datos son -4.0 y 28.1, respectivamente. La curtosis es de -1.22 y la asimetría (skewness) es de 0.006 para la distribución del conjunto de datos. El valor negativo de la curtosis indica que los datos presentan una distribución más bien aplanada. Por otro lado, el valor de asimetría cercano a cero indica que las colas de la distribución son prácticamente simétricas y no difieren significativamente entre sí.

Los valores mínimo y máximo de temperatura media del conjunto de datos son -2.95 y 27.34, respectivamente. La curtosis es de -1.34 y la asimetría (skewness) es de -0.01 para la distribución del conjunto de datos. El valor negativo de la curtosis indica que los datos presentan una distribución más bien aplanada. Por otro lado, el valor de asimetría cercano a cero indica que las colas de la distribución son prácticamente simétricas y no difieren significativamente entre sí.

Se realizó un proceso de normalización antes de construir el modelo LSTM, escalando todos los valores del conjunto de datos al rango entre 0 y 1. En el caso del modelo ARIMA no se aplicó escalado, ya que este no es un paso necesario para este tipo de modelos.

Posteriormente, el conjunto de datos se dividió en datos de entrenamiento y prueba, reservando el 80% del total para entrenamiento y el 20% restante para el conjunto de prueba.

Los modelos LSTM y (S)ARIMA propuestos en este estudio se implementaron en el lenguaje de programación R. Se desarrolló un programa independiente para cada modelo. Para la implementación del modelo SARIMA se utilizó la librería forecast, ampliamente empleada para el análisis de series temporales en R, mientras que para el modelo LSTM se empleó la librería keras en su interfaz para R, orientada al desarrollo de modelos de aprendizaje profundo.

2.2. ARIMA

Los modelos de media móvil autorregresiva se utilizan en casos donde la salida no solo depende de la información actual, sino también de toda la información previa que ha ocurrido a lo largo de un periodo de tiempo. Los modelos ARIMA son aplicables únicamente a series temporales estacionarias; por lo tanto, es esencial asegurarse de que la serie de datos sea estacionaria antes de utilizar estos modelos. Generalmente, los modelos ARIMA se emplean con dos propósitos principales: analizar el conjunto de datos para comprenderlo mejor y predecir tendencias futuras.

Los modelos estadísticos autorregresivos, como ARIMA, predicen valores futuros a partir de valores pasados. Un uso muy común de estos modelos es la predicción de precios futuros en el mercado de valores, donde los precios de una acción pueden estimarse con base en sus valores históricos.

Los modelos ARIMA constan de tres componentes: AR, I y MA. El término “AR” (autoregresivo) se refiere a un modelo en el que una variable depende de sus propios valores previos o rezagados, permitiendo la predicción de valores futuros a partir de datos pasados. La “I” (integrado) representa la diferenciación de los valores de la serie temporal para hacerla estacionaria. Si el conjunto de datos no es estacionario, se transforma restando cada valor de su valor anterior. El componente “MA” (media móvil) representa el error del modelo como una combinación lineal de errores de predicción previos [19].

Los modelos ARIMA requieren que la serie temporal sea estacionaria, ya que los datos no estacionarios no pueden utilizarse directamente para su construcción. Por ello, el primer paso consiste en verificar la estacionariedad de los datos. En este estudio, la estacionariedad se evaluó mediante la prueba de raíz unitaria de Dickey-Fuller aumentada (ADF). Esta prueba se utiliza para determinar la presencia de una raíz unitaria en la serie de datos, lo cual se establece mediante las hipótesis nula y alternativa. Los resultados de la prueba de Dickey-Fuller confirmaron la estacionariedad del conjunto de datos, con un valor p menor a 0.01.

Adicionalmente, el gráfico ACF mostrado en la Figura 2 presenta un comportamiento similar a una onda sinusoidal, lo cual constituye otra evidencia de que la serie es estacionaria.

Figura 2. Funciones de autocorrelación (ACF) y autocorrelación parcial (PACF) de la temperatura media mensual durante el período enero de 2000 a marzo de 2023. Los gráficos ACF y PACF fueron trazados para 50 retardos (lags)

Como puede observarse en la Figura 2, el gráfico ACF se atenúa muy lentamente hasta el rezago 50, mientras que el gráfico PACF no presenta un corte claro incluso después del rezago 50. Esto sugiere que el modelo no corresponde a un modelo AR ni a un modelo MA.

Por lo tanto, se utilizó la función auto.arima() de la librería forecast en R para determinar el modelo con mejor ajuste para los datos.

2.3 SARIMA

SARIMA, abreviatura de Modelo Autorregresivo Integrado de Media Móvil Estacional (Seasonal Autoregressive Integrated Moving Average, también conocido como SARIMA estacional), es básicamente un modelo ARIMA que tiene en cuenta la estacionalidad además de los valores pasados. Incluye tres nuevos parámetros para representar los términos estacionales en ARIMA, así como un parámetro adicional para el período de estacionalidad. Estos nuevos hiperparámetros son los equivalentes estacionales de los existentes en ARIMA y especifican la autorregresión (AR), la diferenciación (I) y la media móvil (MA). Los cuatro elementos estacionales que forman parte de un modelo SARIMA son [12], [20]:

P: orden autorregresivo estacional D: orden de diferenciación estacional Q: orden de media móvil estacional M: período estacional

Para encontrar el mejor modelo ARIMA, se utilizó la función de ARIMA automático, es decir, auto_arima() del módulo de R. Los resultados de la función “auto_arima()” mostraron que el conjunto de datos presenta una estacionalidad de 12 meses, lo cual era un resultado esperado, ya que las temperaturas mensuales siguen un patrón similar a lo largo del año.

El mejor modelo encontrado para el conjunto de datos fue SARIMA (1, 0, 0) × (2, 0, 1)₁₂ con una estacionalidad de 12 meses. Dado que el conjunto de datos presentaba un componente estacional, este modelo SARIMA se utilizó en el estudio para la predicción de los valores de temperatura en el conjunto de prueba.

Los residuos se evaluaron en términos de normalidad y correlación, y se encontró que presentan una distribución normal y no están correlacionados, como se puede observar en el gráfico Q-Q y el histograma de la Figura 3. Para evaluar la idoneidad del modelo para la predicción, se realizó una prueba de diagnóstico, la cual indicó que el modelo es adecuado para tareas de pronóstico.

Tabla 2. Resultados de la prueba de diagnóstico del modelo SARIMA (1, 0, 0) × (2, 0, 1)₁₂**

        Term   Coef StdErr      z P_value CI_low CI_high
         ar1  0.682  0.053 12.860       0  0.578   0.787
         ma1  0.369  0.079  4.664       0  0.214   0.524
         ma2  0.337  0.056  6.069       0  0.228   0.446
   intercept 12.934  1.327  9.748       0 10.333  15.534

La Tabla 2 resume los resultados del modelo SARIMA (1, 0, 0) × (2, 0, 1)₁₂. La columna “Coef” representa el peso de los coeficientes estimados del modelo de los coeficientes y muestra el grado de impacto de cada componente sobre la serie temporal. La cuarta columna indica la significancia estadística de cada uno de los parámetros. Como se puede observar en los valores de dicha columna, todos son menores a 0.05, por lo que resultan estadísticamente significativos.

Figura 3. Gráficos de (a) residuales estandarizados (b) histograma y densidad estimada (c) gráfico Q-Q normal (d) correlograma

El gráfico de residuos estandarizados mostrado en la Figura 3a parece comportarse como ruido blanco y no presenta un patrón evidente, lo que sugiere que el modelo se ajusta adecuadamente al conjunto de datos.

La estimación de densidad por kernel (KDE) (curva roja) mostrada en la Figura 3b casi se superpone con la distribución N(0,1) (curva verde), con media 0 y desviación estándar 1.

En el gráfico Q-Q mostrado en la Figura 3c, la línea roja representa una distribución normal con media 0 y desviación estándar 1, mientras que los puntos azules representan los residuos. El hecho de que los puntos azules estén muy cercanos a la línea roja indica que los residuos siguen una distribución normal y presentan una tendencia lineal.

El correlograma mostrado en la Figura 3d indica que los datos tienen una baja correlación con los valores rezagados.

Todos estos resultados muestran que el modelo se ajusta bien a los datos de la serie temporal y puede utilizarse para predicción y pronóstico. El modelo seleccionado fue posteriormente validado mediante la predicción de las temperaturas medias mensuales en el conjunto de prueba, que contiene valores desde julio de 2018 hasta marzo de 2023, reproduciendo los patrones estacionales conocidos en su pronóstico. Esto mostró que los valores de temperatura media predichos eran iguales o muy cercanos a los datos reales y seguían el mismo patrón estacional.

Figura 4. Gráfico de los valores predichos junto con los valores reales de temperatura utilizando el modelo SARIMA.

La Figura 4 muestra los valores reales y predichos de la temperatura utilizando el modelo SARIMA en la misma gráfica. A partir de la gráfica, se puede observar claramente que los valores predichos por el modelo SARIMA son muy cercanos a los valores reales de temperatura y siguen un patrón similar.

2.4. Memoria a Largo y Corto Plazo (LSTM)

Las redes LSTM son un tipo de red neuronal recurrente (RNN), capaces de recordar información previa y utilizarla para aprender dependencias a largo plazo. Fueron introducidas por primera vez en 1997 por Hochreiter y Schmidhuber, y se han convertido en una metodología ampliamente utilizada para predecir valores futuros a partir de datos históricos. Su desempeño ha demostrado ser notable en una gran variedad de problemas, especialmente en el campo del aprendizaje profundo (Deep Learning).

El término LSTM hace referencia a su capacidad de manejar memoria tanto a corto como a largo plazo. Los pesos de conexión y los sesgos de la red se ajustan durante el proceso de entrenamiento, constituyendo su memoria a largo plazo, mientras que los patrones de activación que cambian en cada instante representan la memoria a corto plazo. En cada paso de tiempo, la salida de la red depende del estado actual de la celda, del estado oculto previo (salida anterior) y de la entrada actual.

A diferencia de las redes neuronales tradicionales, las LSTM poseen conexiones de retroalimentación que les permiten procesar secuencias completas de datos en lugar de observaciones individuales. Esta característica las hace especialmente adecuadas para aplicaciones como reconocimiento de voz, traducción automática, análisis de imágenes y modelado de series temporales, donde es fundamental capturar dependencias entre observaciones sucesivas.

Para este estudio, se seleccionó como mejor modelo un modelo secuencial compuesto por una capa de entrada con 7 neuronas y una capa de salida densa con una neurona.

Una unidad LSTM típica está conformada por una celda de memoria y tres compuertas principales: de entrada, de salida y de olvido. La celda de memoria mantiene su estado a lo largo del tiempo, permitiendo conservar información relevante. Las compuertas regulan el flujo de información mediante funciones sigmoides que toman valores entre 0 y 1, determinando qué información se retiene, se descarta o se incorpora en cada instante.

Se llevó a cabo un análisis exhaustivo de sensibilidad de hiperparámetros con el objetivo de identificar la configuración óptima del modelo LSTM. Para ello, se implementó un procedimiento en el entorno de programación R, utilizando librerías especializadas en aprendizaje profundo, que permitió variar sistemáticamente el número de neuronas en las capas LSTM, la cantidad de capas ocultas y el número de capas densas. Este proceso se realizó mediante estructuras iterativas, registrando el desempeño de cada configuración para su posterior comparación.

El modelo con mejor rendimiento fue seleccionado en función de la menor tasa de error obtenida. El modelo final corresponde a una arquitectura secuencial con una capa de entrada de 7 neuronas y una capa de salida densa, tal como se muestra en la Figura 5, donde la columna “Output Shape” evidencia la estructura del modelo.

El tamaño de lote (batch size) se estableció en 5, y se empleó el algoritmo de optimización Adaptive Moment Estimation (Adam). Como función de pérdida se utilizó el error cuadrático medio (MSE). El número de épocas se fijó en 10, ya que este valor minimizó el error del modelo; incrementarlo resultó en un deterioro del desempeño debido a un posible sobreajuste.

  Model: "sequential"
  ┌───────────────────────────────────┬──────────────────────────┬───────────────
  │ Layer (type)                      │ Output Shape             │       Param # 
  ├───────────────────────────────────┼──────────────────────────┼───────────────
  │ lstm (LSTM)                       │ (None, 7)                │           252 
  ├───────────────────────────────────┼──────────────────────────┼───────────────
  │ dense (Dense)                     │ (None, 1)                │             8 
  └───────────────────────────────────┴──────────────────────────┴───────────────
   Total params: 260 (1.02 KB)
   Trainable params: 260 (1.02 KB)
   Non-trainable params: 0 (0.00 B)

“Figura 5. El resumen del modelo LSTM”

Figure 6 shows the time series plot of actual values and predicted values of the monthly temperature data using the LSTM model developed for the study. As with the ARIMA results above, seasonal variations in the dataset can be clearly seen from the figure. It can also be observed from the figure that although the LSTM model was able to capture the internal structure and follow similar pattern, it underestimates the higher temperatures and overestimates lower temperatures. When compared to the ARIMA results plot in Figure 4, the ARIMA model better approximates the dataset and exhibits closer pattern to the actual data than the LSTM model.

Figura 6. Gráfica de los valores reales y predichos de la temperatura media mensual usando el modelo LSTM.

3. Resultados

Para evaluar y comparar los desempeños, se utilizaron tres métricas: el Error Absoluto Medio (MAE), la Raíz del Error Cuadrático Medio (RMSE) y el Error Cuadrático Medio (MSE). La Raíz del Error Cuadrático Medio es el promedio de todos los errores de predicción y se calcula con la siguiente fórmula:

La Raíz del Error Cuadrático Medio es el promedio de todos los errores de predicción y se calcula con la siguiente fórmula:

\[ MSE = \frac{1}{N} \sum_{i=1}^{N} (P_i - O_i)^2 \] RMSE es la raíz del MSE, y se calcula como:

\[ RMSE = \sqrt{\frac{1}{N} \sum_{i=1}^{N} (P_i - O_i)^2} \] El Error Absoluto Medio es el promedio de los valores absolutos de todas las diferencias entre los valores reales y los valores predichos, y se calcula mediante la siguiente fórmula:

\[ MAE = \frac{1}{N} \sum_{i=1}^{N} |P_i - O_i| \] Como resultado del proceso de evaluación del desempeño, se obtuvieron un MAE de 2.43 y un RMSE de 2.641 para el modelo SARIMA, y un MAE de 3.046 y un RMSE de 3.689 para el modelo LSTM. Los resultados del desempeño se resumen en la Tabla 3.

  2/2 - 1s - 300ms/step

De la Tabla 3, que resume los resultados del modelo, se concluyó que el modelo SARIMA produjo el menor error en la predicción de las temperaturas mensuales en comparación con el modelo LSTM.

Conclusión

Este estudio tuvo como objetivo predecir valores mensuales de temperatura con base en datos históricos de una estación meteorológica ubicada en la ciudad de Ankara, Turquía, desde enero de 2010 hasta marzo de 2023, utilizando dos metodologías diferentes de predicción de series de tiempo, a saber, ARIMA estacional (SARIMA) y LSTM, y se presentaron sus resultados de desempeño para comparación. Las metodologías SARIMA y LSTM utilizadas en este estudio fueron seleccionadas debido a su popularidad y amplio uso en la predicción de series de tiempo.

Como primer paso inicial, se evaluó la estacionariedad del conjunto de datos utilizando la prueba de raíz unitaria de Dickey-Fuller aumentada (ADF), encontrándose que el conjunto de datos era estacionario. Este paso fue necesario, ya que los datos no estacionarios no pueden utilizarse para construir un modelo ARIMA. Los gráficos ACF y PACF no indicaron claramente un modelo AR, MA o ARIMA, por lo que se utilizó la función “auto ARIMA” de un módulo en Python para encontrar el modelo que mejor se ajustara. Este proceso reveló la estacionalidad inherente en el conjunto de datos y produjo como mejor modelo ajustado un SARIMA (1, 0, 0) × (2, 0, 1)_{12}, con una estacionalidad de 12 meses. Se realizó una prueba de normalidad para verificar los residuos, encontrándose que estaban distribuidos normalmente y no estaban correlacionados entre sí. Además, se llevó a cabo una prueba de diagnóstico para evaluar la idoneidad del modelo para la predicción, confirmando su utilidad para este propósito.

El modelo seleccionado se validó adicionalmente prediciendo las temperaturas medias mensuales en un conjunto de prueba compuesto por datos desde julio de 2018 hasta marzo de 2023, reproduciendo los patrones estacionales conocidos en sus pronósticos. Esto demostró que los valores predichos de temperatura media eran idénticos o muy cercanos a los datos reales y seguían el mismo patrón estacional.

Posteriormente, el modelo se aplicó al conjunto de prueba con datos desde julio de 2018 hasta marzo de 2023. Esto mostró valores de temperatura muy cercanos a los reales en el conjunto de prueba y un patrón estacional similar, como se observa en las gráficas, validando que el modelo era capaz de representar el conjunto de datos y podía utilizarse como herramienta de pronóstico para temperaturas medias mensuales futuras.

Para el segundo método, en el cual se utilizó una red LSTM, se realizó un estudio exhaustivo con el fin de encontrar el modelo LSTM con mejor desempeño, variando el número de capas LSTM, capas ocultas y capas densas, así como el número de neuronas en cada una de ellas mediante un programa en Python, y el mejor modelo LSTM fue seleccionado con base en la métrica de RMSE mínimo para predecir las temperaturas medias mensuales. Posteriormente, el modelo LSTM se aplicó al conjunto de prueba para predecir valores de temperatura desde julio de 2010 hasta marzo de 2023. Al igual que el modelo SARIMA, el modelo LSTM también mostró un buen ajuste al conjunto de datos, con valores muy cercanos a las temperaturas reales. Sin embargo, como se observa en la Figura 6, aunque las gráficas de los valores reales y predichos siguen un patrón similar, el modelo tiende a subestimar los valores más altos y, en ocasiones, a sobreestimar los valores más bajos.

Finalmente, se calcularon las métricas de desempeño MSE, RMSE y MAE para comparar la capacidad predictiva de los modelos. Para el modelo SARIMA, los valores de MSE, RMSE y MAE fueron 2.163, 6.977 y 2.641, respectivamente, mientras que para el modelo LSTM fueron 3.046, 13.605 y 3.689. De acuerdo con estos resultados, se puede concluir que ambas metodologías presentan un buen desempeño en la predicción de temperaturas medias mensuales; sin embargo, el modelo SARIMA mostró un desempeño ligeramente superior al del modelo LSTM.

Esto podría deberse al tamaño del conjunto de datos utilizado en el estudio, ya que este contaba con solo 279 observaciones de temperatura y únicamente el 80% (N = 223) se utilizó para entrenar el modelo LSTM. Las redes LSTM son un tipo especial de redes neuronales artificiales (ANN), por lo que, como ocurre con cualquier tipo de ANN, entrenar el modelo con conjuntos de datos más grandes generalmente conduce a un mejor desempeño. Por lo tanto, se requieren experimentos con conjuntos de datos más amplios para evaluar con mayor precisión la superioridad del modelo SARIMA sobre el modelo LSTM en la predicción de temperaturas medias mensuales.

Declaración de Conflicto de Intereses

Los autores declaran que no existe ningún conflicto de interés.

Referencias

[1] M. Murat, I. Malinowska, M. Gos, J. Krzyszczak, “Forecasting daily meteorological time series using ARIMA and regression models,” International Agrophysics, vol. 32, no. 2, pp. 253–264, 2018. doi:10.1515/intag-2017-0007

[2] S. Siami-Namini, N. Tavakoli and A. Siami Namin, “A Comparison of ARIMA and LSTM in Forecasting Time Series,” in Proc. of the 2018 17th IEEE International Conference on Machine Learning and Applications (ICMLA), 17-20 Dec. 2018, Orlando, FL, USA [Online]. Available: IEEE Xplore, https://ieeexplore.ieee.org. [Accessed: 7 Agu. 2023]

[3] P. Liu, ‘Time Series Forecasting Based on ARIMA and LSTM’, in Proceedings of the 2022 2nd International Conference on Enterprise Management and Economic Development (ICEMED 2022), 2022, pp. 1203–1208.

[4] A. Parasyris, G. Alexandrakis, G.V. Kozyrakis, K. Spanoudaki, N.A. Kampanis, “Predicting Meteorological Variables on Local Level with SARIMA, LSTM and Hybrid Techniques”, Atmosphere 2022, vol. 13, no. 878, 2022. doi:10.3390/atmos13060878

[5] K. Tadesse, O. Megersa, and M. Dinka, “The SARIMA model-based monthly rainfall forecasting for the Turksvygbult Station at the Magoebaskloof Dam in South Africa”, Journal of Water and Land Development, vol. 53, pp. 100-107, 2022. doi:10.24425/jwld.2022.140785

[6] C. Chatfield, The analysis of time series: An introduction, 6th ed. London, UK: Chapman & Hall/CRC, 2004.

[7] I. S. Rahayu, E. C. Djamal, R. Ilyas, “Daily Temperature Prediction Using Recurrent Neural Networks and Long-Short Term Memory”, in Proceedings of the 5th NA International Conference on Industrial Engineering and Operations Management, August 10 – 14, 2020, Detroit. Michigan, USA [Online]. Available: ieomsociety.org, http://www.ieomsociety.org. [Accessed: 10 Apr. 2023].

[8] J. Choi, D. C. Roberts, and E. Lee, “Forecasting oil production in North Dakota using the seasonal autoregressive integrated moving average (S-ARIMA)”, Natural Resources, vol. 6, no. 1, pp. 16–26, 2015.

[9] A. Can and A. T. Atimtay, “Time series analysis of mean temperature data in Turkey,” Applied Time Series, vol. 4, no. 20, 2002.

[10] S. Zakaria, N. Al-Ansari, S. Knutsson, and T. Al-Badrany, “ARIMA models for weekly rainfall in the semi-arid Sinjar district at Iraq,” Journal of Earth Science Geotechnical Engineering, vol. 2, no. 3, pp. 25-55, 2012.

[11] P. Chen, A. Niu, D. Liu, W. Jiang, and B. Ma, “Time series forecasting of temperatures using SARIMA: An example from Nanjing,” IOP Conference Series: Materials Science and Engineering, vol. 394, 2018. doi:10.1088/1757- 899X/394/5/052024

[12] D. K. Dwivedi, G. R. Sharma and S. S. Wandre, “Forecasting mean temperature using SARIMA Model for Junagadh City of Gujarat,” IJASR, vol. 7, no. 4, pp. 183–194, Jan. 2017. doi:10.24247/ijasraug201723

[13] J. Asha, S. S. Kumar, and S. Rishidas, ‘Forecasting performance comparison of daily maximum temperature using ARMA based methods’, Journal of Physics: Conference Series, vol. 1921, no. 1, p. 012041, May 2021. doi:10.1088/1742-6596/1921/1/012041

[14] K. M. S. A. Hennayake, R. Dinalankara, and D. Y. Mudunkotuwa, “Machine Learning Based Weather Prediction Model for Short Term Weather Prediction in Sri Lanka,” International Journal of Multidisciplinary Studies (IJMS), vol 9, no. I, 2022. doi:10.4038/ijms.v9i1.159

[15] K. N. Mitu, K. Hasan, “Modelling and Forecasting Daily Temperature Time Series in the Memphis, Tennessee,” International Journal of Environmental Monitoring and Analysis, vol. 9, no. 6, pp. 214-221, Dec. 2021. doi:10.11648/j.ijema.20210906.17

[16] T. Dimri, S. Ahmad, and M. Sharif, “Time series analysis of climate variables using seasonal ARIMA approach,” Journal of Earth System Science volume, vol. 129, 2020. doi:10.1007/s12040-020-01408-x

[17] A. Gangshetty, G. Kaur, U. S. Malunje, “Time Series Prediction of Temperature in Pune using Seasonal ARIMA Model,” International Journal of Engineering Research & Technology (IJERT), vol. 10, Issue 11, November-2021.

[18] D. T. Hoang, Pr. L. Yang, L. D. P. Cuong, P. D. Trung, N. H. Tu, L. V. Truong, T. T. Hien, V. T. Nha, “Weather prediction based on LSTM model implemented AWS Machine Learning Platform,” International Journal for Research in Applied Science & Engineering Technology (IJRASET), vol 8, no. V, May 2020. doi:10.22214/ijraset.2020.5046

[19] “What Is ARIMA Modeling?,” Master’s in Data Science, edX.org, 2023. [Online]. Available: https://www.mastersindatascience.org/learning/statistics-data-science/what-is-arima-modeling. [Accessed: Apr. 10, 2023]

[20] R. J. Hyndman and G. Athanasopoulos, “Forecasting: principles and practice”, 2013.

[21] R. Dolphin. “LSTM Networks | A Detailed Explanation | A Comprehensive Introduction to LSTMs”. Towards Data Science, medium.com, Oct 21, 2020. [Online]. Available: https://towardsdatascience.com/lstm-networks-a-detailed-explanation-8fae6aefc7f9. [Accessed: May 11, 2023].

[22] A. I. Arasu, M. Modani, and N. R. Vadlamani, “Application of Machine Learning Techniques in Temperature Forecast”, in Proc. of the 21st IEEE International Conference on Machine Learning and Applications (ICMLA), 2022, Nassau, Bahamas, pp. 513-518, doi:10.1109/ICMLA55696.2022.00083