Pronóstico de la precipitación estacional en Uruguay: un análisis integral mediante modelos ARIMA y SARIMA

Resumen

El clima influye de manera significativa en las sociedades y en el medio ambiente, siendo la precipitación un elemento clave para la formación de ecosistemas, el desarrollo de la agricultura y la gestión de los recursos hídricos. En este estudio se analizan datos mensuales de lluvia correspondientes al periodo 1991–2021 en Uruguay, a partir de información recopilada en 17 estaciones del Instituto Uruguayo de Meteorología (Inumet). El objetivo principal es emplear modelos autorregresivos para modelar y pronosticar la precipitación, lo cual resulta fundamental para comprender y predecir los patrones climáticos.

A partir de análisis temporales y espaciales, se determinó que la descomposición clásica ofrece mejores resultados cuando se utiliza un modelo aditivo. Además, la prueba de Dickey-Fuller aumentada confirmó que la serie es estacionaria, mientras que la prueba de Mann-Kendall evidenció que no existe una tendencia significativa en la precipitación mensual entre las distintas regiones. De igual forma, los resultados de las funciones de autocorrelación (ACF) y autocorrelación parcial (PACF) no mostraron la presencia de tendencias fuertes ni patrones claramente definidos. En conjunto, estos resultados destacan la importancia de los modelos autorregresivos para el análisis del clima y sus efectos en el entorno. Asimismo, las métricas de desempeño obtenidas durante las etapas de desarrollo y validación del modelo indican que los modelos SARIMA presentan una mayor precisión en las predicciones, siendo este tipo de modelo el que ofrece los mejores resultados para el pronóstico de series temporales por región.

I. Introduccion

El clima tiene un impacto importante en las sociedades y el medio ambiente, siendo la precipitación fundamental para los ecosistemas, la agricultura y la gestión del agua. En Uruguay, las lluvias han sido históricamente irregulares, con sequías e inundaciones, lo que hace que su economía agrícola sea vulnerable al cambio climático.

El análisis de series de tiempo permite estudiar el comportamiento de la precipitación y hacer proyecciones futuras, siendo útil para la planificación y gestión de riesgos. En este contexto, los modelos ARIMA y SARIMA destacan como herramientas eficaces para modelar y predecir la lluvia, especialmente cuando existe estacionalidad. El objetivo del estudio es analizar la precipitación mensual en Uruguay (1991–2021) mediante modelos autorregresivos para comprender su comportamiento y mejorar su pronóstico.

Análisis exploratorio.

El análisis exploratorio de series de tiempo constituye la base para construir un modelo ARIMA eficaz. Este paso fundamental orienta la comprensión detallada de la dinámica interna de los datos. Conocer la composición de la serie permite realizar su predicción.

Descomposición.

La descomposición puede realizarse mediante dos modelos:

el aditivo:

Xt = Tt + St + Et.

multiplicativo:

Xt = Tt × St × Et.

Prueba de estacionariedad de los datos:

La estacionariedad significa que la media y la varianza se mantienen constantes a lo largo del tiempo, por lo que las series de tiempo que presentan tendencia no son estacionarias. Para verificar la estacionariedad de la serie de tiempo, se realizó una prueba de Dickey-Fuller, bajo la siguiente hipótesis:

• H₀: Los datos de precipitación presentan raíz unitaria, es decir, no son estacionarios.

• H₁: Los datos de precipitación son estacionarios.

Análisis de tendencia:

Se utilizó la prueba de Mann-Kendall para analizar la tendencia de la precipitación Esta prueba se aplicó a datos mensuales correspondientes al periodo de 1991 a 2021, considerando las siguientes hipótesis.

• H₀: no existe tendencia.

• H₁: existe una tendencia a un determinado nivel de significancia.

Funciones de autocovarianza y autocorrelación:

La covarianza entre dos observaciones \[ \gamma_k = \text{Cov}(Y_t, Y_{t+k}) = E[(Y_t - \mu)(Y_{t+k} - \mu)] \]

Los valores de \(\gamma_k\), \(k = 1, 2, \ldots\) se denominan la función de autocovarianza.

El coeficiente de autocorrelación en el rezago \(k\) para una serie de tiempo estacionaria es

\[ \rho_k = \frac{E[(Y_t - \mu)(Y_{t+k} - \mu)]}{\sqrt{E[(Y_t - \mu)^2] \, E[(Y_{t+k} - \mu)^2]}} = \frac{\gamma_k}{\gamma_0}, \tag{4} \]

donde \(\gamma_k = \mathrm{Cov}(Y_t, Y_{t+k})\) y \(\gamma_0 = \mathrm{Var}(Y_t)\).
La función de autocorrelación (ACF) es la colección de valores de \(\rho_k\), \(k = 0, 1, 2, \ldots\), por definición \(\rho_0 = 1\).
La ACF es independiente de la escala de medición de la serie de tiempo, por lo que es una cantidad adimensional.

La función de autocorrelación parcial (PACF) entre \(Y_t\) y \(Y_{t-k}\) es la autocorrelación después de ajustar por \(Y_{t-1}, Y_{t-2}, \ldots, Y_{t-k+1}\).
Considere una serie estacionaria y para cualquier valor fijo de \(k\), las ecuaciones de Yule-Walker para la ACF de un proceso autorregresivo AR(\(p\)) están dadas por

\[ \rho(j) = \sum_{i=1}^{k} \phi_{k,i} \rho(j - i), \quad j = 1, 2, \ldots, k \tag{5} \]

En notación matricial como \(\mathbf{P}_k \boldsymbol{\phi}_k = \boldsymbol{\rho}(k)\).
Por lo tanto, para resolver \(\boldsymbol{\phi}_k\) se define \(\boldsymbol{\phi}_k = \mathbf{P}_k^{-1} \boldsymbol{\rho}_k\) para cualquier \(k\) dado, el último coeficiente \(\phi_{k,k}\) se denomina la autocorrelación parcial del proceso en el rezago \(k\).
Para un AR(\(p\)), el proceso cumple que \(\phi_{k,k} = 0\) para \(k > p\).

C. Modelos ARIMA

El modelo Autorregresivo Integrado de Media Móvil (ARIMA) se utiliza para pronosticar modelos de lluvia.
El modelo demuestra un modelo estocástico de series de tiempo que puede utilizarse para anticipar eventos futuros, utilizando datos presentes.
Un modelo autorregresivo (AR) y de media móvil (MA) tiene la forma [22]

\[ Y_t = \delta + \phi_1 Y_{t-1} + \phi_2 Y_{t-2} + \cdots + \phi_p Y_{t-p} + \epsilon_t \tag{6} \]

donde \(\epsilon_t\) es ruido blanco, y \(\delta = (1 - \phi)\mu\).
En un modelo autorregresivo, se pronostica la variable de interés usando una combinación lineal de valores pasados de la variable.

El modelo autorregresivo de media móvil (ARMA) utiliza errores de pronóstico pasados dentro de un modelo tipo regresión.
En general, un modelo ARMA\((p,q)\) se define como [22]

\[ Y_t = \delta + \sum_{i=1}^{p} \phi_i Y_{t-i} + \epsilon_t - \sum_{i=1}^{q} \theta_i \epsilon_{t-i} \tag{7} \]

o \(\Phi(B)Y_t = \delta + \Theta(B)\epsilon_t\), donde \(\epsilon_t\) es ruido blanco.

D. SARIMA

El modelo Autorregresivo Integrado de Media Móvil Estacional (SARIMA) define series que contienen patrones estacionales con período \(s\) (longitud estacional).
Los modelos SARIMA pueden escribirse como SARIMA\((p, d, q) \times (P, D, Q)_s\).
La primera parte contiene el orden de los parámetros no estacionales, mientras que los órdenes de los parámetros estacionales se encuentran en la segunda parte.

Donde \(p\) es el orden autorregresivo no estacional, \(d\) es el número de diferenciaciones regulares, \(q\) es el orden de la media móvil no estacional,
\(P\) es el orden autorregresivo estacional, \(D\) es el número de diferenciaciones estacionales y \(Q\) es el orden de la media móvil estacional.

\(s\) es la longitud estacional. El modelo puede escribirse de manera más formal como [12]:

\[ \Phi(B^s)\,\phi(B)(X_t - \mu) = \Theta(B^s)\,\theta(B) W_t \tag{8} \]

Los componentes no estacionales son:

AR: \[ \phi(B) = 1 - \phi_1 B - \cdots - \phi_p B^p \tag{9} \]

MA: \[ \theta(B) = 1 + \theta_1 B + \cdots + \theta_q B^q \tag{10} \]

Los componentes estacionales son:

AR estacional: \[ \Phi(B^s) = 1 - \Phi_1 B^s - \cdots - \Phi_p B^{ps} \tag{11} \]

MA estacional: \[ \Theta(B^s) = 1 + \Theta_1 B^s + \cdots + \Theta_q B^{qs} \tag{12} \]

Obsérvese que el lado izquierdo de la ecuación (8) presenta la multiplicación de los componentes AR estacionales y no estacionales, mientras que el lado derecho muestra la multiplicación de los componentes MA estacionales y no estacionales.

II. Resultados y Discusión

Una vez realizado el preprocesamiento de los datos, de las 20 estaciones iniciales se conservaron un total de 17 estaciones para el estudio. La estación de Tacuarembó fue descartada, ya que para el año 2018 dejó de operar; en consecuencia, parte de los datos registrados correspondían a una estación cercana y presentaban una cantidad considerable de ceros no verificados.

A. Análisis temporal

Se llevó a cabo la visualización y el análisis estadístico de los datos de precipitación anual acumulada para las 17 estaciones. La Figura 3 muestra que, desde un punto de vista estadístico, la precipitación puede analizarse en tres regiones: norte, centro y sur.

La región norte presenta valores de precipitación anual acumulada entre 900 y 2600 mm, con una media para todo el período de estudio de 1459.3 mm y una desviación estándar de 340.7 mm. La región central presenta valores entre 500 y 2300 mm, con una media de 1320.0 mm y una desviación estándar de 295.6 mm. Por su parte, la región sur presenta valores entre 600 y 2000 mm, con una media de 1184.9 mm y una desviación estándar de 260.9 mm.

El comportamiento de las medias y desviaciones es similar entre regiones; sin embargo, se observa una disminución notable en la magnitud de la precipitación desde el norte hacia el sur. Este comportamiento puede explicarse por la influencia de diferentes masas de aire en cada región.

B. Análisis exploratorio

La descomposición de las series de tiempo se realizó mediante dos métodos (ecuación (1) y ecuación (2)). Este procedimiento se aplicó tanto a las series de cada estación como a las series de precipitación acumulada por regiones.

Se identificaron patrones en las series de tiempo; no obstante, el modelo que mejor describe los datos de precipitación es el modelo aditivo. En general, todos los años presentan un comportamiento similar.

En una serie de tiempo, la observación más reciente depende, en general, de sus valores pasados; sin embargo, esta dependencia suele ser más fuerte con datos recientes y más débil con datos más antiguos. Los modelos de tendencia determinística generan predicciones que no incorporan esta propiedad.

Se aplicó la prueba de Dickey-Fuller aumentada para analizar la estacionariedad de las series de tiempo.

En la Figura: 1 se muestra la precipitación acumulada anual para cada estación meteorológica por región del país durante el período 1991-2021.

Para cada una de las regiones (Tabla I), se obtuvo estacionariedad en todas las pruebas. Tomando como referencia las hipótesis de la subsección II-B, en la Tabla I se observa que el valor \(p\) para todas las regiones es menor a 0.05, por lo que se rechaza \(H_0\). Cuanto más negativo es el estadístico ADF, más fuerte es la evidencia en contra de \(H_0\) (que existe una raíz unitaria). Asimismo, si el ADF es menor (más negativo) que el valor crítico, se rechaza la hipótesis \(H_0\).

TABLA I. Resultados de la prueba de estacionariedad de los datos mensuales de precipitación por región del país
	Prueba de Dickey-Fuller Aumentada
Region	Estadístico.ADF	Valor.p	Valor.crítico.5.
Norte	-16.9	1.0e-29	-2.9
Centro	-11.5	4.9e-21	-2.9
Sur	-11.7	1.0e-21	-2.9

Análisis de tendencia y autocorrelación

El test de Mann-Kendall aplicado al análisis de tendencia mostró que no existe una tendencia significativa en la precipitación mensual. Este análisis se realizó para todas las estaciones bajo estudio y para cada región (Tabla II). Tomando como referencia las hipótesis planteadas en la subsección II-B, se observa en la Tabla II que los valores p son altos (mayores a 0.05), por lo cual no se rechaza la hipótesis nula \(H_0\), que indica ausencia de tendencia.

El coeficiente de Kendall (\(\tau\)) mide la correlación entre las variables climáticas y la precipitación. En este caso, el valor de \(\tau\) es aproximadamente igual a cero, lo que indica ausencia de tendencia. Por otra parte, el estadístico de Mann-Kendall (\(s\)) presenta un valor negativo, lo cual sugiere una tendencia muy débil.

Para identificar relaciones entre los valores originales y rezagados de la serie temporal de precipitación, se analizaron las funciones de autocorrelación (ACF) y autocorrelación parcial (PACF). La ACF mide la correlación entre una variable y sus valores rezagados, mientras que la PACF mide la correlación eliminando el efecto de otros rezagos.

La Figura 2 muestra una rápida disminución en las autocorrelaciones y autocorrelaciones parciales después del primer rezago, lo cual constituye un indicio de que la serie podría ser estacionaria. En general, no se observa evidencia de una tendencia fuerte en la serie analizada.

Fig. 2. Relaciones entre los valores originales y rezagados de la serie temporal de precipitación, mediante las funciones de autocorrelación (ACF) y autocorrelación parcial (PACF) para cada región del país.

TABLA II. Resultados de la prueba de tendencia de Mann-Kendall para la precipitacion mensual por region del pais
	Test Mann-Kendall
Región	p-value	\(\tau\)	\(s\)
North	0.4	0	-1807
Center	0.5	0	-1691
South	0.5	0	-1754

Resultados del análisis de tendencia y modelación

Los gráficos de ACF y PACF refuerzan la posibilidad de que la serie sea estacionaria. Este análisis visual permite determinar los términos apropiados autorregresivos (AR) y de media móvil (MA), es decir, los parámetros \((p, q)\) del modelo ARIMA.

La selección de los parámetros \((p, d, q)\) para el modelo ARIMA y \((p, d, q)(P, D, Q)_s\) para el modelo SARIMA se basó en los gráficos de autocorrelación y en las pruebas de estacionariedad. La Figura 2 muestra estacionalidad sin tendencia, lo que indica que la serie temporal es estacionaria. La prueba de Dickey-Fuller aumentada confirmó esta estacionariedad, con valores p inferiores al nivel de significancia de 0.05 en todas las regiones.

La función de autocorrelación (ACF) presentó un corte significativo en el rezago 0 y valores menores en los rezagos 1, 2 y 4, lo que sugiere modelos MA\((q) = 0, 1, 2, 4\). Por su parte, la función de autocorrelación parcial (PACF) mostró un corte significativo en el rezago 0 y valores menores en los rezagos 1 y 2, sugiriendo modelos AR\((p) = 0, 1, 2\).

TABLA III. Resultados estadísticos de los modelos ARIMA y SARIMA para la precipitación mensual por región
Region	Model	AIC	BIC	HQIC
North	ARIMA(0,0,1)	3988.7	4000.2	3993.3
North	SARIMA(0,0,1)(0,1,1,12)	3879.7	3891.1	3884.2
Center	ARIMA(0,0,1)	3921.6	3933.1	3926.2
Center	SARIMA(0,0,1)(0,1,1,12)	3816.5	3828.0	3821.1
South	ARIMA(0,0,1)	3845.3	3856.9	3849.9
South	SARIMA(0,0,1)(0,1,1,12)	3755.9	3767.3	3760.4

Resultados del modelamiento ARIMA y SARIMA

Los resultados presentados en la Tabla III indican que los valores obtenidos son, en general, similares; sin embargo, los modelos SARIMA muestran un mejor ajuste en comparación con los modelos ARIMA, de acuerdo con los criterios AIC, BIC y HQIC. No obstante, ambos modelos evidencian un desempeño limitado para el tipo de estudio realizado.

Los modelos ARIMA y SARIMA ajustados fueron utilizados para generar pronósticos para el año 2021. Para ello, se empleó un conjunto de datos de entrenamiento correspondiente al periodo comprendido entre el 1 de enero de 1991 y el 31 de diciembre de 2020 (360 observaciones), y un conjunto de prueba correspondiente al periodo entre el 1 de enero de 2020 y el 31 de diciembre de 2020 (12 observaciones).

Fig. 3. Pronóstico de la precipitación para el año 2021 utilizando modelos ARIMA y SARIMA para la región Central del país.

Los modelos entrenados, aunque son capaces de capturar algunos patrones básicos de la serie de tiempo, presentan ciertas limitaciones. La ausencia de autocorrelación significativa en los residuos, evidenciada mediante la prueba de Ljung-Box, sugiere que el modelo SARIMA es adecuado para capturar la estructura de corto plazo de la serie.

Sin embargo, la prueba de Jarque-Bera indica que los residuos no siguen una distribución normal, lo que podría afectar la precisión de los intervalos de predicción. Los resultados sugieren que el modelo SARIMA proporciona una mejor base para el análisis de series temporales que el modelo ARIMA, aunque podrían explorarse alternativas para mejorar el ajuste y la capacidad predictiva.

IV. Conclusiones

En el presente estudio se analizó la precipitación mensual en Uruguay, evidenciando una mayor acumulación de lluvia hacia el norte del país y menores valores hacia el sur. El análisis de series de tiempo aplicado a los datos originales mostró que la serie es estacionaria, sin evidencia clara de estacionalidad.

La prueba de Dickey-Fuller aumentada confirmó la estacionariedad de la serie, mientras que la prueba de Mann-Kendall no evidenció la presencia de una tendencia significativa. Asimismo, los diferentes estadísticos de desempeño utilizados durante las fases de desarrollo y validación del modelo confirmaron un mejor ajuste predictivo al emplear modelos SARIMA.

Dado el comportamiento puntual de la precipitación en los últimos años, el uso de 17 estaciones para el estudio de la precipitación en el país podría resultar limitado; sin embargo, desde un enfoque estadístico fue posible identificar patrones en las series de tiempo a nivel regional (norte, centro y sur).

Aunque el modelo SARIMA presenta ciertos aspectos favorables, la falta de autocorrelación en los residuos, la no normalidad y la baja significancia de algunos términos sugieren que podría ser conveniente aplicar transformaciones a los datos con el fin de mejorar el desempeño de los pronósticos.

Referencias

[1] IPCC, Climate change 2021: The physical science basis, 2021. Contribution of Working Group I to the Sixth Assessment Report of the Intergovernmental Panel on Climate Change. Cambridge University Press. doi:10.1017/9781009157896.

[2] IPCC, Summary for policymakers climate change 2023: Synthesis report, 2023. Contribution of Working Groups I, II and III to the Sixth Assessment Report. IPCC, Geneva. doi:10.59327/IPCC/AR6-9789291691647.001.

[3] M. Rosegrant et al., El impacto en la agricultura y los costos de adaptación, IFPRI, 2009.

[4] L. A. de Oliveira y E. Petrucci, Análisis de la serie de tiempo de la precipitación mensual y eventos de sequía extrema, Revista de Climatología, vol. 22, 2022.

[5] P. Momani y P. Naill, Time series analysis model for rainfall data in Jordan, American Journal of Environmental Sciences, vol. 5, no. 5, 2009.

[6] T. Papalaskaris et al., Stochastic monthly rainfall time series analysis, modeling and forecasting, Procedia Engineering, vol. 162, 2016.

[7] P. Dabral y M. Z. Murry, Modelling and forecasting of rainfall time series using SARIMA, Environmental Processes, vol. 4, no. 2, 2017.

[8] F. M. Bayer, Wavelets e modelos tradicionais de previsão: Um estudo comparativo, Rev. Bras. Biom., vol. 28, no. 2, pp. 40–61, 2010.

[9] A. I. Mendoza Martínez, Introducción a los modelos ARIMA multiplicativos, 2005. Disponible en: https://repositorio.unam.mx/contenidos/406920

[10] H. F. Abd-Elhamid, A. M. El-Dakak, M. Zelenáková, S. O. K., M. Mahdy y S. H. Abd El Ghany, Rainfall forecasting in arid regions in response to climate change using ARIMA and remote sensing, Geomatics, Natural Hazards and Risk, vol. 15, no. 1, 2024.

[11] M. Masum, R. Islam, M. Hossen y A. Akhie, Time series prediction of rainfall and temperature trend using ARIMA model, Journal of Scientific Research, vol. 14, no. 1, pp. 215–227, 2022.

[12] S. O. Adams y M. A. Bamanga, Modelling and forecasting seasonal behavior of rainfall in Abuja, Nigeria: A SARIMA approach, American Journal of Mathematics and Statistics, vol. 10, no. 1, pp. 10–19, 2020.

[13] U. Ashwini, K. Kalaivani, K. Ulagapriya y A. Saritha, Time series analysis based Tamil Nadu monsoon rainfall prediction using seasonal ARIMA, en 2021 6th International Conference on Inventive Computation Technologies (ICICT), IEEE, 2021, pp. 1293–1297.

[14] F. Santinaque Mesones, Análisis estadístico de las precipitaciones anuales extremas en Uruguay, 2020.

[15] L. Frías-Telesca, N. N. Atehortua-Sánchez y F. Pasini, Temporal analysis for the identification of extreme rainfall events recorded in Uruguay over a 30-year period (1991–2021), en 2023 IEEE 13th International Conference on Pattern Recognition Systems (ICPRS), IEEE, 2023, pp. 1–5.

[16] Ministerio de Asuntos Exteriores, Ficha país Uruguay - República Oriental del Uruguay, 2020. Disponible en: https://shorturl.at/WBUWy

[17] INUMET, Características climáticas, 2024. Disponible en: https://www.inumet.gub.uy/clima/estadisticasclimatologicas/caracteristicas-climaticas

[18] INUMET, Mapa de estaciones, 2024. Disponible en: https://www.inumet.gub.uy/clima/recursos-hidricos/mapa-deestaciones

[19] D. A. Dickey y W. A. Fuller, Distribution of the estimators for autoregressive time series with a unit root, Journal of the American Statistical Association, vol. 74, no. 366a, pp. 427–431, 1979.

[20] M. G. Kendall, Rank correlation methods, Griffin, 1948.