Introducción

Tanto a nivel macroeconómico como microeconómico, las tasas de interés influyen en las decisiones de inversión y gasto de las empresas y los consumidores. Es por esto que monitorear las tasas de interés a lo largo del tiempo es importante para evaluar la estabilidad financiera de un país. Además, el análisis y pronóstico de las tasas de interés permiten anticipar cambios en las condiciones económicas, orientar estrategias de inversión, y proporcionar información útil para la toma de decisiones en áreas como préstamos, inversiones y políticas monetarias.

La tasa de interés, expresada en porcentajes, es el costo del uso del capital o la tasa de retorno del ahorro, es decir, “el precio del dinero en el mercado financiero”, el cual se debe pagar por tomarlo como préstamo en una situación determinada. Si un agente económico requiere de dinero para adquirir bienes o financiar sus operaciones, y solicita un préstamo, el interés que se pague sobre el dinero solicitado será el costo que tendrá que pagar por ese servicio.

Si la tasa de interés es alta, la demanda de dinero tiende a ser menor porque resulta más costoso realizar préstamos. Por otro lado, la oferta de dinero es fija o controlada por la política monetaria. Cuando la tasa de interés es baja, la demanda de dinero tiende a aumentar porque es más atractivo tomar préstamos, pero si la oferta de dinero es excesiva, puede generar inflación. En equilibrio, la tasa de interés se establece en un nivel donde la cantidad de dinero demandada es igual a la cantidad de dinero ofrecida. Es por esto que los bancos centrales constantemente deben ajustar la oferta de dinero a través de políticas monetarias para mantener la estabilidad económica y controlar la inflación.

Para poder estudiar los anteriores comportamientos y poner a prueba metodologías de Machine learning para el pronóstico, como los modelos ARIMA, se decidió seleccionar la serie de tiempo de la tasa de interés en Sudáfrica desde octubre de 2012 hasta octubre de 2023. Su descripción histórica se presenta a continuación:

Justificación

Cuando se habla de economía, poco se menciona al continente africano, uno de los más pobres y peor gestionados. Aunque algunas regiones han mejorado en los últimos años, en 2003, 25 países africanos se encontraban en el ranking de aquellos con peor índice de desarrollo humano. Mientras las economías de China e India han crecido rápidamente, y Latinoamérica ha experimentado un crecimiento moderado, obteniendo millones por encima de la mera supervivencia, en la mayor parte de África la economía se ha estancado e incluso decrementado en términos de comercio exterior, inversiones, renta per cápita y otros valores de crecimiento económico.

A pesar de lo anterior, algunas naciones destacan sobre el resto y su influencia repercute en toda la región, atrayendo inversiones y liderando el desarrollo regional. Egipto, Nigeria y Sudáfrica son algunas de las potencias económicas que impulsan el crecimiento de África e influyen en su trayectoria económica. Sudáfrica, con un PIB de 406.000 millones de dólares y 60 millones de habitantes, destaca como centro financiero y líder industrial. Su riqueza en recursos minerales y sus industrias bien establecidas atraen inversiones mundiales e impulsan el crecimiento económico de la región. Por esta razón, se hizo interesante estudiar la tasa de interés de un país con una economía en desarrollo y potencial para el futuro.

Descripción histórica

Figura 1 : Gráfico de la serie de tiempo (Octubre,2012-Octubre, 2023).


Sudáfrica fue uno de los primeros países del continente en alcanzar la independencia en 1910 y actualmente su economía se encuentra entre las más desarrolladas del continente. Destaca por sus amplios recursos naturales y su preeminencia en el sector servicios, y ha sido considerada como una de las grandes economías emergentes desde comienzos del siglo XXI.

Tras lograr un crecimiento significativo entre 2003 y principios de 2008, el país cayó en recesión en 2008–09. El comportamiento inicial de la tasa de interés sudafricana se destaca como una consecuencia directa de la crisis financiera mundial que se inició en 2007, marcada por la crisis en los mercados financieros globales. Esta situación, derivada principalmente de la falta de inversiones en nuevas capacidades de producción, junto con trastornos temporales en la oferta, provocó una desaceleración del crecimiento en varios sectores de la economía, que hasta entonces experimentaron una expansión relativamente rápida.

En Sudáfrica el primer golpe negativo fue la escasez de electricidad que comenzó en 2007. Cuando comenzaron los cortes de electricidad, los precios mundiales de los alimentos y combustibles registraron un fuerte aumento, y la inflación alcanzó un nivel muy superior a la banda de 3% a 6 %. Para luchar contra el aumento de precios, el Banco de Reserva de Sudáfrica elevó considerablemente la tasa de interés, unos 5 puntos porcentuales entre 2006 y 2008, hasta un maximo de 11.3%. Su recuperación luego de dos años de la recesión fue, en algunos aspectos, incompleta, pues la inversión privada, las exportaciones y el empleo, por ejemplo, siguieron muy por debajo de los niveles previos a la crisis.

La tendencia al crecimiento de la tasa de interés en el periodo posterior, se presenta como consecuencia de la desaceleración del crecimiento económico y las restricciones monetarias para controlar la inflación. Comportamiento que solo se vio disminuido en 2020 con la llegada de la pandemia. En este periodo, las tasas de intereses bajaron, pues las expectativas de inflación disminuyeron cuando existe poca actividad económica. Además, los bancos centrales redujeron las tasas de interés como un instrumento para impulsar la recuperación económica al facilitar el acceso al crédito y reducir los costos de endeudamiento para empresas y consumidores.

Tanto en Sudáfrica como en el resto del mundo, las tasas de interés reales han subido con rapidez en los últimos años a raíz de la contracción de la política monetaria para combatir el aumento de la inflación, luego de la gran apertura económica en la recuperación de los efectos de la pandemia.

Estadística descriptiva

La tasa de interés influye en el comportamiento financiero, las inversiones y el crecimiento económico, en este caso se refleja eventos cruciales y las respuestas del banco de la reserva de Sudáfrica.

Figura 2 : Distribución de la tasa de interés.

La media de 6.154 presentada en el gráfico 1 muestra el interés medio durante los años 2012 y 2023. El cuartil 3 con valor aproximadamente de 7.16 sugiere que el 25% de los datos superiores están concentrados hacia tasas de interés relativamente altas, describiendo momentos en los que subieron las tasas de interés para abordar desafíos económicos o inflacionarios. El rango entre el valor mínimo de 2.977 y el máximo de 8.56 destacan la capacidad de Sudáfrica para ajustar su política monetaria según condiciones económicas. Se puede interpretar que las tasas de interés altas reflejan esfuerzos por controlar la inflación o atraer inversores generalmente del extranjero. La variación anual de las tasas de interés se ven reflejadas en el siguiente gráfico:

Figura 3 : Gráfico de cajas de la tasa de interés anualmente.

Para el año 2012, la tasa de interés muestra una media de 4.939 y una variación casi nula, caracterizándose como periodo de equilibrio luego de la recesión y crisis financiera mundial de 2009. En el año 2015 se muestra un aumento en la media con valor de 6.02, este periodo representa una fase de desequilibrio y ajuste económico. Desde los años 2016 a 2019 se observa una media más estable y con poca variación, esto sugiere una demanda de crédito e inversiones estables. En el año 2020, Sudáfrica experimentó un cambio significativo en sus tasas de interés, con una media de 4, un valor máximo de 6.8 y un mínimo de 3,605. Estos valores más bajos en comparación con años anteriores pueden ser atribuidos en gran medida a la pandemia del COVID-19, que generó una crisis económica a nivel mundial.

Luego de la apertura económica iniciada en 2022, Sudáfrica presenta un cambio notable en sus tasas de interés, y para 2023 muestra valores más elevados en comparación con los años anteriores, con una media de 8.1838, un valor máximo de 8.5676 y un mínimo de 6.4. Este valor mínimo está cercano a la media del periodo estudiado. Este aumento se debe a la recuperación económica, llevando al Banco de Reserva a incrementar las tasas para prevenir posibles presiones inflacionarias y mantener la estabilidad económica.

Metodología

Una serie de tiempo es una secuencia de observaciones sobre intervalos de tiempo separados de manera regular. Por ejemplo, la producción diaria en una planta de manufactura durante un mes, la población mundial año a año en un periodo de 1 siglo o el promedio de la tasa de interés mensual en un país durante 10 años. Esta tiene varios componentes que le dan a la serie un aspecto errático (cambios aleatorios o impredecibles a corto plazo) y comprende tendencias, variación estacional, variación cíclica y variación irregular.

Con la finalidad de realizar pronósticos aplicables en diversos campos, incluyendo la economía, las finanzas, la meteorología, entre otros, se suelen utilizar las técnicas de suavizado exponenciales y modelos ARIMA sobre las series de tiempo, siendo esta última la herramienta fundamental del presente estudio.

Modelo AutoRegressive Integrated Moving Average (ARIMA)

Se trata de un modelo mixto con componente autorregresiva y otra de media móvil. En primer lugar, el modelo autorregresivo se basa en la idea de que la observación actual puede explicarse con valores pasados. Estos modelos se denotan como AR(p) siendo p el número de muestras que explican la muestra actual. Es decir, un AR(1) quiere decir que solo la muestra anterior y el ruido contribuye a la salida. Un AR(2) las dos anteriores y el ruido, etc. En segundo lugar, el modelo de medias móviles consiste en realizar una aproximación a la serie utilizando únicamente ruido blanco. La expresión general de los modelos MA(q).

Juntando ambos términos obtenemos los modelos ARMA(p, q), que permiten modelar series estacionarias, pero cuando queremos modelar directamente una no estacionaria utilizamos un modelo ARIMA(p,d,q), donde d hace referencia al número de diferencias necesarias para obtener la estacionariedad.

Para determinar el valor del parámetro autorregresivo, p, para los modelos, hay que buscar cuantos retardos son significativos en el gráfico de la función de autocorrelación parcial estimada (PACF), siempre y cuando el ACF tenga una tendencia decadente y sinusoidal. Se toma el orden de p como el número de barras que pasan el límite de significancia. Para determinar el valor del parámetro de media móvil, q, se sigue el mismo método que con el parámetro p, pero aplicándolo en la función de autocorrelación simple (ACF).

Ahora bien, debido a que la elección de los valores p y q es subjetiva, se debe probar con varios modelos, utilizando criterios de información para decidir cuál es el más adecuado entre ellos.

  • El utilizado en este informe es el Criterio de Información de Akaike AIC, de manera que un modelo es mejor cuanto menor sea este valor, ya que indica un buen ajuste a los datos con una penalización menor por la complejidad del modelo.

  • Entre otros criterios, los residuos del modelo deben comportarse como ruido blanco, sin presentar autocorrelaciones y con una media centrada en cero. Se puede representar el histograma de los residuos para comprobar si la media es nula. Si la media de los residuos no está centrada en el 0, las estimaciones están sesgadas, por lo que el modelo no captura bien el nivel o la tendencia de la serie. Si no se cumplen estas condiciones, significa que se puede encontrar un modelo con un mejor ajuste.

  • Con estas herramientas establecidas, se plantea la necesidad de evaluar el modelo establecido como óptimo, debido a esto, la serie original se parte en en una ventana de entrenamiento y en una de salida, de manera que los pronósticos realizados entran a comparación con los datos ya conocidos que se encuentran en la ventana de salida. Aquí, MAPE es el nuevo criterio que se presenta como un error porcentual absoluto medio, una medida comúnmente utilizada para evaluar la precisión de un modelo de pronóstico en comparación con los valores reales.

Resultados

Prueba de hipótesis estadística de estacionariedad

Figura 4 : Gráfico de autocorrelación de la serie (ACF).

El anterior gráfico muestra la función de autocorrelación (ACF) de la serie original. Una serie es estacionaria si la ACF decrece a cero rápidamente a medida que el rezago aumenta. En este gráfico, el ACF muestra un decrecimiento lento a cero, pudiendo inferir que la serie de tiempo no es estacionaria. Sin embargo, no podemos afirmar esto con certeza sólo a partir del gráfico. Una forma de comprobar esto es realizar una prueba de raíz unitaria a través del Test aumentado de Dickey Fuller (ADF).

Test aumentado de Dickey Fuller (ADF)

  • Ho: La hipótesis nula de la prueba es que la serie de tiempo tiene una raíz unitaria, lo que implica que la serie de tiempo no es estacionaria.
  • H1: La hipótesis alternativa es que la serie de tiempo no tiene una raíz unitaria, lo que implica que la serie de tiempo es estacionaria.

Prueba Dickey Fuller serie original.

## 
##  Augmented Dickey-Fuller Test
## 
## data:  ventana
## Dickey-Fuller = -1.8586, Lag order = 4, p-value = 0.6353
## alternative hypothesis: stationary

El resultado de la prueba para nuestra serie arroja un valor p de 0.635, mayor que el nivel de significancia de 0,05. Por lo tanto, se acepta la hipótesis nula, y se concluye que la serie no es estacionaria. Teniendo en cuenta que el modelo ARIMA se aplica en series estacionarias, fue necesario realizar dos órdenes de diferenciación para obtener un valor p de 0.01, mucho menor que el nivel de significancia de 0.05, por lo tanto, se rechaza la hipótesis nula y se concluye que después de aplicar una doble diferenciación la serie es estacionaria.

Prueba Dickey Fuller con doble diferenciación.

## 
##  Augmented Dickey-Fuller Test
## 
## data:  serie_Diff2
## Dickey-Fuller = -6.9973, Lag order = 4, p-value = 0.01
## alternative hypothesis: stationary

Figura 5 : Serie con doble diferenciación.

Figura 6 : ACF de la Serie con doble diferenciación.

Modelos ARIMA

Estimación y selección de Orden Para seleccionar el orden de nuestro modelo ARIMA usamos el gráfico ACF, y el gráfico PACF de nuestra serie diferenciada dos veces, que nos permite estimar los valores apropiados para p y q.

Figura 7 : ACF y PACF de la serie con doble diferenciación.

Analizando estos gráficos, en el PACF hay 2 valores significativos en los dos primeros rezagos y nuevamente no existen más valores significativos hasta el rezago 10. Por otro lado, hay un pico significativo en el primer rezago del ACF y luego no hay picos significativos hasta el rezago 10. Entonces, los valores estimados para p y q son 2 y 1 respectivamente

De lo anterior, podemos deducir que nuestro primer modelo ARIMA es de orden (2,2,1). Luego ajustamos este modelo con las siguientes variaciones: ARIMA(1,2,1), ARIMA(1,2,0), ARIMA(2,2,0), y se obtuvieron los siguientes resultados:

Criterio de bondad de ajuste

En general, se considera que un modelo con un AIC o AICc más bajo es un mejor ajuste a los datos. En este caso, después de obtener los resultados y comparar estos valores de las 4 variaciones del modelo, el ARIMA(1,2,1) con AIC=2.76 , es él modeló con el menor valor de todos y, por lo tanto, nuestro modelo propuesto.

Cuando utilizamos la función auto.arima(), nos da como resultado un modelo ARIMA(1,1,1) con AIC=-3, mucho menor al AIC=2.76 del modelo ARIMA(1,2,1). Sin embargo, el orden de la diferencia no es el mismo, lo que hace que los valores de AIC entre estos modelos no sean comparables.

Test de Ljung-Box

Utilizamos esta prueba estadística para evaluar la independencia de los residuos de los modelos. Teniendo las siguientes hipótesis:

  • H0: Los residuos se distribuyen de forma independiente.
  • H1: Los residuos no se distribuyen de forma independiente.

Buscamos no rechazar la hipótesis nula. Es decir, nos gustaría ver que el valor p de la prueba sea mayor que 0.05, porque esto significa que los residuos de nuestro modelo de series de tiempo son independientes, lo que a menudo es una suposición que hacemos al crear un modelo.

Tabla 1 : Resultados de las pruebas.

De los resultados de esta prueba excluimos los modelos 3 y 4, debido a que estos tienen un valor p por debajo del 0.05, indicando que los residuales no se distribuyen de forma independiente. Quedando entonces los modelos 1 y 2, al comparar estos modelos resulta ser mejor el modelo 2 con ARIMA(1,2,1) pues además de tener el valor AIC más pequeño, tiene de valor p más grande en el Ljung-Box test , los que sugiere que el modelo presenta mejor independencia en la distribución de los residuales, además de que estos presentan ruido blanco y una distribución normal visualmente.

Con base en el análisis de las anteriores pruebas, proponemos el modelo 2, ARIMA(1,2,1) , como el mejor modelo para realizar los pronósticos.

## 
##  Ljung-Box test
## 
## data:  Residuals from ARIMA(1,2,1)
## Q* = 27.993, df = 22, p-value = 0.1759
## 
## Model df: 2.   Total lags used: 24

Figura 7 : Residuales del ARIMA(1,2,1).

Pronósticos

Empleando nuestro modelo más óptimo y haciendo uso de la función forecast() obtuvimos los siguientes pronósticos para las 7 observaciones de abril a octubre de 2023:

Pronósticos modelo ARIMA(1,2,1)

En general, los pronósticos parecen ser bastante precisos, ya que para el intervalo de confianza del 95% el valor real de las observaciones se encuentra dentro de los límites en todos las predicciones. Por otro lado, para un nivel de confianza del 80% los valores reales de los meses de abril, mayo y junio son ligeramente mayor al límite superior del intervalo de confianza, mientras que los otros meses permanecen dentro de los límites. Además de esto, podemos observar que los pronósticos puntuales son bastante cercanos a los valores reales.

Según los valores reales, la tasa de interés aumentan gradualmente desde abril con 7.72 hasta el mes de julio, alcanzando un valor de 8.58, posteriormente desciende durante los meses de agosto y septiembre hasta 8.32, para luego en el mes de octubre nuevamente ascender a un valor de 8.55. Este comportamiento, de crecimiento y decrecimiento, no se puede observar en los pronósticos, sin embargo, estos tienen una tendencia ascendente, al igual que los valores reales.

Finalmente, utilizamos la función MAPE para evaluar la precisión de nuestro pronóstico. Por medio de esta función calculamos el porcentaje de error entre los valores reales y los valores pronosticados, obteniendo un error del 4.58%, lo que nos indica que nuestro modelo de pronóstico tiene un 95.42% de aceptación.

En los siguientes gráficos podemos observar el comportamiento y tendencia que tiene nuestros pronósticos, donde se espera que la tasa de interés continúe aumentando durante los siguientes meses.

Figura 8 : Visualización del pronostico.

Modelo con una ventana reducida

Realizamos un segundo modelo con una ventana más pequeña, con el objetivo de comparar los resultados entre las dos ventanas. Para este nuevo modelo tomamos datos desde el mes de enero de 2020 hasta octubre de 2023 (46 observaciones), realizando todos los procesos de prueba y análisis para identificar el mejor modelo, se llegó al modelo ARIMA(1,2,1) como el más óptimo para esta ventana.

Figura 9 : Serie de la ventana reducida.


Tabla 2 : Resultados de las pruebas para la ventana reducida.


Pronósticos con ventana reducida, ARIMA(1,2,1)


Para este modelo con la ventana reducida, al igual que en la ventana anterior, los pronósticos parecen ser bastante buenos. Los valores reales permanecen dentro de los intervalos de confianza del 80% y 90%; además, los pronósticos puntuales son bastante próximos a estos valores reales. También, este pronóstico nos da un indicio de que en los próximos meses habrá una tendencia gradual de crecimiento, como los que presenta los datos reales con algunas variaciones. Al comparar la precisión entre los dos modelos, podemos deducir que el modelo con la ventana reducida (error=4.89%) tiene un error ligeramente mayor al primer modelo analizado (error=4.58%). Infiriendo así, que un modelo con una ventana más reducida tiene una menor exactitud en los pronósticos.

Conclusiones

Cabe resaltar que es importante ajustar el modelo ARIMA de acuerdo a los criterios establecidos, pues esto garantiza que los resultados sean cada vez más exactos. Cuando tenemos una serie de tiempo que a simple vista es impredecible en su comportamiento, la utilización de estas metodologías se hace muy útil para la toma de decisiones que en un futuro cercano puede generar beneficios importantes. Gracias a los pronósticos de las tasas de interés, grandes entidades empresariales sudafricanas podrían anticipar cambios en las condiciones económicas y orientar estrategias de inversión. Por ejemplo, de acuerdo al pronóstico realizado, donde la tasa de interés tiende al crecimiento, los costos de endeudamiento para las empresas aumentan, incentivando a reducir la dependencia de la deuda, o esperar a un periodo favorable para un nuevo préstamo.

Es posible también entender las decisiones de las entidades que controlan el valor de la tasa de interés, como el Banco Central de la República Sudafricana, pues los ajustes reflejan la necesidad de aumentar los porcentajes para disminuir la demanda que contribuye a las tendencias inflacionarias. Además, también es útil para una planificación financiera personal, cuando se utilizan los pronósticos de tasas de interés para decisiones sobre ahorro, inversión, compra de vivienda, entre otros.

Con la evaluación de pronósticos para ventanas de diferentes tamaños, se puede establecer que una ventana con más de cien observaciones, nos proporciona una mejor estimación de la tendencia de la serie de tiempo, pues al capturar factores históricos y variaciones irregulares, los resultados de los pronósticos son más precisos y confiables. Por otro lado, una ventana más pequeña, que no capta completamente las variaciones a largo plazo, puede ser menos sensible para realizar pronósticos. Sin embargo, la diferencia en el porcentaje de error no es significativa, por lo tanto, la elección de una ventana de tiempo adecuada depende del comportamiento histórico de la serie, donde pocos datos o la consideración de eventos muy rezagados no contribuye al establecimiento de un buen modelo.

Referencias bibliográficas