1 Enunciado:

En este momento deberemos retomar la Unidad 1 en la cual se creó un minilibro que contiene el entregable de dicha unidad. Este documento tiene como repositorio GitHub (elaborado desde Markdown). Ahora, en esta Unidad 2, se debe continuar con los datos presentados en dicho entregable y se debe evidenciar, en una de las variables en el tiempo, la aproximación en promedio móvil, en rezagos y en estacionalidad. Todo lo anterior, a través de funciones y gráficas que permitan detectar patrones y ciclos de la variable.

2 Análisis exploratorio:

## tibble [310 × 2] (S3: tbl_df/tbl/data.frame)
##  $ Fecha: POSIXct[1:310], format: "2024-10-01" "2024-09-01" ...
##  $ Tasa : num [1:310] 10.2 10.8 10.8 11.8 11.8 ...

Los datos representan una serie de tiempo de 310 filas y 2 columnas, correspondientes a la fecha y a la tasa. Se observa que la fecha realmente corresponde a un dato mensual por tanto conviene ajustar el formato.

## # A tibble: 2 × 2
##   Fecha                Tasa
##   <dttm>              <dbl>
## 1 2024-10-01 00:00:00  10.2
## 2 1999-01-01 00:00:00  26

Al consultar el primer y último registro del dataset, se identifica que la observación más reciente corresponde al mes de octubre de 2024 con una tasa de 10.25%, mientras que el registro más antiguo es de enero de 1999, con una tasa de 26%. Estos datos indican que el dataset abarca un periodo de aproximadamente 25 años (310 meses), desde finales del siglo XX hasta la fecha actual, reflejando un amplio intervalo temporal que podría incluir distintas tendencias o cambios económicos en la variable Tasa.

##      Fecha                             Tasa       
##  Min.   :1999-01-01 00:00:00.00   Min.   : 1.750  
##  1st Qu.:2005-06-08 12:00:00.00   1st Qu.: 4.250  
##  Median :2011-11-16 00:00:00.00   Median : 6.000  
##  Mean   :2011-11-16 00:18:34.83   Mean   : 6.957  
##  3rd Qu.:2018-04-23 12:00:00.00   3rd Qu.: 9.250  
##  Max.   :2024-10-01 00:00:00.00   Max.   :26.000

No se identifican datos ausentes:

## Fecha  Tasa 
##     0     0

Con el código siguiente, se agregan dos columnas adicionales, llamadas Año y Mes, lo anterior para poder tener una mejor visual de los datos, teniendo en cuenta el gran número de registros que tiene el dataset.

## # A tibble: 6 × 4
##    Anio Mes   Fecha       Tasa
##   <dbl> <ord> <date>     <dbl>
## 1  2024 oct   2024-10-01  10.2
## 2  2024 sept  2024-09-01  10.8
## 3  2024 ago   2024-08-01  10.8
## 4  2024 jul   2024-07-01  11.8
## 5  2024 jun   2024-06-01  11.8
## 6  2024 may   2024-05-01  12.2

3. Gráficos de visualización:

## `geom_smooth()` using formula = 'y ~ x'

## `geom_smooth()` using formula = 'y ~ x'

Esta gráfica permite ver con más detalle los cambios de tendencia:

## `summarise()` has grouped output by 'Anio'. You can override using the
## `.groups` argument.
Anio ene feb mar abr may jun jul ago sept oct nov dic
1999 26.0 26.0 24.0 20.0 19.0 18.0 18.0 17.0 16.0 16.0 15.0 13.0
2000 12.0 12.0 12.0 12.0 12.0 12.0 12.0 12.0 12.0 12.0 12.0 12.0
2001 12.0 12.0 12.0 11.5 11.5 11.5 11.5 11.0 10.0 9.5 9.2 8.8
2002 8.5 8.0 8.0 7.2 6.2 5.8 5.2 5.2 5.2 5.2 5.2 5.2
2003 5.2 6.2 6.2 6.2 7.2 7.2 7.2 7.2 7.2 7.2 7.2 7.2
2004 7.2 7.2 7.0 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8 6.8
2005 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.5 6.0 6.0 6.0
2006 6.0 6.0 6.0 6.0 6.0 6.2 6.5 6.5 6.8 6.8 7.2 7.2
2007 7.5 7.8 8.0 8.2 8.2 8.8 9.0 9.2 9.2 9.2 9.2 9.5
2008 9.5 9.5 9.8 9.8 9.8 9.8 9.8 10.0 10.0 10.0 10.0 10.0
2009 9.5 9.5 9.0 7.0 7.0 5.0 4.5 4.5 4.5 4.0 4.0 3.5
2010 3.5 3.5 3.5 3.5 3.5 3.0 3.0 3.0 3.0 3.0 3.0 3.0
2011 3.0 3.0 3.2 3.5 3.5 4.0 4.2 4.5 4.5 4.5 4.5 4.8
2012 4.8 5.0 5.2 5.2 5.2 5.2 5.2 5.0 4.8 4.8 4.8 4.5
2013 4.2 4.0 3.8 3.2 3.2 3.2 3.2 3.2 3.2 3.2 3.2 3.2
2014 3.2 3.2 3.2 3.2 3.5 3.5 4.0 4.2 4.5 4.5 4.5 4.5
2015 4.5 4.5 4.5 4.5 4.5 4.5 4.5 4.5 4.5 4.8 4.8 5.5
2016 5.8 6.0 6.2 6.5 6.5 7.2 7.5 7.8 7.8 7.8 7.8 7.8
2017 7.5 7.5 7.2 7.0 7.0 6.2 6.2 5.5 5.2 5.2 5.0 4.8
2018 4.8 4.5 4.5 4.5 4.2 4.2 4.2 4.2 4.2 4.2 4.2 4.2
2019 4.2 4.2 4.2 4.2 4.2 4.2 4.2 4.2 4.2 4.2 4.2 4.2
2020 4.2 4.2 4.2 3.8 3.8 2.8 2.5 2.5 2.0 1.8 1.8 1.8
2021 1.8 1.8 1.8 1.8 1.8 1.8 1.8 1.8 1.8 2.0 2.0 2.5
2022 3.0 4.0 4.0 5.0 5.0 6.0 7.5 9.0 9.0 10.0 11.0 11.0
2023 12.0 12.8 12.8 13.0 13.0 13.2 13.2 13.2 13.2 13.2 13.2 13.2
2024 13.0 12.8 12.8 12.2 12.2 11.8 11.8 10.8 10.8 10.2 NA NA

A partir de la tabla se pueden confirmar las tendencias mencionadas anteriormente, con un comportamiento descendente en los 12 primeros años (1999 a 2010), una estabilización en los 5 años siguientes (2011-2015) y un incremento significativo en años recientes (2021 en adelante).

4. Análisis de serie de tiempo:

4.1. Promedio o media móvil

Permite analizar el mercado a través de las tendencias. La media móvil es una técnica estadística que se utiliza para analizar datos a lo largo del tiempo. Permite calcular la media de un conjunto de valores en un intervalo específico y luego desplazar ese intervalo a lo largo de la serie de datos para obtener una nueva serie de medias; lo que permite suavizar fluctuaciones en los datos así como resaltar tendencias.

Se conoce como media móvil ya que el valor se calcula constantemente a medida que pasa el tiempo; de esta forma, la media cambia cada vez que los valores cambian.

4.2. Rezago (operador backshift) y estacionalidad

El operador rezago actúa sobre una serie de tiempo

## # A tibble: 6 × 6
##    Anio Mes   Fecha       Tasa PromedioMovil Tasa_lag1
##   <dbl> <ord> <date>     <dbl>         <dbl>     <dbl>
## 1  2024 oct   2024-10-01  10.2          NA        NA  
## 2  2024 sept  2024-09-01  10.8          NA        10.2
## 3  2024 ago   2024-08-01  10.8          10.6      10.8
## 4  2024 jul   2024-07-01  11.8          11.1      10.8
## 5  2024 jun   2024-06-01  11.8          11.4      11.8
## 6  2024 may   2024-05-01  12.2          11.9      11.8

La gráfica visualiza la correlación entre una variable y sus valores rezagados (delayed values). Este gráfico es útil para detectar patrones en series temporales y evaluar la autocorrelación en los datos.

  • 1. Año vs Rezagos (lag 1, 2, 3)

Las gráficas entre Año y sus diferentes rezagos muestran una relación lineal perfecta, lo que era de esperarse, ya que el valor de un año en un rezago anterior está directamente relacionado con los años consecutivos. Esto sugiere que el “Año” no aporta una variabilidad significativa en términos de cambios bruscos, es decir, la serie avanza sin saltos.

  • 2. Mes vs Rezagos (lag 1, 2, 3)

Las gráficas entre Mes y sus rezagos muestran una estructura cíclica, con puntos que siguen un patrón predecible. Esto tiene sentido, ya que los meses siguen un ciclo repetitivo de 12 unidades (de enero a diciembre).

los meses correlacionan bien con sus rezagos inmediatos, pero a medida que aumenta el número de rezagos (lag 2, lag 3), el ciclo es más visible, lo que indica que la periodicidad estacional en los datos está bien representada.

  • 3. Fecha vs Rezagos (lag 1, 2, 3)

Similar al año, la relación entre Fecha y sus rezagos también muestra una estructura lineal. Esto era previsible, ya que las fechas están organizadas de manera continua. No se observan cambios abruptos o interrupciones que puedan señalar eventos singulares en la serie temporal.

  • 4. Tasa vs Rezagos (lag 1, 2, 3)

En las gráficas entre Tasa y sus rezagos, especialmente en el rezago 1 (lag 1), se aprecia una clara correlación positiva, lo que significa que la tasa en un mes está fuertemente relacionada con la tasa del mes anterior. Esta relación indica una persistencia en la tasa, es decir, no hay cambios abruptos entre periodos consecutivos.

A medida que el rezago aumenta (lag 2 y lag 3), la relación sigue siendo positiva pero disminuye levemente, lo cual es normal: los valores más distantes en el tiempo tienen menos influencia directa entre sí, aunque todavía se observa cierta correlación.

Esto sugiere que la serie de tasas no presenta grandes fluctuaciones a corto plazo y que los valores siguen un comportamiento más estable, lo que puede indicar una tendencia suave sin variaciones abruptas.

  • 5. Promedio Movil vs Rezagos (lag 1, 2, 3)

Similar a la “Tasa”, las gráficas entre el Promedio Móvil y sus rezagos muestran una alta correlación, especialmente para lag 1. Esto sugiere que los promedios móviles no cambian drásticamente de un mes a otro, y los valores del promedio móvil están fuertemente ligados a los meses anteriores. A medida que aumenta el rezago (lag 2, lag 3), la correlación disminuye ligeramente, lo que indica que los valores anteriores siguen teniendo una influencia pero con una menor magnitud.

  • 6. Tasa Lag1 vs Rezagos

Las gráficas entre Tasa_lag1 y sus rezagos también muestran una alta correlación. Esto es de esperar, ya que los valores rezagados de una variable tienden a mostrar correlación fuerte con rezagos cercanos.

CONCLUSIÓN GENERAL:

Los gráficos de rezago muestran una clara autocorrelación tanto en las variables de Tasa como en el Promedio Móvil, lo que sugiere que los valores actuales están muy influenciados por sus valores anteriores.

No se observan grandes fluctuaciones o cambios abruptos en la serie temporal, lo que implica que los datos de tasa y promedio móvil siguen una evolución suave a lo largo del tiempo.

La estructura cíclica en los meses sugiere que existe un patrón estacional predecible, lo cual es clave para definir modelos de predicción de series temporales con componentes estacionales, como modelos ARIMA/SARIMA o de descomposición estacional.