En este momento deberemos retomar la Unidad 1 en la cual se creó un minilibro que contiene el entregable de dicha unidad. Este documento tiene como repositorio GitHub (elaborado desde Markdown). Ahora, en esta Unidad 2, se debe continuar con los datos presentados en dicho entregable y se debe evidenciar, en una de las variables en el tiempo, la aproximación en promedio móvil, en rezagos y en estacionalidad. Todo lo anterior, a través de funciones y gráficas que permitan detectar patrones y ciclos de la variable.
## tibble [310 × 2] (S3: tbl_df/tbl/data.frame)
## $ Fecha: POSIXct[1:310], format: "2024-10-01" "2024-09-01" ...
## $ Tasa : num [1:310] 10.2 10.8 10.8 11.8 11.8 ...
Los datos representan una serie de tiempo de 310 filas y 2 columnas, correspondientes a la fecha y a la tasa. Se observa que la fecha realmente corresponde a un dato mensual por tanto conviene ajustar el formato.
## # A tibble: 2 × 2
## Fecha Tasa
## <dttm> <dbl>
## 1 2024-10-01 00:00:00 10.2
## 2 1999-01-01 00:00:00 26
Al consultar el primer y último registro del dataset, se identifica que la observación más reciente corresponde al mes de octubre de 2024 con una tasa de 10.25%, mientras que el registro más antiguo es de enero de 1999, con una tasa de 26%. Estos datos indican que el dataset abarca un periodo de aproximadamente 25 años (310 meses), desde finales del siglo XX hasta la fecha actual, reflejando un amplio intervalo temporal que podría incluir distintas tendencias o cambios económicos en la variable Tasa.
## Fecha Tasa
## Min. :1999-01-01 00:00:00.00 Min. : 1.750
## 1st Qu.:2005-06-08 12:00:00.00 1st Qu.: 4.250
## Median :2011-11-16 00:00:00.00 Median : 6.000
## Mean :2011-11-16 00:18:34.83 Mean : 6.957
## 3rd Qu.:2018-04-23 12:00:00.00 3rd Qu.: 9.250
## Max. :2024-10-01 00:00:00.00 Max. :26.000
No se identifican datos ausentes:
## Fecha Tasa
## 0 0
Con el código siguiente, se agregan dos columnas adicionales, llamadas Año y Mes, lo anterior para poder tener una mejor visual de los datos, teniendo en cuenta el gran número de registros que tiene el dataset.
## # A tibble: 6 × 4
## Anio Mes Fecha Tasa
## <dbl> <ord> <date> <dbl>
## 1 2024 oct 2024-10-01 10.2
## 2 2024 sept 2024-09-01 10.8
## 3 2024 ago 2024-08-01 10.8
## 4 2024 jul 2024-07-01 11.8
## 5 2024 jun 2024-06-01 11.8
## 6 2024 may 2024-05-01 12.2
## `geom_smooth()` using formula = 'y ~ x'
Puntos Azules: Los puntos azules indican los valores de “Tasa” en momentos específicos. Hay una dispersión considerable, sugiriendo que la tasa ha experimentado fluctuaciones a lo largo del tiempo.
Línea Roja: Esta línea es el resultado de un ajuste de suavización (usando el método LOESS, como se especificó en tu código). La línea roja ilustra la tendencia general de la “Tasa” a lo largo del tiempo. A partir de la línea, se puede observar que, aunque hay variaciones, existe una tendencia que se puede analizar para hacer predicciones o entender mejor el comportamiento de la variable.
Variaciones: La gráfica muestra que la Tasa ha tenido picos y valles, lo que podría indicar variaciones estacionales o influencias externas que afectan la variable a lo largo del tiempo. A partir de la línea de suavización, parece que la Tasa ha ido disminuyendo o estabilizándose en ciertos períodos, teniendo una caída significativa desde 1999 hasta 2003, y un aumento importante de 2021 a 2024.
## `geom_smooth()` using formula = 'y ~ x'
Esta gráfica permite ver con más detalle los cambios de tendencia:
Desde 1999, se confirma la disminución significativa en la tasa, que empieza muy alta (cerca de 25) y cae rápidamente hasta estabilizarse alrededor de los años 2007-2008 en un valor muy inferior (por debajo de 10).
Entre 2005 y 2020, se observan picos y caídas a intervalos relativamente regulares, pero sin grandes cambios en los niveles generales hasta el repunte final.
Eentre 2010 y 2020, la tasa se mantiene más estable, con algunas oscilaciones en torno a los 5-10 puntos.
A partir de 2021, hay una tendencia de aumento, que se hace más pronunciada hacia los años más recientes. Esto podría ser consecuencia de algún cambio en las políticas o factores externos como la pandemia de COVID-19.
La línea de tendencia suavizada indica una caída rápida, seguida de un periodo de estabilización, y finalmente una tendencia de aumento en los años recientes, semejando una forma de “U” suavizada.
## `summarise()` has grouped output by 'Anio'. You can override using the
## `.groups` argument.
| Anio | ene | feb | mar | abr | may | jun | jul | ago | sept | oct | nov | dic |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1999 | 26.0 | 26.0 | 24.0 | 20.0 | 19.0 | 18.0 | 18.0 | 17.0 | 16.0 | 16.0 | 15.0 | 13.0 |
| 2000 | 12.0 | 12.0 | 12.0 | 12.0 | 12.0 | 12.0 | 12.0 | 12.0 | 12.0 | 12.0 | 12.0 | 12.0 |
| 2001 | 12.0 | 12.0 | 12.0 | 11.5 | 11.5 | 11.5 | 11.5 | 11.0 | 10.0 | 9.5 | 9.2 | 8.8 |
| 2002 | 8.5 | 8.0 | 8.0 | 7.2 | 6.2 | 5.8 | 5.2 | 5.2 | 5.2 | 5.2 | 5.2 | 5.2 |
| 2003 | 5.2 | 6.2 | 6.2 | 6.2 | 7.2 | 7.2 | 7.2 | 7.2 | 7.2 | 7.2 | 7.2 | 7.2 |
| 2004 | 7.2 | 7.2 | 7.0 | 6.8 | 6.8 | 6.8 | 6.8 | 6.8 | 6.8 | 6.8 | 6.8 | 6.8 |
| 2005 | 6.5 | 6.5 | 6.5 | 6.5 | 6.5 | 6.5 | 6.5 | 6.5 | 6.5 | 6.0 | 6.0 | 6.0 |
| 2006 | 6.0 | 6.0 | 6.0 | 6.0 | 6.0 | 6.2 | 6.5 | 6.5 | 6.8 | 6.8 | 7.2 | 7.2 |
| 2007 | 7.5 | 7.8 | 8.0 | 8.2 | 8.2 | 8.8 | 9.0 | 9.2 | 9.2 | 9.2 | 9.2 | 9.5 |
| 2008 | 9.5 | 9.5 | 9.8 | 9.8 | 9.8 | 9.8 | 9.8 | 10.0 | 10.0 | 10.0 | 10.0 | 10.0 |
| 2009 | 9.5 | 9.5 | 9.0 | 7.0 | 7.0 | 5.0 | 4.5 | 4.5 | 4.5 | 4.0 | 4.0 | 3.5 |
| 2010 | 3.5 | 3.5 | 3.5 | 3.5 | 3.5 | 3.0 | 3.0 | 3.0 | 3.0 | 3.0 | 3.0 | 3.0 |
| 2011 | 3.0 | 3.0 | 3.2 | 3.5 | 3.5 | 4.0 | 4.2 | 4.5 | 4.5 | 4.5 | 4.5 | 4.8 |
| 2012 | 4.8 | 5.0 | 5.2 | 5.2 | 5.2 | 5.2 | 5.2 | 5.0 | 4.8 | 4.8 | 4.8 | 4.5 |
| 2013 | 4.2 | 4.0 | 3.8 | 3.2 | 3.2 | 3.2 | 3.2 | 3.2 | 3.2 | 3.2 | 3.2 | 3.2 |
| 2014 | 3.2 | 3.2 | 3.2 | 3.2 | 3.5 | 3.5 | 4.0 | 4.2 | 4.5 | 4.5 | 4.5 | 4.5 |
| 2015 | 4.5 | 4.5 | 4.5 | 4.5 | 4.5 | 4.5 | 4.5 | 4.5 | 4.5 | 4.8 | 4.8 | 5.5 |
| 2016 | 5.8 | 6.0 | 6.2 | 6.5 | 6.5 | 7.2 | 7.5 | 7.8 | 7.8 | 7.8 | 7.8 | 7.8 |
| 2017 | 7.5 | 7.5 | 7.2 | 7.0 | 7.0 | 6.2 | 6.2 | 5.5 | 5.2 | 5.2 | 5.0 | 4.8 |
| 2018 | 4.8 | 4.5 | 4.5 | 4.5 | 4.2 | 4.2 | 4.2 | 4.2 | 4.2 | 4.2 | 4.2 | 4.2 |
| 2019 | 4.2 | 4.2 | 4.2 | 4.2 | 4.2 | 4.2 | 4.2 | 4.2 | 4.2 | 4.2 | 4.2 | 4.2 |
| 2020 | 4.2 | 4.2 | 4.2 | 3.8 | 3.8 | 2.8 | 2.5 | 2.5 | 2.0 | 1.8 | 1.8 | 1.8 |
| 2021 | 1.8 | 1.8 | 1.8 | 1.8 | 1.8 | 1.8 | 1.8 | 1.8 | 1.8 | 2.0 | 2.0 | 2.5 |
| 2022 | 3.0 | 4.0 | 4.0 | 5.0 | 5.0 | 6.0 | 7.5 | 9.0 | 9.0 | 10.0 | 11.0 | 11.0 |
| 2023 | 12.0 | 12.8 | 12.8 | 13.0 | 13.0 | 13.2 | 13.2 | 13.2 | 13.2 | 13.2 | 13.2 | 13.2 |
| 2024 | 13.0 | 12.8 | 12.8 | 12.2 | 12.2 | 11.8 | 11.8 | 10.8 | 10.8 | 10.2 | NA | NA |
A partir de la tabla se pueden confirmar las tendencias mencionadas anteriormente, con un comportamiento descendente en los 12 primeros años (1999 a 2010), una estabilización en los 5 años siguientes (2011-2015) y un incremento significativo en años recientes (2021 en adelante).
Permite analizar el mercado a través de las tendencias. La media móvil es una técnica estadística que se utiliza para analizar datos a lo largo del tiempo. Permite calcular la media de un conjunto de valores en un intervalo específico y luego desplazar ese intervalo a lo largo de la serie de datos para obtener una nueva serie de medias; lo que permite suavizar fluctuaciones en los datos así como resaltar tendencias.
Se conoce como media móvil ya que el valor se calcula constantemente a medida que pasa el tiempo; de esta forma, la media cambia cada vez que los valores cambian.
El operador rezago actúa sobre una serie de tiempo
## # A tibble: 6 × 6
## Anio Mes Fecha Tasa PromedioMovil Tasa_lag1
## <dbl> <ord> <date> <dbl> <dbl> <dbl>
## 1 2024 oct 2024-10-01 10.2 NA NA
## 2 2024 sept 2024-09-01 10.8 NA 10.2
## 3 2024 ago 2024-08-01 10.8 10.6 10.8
## 4 2024 jul 2024-07-01 11.8 11.1 10.8
## 5 2024 jun 2024-06-01 11.8 11.4 11.8
## 6 2024 may 2024-05-01 12.2 11.9 11.8
La gráfica visualiza la correlación entre una variable y sus valores rezagados (delayed values). Este gráfico es útil para detectar patrones en series temporales y evaluar la autocorrelación en los datos.
Las gráficas entre Año y sus diferentes rezagos muestran una relación lineal perfecta, lo que era de esperarse, ya que el valor de un año en un rezago anterior está directamente relacionado con los años consecutivos. Esto sugiere que el “Año” no aporta una variabilidad significativa en términos de cambios bruscos, es decir, la serie avanza sin saltos.
Las gráficas entre Mes y sus rezagos muestran una estructura cíclica, con puntos que siguen un patrón predecible. Esto tiene sentido, ya que los meses siguen un ciclo repetitivo de 12 unidades (de enero a diciembre).
los meses correlacionan bien con sus rezagos inmediatos, pero a medida que aumenta el número de rezagos (lag 2, lag 3), el ciclo es más visible, lo que indica que la periodicidad estacional en los datos está bien representada.
Similar al año, la relación entre Fecha y sus rezagos también muestra una estructura lineal. Esto era previsible, ya que las fechas están organizadas de manera continua. No se observan cambios abruptos o interrupciones que puedan señalar eventos singulares en la serie temporal.
En las gráficas entre Tasa y sus rezagos, especialmente en el rezago 1 (lag 1), se aprecia una clara correlación positiva, lo que significa que la tasa en un mes está fuertemente relacionada con la tasa del mes anterior. Esta relación indica una persistencia en la tasa, es decir, no hay cambios abruptos entre periodos consecutivos.
A medida que el rezago aumenta (lag 2 y lag 3), la relación sigue siendo positiva pero disminuye levemente, lo cual es normal: los valores más distantes en el tiempo tienen menos influencia directa entre sí, aunque todavía se observa cierta correlación.
Esto sugiere que la serie de tasas no presenta grandes fluctuaciones a corto plazo y que los valores siguen un comportamiento más estable, lo que puede indicar una tendencia suave sin variaciones abruptas.
Similar a la “Tasa”, las gráficas entre el Promedio Móvil y sus rezagos muestran una alta correlación, especialmente para lag 1. Esto sugiere que los promedios móviles no cambian drásticamente de un mes a otro, y los valores del promedio móvil están fuertemente ligados a los meses anteriores. A medida que aumenta el rezago (lag 2, lag 3), la correlación disminuye ligeramente, lo que indica que los valores anteriores siguen teniendo una influencia pero con una menor magnitud.
Las gráficas entre Tasa_lag1 y sus rezagos también muestran una alta correlación. Esto es de esperar, ya que los valores rezagados de una variable tienden a mostrar correlación fuerte con rezagos cercanos.
CONCLUSIÓN GENERAL:
Los gráficos de rezago muestran una clara autocorrelación tanto en las variables de Tasa como en el Promedio Móvil, lo que sugiere que los valores actuales están muy influenciados por sus valores anteriores.
No se observan grandes fluctuaciones o cambios abruptos en la serie temporal, lo que implica que los datos de tasa y promedio móvil siguen una evolución suave a lo largo del tiempo.
La estructura cíclica en los meses sugiere que existe un patrón estacional predecible, lo cual es clave para definir modelos de predicción de series temporales con componentes estacionales, como modelos ARIMA/SARIMA o de descomposición estacional.