En el presente documento se realiza un análisis sobre el comportamiento de la tasa de subocupación, la cual cuenta con una lista de datos desde el año 2001 hasta el año 2025 con un frecuencia mensual (12).

# Librerías
library(readxl)
library(ggplot2)
library(ggfortify)
library(dplyr)
library(forecast)

Antes de analizar el comportamiento de la serie de tiempo, hay que entender qué es la tasa de subempleo. El subempleo se presenta en dos ocasiones según el DANE (Departamento Administrativo Nacional de Estadística), en primer lugar, por insuficiencia de horas, es decir que los empleados trabajan menos horas que las deseadas, teniendo una jornada inferior a 44 horas semanales. Por otra parte, están las condiciones de empleo inadecuado en términos de competencias e ingresos.

Serie_tasa_subocupacion <- read_excel(
  "C:/Users/juanv/Downloads/Serie total nacional.xlsx", 
  sheet = "Tasa de subocupación"
)

View(Serie_tasa_subocupacion)

Serie_mensual_tasa_subocupacion <- ts(
  Serie_tasa_subocupacion$Tasa_de_subocupacion, 
  start = c(2001,1), 
  frequency = 12
)

autoplot(Serie_mensual_tasa_subocupacion) +
  ggtitle("Total Nacional: Serie de la tasa de subocupación") +
  xlab("Año") +
  ylab("Porcentaje") +
  scale_y_continuous(breaks = seq(0, 16, by = 1)) +
  theme_classic() +
  theme(
    panel.border = element_rect(fill = NA, color = "black", linewidth = 1.2), 
    plot.title = element_text(family = "serif", face = "bold", size = 15),
    axis.title = element_text(family = "serif", face = "bold"),
    panel.grid.major = element_line(color = "grey80", linewidth = 0.25),
    panel.grid.minor = element_line(color = "grey90", linewidth = 0.2)
  )

Teniendo en cuenta las características que explican el comportamiento de la serie, antes hay que entender por qué es importante dicha representación porcentual de los subempelados a lo largo del tiempo.

El análisis de la serie facilita identificar comportamientos recurrentes, evaluar la dinámica del mercado laboral y generar pronósticos sobre su posible trayectoria futura.

El comportamiento de la serie evidencia una tendencia decreciente de largo plazo, lo que sugiere una reducción progresiva en la tasa de subocupación a lo largo del tiempo. No obstante, en el año 2020 se observa una ruptura marcada asociada a la pandemia del COVID-19, cuyos valores atípicos generaron un choque transitorio que alteró la dinámica habitual de la serie. Posteriormente, la trayectoria retoma su tendencia descendente. En cuanto a la estacionalidad, esta no se presenta de forma claramente definida, ya que los datos no exhiben un patrón mensual constante y se observan fluctuaciones irregulares con aumentos y caídas variables. Por ello, dichos movimientos pueden interpretarse más como componentes cíclicos asociados a cambios económicos coyunturales que como un comportamiento estrictamente estacional.

La tendencia decreciente en la serie de tiempo es ideal, puesto que, el subempleo se considera perjudial en la economía, ya que, lo trabajadores reciben menos ingresos, es decir, por debajo del salario mínimo vigente, reduciendo el consumo afectando el crecimiento de la economía; al igual que el desaprovechamiento de sus competencias afectando la estabilidad de sus capacidades.

ggseasonplot(
  Serie_mensual_tasa_subocupacion, 
  year.labels = TRUE, 
  year.labels.left = TRUE
) +
  ylab("Porcentaje") +
  xlab("Mes") +
  ggtitle("Gráfico de estacionalidad: Tasa de subocupación") +
  theme_classic() +
  theme(
    panel.border = element_rect(fill = NA, color = "black", linewidth = 1.2), 
    plot.title = element_text(family = "serif", face = "bold", size = 15),
    axis.title = element_text(family = "serif", face = "bold"),
    panel.grid.major = element_line(color = "grey80", linewidth = 0.25),
    panel.grid.minor = element_line(color = "grey90", linewidth = 0.2)
  ) +
  scale_y_continuous(breaks = seq(0, 16, by = 1))

El propósito del gráfico de estacionalidad es representar el comportamiento de la serie mes a mes a lo largo de los años, con el fin de identificar la existencia de patrones o frecuencias que se repitan de manera sistemática. En el caso de la tasa de subocupación, no se observa una estacionalidad claramente definida; sin embargo, se evidencia que, en la mayoría de los años, los valores mínimos tienden a concentrarse al inicio y al cierre del año. Este comportamiento podría estar asociado a factores propios de la dinámica del mercado laboral y a variaciones en la actividad económica. Durante el resto del año, las fluctuaciones no siguen una periodicidad fija ni predecible, por lo que resulta complejo atribuir estos movimientos a efectos estacionales, interpretándose más bien como variaciones de carácter cíclico o coyuntural.

serie_sin_2020 <- Serie_mensual_tasa_subocupacion

serie_sin_2020[
  time(serie_sin_2020) >= 2020 &
  time(serie_sin_2020) < 2021
] <- NA

ggseasonplot(
  serie_sin_2020,
  year.labels = TRUE,
  year.labels.left = TRUE
) +
  ylab("Porcentaje") +
  xlab("Mes") +
  ggtitle("Gráfico de estacionalidad (sin el 2020): Tasa de subocupación") +
  theme_classic() +
  theme(
    panel.border = element_rect(fill = NA, color = "black", linewidth = 1.2), 
    plot.title = element_text(family = "serif", face = "bold", size = 15),
    axis.title = element_text(family = "serif", face = "bold"),
    panel.grid.major = element_line(color = "grey80", linewidth = 0.25),
    panel.grid.minor = element_line(color = "grey90", linewidth = 0.2)
  ) +
  scale_y_continuous(breaks = seq(6, 16, by = 1))

La segunda gráfica de estacionalidad se diferencia de la primera, en cuanto a la falta del año 2020 conocido por la pandemia del COVID-19 que con sus datos altera la escala de los años restantes. Por ello el objetivo de esta gráfica es observar más de cerca el resto de los años que se manejan a una escala similar. Se puede decir que en el caso de enero en la gran mayoría de años a lo largo de este mes hay un incremento, esto puede darse por la reactivación del mercado laboral, luego del periodo vacacional de final de año, llegando a un pico en el mes de febrero y luego mostrar un comportamiento sin frecuencia fija (ciclos) en los demás meses del año.

# Gráfica de autocorrelación con títulos personalizados
acf(Serie_mensual_tasa_subocupacion, main = "Autocorrelación") +
  xlab("Rezago") +
  ylab("Autocorrelación") +
  theme_classic() +
  theme(
    text = element_text(family = "Times New Roman"),
    plot.title = element_text(size = 16, face = "bold", hjust = 0.5),
    axis.title = element_text(size = 14, face = "bold"),
    axis.text = element_text(size = 12),
    panel.grid.major = element_line(color = "grey80", size = 0.5),
    panel.grid.minor = element_line(color = "grey90", size = 0.25)
  )

## NULL

En la gráfica de autocorrelación, se observa que los valores significativos se concentran principalmente en los primeros rezagos, lo que indica que la serie tiene memoria a corto plazo. Es decir a medida que aumentan los rezagos, la correlación se desvanece, lo que puede indicar que no hay una dependencia fuerte a largo plazo. En conclusión, la serie se comporta principalmente como un proceso de corta memoria, donde los valores recientes influyen más que los valores lejanos en el tiempo.