En este informe, se realizará un análisis de series temporales: *1) Extracción de señales o descomposición de series temporales y 2) Pronóstico del número de microempresas nuevas en Cali. El periodo de análisis es desde el primer trimestre de 2004 (1T2004) y el cuarto trimestre de 2024 (4T2024).
El análisis de series temporales permite identificar patrones subyacentes en los datos, como tendencias, estacionalidad y componentes irregulares, lo que facilita una mejor comprensión del comportamiento de la variable a analizar. Para ello, se emplearán técnicas estadísticas o métodos de descomposición y el Modelo ARIMA con el fin de extraer información clave que pueda contribuir a la toma de decisiones estratégicas.
A lo largo del informe, se presentarán los resultados obtenidos y se discutirán sus implicaciones en el contexto empresarial de Cali.
Puntualmente, el análisis de la creación de microempresas en Cali es clave para la planificación económica y la toma de decisiones estratégicas. Identificar patrones y tendencias en estos datos ayuda a mejorar las condiciones para los emprendedores y fortalecer el desarrollo económico local.
#Cargar librerías necesarias
library(readxl) # Para leer archivos Excel
library(tseries) # Para pruebas de estacionariedad
library(forecast) # Para modelado ARIMA y pronósticos
library(ggplot2) # Para visualización de datos
library(plotly) # Para gráficos interactivos
library(timetk)
Cargar base de datos
library(readxl)
data_col <- read_excel("C:/Users/ESTEFI/Desktop/Uni/QUINTO SEMESTRE/Analitica de datos/Extracción de señales/MICRO.xlsx",
col_types = c("date", "numeric"))
Un paso indispensable es declarar la variable como serie temporal:
# Convertir/declarar el número de microempresas en serie de tiempo trimestral
micro_ts <- ts(data_col$MICRO, start = c(2004, 1), frequency = 4)
micro_ts
## Qtr1 Qtr2 Qtr3 Qtr4
## 2004 4064 3394 3282 1951
## 2005 2956 3188 3768 1812
## 2006 3436 3241 3267 2058
## 2007 4327 3408 3255 2168
## 2008 3592 3300 3489 2090
## 2009 3281 3027 3328 2340
## 2010 3503 3205 3469 2006
## 2011 3493 3503 3457 2131
## 2012 3847 3412 3447 2224
## 2013 3462 3739 3896 2715
## 2014 4406 3686 3900 3122
## 2015 3609 3460 3784 2459
## 2016 4299 4072 4276 2769
## 2017 5106 3896 3956 2618
## 2018 5009 4406 4349 3481
## 2019 6508 5169 5488 3510
## 2020 6046 2600 6156 4396
## 2021 6197 3860 4803 3956
## 2022 6210 4869 5785 3700
## 2023 5362 4409 4485 3087
## 2024 4939 4530 4473 3150
Ahora si calculamos estadísticas descriptivas
En la tabla siguiente se observa lo siguiente:
En promedio, cada trimestre se han creado alrededor de 3760 microempresas. Este es un valor de referencia para entender el comportamiento típico.
La mediana indica que la mitad de los trimestres tuvieron menos de 3506.5 microempresas nuevas y la otra mitad tuvo más. Como está un poco por debajo de la media, sugiere que hay algunos valores altos que están elevando el promedio.
Existe una variabilidad notable en la cantidad de microempresas nuevas por trimestre. Un valor de 1052 indica que los datos fluctúan bastante alrededor del promedio.
la variabilidad relativa de la serie no es excesivamente alta. Un 27.99% implica que, aunque hay oscilaciones, los datos no son extremadamente dispersos respecto al promedio.
# Calcular estadísticas descriptivas básicas
descriptive_stats <- data.frame(
Min = min(micro_ts),
Max = max(micro_ts),
Media = mean(micro_ts),
Mediana = median(micro_ts),
DesviacionEstandar = sd(micro_ts),
CoefVar = sd(micro_ts) / mean(micro_ts)
)
print(descriptive_stats)
## Min Max Media Mediana DesviacionEstandar CoefVar
## 1 1812 6508 3760.5 3506.5 1052.423 0.2798625
Exploramos el comportamiento o evolución de la variable:
En la Figura 1. destaca lo siguiente:
*Hacia el final de la serie se nota una caída en el número de microempresas. Podría estar asociado a factores económicos como inflación, desaceleración económica o menor acceso a financiamiento para emprendedores.
Por tanto, la Figura 1, sugiere que la creación de microempresas en Cali ha aumentado a lo largo del tiempo, pero con fuertes fluctuaciones. Es clave analizar qué factores han impulsado los picos y qué ha causado las caídas recientes, para entender mejor el ecosistema emprendedor de la ciudad.
# Gráfico interactivo de la serie original
grafico_serie <- ggplot(data_col, aes(x = seq.Date(from = as.Date("2004-01-01"), by = "quarter", length.out = nrow(data_col)), y = micro_ts)) +
geom_line(color = "grey", size = 0.4) +
geom_point(color = "black", size = 0.1) +
ggtitle("Figura 1.Evolución de las microempresas en Cali") +
xlab("Tiempo") +
ylab("Número de microempresas") +
theme_minimal()
ggplotly(grafico_serie)
*Muchas series de tiempo son una combinación de varias influencias. Es por eso que, separar la tendencia, la estacionalidad y los componentes aleatorios permite entender mejor qué está impulsando los cambios en la serie.
Si analizamos la creación de microempresas en Cali, podríamos querer saber si el crecimiento se debe a una tendencia real o a fluctuaciones estacionales.
*Detectar cambios inesperados en la serie es más fácil cuando se eliminan componentes predecibles. Ejemplo: Si hay una caída abrupta en el número de microempresas, podemos verificar si es una anomalía (ruido) o un cambio estructural en la economía.
En conclusión, la descomposición de series de tiempo permite comprender mejor los datos, mejorar predicciones y tomar decisiones más estratégicas. Es una herramienta clave en la analítica de negocios, especialmente en entornos donde las fluctuaciones en los datos pueden afectar inversiones, políticas económicas y estrategias empresariales.
# Cargar librerías necesarias
library(ggplot2)
library(plotly)
# Descomposición de la serie temporal
stl_decomp <- stl(micro_ts, s.window = "periodic")
# Convertir la descomposición a un data frame para graficar con ggplot2
stl_df <- data.frame(
Time = rep(time(micro_ts), 4), # Tiempo repetido para cada componente
Value = c(stl_decomp$time.series[, "seasonal"],
stl_decomp$time.series[, "trend"],
stl_decomp$time.series[, "remainder"],
micro_ts),
Component = rep(c("Estacional", "Tendencia", "Residuo", "Serie Original"), each = length(micro_ts))
)
# Crear gráfico con ggplot2
p <- ggplot(stl_df, aes(x = Time, y = Value, color = Component)) +
geom_line() +
facet_wrap(~Component, scales = "free_y", ncol = 1) +
theme_minimal() +
labs(title = "Figura A. Descomposición del número de microempresas en Cali",
x = "Tiempo",
y = "Valor")
# Convertir a gráfico interactivo con plotly
ggplotly(p)
Interpretación Figura A.Descomposición temporal
Componente estacional
Muestra patrones recurrentes a lo largo del tiempo. La interpretación de este componente es clave para entender fluctuaciones predecibles dentro de cada período analizado.
Las caidas o incrementos del gcomponente estacional ocurren a intervalos similares (Primer trimestre y cuarto trimestre de cada año), lo que indica que el comportamiento estacional se mantiene a lo largo del tiempo.
Así, el componente estacional sugiere que hay fluctuaciones repetitivas en la creación de microempresas en Cali a lo largo de cada año. Comprender estos patrones permite ajustar estrategias de apoyo al emprendimiento y realizar pronósticos más precisos para futuras decisiones económicas. También puede ayudar a prever en qué períodos del año se espera un menor número de empresas y planificar estrategias para mitigar estos efectos.
Componente de residuo
El componente residual permanece relativamente estable durante la mayor parte del horizonte de análisis, fluctuando en torno a cero y sin presentar alteraciones significativas. No obstante, alrededor del año 2020 se observa una desviación negativa considerable que sobresale claramente frente al comportamiento habitual de la serie. Este cambio está estrechamente relacionado con los efectos de la pandemia sobre la actividad empresarial en Cali.
Debido a que esta perturbación aparece en el residuo y no en la tendencia, se puede concluir que corresponde a un evento extraordinario y transitorio, originado por factores externos, y no a una modificación permanente en la trayectoria de largo plazo de la creación de microempresas.
Componente de tendencia
La tendencia evidencia un crecimiento estructural gradual y sostenido desde el comienzo del periodo hasta aproximadamente 2019, lo que refleja el fortalecimiento progresivo del ecosistema emprendedor de Cali. A partir de ese año se observa un incremento más pronunciado, llevando la serie a sus niveles máximos históricos.
Este comportamiento puede estar relacionado con la recuperación económica y con el aumento del emprendimiento como alternativa frente a la pérdida de empleo durante la pandemia. En los últimos años del periodo analizado, la tendencia presenta una ligera desaceleración; sin embargo, continúa en niveles considerablemente superiores a los registrados antes de 2018. Esto sugiere que la creación de microempresas en la ciudad ha alcanzado un nuevo nivel estructural más elevado.
Serie original versus serie ajustada por estacionalidad
En la Figura 2 se aprecia que la serie corregida por estacionalidad permite identificar con mayor claridad los cambios estructurales de la variable, al eliminar las fluctuaciones periódicas que se repiten de manera sistemática a lo largo del año.
Este procedimiento resulta útil para analizar la evolución real de la creación de microempresas y para formular estrategias de apoyo al emprendimiento basadas en información más depurada. Asimismo, contribuye a mejorar la calidad de los pronósticos y a respaldar decisiones estratégicas en el sector, ya que reduce el efecto de patrones estacionales que podrían distorsionar la interpretación de los datos.
En síntesis, la descomposición de la serie temporal facilita la identificación de la tendencia de largo plazo y proporciona una base más sólida para anticipar riesgos y oportunidades en el desarrollo de las microempresas en Cali.
Graficamos serie original VS ajustada por estacionalidad
En la Figura 2, se observa que en la serie ajustada por estacionalidad se pueden apreciar con mayor precisión cambios estructurales, facilitando el análisis sin la interferencia de variaciones temporales recurrentes.
Estos análisis permiten diseñar estrategias de apoyo al emprendimiento basadas en datos reales, sin sesgos estacionales. Además, proporciona información clave para la toma de decisiones estratégicas en el sector de microempresas y, mejora la precisión de las estimaciones futuras al eliminar patrones estacionales que podrían distorsionar los análisis.
En conclusión, la descomposición de la serie temporal no solo facilita la identificación de tendencias de largo plazo, sino que también permite tomar decisiones más informadas, anticipando oportunidades y riesgos en el sector de las microempresas en Cali
# Extraer los componentes de la descomposición
micro_sa <- micro_ts - stl_decomp$time.series[, "seasonal"]
# Crear vector de fechas correctamente alineado con la serie
fechas <- seq.Date(from = as.Date("2004-01-01"), by = "quarter", length.out = length(micro_ts))
# Gráfico mejorado con fechas en el eje X
grafico_ajustada <- ggplot() +
geom_line(aes(x = fechas, y = micro_ts), color = "grey", size = 0.5, linetype = "solid", name = "Serie Original") +
geom_line(aes(x = fechas, y = micro_sa), color = "black", size = 0.6, linetype = "solid", name = "Serie Ajustada") +
ggtitle("Figura 2. Microempresas:Serie Original vs Serie Ajustada por Estacionalidad") +
xlab("Tiempo") +
ylab("Número de microempresas") +
theme_minimal() +
theme(axis.text.x = element_text(angle = 45, hjust = 1)) # Rotar etiquetas para mejor visualización
# Convertir a gráfico interactivo
ggplotly(grafico_ajustada)
Ahora graficamos serie original vs tendencia
La serie original de microempresas contiene variaciones estacionales y aleatorias que pueden dificultar la identificación de patrones reales. La extracción de la tendencia permite centrarse en los cambios estructurales de la serie.
Analizar la tendencia ayuda a prever escenarios futuros y anticipar posibles crisis o oportunidades en el sector de microempresas.
Después del fuerte crecimiento post-2020, la tendencia parece estabilizarse e incluso mostrar una leve reducción, sugiriendo posibles cambios en las condiciones económicas o en el mercado.
# Extraer la tendencia de la descomposición STL
tendencia <- stl_decomp$time.series[, "trend"]
# Gráfico interactivo de la serie original vs tendencia
grafico_tendencia <- ggplot() +
geom_line(aes(x = fechas, y = micro_ts), color = "grey", size = 0.7, linetype = "solid", name = "Serie Original") +
geom_line(aes(x = fechas, y = tendencia), color = "black", size = 0.8, linetype = "solid", name = "Tendencia") +
ggtitle("Figura 3. Microempresas:Serie Original vs Tendencia") +
xlab("Tiempo") +
ylab("Número de microempresas") +
theme_minimal() +
theme(axis.text.x = element_text(angle = 45, hjust = 1)) # Rotar etiquetas del eje X para mejor visualización
# Convertir a gráfico interactivo
ggplotly(grafico_tendencia)
Interpretación de la Figura 3. Serie original vs tendencia
La comparación entre la serie original y la tendencia permite identificar con mayor claridad el comportamiento estructural de la creación de microempresas en Cali, ya que la tendencia elimina gran parte de las fluctuaciones de corto plazo y del efecto estacional.
En la gráfica se observa que, aunque la serie original presenta variaciones considerables entre trimestres, la tendencia revela un crecimiento gradual y sostenido durante buena parte del período analizado. Desde 2004 hasta aproximadamente 2014, el número de microempresas nuevas se mantiene relativamente estable, con incrementos moderados y sin cambios bruscos.
A partir de 2015 comienza una fase de expansión más evidente, que se intensifica desde 2018. Este comportamiento sugiere un fortalecimiento del ecosistema emprendedor en Cali, acompañado de mayores oportunidades para la creación de nuevos negocios.
El punto más alto de la tendencia se registra entre 2020 y 2021. Este incremento puede estar relacionado con el aumento del emprendimiento como alternativa frente a la pérdida de empleo y la incertidumbre económica generada por la pandemia. Muchas personas optaron por crear pequeños negocios como mecanismo de generación de ingresos.
Posteriormente, hacia los años 2022 a 2024, la tendencia muestra una ligera desaceleración. No obstante, los niveles se mantienen claramente por encima de los observados antes de 2018, lo que indica que la creación de microempresas continúa en un nivel estructuralmente más alto que en años anteriores.
En síntesis, la Figura 3 evidencia que, a pesar de la volatilidad trimestral observada en la serie original, la tendencia de largo plazo es positiva. Esto confirma que la actividad emprendedora en Cali ha crecido de manera importante en las últimas dos décadas y que, aunque recientemente se observa cierta moderación, el dinamismo del sector sigue siendo sólido.
Ahora calculamos la tasa de crecimiento de la serie original vs tendencia
#Cálculo de la tasa de crecimiento anual correctamente alineada
tasa_crecimiento <- (micro_ts[(5:length(micro_ts))] / micro_ts[1:(length(micro_ts) - 4)] - 1) * 100
tasa_tendencia <- (tendencia[(5:length(tendencia))] / tendencia[1:(length(tendencia) - 4)] - 1) * 100
# Crear vector de fechas corregido
fechas_corregidas <- seq(from = as.Date("2005-01-01"), by = "quarter", length.out = length(tasa_crecimiento))
# Verificar longitudes
print(length(fechas_corregidas))
## [1] 80
print(length(tasa_crecimiento))
## [1] 80
print(length(tasa_tendencia))
## [1] 80
# Gráfico de la tasa de crecimiento anual
grafico_crecimiento <- ggplot() +
geom_line(aes(x = fechas_corregidas, y = tasa_crecimiento), color = "grey", size = 0.7) +
geom_line(aes(x = fechas_corregidas, y = tasa_tendencia), color = "black", size = 0.8, linetype = "dashed") +
ggtitle("Figura 4. Microempresas: Tasa de crecimiento anual % de la serie Original vs Tendencia") +
xlab("Tiempo") +
ylab("% de Crecimiento Anual") +
theme_minimal()
# Convertir a gráfico interactivo
ggplotly(grafico_crecimiento)
Interpretación de la Figura 4. Tasa de crecimiento anual de la serie original y la tendencia
La tasa de crecimiento anual permite analizar cómo ha variado, en términos porcentuales, el número de microempresas creadas en Cali con respecto al mismo trimestre del año anterior. Este indicador es especialmente útil para identificar periodos de expansión y contracción, así como para evaluar la intensidad de los cambios observados en la serie.
En la gráfica se aprecia que la serie original presenta una elevada volatilidad, con oscilaciones frecuentes entre tasas positivas y negativas. Esto refleja que la creación de microempresas responde de manera sensible a las condiciones económicas, sociales y empresariales de cada periodo.
La línea correspondiente a la tendencia, representada con una línea discontinua, muestra un comportamiento mucho más estable y facilita la identificación del patrón de largo plazo. Durante los primeros años del análisis, las tasas de crecimiento se mantienen en niveles moderados, lo que indica una evolución relativamente estable en la creación de nuevos negocios.
A partir de 2018 se observa una aceleración importante en la tasa de crecimiento de la tendencia, alcanzando su punto máximo entre 2019 y 2020. Este comportamiento coincide con un incremento significativo en la creación de microempresas y puede estar relacionado con el aumento del emprendimiento como alternativa de generación de ingresos durante la crisis provocada por la pandemia.
Después de este pico, la tasa de crecimiento comienza a descender de forma gradual. Esta reducción no implica una caída en el número de microempresas, sino una desaceleración en su ritmo de expansión. En otras palabras, el número de nuevas empresas continúa siendo alto, pero crece a una velocidad menor que en los años anteriores.
Hacia el final del periodo, la tasa de crecimiento de la tendencia converge hacia valores cercanos a cero, lo que sugiere que la creación de microempresas en Cali ha entrado en una etapa de estabilización. Esto indica que, tras el fuerte crecimiento observado en los años recientes, el sector parece haber alcanzado un nuevo nivel de equilibrio.