En este informe, se realizará un análisis de series temporales: *1) Extracción de señales o descomposición de series temporales y 2) Pronóstico del número de microempresas nuevas en Cali. El periodo de análisis es desde el primer trimestre de 2004 (1T2004) y el cuarto trimestre de 2024 (4T2024).
El análisis de series temporales permite identificar patrones subyacentes en los datos, como tendencias, estacionalidad y componentes irregulares, lo que facilita una mejor comprensión del comportamiento de la variable a analizar. Para ello, se emplearán técnicas estadísticas o métodos de descomposición y el Modelo ARIMA con el fin de extraer información clave que pueda contribuir a la toma de decisiones estratégicas.
A lo largo del informe, se presentarán los resultados obtenidos y se discutirán sus implicaciones en el contexto empresarial de Cali.
Puntualmente, el análisis de la creación de microempresas en Cali es clave para la planificación económica y la toma de decisiones estratégicas. Identificar patrones y tendencias en estos datos ayuda a mejorar las condiciones para los emprendedores y fortalecer el desarrollo económico local.
#Cargar librerías necesarias
library(readxl) # Para leer archivos Excel
library(tseries) # Para pruebas de estacionariedad
library(forecast) # Para modelado ARIMA y pronósticos
library(ggplot2) # Para visualización de datos
library(plotly) # Para gráficos interactivos
library(timetk)
Cargar base de datos
library(readxl)
data_col <- read_excel("~/Desktop/Analitica de datos/MICRO.xlsx",
col_types = c("date", "numeric"))
Un paso indispensable es declarar la variable como serie temporal:
# Convertir/declarar el número de microempresas en serie de tiempo trimestral
micro_ts <- ts(data_col$MICRO, start = c(2004, 1), frequency = 4)
micro_ts
## Qtr1 Qtr2 Qtr3 Qtr4
## 2004 4064 3394 3282 1951
## 2005 2956 3188 3768 1812
## 2006 3436 3241 3267 2058
## 2007 4327 3408 3255 2168
## 2008 3592 3300 3489 2090
## 2009 3281 3027 3328 2340
## 2010 3503 3205 3469 2006
## 2011 3493 3503 3457 2131
## 2012 3847 3412 3447 2224
## 2013 3462 3739 3896 2715
## 2014 4406 3686 3900 3122
## 2015 3609 3460 3784 2459
## 2016 4299 4072 4276 2769
## 2017 5106 3896 3956 2618
## 2018 5009 4406 4349 3481
## 2019 6508 5169 5488 3510
## 2020 6046 2600 6156 4396
## 2021 6197 3860 4803 3956
## 2022 6210 4869 5785 3700
## 2023 5362 4409 4485 3087
## 2024 4939 4530 4473 3150
Ahora si calculamos estadísticas descriptivas
En la tabla siguiente se observa lo siguiente:
En promedio, cada trimestre se han creado alrededor de 3760 microempresas. Este es un valor de referencia para entender el comportamiento típico.
La mediana indica que la mitad de los trimestres tuvieron menos de 3506.5 microempresas nuevas y la otra mitad tuvo más. Como está un poco por debajo de la media, sugiere que hay algunos valores altos que están elevando el promedio.
Existe una variabilidad notable en la cantidad de microempresas nuevas por trimestre. Un valor de 1052 indica que los datos fluctúan bastante alrededor del promedio.
la variabilidad relativa de la serie no es excesivamente alta. Un 27.99% implica que, aunque hay oscilaciones, los datos no son extremadamente dispersos respecto al promedio.
# Calcular estadísticas descriptivas básicas
descriptive_stats <- data.frame(
Min = min(micro_ts),
Max = max(micro_ts),
Media = mean(micro_ts),
Mediana = median(micro_ts),
DesviacionEstandar = sd(micro_ts),
CoefVar = sd(micro_ts) / mean(micro_ts)
)
print(descriptive_stats)
## Min Max Media Mediana DesviacionEstandar CoefVar
## 1 1812 6508 3760.5 3506.5 1052.423 0.2798625
Exploramos el comportamiento o evolución de la variable:
En la Figura 1. destaca lo siguiente:
*Hacia el final de la serie se nota una caída en el número de microempresas. Podría estar asociado a factores económicos como inflación, desaceleración económica o menor acceso a financiamiento para emprendedores.
Por tanto, la Figura 1, sugiere que la creación de microempresas en Cali ha aumentado a lo largo del tiempo, pero con fuertes fluctuaciones. Es clave analizar qué factores han impulsado los picos y qué ha causado las caídas recientes, para entender mejor el ecosistema emprendedor de la ciudad.
# Gráfico interactivo de la serie original
grafico_serie <- ggplot(data_col, aes(x = seq.Date(from = as.Date("2004-01-01"), by = "quarter", length.out = nrow(data_col)), y = micro_ts)) +
geom_line(color = "grey", size = 0.4) +
geom_point(color = "black", size = 0.1) +
ggtitle("Figura 1.Evolución de las microempresas en Cali") +
xlab("Tiempo") +
ylab("Número de microempresas") +
theme_minimal()
ggplotly(grafico_serie)
Esta gráfica revela que el tejido empresarial de Cali ha transitado por dos etapas claramente diferenciadas. En la primera fase (2005-2017), la tendencia se mantuvo en un canal de crecimiento inercial y sumamente estable, con variaciones mínimas año tras año. Sin embargo, a partir de 2018 se observa un cambio estructural que aceleró la creación de empresas, elevando el nivel base de la ciudad de un promedio de 3,500 registros a un nuevo umbral que oscila entre los 4,500 y 5,000 registros actuales. Se concluye que, a pesar de las crisis, la masa crítica de microemprendimientos en Cali es hoy significativamente más robusta que hace dos décadas.
No obstante, esta evolución está profundamente condicionada por una estacionalidad rítmica y agresiva. Los valles recurrentes que se observan en la serie original indican periodos anuales donde la actividad de registro se contrae de forma sistemática, con caídas que pueden alcanzar las 1,000 unidades. Esto permite concluir que el ecosistema empresarial local es extremadamente sensible a los ciclos del calendario institucional y comercial, lo que obliga a las políticas de apoyo al emprendimiento a considerar estas fluctuaciones para no malinterpretar las bajas temporales como crisis permanentes.
Finalmente, el análisis del residuo (ruido) subraya la magnitud del impacto excepcional del año 2020. La caída abrupta que se sale de toda norma estadística previa confirma que la pandemia no fue un evento cíclico, sino un choque externo que eliminó momentáneamente el equivalente a años de crecimiento. La conclusión fundamental es que, si bien la tendencia muestra una recuperación exitosa y un “salto” de nivel post-confinamiento, la volatilidad residual detectada en los últimos periodos sugiere que el sector aún está en un proceso de ajuste frente a un entorno económico que todavía no recupera la estabilidad total del periodo pre-2019.**
# Cargar librerías necesarias
library(ggplot2)
library(plotly)
# Descomposición de la serie temporal
stl_decomp <- stl(micro_ts, s.window = "periodic")
# Convertir la descomposición a un data frame para graficar con ggplot2
stl_df <- data.frame(
Time = rep(time(micro_ts), 4), # Tiempo repetido para cada componente
Value = c(stl_decomp$time.series[, "seasonal"],
stl_decomp$time.series[, "trend"],
stl_decomp$time.series[, "remainder"],
micro_ts),
Component = rep(c("Estacional", "Tendencia", "Residuo", "Serie Original"), each = length(micro_ts))
)
# Crear gráfico con ggplot2
p <- ggplot(stl_df, aes(x = Time, y = Value, color = Component)) +
geom_line() +
facet_wrap(~Component, scales = "free_y", ncol = 1) +
theme_minimal() +
labs(title = "Figura A. Descomposición del número de microempresas en Cali",
x = "Tiempo",
y = "Valor")
# Convertir a gráfico interactivo con plotly
ggplotly(p)
Interpretación Figura A.Descomposición temporal
**Componente estacional Tendencia: Se observa un comportamiento de crecimiento moderado y estable entre 2005 y 2017. A partir de 2018, la tendencia muestra una aceleración significativa, alcanzando su punto máximo histórico cerca de 2021, para luego entrar en una fase de corrección o estabilización hacia 2025.
Estacionalidad: Presenta un patrón altamente marcado y regular. Se identifican caídas sistemáticas y profundas (valles de hasta -1000 unidades) seguidas de picos de recuperación. Esto sugiere que la creación o registro de microempresas en Cali depende fuertemente de ciclos anuales específicos (posiblemente cierres de año o periodos de renovación de registros).
Residuo (Ruido): La serie es mayormente limpia hasta el año 2020. En ese periodo, el residuo muestra una caída abrupta y negativa (cercana a -2000), que representa el impacto impredecible de la pandemia, seguido de picos positivos de alta volatilidad durante la reactivación.**
# Extraer los componentes de la descomposición
micro_sa <- micro_ts - stl_decomp$time.series[, "seasonal"]
# Crear vector de fechas correctamente alineado con la serie
fechas <- seq.Date(from = as.Date("2004-01-01"), by = "quarter", length.out = length(micro_ts))
# Gráfico mejorado con fechas en el eje X
grafico_ajustada <- ggplot() +
geom_line(aes(x = fechas, y = micro_ts), color = "grey", size = 0.5, linetype = "solid", name = "Serie Original") +
geom_line(aes(x = fechas, y = micro_sa), color = "black", size = 0.6, linetype = "solid", name = "Serie Ajustada") +
ggtitle("Figura 2. Microempresas:Serie Original vs Serie Ajustada por Estacionalidad") +
xlab("Tiempo") +
ylab("Número de microempresas") +
theme_minimal() +
theme(axis.text.x = element_text(angle = 45, hjust = 1)) # Rotar etiquetas para mejor visualización
# Convertir a gráfico interactivo
ggplotly(grafico_ajustada)
**Ahora graficamos serie original vs tendencia Tendencia: La línea oscura (ajustada) revela la verdadera trayectoria del sector empresarial sin el “ruido” de los meses buenos o malos del año. Confirma que, tras el impacto de 2020, el nivel base de microempresas en la ciudad subió de un promedio de 3500 a uno cercano a 4500-5000.
Estacionalidad: Al comparar ambas líneas, se nota que los valles de la línea gris (serie original) son mucho más pronunciados que la tendencia ajustada. Esto indica que la estacionalidad negativa tiene un peso muy fuerte en el ecosistema empresarial de Cali en ciertos meses.
Residuo (Ruido): Las brechas puntuales entre la línea negra y los puntos de la gris, que no siguen el patrón repetitivo, muestran eventos fortuitos. El desajuste más evidente ocurre en la reapertura económica post-confinamiento.**
# Extraer la tendencia de la descomposición STL
tendencia <- stl_decomp$time.series[, "trend"]
# Gráfico interactivo de la serie original vs tendencia
grafico_tendencia <- ggplot() +
geom_line(aes(x = fechas, y = micro_ts), color = "grey", size = 0.7, linetype = "solid", name = "Serie Original") +
geom_line(aes(x = fechas, y = tendencia), color = "black", size = 0.8, linetype = "solid", name = "Tendencia") +
ggtitle("Figura 3. Microempresas:Serie Original vs Tendencia") +
xlab("Tiempo") +
ylab("Número de microempresas") +
theme_minimal() +
theme(axis.text.x = element_text(angle = 45, hjust = 1)) # Rotar etiquetas del eje X para mejor visualización
# Convertir a gráfico interactivo
ggplotly(grafico_tendencia)
**Ahora calculamos la tasa de crecimiento de la serie original vs tendencia Tendencia: La línea negra suavizada permite ver que Cali ha pasado por tres etapas: estabilidad (2005-2012), crecimiento progresivo (2013-2019) y un “escalón” de crecimiento tras la crisis, aunque con una ligera pendiente negativa al final del periodo (2024-2025).
Estacionalidad: Se manifiesta como el movimiento oscilatorio de la línea gris que “atraviesa” constantemente la tendencia.
Residuo (Ruido): La distancia vertical entre la línea gris y la negra representa el ruido. El hecho de que la línea gris sea tan “nerviosa” indica que el número de microempresas en Cali es sensible a cambios de corto plazo en el entorno económico local.**
#Cálculo de la tasa de crecimiento anual correctamente alineada
tasa_crecimiento <- (micro_ts[(5:length(micro_ts))] / micro_ts[1:(length(micro_ts) - 4)] - 1) * 100
tasa_tendencia <- (tendencia[(5:length(tendencia))] / tendencia[1:(length(tendencia) - 4)] - 1) * 100
# Crear vector de fechas corregido
fechas_corregidas <- seq(from = as.Date("2005-01-01"), by = "quarter", length.out = length(tasa_crecimiento))
# Verificar longitudes
print(length(fechas_corregidas))
## [1] 80
print(length(tasa_crecimiento))
## [1] 80
print(length(tasa_tendencia))
## [1] 80
# Gráfico de la tasa de crecimiento anual
grafico_crecimiento <- ggplot() +
geom_line(aes(x = fechas_corregidas, y = tasa_crecimiento), color = "grey", size = 0.7) +
geom_line(aes(x = fechas_corregidas, y = tasa_tendencia), color = "black", size = 0.8, linetype = "dashed") +
ggtitle("Figura 4. Microempresas: Tasa de crecimiento anual % de la serie Original vs Tendencia") +
xlab("Tiempo") +
ylab("% de Crecimiento Anual") +
theme_minimal()
# Convertir a gráfico interactivo
ggplotly(grafico_crecimiento)
**Interpretación Figura 3. Tendencia VS original: crecimiento anual% Tendencia: La tasa de crecimiento (línea discontinua) oscila históricamente cerca del 0% al 10%. Sin embargo, se observa un ciclo de expansión agresiva previo a 2020 y una recuperación volátil posterior, donde la tendencia de crecimiento ahora parece converger de nuevo hacia el 0%.
Estacionalidad: Causa variaciones extremas en la velocidad de crecimiento, haciendo que la tasa real salte de valores positivos a negativos en periodos cortos.
Residuo (Ruido): Es el componente dominante en 2020, donde la tasa de crecimiento se desplomó hasta un -50% anual. Este choque externo fue tan fuerte que desplazó completamente la serie de su comportamiento habitual, seguido por un “rebote” estadístico igualmente alto en 2021.**