Marco de análisis

Sector económico: Construcción

Empresa: Cemento Argos

Variables de análisis:

• Producción de Cemento (PNCEM)

• Despacho de Cementos (DECEM)

• Licencias de construcción Colombia (LICC)

Introducción

Contexto del sector de construcción

La construcción es uno de los motores del crecimiento económico y del desarrollo tanto productivo como social de Colombia. Su gran alcance y valor se evidencian en la articulación con múltiples sectores de la economía, así como en su impacto en la generación de empleo, el comercio de materiales y la creación de infraestructura.

De acuerdo con datos del Departamento Administrativo Nacional de Estadística (DANE), el sector de la construcción aportó en 2024 entre el 8,5 % y 8,8 % del PIB nacional, lo que equivale a más de $125 billones. A su vez, el valor agregado de la construcción registró un crecimiento del 4,1 % frente al tercer trimestre de 2023. Este incremento refleja una mejora impulsada principalmente por el aumento de las obras civiles (16,5 %) y de las actividades especializadas (3,8 %).

Además, el sector de la construcción es una de las áreas que más empleo genera en el país, tanto de manera directa como indirecta. Según cifras del DANE, en octubre de 2024, el número total de ocupados en Colombia alcanzó los 23.393.000, de los cuales la construcción representó el 6,8 %. Asimismo, en comparación con el año anterior, el empleo en este rubro aumentó un 5,2 %, lo que se traduce en 73.000 nuevos puestos de trabajo.

Por otra parte, este sector también destaca por su alto índice de inversiones, ya que es considerado una opción segura para la generación de patrimonios en el país. Al mismo tiempo, su evolución se encuentra alineada con los Objetivos de Desarrollo Sostenible (ODS) lo que ha permitido mejorar las condiciones de las ciudades y sus zonas aledañas, facilitando el aprovechamiento de recursos, la recuperación de áreas afectadas por el conflicto y la inclusión de comunidades vulnerables, entre otros aspectos.

Gracias a ello, ha sido posible avanzar en el cumplimiento de varios ODS, tales como:

•Fin de la pobreza (ODS 1), mediante subsidios como el programa Mi Casa Ya. •Trabajo decente y crecimiento económico (ODS 8). •Ciudades y comunidades sostenibles (ODS 11).

Rol de cementos Argos

En este contexto, Cementos Argos se consolida como una de las empresas más representativas del sector de construcción,especialmente en el mercado de cemento y concreto. Con mas de ocho décadas de trayectoria, la empresa ha establecido un legado arraigado en el progreso económico y social del país con sus contribuciones de materiales necesarios para la edificación de carreteras, puentes, aeropuertos y otros proyectos de infraestructura que han mejorado la conectividad y estimulado la inversión.

imagen cementos argos

En este sentido, para Cementos Argos, es esencial entender la evolución del sector, identificando patrones, tendencias y señales que apoyen la toma de decisiones. Asimismo, la empresa necesita realizar un análisis prospectivo y estar informada sobre los desafíos previstos para 2025, especialmente a raíz del debilitamiento de las políticas de vivienda y los retrasos en infraestructura. Según el más reciente informe de Corficolombiana, titulado “La construcción en su laberinto”, el centro de esta problemática radica en la suspensión del programa “Mi Casa Ya”, los problemas estructurales en los proyectos de Asociaciones Público-Privadas (APP) y la reducción del presupuesto de inversión del INVÍAS. Estos obstáculos no solo impactan a la empresa, sino también a los hogares de ingresos bajos y medios, que enfrentan crecientes barreras para acceder a una vivienda propia.

Selección de variables para comprender la dinámica del sector de construcción

En calidad de analistas económicos y financieros de Cementos Argos,se seleccionaron las siguuientes variables a fines al sector de construción:

Producción de Cemento (PNCEM): Este indicador refleja el nivel de actividad industrial en la fabricación de cemento, insumo esencial para cualquier tipo de obra civil o edificaciones. Su análisis permite identificar la dinámica interna del sector y anticipar variaciones en la oferta.

Despachos de Cemento (DECEM): Esta variable evidencia el comportamiento de la demanda efectiva. A través del volumen de despachos se puede inferir el ritmo de ejecución de obras en el país y la intensidad de uso del cemento en distintos frentes de construcción.

Licencias de Construcción (LICC): Las licencias de construcción en Colombia son un indicador adelantado, ya que permiten anticipar la actividad futura del sector. Cuando aumenta el número de licencias aprobadas, se espera que en los meses siguientes se inicie un mayor número de proyectos de construcción. Este indicador refleja el nivel de confianza y planeación de los agentes del sector, así como la disposición de invertir en nuevas obras.

Metodología

Como analistas económicos y financieros de Cementos Argos, nuestro objetivo es evaluar la evolución del sector de la construcción en Colombia, identificando patrones, tendencias y señales que sirvan de apoyo en la toma de decisiones estratégicas tanto para la empresa como para el sector en general.

Para este análisis, se utiliza una base de datos compuesta por 156 observaciones mensuales y 3 variables económicas, comprendidas entre enero de 2012 y diciembre de 2024, la cual fue construida a partir de información oficial del DANE.

Las variables analizadas son de carácter cuantitativo y fueron renombradas y declaradas como series temporales para facilitar su tratamiento:

Producción de cemento (PNCEM) → Variable 1

variable1_ts <- ts(data$PNCEM, start = c(2012,1), frequency = 12)
variable1_ts
##            Jan       Feb       Mar       Apr       May       Jun       Jul
## 2012  868474.0  865408.0  998847.0  852138.0  919675.0  906243.0  910743.0
## 2013  803846.0  823731.0  930060.0  888046.0  929099.0  879965.0  966824.0
## 2014  821445.8  908543.1 1089339.5 1028889.7 1074107.8  986800.1 1081296.1
## 2015  899518.5 1034033.4 1098526.0 1056733.9 1128654.1 1023576.6 1108864.4
## 2016  968000.7 1076538.1 1025163.3 1108543.4 1054354.4 1012287.1  912684.1
## 2017  897063.5 1025705.0 1099919.7  976913.7 1021787.4 1006870.5 1079282.2
## 2018  906920.5  955449.3 1066143.4 1034777.6 1007110.9  995956.4 1021557.8
## 2019  928828.6  993333.3 1147660.3  971013.0 1119226.6 1025805.1 1118126.7
## 2020 1045240.9 1042244.0  850163.8  198924.9  778730.3  977660.3 1131331.2
## 2021 1034344.7 1139862.9 1200339.1 1135881.8  880396.4 1108427.0 1201721.7
## 2022 1040160.8 1133914.0 1341585.4 1214953.5 1251173.5 1189314.5 1200980.9
## 2023 1047479.1 1140751.0 1231072.6 1111785.8 1237255.1 1116485.4 1221109.3
## 2024 1006077.9 1091777.0 1114426.0 1146361.4 1093702.8 1069209.8 1155668.7
##            Aug       Sep       Oct       Nov       Dec
## 2012  942864.0  894974.0  885860.0  931125.0  948435.0
## 2013  941125.0 1002957.0 1048557.0 1020409.0 1017314.0
## 2014 1068933.6 1071902.7 1074163.9 1069628.5 1127320.3
## 2015 1139186.2 1125937.9 1176890.0 1045135.7 1209660.3
## 2016 1130482.4 1023568.4 1076104.9 1009009.2 1098666.2
## 2017 1034803.5 1025617.1 1081553.1 1028965.7 1020361.5
## 2018 1097724.3 1083427.0 1107128.4 1094297.7 1089381.0
## 2019 1175004.6 1093948.0 1135813.5 1112915.0 1191117.6
## 2020 1095590.7 1148007.1 1190414.4 1213983.9 1176276.7
## 2021 1163338.7 1229149.7 1234917.7 1201226.8 1267497.4
## 2022 1233964.5 1279462.0 1249315.4 1193547.5 1283041.9
## 2023 1178826.2 1261109.0 1261911.4 1112027.2 1291078.1
## 2024 1189179.0 1109916.7 1180815.2 1121219.4 1145356.5

Despacho de cemento (DECEM) → Variable 2

variable2_ts <- ts(data$DECEM, start = c(2012, 1), frequency = 12)
variable2_ts
##            Jan       Feb       Mar       Apr       May       Jun       Jul
## 2012  823283.7  846615.1  950452.9  789542.0  904690.6  879219.3  879632.6
## 2013  797141.6  826921.1  808108.3  917850.5  901645.6  864810.7  980476.6
## 2014  810402.5  928329.4 1041472.4  956972.4 1034413.3  918642.5 1059514.7
## 2015  927848.3  986176.4 1079949.1  999411.6 1061957.2 1012089.6 1152372.0
## 2016  939138.8 1045943.9 1007468.5 1058103.1 1005411.0  997177.5  924987.7
## 2017  913190.4 1007968.3 1083268.2  900004.9  999046.0  983520.3 1041467.8
## 2018  909395.5  960500.3  978879.9 1030819.5  984012.0  943219.3  990012.1
## 2019  917158.5  972510.7 1035824.3  991119.7 1054963.4  979305.2 1113127.7
## 2020  994701.3 1024532.8  739689.4  242413.7  705921.0  904954.8 1093059.4
## 2021  989097.3 1079241.9 1189013.8 1050823.9  815891.2 1071880.6 1131975.9
## 2022  963889.4 1106900.3 1257124.9 1089208.1 1103450.4 1117050.3 1124719.6
## 2023  930371.1 1057742.2 1162546.0  987450.8 1126139.4 1033032.1 1051542.1
## 2024  896617.8 1032284.3  939625.7 1074893.5 1003338.7  942870.1 1050528.2
##            Aug       Sep       Oct       Nov       Dec
## 2012  906463.0  862746.7  906790.6  915069.6  831485.2
## 2013  870423.1  981342.5 1032773.3  978662.3  905880.8
## 2014 1020250.3 1085842.5 1089667.1 1040586.8  984139.6
## 2015 1108117.5 1142760.7 1161600.8 1067607.3 1106888.9
## 2016 1089617.9 1015052.3  993667.3 1017490.6 1006878.6
## 2017 1033008.5 1022836.0 1029658.7 1021276.7  948589.1
## 2018 1061280.2 1030848.1 1083220.2 1064519.7  973383.7
## 2019 1099300.5 1078411.7 1110885.7 1083302.8 1079406.9
## 2020 1052074.0 1131203.4 1169113.2 1121991.0 1054316.6
## 2021 1097788.3 1163918.5 1150044.1 1166822.2 1134856.2
## 2022 1190049.8 1189530.8 1123078.6 1118150.0 1122246.0
## 2023 1103019.7 1131366.0 1113741.8 1103166.9 1093586.7
## 2024 1074200.5 1003766.7 1073791.9 1015636.2 1002034.8

Licencias de construcción Colombia (LICC) → Variable 3

variable3_ts <- ts(data$LICC, start = c(2012, 1), frequency = 12)
variable3_ts
##          Jan     Feb     Mar     Apr     May     Jun     Jul     Aug     Sep
## 2012 1498909 1728147 1425267 1388134 1960736 1956173 1890780 1802859 1910242
## 2013 2094058 2205691 1843902 1904198 2397117 1757329 1794134 2141280 2366607
## 2014 1852424 2245434 2324692 2366411 2289778 1865683 2676808 1613517 1625911
## 2015 2047371 2169494 2113458 2424498 1595093 2318565 2185818 1857652 2375383
## 2016 1547135 1669062 1673598 1729128 2126223 1537734 1588860 1742770 1806840
## 2017 1361372 1674360 1765535 1581355 1620579 1474165 1551403 1760635 1824302
## 2018 1454410 1472991 1086990 1806498 1713273 1438738 1687364 1579630 1595654
## 2019 1320654 1521559 1559022 1375196 1767713 1500038 1512004 1392231 1395518
## 2020 1598506 1681914  896291  278982  760289 1070765 1143823 1024511 1598312
## 2021 1164319 1708030 1439976 1473196 1561833 1705955 1451379 1688041 1489381
## 2022 1460116 1715165 1859815 1819122 1575094 2346884 3428147 2919277 2391248
## 2023 1820444 1271995 1207070  979307 1646999 1181368  959692 1699442 1442325
## 2024 1234954  972515  967991 1374365 1148535 1016621  989385 1379670 1391058
##          Oct     Nov     Dec
## 2012 1560556 1645891 2456199
## 2013 1951388 2050465 2089402
## 2014 2304708 1503624 2524944
## 2015 2051518 1761102 4139543
## 2016 2011801 1982363 2628670
## 2017 1690922 1823182 1971060
## 2018 1629967 1797697 1616273
## 2019 1435841 1580802 3265490
## 2020 1071214 1161663 1942476
## 2021 1058146 1392092 1998939
## 2022 1729225 2122610 2371657
## 2023 1407828 1771536 2563269
## 2024  974136 1490060 1850318

A partir de estas series, se llevó a cabo un análisis exploratorio que incluyó métricas de estadística descriptiva y la evaluación de relaciones entre las variables, a través de gráficos de dispersión y el cálculo del coeficiente de correlación.

Adicionalmente, se implementó una descomposición STL (Seasonal and Trend decomposition using Loess) con el propósito de separar cada serie temporal en sus componentes de tendencia, estacionalidad y ruido aleatorio (residuo). Esta técnica permitió comprender con mayor claridad los factores que impulsan los cambios en las series analizadas.

Por otro lado, como parte de un análisis prospectivo, se seleccionó la variable de producción de cemento por su relevancia en el sector de la construcción. Se aplicó un modelo ARIMA (AutoRegressive Integrated Moving Average), tanto de forma manual como automática, con el fin de pronosticar su comportamiento en el corto plazo, específicamente para el mes de enero de 2025.

Este enfoque metodológico permitió:

• Analizar la dinámica del sector y su evolución en el tiempo.

• Identificar señales relevantes mediante la descomposición de series temporales.

• Generar pronósticos de corto plazo con ARIMA para anticipar tendencias y posibles impactos.

• Extraer insights valiosos que orienten la toma de decisiones de la empresa relacionada con el sector de la construcción.

Resultados

Análisis de la interacción entre variables

Las licencias de construcción constituyen el punto de partida del ciclo de actividad en el sector edificador. Su comportamiento refleja las decisiones de inversión que anticipan nuevos proyectos inmobiliarios o de infraestructura, y por esta razón, se consideran un indicador adelantado del comportamiento del sector. En este sentido, un aumento en la expedición de licencias suele interpretarse como una señal de crecimiento futuro, ya que los permisos habilitan el inicio de obras que se ejecutarán en los meses siguientes. Sin embargo, debido a que estas decisiones están altamente influenciadas por la percepción del entorno económico, la confianza empresarial y las políticas gubernamentales, las licencias tienden a mostrar una mayor volatilidad frente a las demás variables del sector.

Este comportamiento se evidencia en la correlación entre las licencias de construcción y los despachos de cemento, el cual arroja un coeficiente relativamente bajo (cor ≈ 0.22), sugiriendo una relación débil entre ambas variables. Aunque teóricamente las licencias deberían anticipar aumentos en los despachos, la baja correlación observada puede explicarse por los rezagos temporales entre la planeación y la ejecución de las obras, así como por factores externos que pueden alterar la ejecución de los proyectos autorizados.

## [1] 0.217004

Por su parte, el despacho de cemento representa el siguiente eslabón del proceso constructivo y se asocia directamente con el avance físico de las obras. A medida que los proyectos comienzan a ejecutarse, se incrementa la demanda de materiales, siendo el cemento uno de los insumos esenciales. Por lo tanto, los despachos suelen responder con cierto rezago al aumento en las licencias de construcción. Esta variable nos da una señal más cercana al consumo real en las obras y permite observar cómo se materializan las intenciones expresadas previamente por las licencias. Su comportamiento es más estable, lo que indica una menor sensibilidad a factores externos de corto plazo.

Esta estabilidad y cercanía con la ejecución efectiva de obras se reflejan en la fuerte correlación observada entre los despachos de cemento y la producción de cemento, cuya correlación fue muy alta (cor ≈ 0.93). Esta relación, evidenciada también en la gráfica correspondiente, confirma que las empresas productoras ajustan sus niveles de producción en respuesta directa al comportamiento de los despachos, lo cual garantiza un suministro eficiente y constante.

cor_decem_pncem <- cor(as.numeric(variable2_ts), as.numeric(variable1_ts), method = "pearson")
print(cor_decem_pncem)
## [1] 0.9342798

Como se mencionó anteriormente, la producción de cemento refleja la respuesta de la industria frente a la demanda esperada del mercado. Por ejemplo, Cementos Argos, al igual que otras empresas cementeras, ajusta sus niveles de producción en función del comportamiento observado en los despachos, anticipando las necesidades de los distribuidores y constructores. Por ello, esta variable está fuertemente correlacionada con los despachos, dado que un aumento en la salida de cemento exige reponer inventarios para mantener el suministro.

Análisis exploratorio con métricas de estadística descriptiva

Variable 1: Producción de cemento (PNCEM)

• El valor mínimo registrado de producción de cemento es de 198,924.9, un dato que corresponde al periodo de la pandemia por COVID-19, cuando muchas actividades industriales se vieron fuertemente afectadas por restricciones sanitarias y caídas en la demanda. En contraste, el valor máximo alcanzó los 1,341,585, lo que refleja la capacidad del sector para recuperarse y operar en condiciones normales.

• La media de la producción es de 1,062,721, lo cual indica que, en términos generales, la producción de cemento se ha mantenido en niveles altos.

• La mediana es de 1,076,321, lo que significa que la mitad de los datos están por debajo de este valor y la otra mitad por encima. Dado que la mediana es ligeramente superior a la media, esto podría indicar una ligera asimetría negativa (sesgo a la izquierda).

• La desviación estándar es de 133,962.9, lo cual señala que, en promedio, los datos se desvían bastante respecto a la media. Esto refuerza la idea de que hay una considerable dispersión en la producción de cemento, probablemente debido a factores económicos, estacionales o de demanda.

• El coeficiente de variación es del 12.6%, lo cual es un valor relativamente bajo. Esto indica que, a pesar de la alta desviación estándar, la variabilidad relativa con respecto al promedio no es tan elevada. Es decir, hay cierta estabilidad en la producción de cemento.

##        Min     Max   Media Mediana DesviacionEstandar   CoefVar
## 1 198924.9 1341585 1062721 1076321           133962.9 0.1260566

Variable 2: Despacho de cemento (DECEM)

• El valor mínimo de despacho registrado es de 242,413.7, y al igual que en la variable de producción, este valor tan bajo se atribuye al periodo de la pandemia por COVID-19. Por otro lado, el valor máximo es de 1,257,125.

• La media de los despachos es de 1,009,828 y la mediana es de 1,023,684, ligeramente superior a la media. Esto sugiere una leve asimetría negativa, lo cual indica que hay algunos valores bajos (como el mínimo durante la pandemia) que están tirando el promedio hacia abajo, aunque no de forma extrema.

• La desviación estándar es de 117,009.1, lo que implica una dispersión relativamente moderada alrededor de la media. Aunque hay cierta variabilidad, los despachos no presentan cambios drásticos en la mayoría del tiempo, lo que apunta a una dinámica más estable comparada con la producción.

• Con un coeficiente de variación del 11.6%, la variabilidad relativa en los despachos es baja. Esto confirma que, en proporción al promedio, los datos son consistentes y que los despachos se han mantenido relativamente estables durante el periodo analizado, incluso con los impactos temporales como los de la pandemia.

##        Min     Max   Media Mediana DesviacionEstandar   CoefVar
## 1 242413.7 1257125 1009828 1023684           117009.1 0.1158702

Variable 3: Licencias de construcción Colombia (LICC)

• El valor mínimo observado en la serie es de 278,982, mientras que el valor máximo asciende a 4,139,543. Esta diferencia es notablemente amplia y revela una alta volatilidad en la dinámica de otorgamiento de licencias de construcción. Es probable que factores como la pandemia, la incertidumbre económica, reformas normativas y cambios en la inversión del sector hayan influido significativamente en estas variaciones extremas.

• La media es de 1,727,825 y la mediana es de 1,684,639, un poco menor que la media. Esta ligera diferencia sugiere una asimetría positiva en la distribución, es decir, algunos valores extremadamente altos están empujando la media hacia arriba.

• La desviación estándar es de 500,702.8, lo cual indica una dispersión muy alta respecto a la media. Es una señal clara de que el número de licencias de construcción ha tenido fluctuaciones importantes a lo largo del tiempo, posiblemente por factores estacionales, coyunturales o estructurales del sector.

• El coeficiente de variación es del 28.9%, lo que representa una variabilidad relativa elevada en comparación con las otras dos variables (producción y despacho de cemento). Esto implica que los cambios en las licencias de construcción son menos estables y más susceptibles a factores externos, reflejando una mayor sensibilidad del sector de construcción frente a condiciones económicas o políticas.

##      Min     Max   Media Mediana DesviacionEstandar   CoefVar
## 1 278982 4139543 1727825 1684639           500702.8 0.2897878

Extracción de Señales

La descomposición de series de tiempo es una herramienta importante para analizar datos con mayor profundidad, optimizar predicciones y fundamentar decisiones estratégicas. Esto se debe a que, por lo general, las series de tiempo reflejan una combinación de distintos factores. Al separar sus componentes —tendencia, estacionalidad y ruido aleatorio—, podemos identificar con mayor claridad qué está impulsando los cambios en los datos.

En este caso, al estudiar la producción de cemento, su despacho y las licencias de construcción en Colombia, la descomposición nos ayuda a discernir si el crecimiento observado responde a una tendencia real o simplemente a fluctuaciones estacionales.

Además, esta técnica facilita la detección de cambios inesperados, ya que al eliminar los patrones predecibles (como la estacionalidad), las anomalías o variaciones atípicas se vuelven más evidentes. Así, si detectamos una caída abrupta en los datos, podremos determinar si se trata de un simple ruido o de un cambio estructural en la dinámica económica.

Gráfico original de la variable 1: Producción de cemento

En el gráfico de la evolución de producción de cemento en Colombia se evidencia una tendencia general de crecimiento con algunas fluctuaciones a lo largo del tiempo. Se destaca una caída abrupta en 2020, atribuible al impacto de la pandemia de COVID-19, que afectó significativamente la actividad económica y la construcción. Sin embargo, tras esta disminución, la producción se recupera rápidamente y alcanza niveles similares o superiores a los años previos. A partir de 2021, aunque la tendencia sigue siendo positiva, se observa cierta volatilidad, posiblemente relacionada con factores económicos, políticos o sectoriales que afectan la industria de la construcción.

Extracción de Señales Variable 1: Producción de cemento

Componente estacional

El componente estacional muestra patrones recurrentes y bien definidos a lo largo de todo el período analizado, lo cual es fundamental para identificar fluctuaciones previsibles dentro de cada año. Se observa que los picos estacionales suelen concentrarse en el mes de noviembre, mientras que los valores mínimos aparecen de forma consistente hacia finales de cada año, especialmente en diciembre. Esto indica que existe una estacionalidad marcada y persistente en la producción de cemento, probablemente asociada a ciclos de actividad constructiva. Reconocer estas fluctuaciones cíclicas permite prever en qué momentos del año la producción tiende a disminuir, lo cual resulta útil para la planificación logística y operativa de cementos Argos.

Componente de residuo

El componente de residuo, tiende a mantenerse relativamente estable y con magnitudes pequeñas. Sin embargo, se destacan ciertas caídas abruptas, que corresponden a choques estructurales que impactaron la actividad productiva. Por ejemplo, se identifican caídas importantes en:

• Junio de 2016: el Dane reportó una caída del 33,2% en las licencias de construcción frente al mismo mes del año anterior, mientras que en el acumulado anual la reducción fue del 21%, siendo Antioquia y Cauca las regiones más afectadas. Este comportamiento estuvo acompañado por una disminución en la producción de cemento, atribuible en parte a los cambios de administración municipal. Estos periodos de transición suelen generar retrasos en la aprobación de licencias, con reducciones que oscilan entre 28% y 30%, ya que las nuevas administraciones priorizan la aprobación de sus planes de desarrollo durante los primeros seis a ocho meses, lo que ralentiza los trámites de permisos de construcción.

• Marzo de 2020: de acuerdo con el portal de grupo Bancolombia (2020), las últimas dos semanas de marzo de 2020 coincidieron con el inicio de la cuarentena decretada por el Gobierno Nacional, lo que generó una caída del 58,6% en las licencias para vivienda y una disminución de 28,6% en los despachos de cemento. A la par los costos de construcción de vivienda aumentaron, asociados en gran medida al aumento del precio de los insumos.

• Abril de 2021: según un informe de CAMACOL (2021), el sector de la construcción se vio afectado por el Paro Nacional. Si bien las protestas eran legítimas, en algunos casos se presentaron bloqueos y disturbios que agravaron la situación económica del país, ya debilitada por la pandemia. Estos eventos generaron graves disrupciones en las cadenas de valor, impidiendo tanto la comercialización de insumos como el desplazamiento de trabajadores a sus lugares de empleo.

El paro reflejó al sector de construcción pérdidas por $4,5 billones en inversión de desarrollos inmobiliarios, y de $2,2 billones en valor agregado para la economía nacional.

Componente de tendencia

La tendencia muestra un crecimiento sostenido entre 2012 y 2019, seguido por una fuerte caída en 2020. Posteriormente, la tendencia retoma un proceso de recuperación hasta alcanzar su punto máximo alrededor del año 2022, para luego mostrar una leve desaceleración hacia el 2024.

Gráfico original de la variable 2: Despacho de Cemento

El gráfico de la evolución de los despachos de cemento en Colombia evidencia una tendencia general al alza entre 2012 y 2024, con fluctuaciones moderadas a lo largo del periodo. Se observa un crecimiento constante hasta finales de 2015. También, se destaca una fuerte caída en los despachos alrededor del año 2020. Posteriormente, los despachos se recuperan rápidamente, alcanzando incluso niveles superiores a los del periodo anterior. Sin embargo, desde 2023 se percibe una leve disminución en los niveles de despacho, posiblemente reflejando condiciones económicas o estructurales recientes del país.

Extracción Señales variable 2: Despacho de cemento

Componente estacional

El componente estacional muestra un patrón con picos de actividad concentrados en septiembre y mínimos recurrentes en diciembre. Esta estacionalidad constante a lo largo del tiempo indica que los despachos de cemento tienden a reducirse hacia el cierre del año, probablemente por una menor ejecución de obras debido a factores como vacaciones, clima o cierre presupuestal de proyectos.

Componente de residuo

En cuanto al residuo, la serie presenta variaciones pequeñas en la mayoría del período. No obstante, se observan anomalías puntuales, similares al comportamiento de la variable de producción de cemento, lo cual tiene sentido ya que son variables altamente correlacionadas.

Componente de tendencia

La tendencia refleja un período de crecimiento sostenido entre 2012 y 2015, impulsado principalmente por el dinamismo del sector de la construcción. Este desempeño se debió al auge en obras civiles y edificaciones, un escenario que había sido anticipado en 2013 por Andrés Pardo Amézquita, gerente de investigaciones económicas. Él señaló que la construcción sería el motor de la expansión económica, gracias a las políticas públicas implementadas, como el programa “100.000 Viviendas Gratis” y el Plan de Impulso al Empleo y la Productividad (Pipe).

Esta tendencia alcista estuvo seguida de una fase de estancamiento leve debido a los retrasos de los permisos de contrucción y lacaída de las licencias. Posteriorme se registra una caída abrupta en 2020, atribuida a pandemia.

Tras este período, el sector experimentó una recuperación significativa entre 2021 y 2022, impulsada en gran medida por la mayor asignación de subsidios del programa Mi Casa Ya. Esta iniciativa permitió beneficiar a más de 66 mil hogares en 2021 y 65 mil en 2022, reactivando así la demanda y consolidando el repunte del mercado constructor.

Sin embargo, se muestran señales de desaceleración posteriores, tras el cambio de gobierno, ya que se estableció la disminución de subsidios de Mi Casa Ya, alcanzando solo 51 mil hogares beneficiados en 2023.

Gráfico original de la variable 3:Licencias de construcción Colombia

El gráfico de la evolución de las licencias de construcción en Colombia entre 2012 y 2024 muestra un comportamiento más volátil en comparación con la producción y los despachos de cemento. Aunque se observa cierta estabilidad en los niveles entre 2012 y 2018, hay picos importantes, como uno notable en 2015, donde las licencias superan los 4 millones. A partir de 2019, la tendencia es más inestable, con una fuerte caída en 2020 y tras este descenso, hay una recuperación paulatina, pero el comportamiento sigue siendo errático, con subidas y bajadas abruptas, lo que sugiere incertidumbre en el sector de la construcción y cambios en la dinámica del mercado inmobiliario.

Extracción Señales variable 3: Licencias de construcción Colombia

Componente estacional

El componente estacional revela un patrón con picos altos que suelen presentarse en noviembre, mientras que los mínimos recurrentes se concentran en febrero. Esta dinámica sugiere una mayor expedición de licencias hacia el cierre del año, posiblemente relacionada con la aprobación de proyectos antes del cambio de vigencia presupuestal o para planificar obras que inician con el nuevo año. En contraste, los meses posteriores al cierre fiscal —como febrero— suelen mostrar una baja en la actividad de licenciamiento.

Componente de residuos

El componente de residuo muestra una mayor volatilidad frente a las otras dos variables (producción y despacho de cemento), lo que refleja que las licencias están más expuestas a factores externos como la incertidumbre económica, decisiones de política pública o cambios en las expectativas del sector. Se observan picos y caídas pronunciadas en diversos puntos, indicando la influencia de eventos transitorios que afectan abruptamente las decisiones de inversión, tales como:

• Noviembre de 2015 (pico): el Gobierno Nacional dio un impulso decisivo al sector de la vivienda mediante la expedición del Decreto 2218, que reformó el marco normativo establecido en el Decreto 1077 de 2015. Este período marcó un hito significativo con la culminación de las primeras 100.000 viviendas gratuitas del programa del Ministerio de Vivienda, Ciudad y Territorio. Además, el ministro Luis Henao Cardona destacó que 2015 representó el mejor momento para el sector constructor en 20 años, evidenciado por los 26,7 millones de metros cuadrados licenciados que consolidaron esta actividad como motor de desarrollo económico y generación de empleo. Según las estadísticas del DANE, el área total licenciada en 2015 alcanzó 26.742.759 m², mostrando un crecimiento del 6,1% frente a 2014, donde destaca que 19.758.964 m² correspondieron específicamente a proyectos de vivienda.

• Noviembre de 2019 (pico): Según el grupo Bancolombia (2020) en noviembre hubo un incremento significativo en las importaciones de cemento (+217%), que alcanzaron 20,78 mil toneladas.

• Marzo de 2020 (caída): coincide con el inicio de la cuarentena decretada por el Gobierno Nacional, lo que generó una caída del 58,6% en las licencias para vivienda.

• Junio de 2022 (pico): Un informe del DANE reveló que en junio de 2022 se licenciaron 2.534.324 m² para construcción, lo que representó un aumento de 567.510 m² frente al mismo mes del año anterior ( 1.966.814 m² ), equivalente a un crecimiento del 28,9 % en el área licenciada. Esta dinámica positiva fue atribuida por el DANE al incremento del 37,6 % en el área aprobada para vivienda, impulsado por una mejora progresiva en la compra de vivienda, lo que generó una mayor demanda de licencias de construcción. Durante el segundo trimestre de ese año (abril a junio), se desembolsaron $5,54 billones para la compra de vivienda, de los cuales $3,87 billones correspondieron a créditos hipotecarios y $1,67 billones a leasing habitacional.

Componente de tendencia

En cuanto a la tendencia, esta exhibe una etapa expansiva hasta 2015, seguida por un descenso prolongado hasta 2019. Posteriormente, se evidencia una caída marcada en 2020, en línea con el impacto de la pandemia. No obstante, entre 2021 y 2022 hay una recuperación notable, posiblemente por el impulso a la reactivación económica. A partir de 2023, la tendencia vuelve a disminuir, lo que podría reflejar incertidumbre en el entorno macroeconómico.

Después de la descomposición temporal de cada variable, se extrae la variable ajustada por estacionalidad para graficarla junto con la serie original:

Gráfico: Producción de cemento Original vs ajustada

Con base en el gráfico se evidencia que ambas series se mantienen bastante cercanas a lo largo del tiempo, pero con ligeras diferencias visibles, especialmente en algunos picos y caídas. Esto indica que el componente estacional tiene una influencia moderada sobre la variable: si bien no distorsiona significativamente la tendencia general, sí introduce fluctuaciones temporales que, al ser removidas, permiten identificar con mayor claridad los cambios estructurales reales.

Gráfico: Despacho de Cemento Original vs Ajustada

En el gráfico se observa una leve separación entre ambas líneas, especialmente en los extremos, lo que indica que la estacionalidad tiene una influencia moderada. La serie ajustada permite detectar más claramente los cambios estructurales, mostrando que si bien las fluctuaciones estacionales no son dominantes, sí afectan el comportamiento de corto plazo.

Gráfico: Licencias de construcción colombia vs ajustada

En el gráfico se evidencia una mayor separación entre ambas series, especialmente en los picos, lo que indica que la estacionalidad tiene una influencia significativa sobre la variable.

Ahora graficamos serie original vs tendencia

Tendencia Producción de Cemento

Tendencia Despacho de Cemento

Tendencia Licencias de Construcción

Ahora calculamos la tasa de crecimiento de la serie original vs tendencia

Tasa de crecimiento de la serie de tendencia y original para la producción de cemento

Tasa de crecimiento de la serie de tendencia y original para el despacho de cemento

Tasa de crecimiento de la serie de tendencia y original para las licencias de construcción

Análisis en conjunto de las tasas de crecimiento de las variables analizadas

Entre 2012 y 2024, el sector de la construcción ha transitado por múltiples ciclos marcados por expansiones, contracciones y choques externos, sumados a factores estructurales y decisiones de política pública.

La producción y despachos de cemento, por su parte presentaron un comportamiento con tres ciclos en común:

• Primer ciclo (2013-2016): En 2013, ambos indicadores mostraron una caída cercana al -4%, reflejo de una desaceleración en el ritmo de ejecución de obras civiles. Pese a una recuperación hacia 2014-2015 (con tasas de crecimiento positivas cercanas al 10% en producción y despachos), el ciclo cerró con una nueva contracción leve en 2016.

• Segundo ciclo (2016-2019): Este fue un periodo de estabilidad relativa pero con bajo crecimiento. La tasa de crecimiento osciló en torno al 0% y culminó en 2019 con valores negativos cercanos al -2%. Esta etapa se asocia a una ralentización en la inversión pública y privada, con un entorno de incertidumbre que desincentivó nuevos proyectos.

• Tercer ciclo (2020-2024): El ciclo más abrupto comienza con una fuerte contracción en 2020, donde la producción cayó -10% y los despachos -11%, producto del cierre total de actividades por la pandemia. No obstante, en 2021 se observó un “efecto rebote” (+18%), evidenciando una rápida reactivación de la actividad constructiva. Desde 2022 hasta 2023, ambos indicadores se estabilizaron cerca del 0%, reflejando una fase de estancamiento. Sin embaergo, para inicios de 2024, el retorno a tasas negativas indica el inicio de un nuevo periodo de contracción, asociado al debilitamiento de la política de vivienda y la incertidumbre en infraestructura.

Por otro lado, las licencias de construcción han mostrado un comportamiento más volátil:

• Entre 2013 y 2015, las tasas comenzaron en terreno positivo pero descendieron rápidamente.

• 2018-2019 marcó una leve recuperación que no logró consolidarse, reflejo de una cautela persistente en el sector.

• En 2020, el impacto de la pandemia generó una caída del -27%, la más fuerte del período.

• Aunque en 2021 se dio un repunte abrupto (+30%), este respondió al efecto base y no a una recuperación sostenida.

• Desde 2022 hasta 2024, las tasas se mantuvieron cercanas a 0%, e incluso en negativo, con una tendencia descendente que refleja un deterioro en las expectativas de inversión en el sector.

¿A qué se debe los factores estructurales del debilitamiento recientes (2023-2024)?

1. Política de vivienda

El programa Mi Casa Ya representó un motor clave en los años de recuperación postpandemia, beneficiando a más de 60.000 hogares anuales en 2021 y 2022. Sin embargo, su reducción a 50.000 subsidios en 2023-2024 y la suspensión total en diciembre de 2024 marcaron un punto de quiebre. Esta decisión incrementó en un 40% las cuotas para los hogares de menores ingresos, reduciendo su capacidad de compra y afectando especialmente el segmento de Vivienda de Interés Social (VIS), que constituye el núcleo de la demanda en el sector.

El cambio de enfoque hacia mejoramientos de vivienda, menos intensivos en materiales y mano de obra, ha debilitado la cadena de valor de la construcción, afectando tanto la demanda de insumos como la generación de empleo.

2. Infraestructura vial

Los proyectos de infraestructura bajo el modelo de Asociaciones Público-Privadas (APP) en Colombia son contratos entre el gobierno y empresas privadas para construir y mantener bienes y servicios públicos. Aunque son clave para el desarrollo de infraestructura, enfrentan problemas estructurales. De los siete proyectos carreteros de la primera ola de las 5G, solo cuatro están en construcción, y ninguno de la segunda ola ha avanzado. Además, los ajustes en las tarifas de peajes, una fuente crucial de financiamiento para estos proyectos, están rezagados: en 2024 solo se aprobó un aumento del 4,64%, dejando pendiente el ajuste por la inflación de 2023 (13,1%) y 2024 (5,2%). Esta falta de actualización genera incertidumbre para los inversionistas y distorsionan los flujos financieros proyectados en los contratos, afectando la viabilidad de nuevos proyectos de infraestructura vial en el país.

Por otro lado, el Instituto Nacional de Vías (INVÍAS), entidad encargada de desarrollar infraestructura vial, enfrenta una reducción del 20% en su presupuesto de inversión para 2025, el más bajo en términos reales de los últimos cinco años. Esto frena el avance de proyectos, limitando el crecimiento del sector de la construcción, que depende en gran medida de estas obras para mantener su dinamismo y generar empleo

3. Insolvencia de empresas de construcción

Las dificultades en el sector de construcción han estado afectando gravemente a las empresas, lo que ha llevado a que el número de procesos de insolvencia alcance su nivel más alto en más de una década. Según datos de la Superintendencia de Sociedades, entre enero y octubre de 2024, 102 empresas entraron en procesos de insolvencia, lo que representa un aumento del 12% en comparación con el mismo período de 2023 y un incremento del 240% respecto a los niveles prepandemia (2019). Además, si se compara con 2014, el aumento es de más del 1.000%, ya que en ese año solo seis empresas se encontraban en dicha situación.

En términos simples, esto significa que cada vez son más las compañías que no pueden cumplir con sus obligaciones financieras. De las empresas constructoras en procesos de insolvencia hasta octubre de 2024, 53 estaban en reorganización y 49 en liquidación, con deudas que sumaban $1,2 billones y $518.897 millones, respectivamente.

En este contexto, la política de vivienda no ha logrado revertir el deterioro que ha afectado al sector, lo que ha contribuido a la pérdida de numerosos empleos en el país. De hecho, según Camacol, hasta agosto de 2024 se habían perdido 79.000 puestos de trabajo, principalmente de obreros y operarios con salarios mínimos.

Pronóstico y evaluación del modelo

A continuación, se realizó un pronóstico para enero de 2025 utilizando los modelos ARIMA manual, automático y SARIMA. Cada uno de estos modelos fue ajustado con base en el comportamiento histórico de la serie temporal. Posteriormente, se evaluó el desempeño de cada modelo mediante métricas estadísticas como el RMSE, MAE y MAPE, con el fin de identificar cuál proporciona la mejor precisión en las predicciones.

Modelo ARIMA

Un modelo ARIMA (Autoregressive Integrated Moving Average) es una herramienta estadística utilizada para analizar y predecir series de tiempo. En términos simples, es como una “bola de cristal matemática” que usa datos pasados para estimar valores futuros, especialmente útil en finanzas para preveer precios, ventas o ingresos.

Desglose del nombre ARIMA

Autoregressive o autorregresivo (AR) → Usa valores pasados para predecir el futuro

Integrated (I) → Ajusta tendencias en los datos para hacerlos estacionarios (sin patrones cambiantes en el tiempo).

MAving Average o media móvil (MA)- → Suaviza fluctuaciones aleatorias a partir de errores pasados.

ARIMA combina estos tres elementos para crear una predicción más precisa.

Metodología Box-Jenkins

La metodología Box-Jenkins es un enfoque sistemático para construir modelos ARIMA con el objetivo de analizar y pronosticar series de tiempo. Fue desarrollada por George Box y Gwilym Jenkins y se basa en cuatro etapas clave:

1️⃣ Identificación 2️⃣ Estimación 3️⃣ Validación 4️⃣ Pronóstico

Se usa especialmente cuando se quiere encontrar el modelo ARIMA más adecuado para una serie de tiempo.

Antes de empezar a aplicar la metodlogía BOX-JENKINS, debemos dividir el conjunto de datos de prueba y entrenamiento

✅ Para entrenar el modelo con datos históricos sin usar información futura.

✅Para evaluar la precisión del modelo comparando sus predicciones con los datos reales de prueba.

# Divisiónde los datos para entrenamiento y para prueba o test

# En este caso el conjunto de entrenamiento es: Enero 2012-Septiembre 2024 y  el conjunto de prueba o test: noviembre 2024-diciembre 2024 

train_size <- length(variable1_ts) - 3 # Se deja fuera los últimos 3 valores para usarlos como set de prueba.
train_ts <- window(variable1_ts, end = c(2024, 9))  # Entrenamiento hasta septiembre 2024
test_ts <- window(variable1_ts, start = c(2024, 10))  # Prueba inicia desde oct2024

Paso 1: Identificación del modelo

Identificar estacionariedad

library(tseries)
# Prueba de estacionariedad con Augmented Dickey-Fuller (ADF)
adf_test <- adf.test(train_ts) #Se aplica el test ADF a la variable 1 (conjunto de entrenamiento)
print(adf_test) # se muestra el resultado del test
## 
##  Augmented Dickey-Fuller Test
## 
## data:  train_ts
## Dickey-Fuller = -4.5156, Lag order = 5, p-value = 0.01
## alternative hypothesis: stationary

Aunque el valor p es menor que 0.05, se debe hacer otra diferenciación ya que prima el analisis del gráfico y este muestra que no hay estacionariedad.

Diferenciación en niveles

Primera diferenciación

Segunda diferenciación

Ahora probamos estacionariedad en la serie diferenciada

adf_test_diff <- adf.test(train_diff2)
print(adf_test_diff)
## 
##  Augmented Dickey-Fuller Test
## 
## data:  train_diff2
## Dickey-Fuller = -9.4901, Lag order = 5, p-value = 0.01
## alternative hypothesis: stationary

En el test ADF se muestra que el valor que puede tomar d=2

El valor-p sigue siendo menor a 0.05 con una segunda diferencia en niveles y el gráfico presento una mejoría.

Identificación manual de p y q

Con el fin de identificar que valores toma p y q se utiliza:

ACF (Autocorrelation Function): Muestra la correlación de la serie con sus rezagos y ayuda a determinar el parámetro q en un modelo ARIMA(p, d, q).

PACF (Partial Autocorrelation Function): Muestra la correlación parcial entre la serie y un rezago específico, eliminando el efecto de rezagos intermedios. Ayuda a determinar el parámetro p en un modelo ARIMA(p, d, q).

Interpretación correlogramas

Se puede observar que los valores que podrian tomar p y q serian:

p = 1 , 2 , 3 , 4 , 6 (Óptimo 1)

q = 1 , 5 , 6 (Óptimo 1)

El modelo óptimo para esta variable seria (1,2,1)

Paso 2:Estimación manual del modelo

# Cálculo manual de modelo ARIMA
manual_arima_model <- Arima(train_ts, order = c(1,2,1)) #Se va a estimar un modelo Arima de orden (1,2,1)
summary(manual_arima_model)
## Series: train_ts 
## ARIMA(1,2,1) 
## 
## Coefficients:
##           ar1      ma1
##       -0.3616  -1.0000
## s.e.   0.0756   0.0169
## 
## sigma^2 = 1.336e+10:  log likelihood = -1976.45
## AIC=3958.89   AICc=3959.06   BIC=3967.95
## 
## Training set error measures:
##                     ME     RMSE      MAE       MPE     MAPE      MASE
## Training set -2532.308 114051.3 73359.45 -2.513701 9.017053 0.9110339
##                     ACF1
## Training set -0.07419532

Significacia de coeficientes

library(lmtest)

# Evaluar la significancia estadística de los coeficientes del modelo ARIMA
coeftest(manual_arima_model)
## 
## z test of coefficients:
## 
##      Estimate Std. Error  z value  Pr(>|z|)    
## ar1 -0.361620   0.075615  -4.7824 1.732e-06 ***
## ma1 -1.000000   0.016858 -59.3190 < 2.2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

ar1 y ma1, son altamente significativos (***), lo que significa que estos coeficientes tienen un impacto importante en el modelo. Como al menos uno de los dos componentes es significativo, entonces se continua con la validación de residuos del modelo.

Paso 3:Validación de residuos del modelo estimado manual

La validación de residuos es crucial para determinar si el modelo ARIMA es adecuado o si necesita mejoras. El objetivo es verificar que los residuos (errores de predicción) se comporten como ruido blanco, es decir, sin patrones detectables.

 checkresiduals(manual_arima_model)

## 
##  Ljung-Box test
## 
## data:  Residuals from ARIMA(1,2,1)
## Q* = 54.758, df = 22, p-value = 0.0001285
## 
## Model df: 2.   Total lags used: 24

Serie de residuos: Muestra cómo se comportan los errores a lo largo del tiempo. Lo ideal es que tenga valores cercanos a cero, sin embargo, podemos observar que hay distintos picos, como en el año 2020, por efecto de la pandemia.

Función de autocorrelación: La mayoría de las barras están dentro de las líneas azules (intervalos de confianza). Sin embargo, algunos rezagos (5) salen abruptamente del rango, lo que sugiere que aún puede haber estructura no capturada en los datos. Esto indica que el modelo podría mejorarse, pero no es un modelo muy aceptable.

Histograma de residuos con ajuste normal: Sirve para verificar si los errores siguen una distribución normal, lo cual es un supuesto clave en ARIMA. En este caso, la curva naranja representa la distribución normal teórica. Los residuos se acercan a la normalidad, pero hay algunos valores extremos (colas más gruesas de lo esperado). Esto indica que puede haber eventos atípicos o datos no bien explicados por el modelo.

Paso 4: Pronóstico

Pronóstico en el test de prueba (oct, nov y dic 2024) y gráfico

Se puede observar que el pronóstico manual sigue la tendencia de los datos observados, sin embargo, hay una diferencia muy grande entre el pronóstico y el valor observado en el primer mes. Se puede buscar un modelo mas óptimo.

# Calcular métricas de evaluación del modelo manual
mae_manual <- mean(abs(manual_forecast$mean - test_ts), na.rm = TRUE)
rmse_manual <- sqrt(mean((manual_forecast$mean - test_ts)^2, na.rm = TRUE))

# Mostrar métricas de evaluación del modelo manual
cat("MAE Manual: ", mae_manual, "\n")
## MAE Manual:  19479
cat("RMSE Manual: ", rmse_manual, "\n")
## RMSE Manual:  24268.97

A continuación se calcula la Tabla de pronóstico modelo manual VS los datos reales u observado en oct,nov y dic2024

# Cargar librerías necesarias
library(forecast)
library(dplyr)

# Generar pronóstico con el modelo ARIMA identificado
arima_forecast_manual <- forecast(manual_arima_model, h = length(test_ts))

# Crear un dataframe con los valores observados y pronosticados
forecast_table_manual <- data.frame(
  Tiempo = time(arima_forecast_manual$mean),  # Extraer las fechas del pronóstico
  Observado = as.numeric(test_ts),  # Valores reales
  Pronosticado = as.numeric(arima_forecast_manual$mean)  # Valores pronosticados
)

# Mostrar la tabla
print(forecast_table_manual)
##     Tiempo Observado Pronosticado
## 1 2024.750   1180815      1140947
## 2 2024.833   1121219      1132093
## 3 2024.917   1145357      1137661

Ahora pronosticamos fuera del periodo de análisis: Enero 2025

# Cargar librerías necesarias
library(forecast)

# Hacer un pronóstico para el siguiente mes (1 período adicional)
next_forecast_manual <- forecast(manual_arima_model, h = length(test_ts) + 1)

# Extraer el pronóstico del próximo mes
next_month_forecast_manual <- data.frame(
  Tiempo = time(next_forecast_manual$mean),  # Extraer la fecha del pronóstico
  Pronostico = as.numeric(next_forecast_manual$mean)  # Valor pronosticado
)

# Mostrar el pronóstico completo
print(next_month_forecast_manual)
##     Tiempo Pronostico
## 1 2024.750    1140947
## 2 2024.833    1132093
## 3 2024.917    1137661
## 4 2025.000    1138015
# Extraer solo el valor del trimestre adicional (último de la tabla)
next_month <- tail(next_month_forecast_manual, 1)
print(paste("Pronóstico para enero 2025:", next_month$Tiempo, "=", next_month$Pronostico))
## [1] "Pronóstico para enero 2025: 2025 = 1138014.54926251"

Modelo ARIMA automático

Identificación automática del modelo ARIMA

library(forecast)

# Ajustar un modelo ARIMA automático sin estacionalidad, por eso se pone seasonal=FALSE
auto_arima_model_no_seasonal <- auto.arima(train_ts, seasonal = FALSE)

# Mostrar el modelo seleccionado
summary(auto_arima_model_no_seasonal)
## Series: train_ts 
## ARIMA(1,1,1) 
## 
## Coefficients:
##          ar1      ma1
##       0.3336  -0.8940
## s.e.  0.0957   0.0472
## 
## sigma^2 = 1.13e+10:  log likelihood = -1974.44
## AIC=3954.88   AICc=3955.04   BIC=3963.95
## 
## Training set error measures:
##                    ME     RMSE      MAE       MPE     MAPE      MASE
## Training set 10449.67 105259.9 72659.69 -1.566531 8.971488 0.9023438
##                     ACF1
## Training set -0.03433432

Significancia de coeficientes

library(lmtest)

# Evaluar la significancia estadística de los coeficientes del modelo ARIMA
coeftest(auto_arima_model_no_seasonal)
## 
## z test of coefficients:
## 
##      Estimate Std. Error  z value  Pr(>|z|)    
## ar1  0.333617   0.095680   3.4868 0.0004888 ***
## ma1 -0.893984   0.047222 -18.9315 < 2.2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
# Ajuste del modelo ARIMA(1,1,1) 
darima_auto <- Arima(train_ts, 
                order = c(1, 1, 1))  # Especificamos directamente (p=1, d=1, q=1)  

# Mostrar resumen del modelo ajustado
summary(darima_auto)
## Series: train_ts 
## ARIMA(1,1,1) 
## 
## Coefficients:
##          ar1      ma1
##       0.3336  -0.8940
## s.e.  0.0957   0.0472
## 
## sigma^2 = 1.13e+10:  log likelihood = -1974.44
## AIC=3954.88   AICc=3955.04   BIC=3963.95
## 
## Training set error measures:
##                    ME     RMSE      MAE       MPE     MAPE      MASE
## Training set 10449.67 105259.9 72659.69 -1.566531 8.971488 0.9023438
##                     ACF1
## Training set -0.03433432
# Diagnóstico del modelo (los residuos deben ser ruido blanco)
checkresiduals(darima_auto)  # Verificar si los residuos son aleatorios y no presentan patrones

## 
##  Ljung-Box test
## 
## data:  Residuals from ARIMA(1,1,1)
## Q* = 45.196, df = 22, p-value = 0.002506
## 
## Model df: 2.   Total lags used: 24

Serie de residuos: La serie de residuos oscila alrededor de cero, lo cual es una buena señal. Sin embargo, hay algunos datos atípicos marcados, especialmente uno muy fuerte hacia 2020, lo que significa el choque de la pandemia. Los residuos parecen no tener una estructura clara, lo que indica que el modelo está capturando bien la tendencia general de la serie.

Función de Autocorrelación: La mayoría de los rezagos están dentro de las bandas de confianza (líneas azules), sin embargo, hay algunos datos que se pasan.

Histograma de residuos con ajuste normal: El histograma tiene una forma aproximadamente simétrica, aunque ligeramente sesgada a la izquierda.

Pronóstico modelo ARIMA automático (1,1,1)

# Generar pronóstico para el conjunto de prueba
forecast_arima_auto <- forecast(darima_auto, h = length(test_ts))  # Predecir los valores futuros

# Crear dataframe para gráfico interactivo del pronóstico
forecast_data_auto <- data.frame(Tiempo = time(forecast_arima_auto$mean), 
                            Pronostico = as.numeric(forecast_arima_auto$mean),
                            Observado = as.numeric(test_ts))

# Graficar pronóstico junto con los valores observados reales
p4auto <- ggplot(forecast_data_auto, aes(x = Tiempo)) +
  geom_line(aes(y = Pronostico, color = "Pronóstico")) +
  geom_line(aes(y = Observado, color = "Observado")) +
  ggtitle("Pronóstico vs Observado") +
  xlab("Tiempo") + ylab("variable1")

ggplotly(p4auto)  # Convertir el gráfico en interactivo

Se puede observar que el pronóstico automático no sigue la tendencia de los datos observados.

Modelo SARIMA automático

# Identificación automática del mejor modelo ARIMA
auto_arima_model <- auto.arima(train_ts)  # Busca automáticamente los mejores parámetros del modelo ARIMA
print(auto_arima_model)
## Series: train_ts 
## ARIMA(1,1,1)(0,0,1)[12] 
## 
## Coefficients:
##          ar1      ma1    sma1
##       0.3748  -0.9184  0.3120
## s.e.  0.0966   0.0477  0.0782
## 
## sigma^2 = 1.02e+10:  log likelihood = -1966.72
## AIC=3941.45   AICc=3941.72   BIC=3953.54
# Cargar el paquete necesario
library(forecast)

# Ajustar el modelo SARIMA(0,1,1)(1,0,0)[12]
darima <- Arima(train_ts, 
                order = c(1, 1, 1),  # (p,d,q) -> (0,1,1)
                seasonal = list(order = c(0, 0, 1),  # (P,D,Q) -> (1,0,0)
                                period = 12))  # Periodicidad estacional de 12 meses

# Mostrar resumen del modelo ajustado
summary(darima)
## Series: train_ts 
## ARIMA(1,1,1)(0,0,1)[12] 
## 
## Coefficients:
##          ar1      ma1    sma1
##       0.3748  -0.9184  0.3120
## s.e.  0.0966   0.0477  0.0782
## 
## sigma^2 = 1.02e+10:  log likelihood = -1966.72
## AIC=3941.45   AICc=3941.72   BIC=3953.54
## 
## Training set error measures:
##                    ME     RMSE      MAE      MPE    MAPE      MASE        ACF1
## Training set 9371.476 99667.25 67628.01 -1.49445 8.36446 0.8398565 -0.03621159
# Diagnóstico del modelo (los residuos deben ser ruido blanco)
checkresiduals(darima)  # Verificar si los residuos son aleatorios y no presentan patrones

## 
##  Ljung-Box test
## 
## data:  Residuals from ARIMA(1,1,1)(0,0,1)[12]
## Q* = 15.553, df = 21, p-value = 0.7942
## 
## Model df: 3.   Total lags used: 24

Serie de residuos: Sigue mostrando un comportamiento centrado en cero, lo cual es bueno ya que es mismo comportamiento a los otros dos modelos ARIMA. También presenta ese movimiento grande en la época de la pandemia, pero es razonable. Sin embargo, se aprecia una ligera mejora en la estabilidad de los residuos, especialmente después de 2020.

Función de Autocorrelación: Muy similar al modelo automático, la mayoría de los rezagos están dentro de las bandas de confianza. Este modelo reduce el número de variables que superan la línea azul, en este caso solo hay una.

Histograma de residuos con ajuste normal: Aquí se nota una mejora ya que la distribución está ligeramente más centrada y menos sesgada. Hay ligera a simetría a la izquierda, pero la curva normal se ajusta mejor que en el modelo anterior.

# Generar pronóstico para el conjunto de prueba
forecast_arima <- forecast(darima, h = length(test_ts))  # Predecir los valores futuros

# Crear dataframe para gráfico interactivo del pronóstico
forecast_data <- data.frame(Tiempo = time(forecast_arima$mean), 
                            Pronostico = as.numeric(forecast_arima$mean),
                            Observado = as.numeric(test_ts))

# Graficar pronóstico junto con los valores observados reales
p4 <- ggplot(forecast_data, aes(x = Tiempo)) +
  geom_line(aes(y = Pronostico, color = "Pronóstico")) +
  geom_line(aes(y = Observado, color = "Observado")) +
  ggtitle("Pronóstico vs Observado") +
  xlab("Tiempo") + ylab("Unidad Variable 1")

ggplotly(p4)  # Convertir el gráfico en interactivo

En este modelo vemos que la tendencia del pronóstico y los datos siguen el mismo patrón. También, cabe aclarar que el modelo subestima el valor real. Por otro lado, el pronóstico está haciendo una estimación más o menos tomando en cuenta la estacionalidad. Pero este es el modelo que más se acerca hasta el momento.

# Cargar librerías necesarias
library(forecast)
library(dplyr)

# Generar pronóstico con el modelo ARIMA identificado
arima_forecast <- forecast(auto_arima_model, h = length(test_ts))

# Crear un dataframe con los valores observados y pronosticados
forecast_table <- data.frame(
  Tiempo = time(arima_forecast$mean),  # Extraer las fechas del pronóstico
  Observado = as.numeric(test_ts),  # Valores reales
  Pronosticado = as.numeric(arima_forecast$mean)  # Valores pronosticados
)

# Mostrar la tabla
print(forecast_table)
##     Tiempo Observado Pronosticado
## 1 2024.750   1180815      1147233
## 2 2024.833   1121219      1117421
## 3 2024.917   1145357      1171977
# Cargar librerías necesarias
library(forecast)

# Hacer un pronóstico para el siguiente mes (1 período adicional)
next_forecast <- forecast(auto_arima_model, h = length(test_ts) + 1)

# Extraer el pronóstico del próximo mes
next_month_forecast <- data.frame(
  Tiempo = time(next_forecast$mean),  # Extraer la fecha del pronóstico
  Pronostico = as.numeric(next_forecast$mean)  # Valor pronosticado
)

# Mostrar el pronóstico completo
print(next_month_forecast)
##     Tiempo Pronostico
## 1 2024.750    1147233
## 2 2024.833    1117421
## 3 2024.917    1171977
## 4 2025.000    1101935
# Extraer solo el valor del trimestre adicional (último de la tabla)
next_month <- tail(next_month_forecast, 1)
print(paste("Pronóstico para enero 2025:", next_month$Tiempo, "=", next_month$Pronostico))
## [1] "Pronóstico para enero 2025: 2025 = 1101934.82625893"

Modelo Manual (4,2,1)

# Cálculo manual de modelo ARIMA
manual_arima_model2 <- Arima(train_ts, order = c(4,2,1)) 
summary(manual_arima_model2)
## Series: train_ts 
## ARIMA(4,2,1) 
## 
## Coefficients:
##           ar1      ar2      ar3      ar4      ma1
##       -0.4882  -0.2974  -0.2298  -0.1704  -1.0000
## s.e.   0.0802   0.0877   0.0875   0.0800   0.0178
## 
## sigma^2 = 1.239e+10:  log likelihood = -1969.86
## AIC=3951.73   AICc=3952.31   BIC=3969.83
## 
## Training set error measures:
##                   ME   RMSE      MAE       MPE     MAPE      MASE        ACF1
## Training set -2915.4 108754 69503.23 -2.731248 8.739925 0.8631445 -0.00863813
library(lmtest)

# Evaluar la significancia estadística de los coeficientes del modelo ARIMA
coeftest(manual_arima_model2)
## 
## z test of coefficients:
## 
##      Estimate Std. Error  z value  Pr(>|z|)    
## ar1 -0.488185   0.080171  -6.0893 1.134e-09 ***
## ar2 -0.297351   0.087715  -3.3900  0.000699 ***
## ar3 -0.229816   0.087540  -2.6253  0.008658 ** 
## ar4 -0.170386   0.079964  -2.1308  0.033108 *  
## ma1 -0.999997   0.017753 -56.3286 < 2.2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
 checkresiduals(manual_arima_model2)

## 
##  Ljung-Box test
## 
## data:  Residuals from ARIMA(4,2,1)
## Q* = 51.002, df = 19, p-value = 9.32e-05
## 
## Model df: 5.   Total lags used: 24

Serie de residuos: En general como las versiones anteriores los residuos se acercan a cero, pero también tiene una variación en la época de la pandemia.

Función de Autocorrelación: En este caso hay más datos por fuera de las bandas, existen cuatro datos fuera de lugar. A diferencia de solo uno como lo que ocurre en el SARIMA.

Histograma de residuos con ajuste normal: Se ajusta mejor a la distribución normal que el modelo anterior, lo cual favorece a ARIMA(4,2,1).

#Aquí se crea el pronóstico con el modelo ARIMA manual y se guarda en una nueva riable u objeto "manual_forecast"
manual_forecast2 <- forecast(manual_arima_model2, h = length(test_ts)) #Se generan tantos pronósticos como valores tenga el conjunto de prueba (test_ts).

# Crear dataframe para gráfico interactivo del pronóstico manual
manual_forecast_data2 <- data.frame(Tiempo = time(manual_forecast2$mean), ## Extrae las fechas del pronóstico
                                   Pronostico = as.numeric(manual_forecast2$mean), ## Valores pronosticados
                                   Observado = as.numeric(test_ts)) ## Valores reales de la serie

# Graficar pronóstico manual junto con los valores observados reales
p_manual2 <- ggplot(manual_forecast_data2, aes(x = Tiempo)) +
  geom_line(aes(y = Pronostico, color = "Pronóstico Manual")) +
  geom_line(aes(y = Observado, color = "Observado")) +
  ggtitle("Variable1:Pronóstico Manual vs Observado") +
  xlab("Tiempo") + ylab("Variable1")

ggplotly(p_manual2)

Se observa que los datos que se pronostican se acercan mucho a los datos reales al final de las proyecciones. Aunque tiene un buen comportamiento en tendencia general, falla en la forma (curvatura) de la serie observada, lo que puede llevar a errores significativos si se utiliza para toma de decisiones.

Conclusión del pronóstico

Tras analizar las proyecciones obtenidas, se concluye que el modelo con mejor desempeño es el SARIMA automático: ARIMA(1,1,1)(0,0,1)[12], el cual presentó el mejor ajuste y una mayor capacidad para seguir la tendencia histórica de la serie. Esto se confirma mediante sus menores valores de los criterios AIC (3941.72) y BIC (3953.54), que indican una mayor eficiencia estadística frente a los demás modelos evaluados.

Con base en este modelo, se estima que la producción de cemento en enero de 2025 será de 1,101,934.82 toneladas, lo que representa una disminución del 3,79% respecto a diciembre de 2024. Esta caída es coherente con el patrón estacional del sector, caracterizado por una menor demanda en 2024, influenciada por las políticas gubernamentales sobre la reducción de subsidios.

Adicionalmente, el comportamiento proyectado también se alinea con el escenario conservador planteado por Camacol. En este escenario, se estima que para 2025, el programa ‘Mi Casa Ya’ se restringe nuevamente a 20.500 cupos; las tasas de interés aumentan, alcanzando un promedio del 12% y aunque la vivienda NOVIS mejora levemente, la VIS enfrenta una contracción severa debido a la disminución de subsidios y al incremento de las tasas de interés, lo que eleva los desistimientos.

Frente a este panorama, se recomienda que Grupo Argos ajuste su estrategia de inventario y logística para evitar un sobreabastecimiento en los primeros meses del año 2025. Específicamente, debería reducir el nivel de inventarios para enero, dar prioridad a los productos de mayor rotación y mantener una comunicación constante con los proveedores para responder con flexibilidad a posibles fluctuaciones de la demanda. Además, puede ser oportuno aprovechar este periodo de baja actividad para lanzar campañas promocionales dirigidas a incentivar el consumo de sus productos.

Recomendaciones Estratégicas

o ¿Qué decisiones podrían tomar las empresas basadas en las señales extraídas?

Cementos Argos podría considerar las siguientes acciones estratégicas:

  1. Reducción de inventarios para evitar acumulaciones innecesarias y disminuir los costos asociados al almacenamiento y producción.

  2. Optimización de costos mediante ajustes en los gastos operativos y la renegociación de contratos con proveedores o aliados estratégicos.

  3. Implementación de incentivos comerciales como promociones y descuentos que estimulen la demanda en un contexto de menor actividad económica.

o ¿Cómo podrían ajustar estrategias en función del pronóstico de corto plazo?

Dado que el pronóstico anticipa una caída en la producción, principalmente como resultado de políticas gubernamentales restrictivas, se sugiere:

  1. Reducir costos operativos de forma anticipada para adaptarse al entorno adverso.

  2. Evitar compromisos financieros grandes (como adquisición de nueva maquinaria) durante este periodo de baja.

  3. Ajustar las campañas publicitarias, enfocándolas en segmentos estratégicos o nichos con mayor potencial, ya que la reducción de subsidios puede retrasar los retornos.

  4. Revisar el presupuesto de corto plazo en función de la postura gubernamental, priorizando inversiones estratégicas de bajo riesgo.

Impactos

Empresa

Operaciones: permite anticipar y ajustar niveles de producción, evitando sobrecostos por exceso de inventario.

Finanzas: mejora la planificación del flujo de caja.

Área comercial: posibilita el diseño de campañas publicitarias alineadas al ciclo económico del sector.

Proveedores: Una caída en la demanda puede generar una reducción en los pedidos, afectando su estabilidad financiera.

Clientes: Malas decisiones en la gestión de inventarios pueden provocar escasez o sobreoferta, alterando los tiempos de entrega y la percepción del mercado.

Competencia: Una respuesta ágil y eficiente al pronóstico puede mejorar la participación en el mercado, forzando a los competidores a reevaluar sus estrategias para no perder terreno.

Referencias

Bancolombia. (2020). Impacto de la pandemia en el sector de la construcción en marzo de 2020. Capital Inteligente. https://www.bancolombia.com/empresas/capital-inteligente/actualidad-economica-sectorial/sector-cemento/impacto-pandemia-sector-construccion-marzo-2020

Bancolombia. (2020). Perspectivas de la construcción en Colombia 2020. Capital Inteligente. https://www.bancolombia.com/empresas/capital-inteligente/actualidad-economica-sectorial/sector-cemento/perspectivas-construccion-colombia-2020

Camacol. Golpe a la economía por cuenta del paro y los bloqueos. Revista Urbana. https://camacol.co/actualidad/publicaciones/revista-urbana/90/actualidad/golpe-la-economia-por-cuenta-del-paro-y-los

Diario de Avisos. (2023, septiembre 12). Cementos Argos: un legado de liderazgo y excelencia en la gestión de tierras para una industria del cemento más resiliente en América Latina. Canarias en Red. https://diariodeavisos.elespanol.com/canariasenred/cementos-argos-un-legado-de-liderazgo-y-excelencia-en-la-gestion-de-tierras-para-una-industria-del-cemento-mas-resiliente-en-america-latina/

Edición. (2025). PERSPECTIVAS ECONÓMICAS DEL SECTOR CONSTRUCTOR PARA EL 2025. CAMACOL. https://camacol.co/actualidad/publicaciones/revista-urbana/103/actualidad/perspectivas-economicas-del-sector

La República. (2016, julio 14). Malas cifras del sector de construcción son temporales. https://www.larepublica.co/infraestructura/malas-cifras-del-sector-de-construccion-son-temporales-2411796

La República. (2014, enero 16). Construcción y minería llevarían el crecimiento económico de Colombia en 2014 a 5%. https://www.larepublica.co/economia/construccion-y-mineria-llevarian-el-crecimiento-economico-de-colombia-en-2014-a-5-2089771

Minvivienda. (2016, enero 19). En 2015 la construcción tuvo su mejor año en dos décadas, según las cifras de licencias: Minvivienda. https://minvivienda.gov.co/sala-de-prensa/en-2015-la-construccion-tuvo-su-mejor-ano-en-dos-decadas-segun-las-cifras-de-licencias-minvivienda

Orlando, M. (2025, enero). ¿Qué viene para la vivienda? La actividad del sector en 2025 dependerá de las ventas de 2023 que cayeron en 48,8%. El Colombiano. https://www.elcolombiano.com/negocios/por-que-es-buen-momento-para-comprar-vivienda-en-2025-ventas-crecen-CH26473133

Portafolio. (2021, julio 14). En junio licencias de construcción crecieron 28,9%. https://www.portafolio.co/negocios/empresas/en-junio-licencias-de-construccion-crecieron-28-9-570893

Portafolio. (2024, marzo 18). Informe sobre la construcción de Colombia 2024: crecimiento del PIB, empleo y producción de cemento. https://www.portafolio.co/mis-finanzas/vivienda/informe-sobre-la-construccion-de-colombia-2024-crecimiento-del-pib-empleo-y-produccion-de-cemento-619520

Valora Analitik. Impacto económico del sector inmobiliario. https://www.valoraanalitik.com/impacto-economico-sector-inmobiliario/

Zapata, A. (2024). Hay 112 constructoras que entraron en procesos de insolvencia: el nivel más alto en más de 10 años. El Colombiano. https://www.elcolombiano.com/negocios/empresas/hay-112-constructoras-que-entraron-en-procesos-de-insolvencia-el-nivel-mas-alto-en-mas-de-10-anos-CM25832365