1. Contextualización sector y variables

Introducción del sector y la empresa:

Por medio de este trabajo se estudiará el sector automotriz en el valle del cauca, se analizaran los resultados, características y aspectos más importantes encontrados en las variables, asumiendo el rol de analistas financieros y económicos de la empresa Casa Toro, uno de los concesionarios más grandes del país, desde 1934 se ha consolidado con el paso del tiempo y ha aumentado su portafolio hasta ser el distribuidor oficial de muchas marcas (Mazda, Renault, Ford, Volkswagen etc.), además de haber incrementado sus servicios incluyendo ventas de vehículos usados, mantenimiento, servicio postventa entre otros más.

Pero ¿Por qué consideramos importante que el sector automotriz sea analizado?, primero, es un sector que es sumamente importante para la economía, por medio de su estado podemos darnos cuenta de la evolución de procesos como importaciones, comercialización, financiamiento, y el mantenimiento de vehículos.

Acionalmente, ha presentado un aumentado en los últimos años, con un crecimiento del 23,2% en 2025 comparación con el 2024 con 23.791 unidades de vehículos vendidas (Informe del Sector Automotor a Junio a 2025. (2025, julio 1). Fenalco. https://www.fenalco.com.co/blog/gremial-4/informe-del-sector-automotor-a-junio-de-2025-8178), se conoce además que este sector muestra la confianza que el consumidor posee, ya que existe una relación directa entre el aumento de confianza y la disposición a acceder a la compra de un vehículo, por lo que con este trabajo se puede entender las tendencias de compra, disposición y capacidad de financiamiento de los colombianos.

Variables seleccionadas:

Para llegar al propósito expresado en la introducción hemos seleccionado 4 variables que consideramos relevantes y relacionados con el sector escogido, las cuales son:

  1. Ventas de vehículos nuevos nivel nacional (VEH)

  2. Índice de Confianza del Consumidor (ICC)

  3. Tasa de cambio pesos/dólar (TRM)

  4. Cartera del Sector Bancario (CART)

Descripción y justificación de elección de variables:

Las Venta de Vehículos a Nivel Nacional es de vital importancia ya que su análisis es clave para la planeación logística y de inventarios, permitiéndonos anticipar las estrategias de las casas matrices y asegurar nuestra competitividad frente al volumen total de matrículas en el país. Por esta razón va a ser nuestra variable a pronosticar.

El Índice de confianza al consumidor ICC permite conocer la perspectiva de los hogares en relación a la situación económica actual o futura, en el caso de la comercialización de vehículos, al ser un bien durable y una inversión más grande, la confianza del consumidor permite conocer si se estaría dispuesta a ser una compra mayor o si se decide abstenerse, “Si bien la economía colombiana ha registrado un crecimiento moderado, la mejoría en la confianza del consumidor ha sido un factor determinante para que cada vez más hogares tomen la decisión de renovar su vehículo o decidan acceder a uno por primera vez” (Informe del Sector Automotor a Junio a 2025. (2025, julio 1). Fenalco. https://www.fenalco.com.co/blog/gremial-4/informe-del-sector-automotor-a-junio-de-2025-8178)

En el caso de la Tasa de cambio (pesos/dólar) TRM, esta es el valor del peso colombiano frente al dólar. en el caso del sector automotriz incluyendo la empresa, ya que el proceso de exportación es fundamental en este sector, al existir muchas marcas extranjeras, en el caso de Casa Toro, las marcas de las cuales es distribuidor oficial son extranjeras, una fluctuación en la tasa de cambio puede afectar tanto positiva como negativamente el precio de los vehículos y por ende la demanda de los mismos. por lo que es una variable a fundamental a considerar para conocer el estado del sector ya que ignorarla puede generar un impacto negativo directamente en las utilidades de la empresa.

Finalmente, la Cartera del Sector Bancario es de suma importancia ya que el crédito es el facilitador esencial de nuestras operaciones comerciales, ya que la mayoría de las ventas dependen del financiamiento externo. Monitorear la evolución de la cartera nos permite evaluar la liquidez del sistema y la disposición de la banca para otorgar préstamos, lo cual es un indicador directo del flujo de clientes que podrán concretar la compra en nuestras vitrinas.

Declararamos las variables como serie temporaes:

Ventas de vehiculos nuevos

##        Jan   Feb   Mar   Apr   May   Jun   Jul   Aug   Sep   Oct   Nov   Dec
## 2014 20115 23744 24075 26128 26865 22974 27650 27465 29528 31386 25700 40393
## 2015 21241 22871 24671 21863 22525 22476 26595 23208 24855 22412 21004 29546
## 2016 16740 20278 19737 20291 19464 20589 17526 22409 21378 19168 22384 33431
## 2017 17215 17931 21022 17082 19898 19826 18607 20901 19297 19689 21103 25386
## 2018 16399 18293 19523 20166 20522 18270 19315 21410 21370 21496 26245 33043
## 2019 15941 18440 20170 19763 22269 19455 22874 23284 22659 23858 23946 30661
## 2020 18427 20547 12290   217  8933 11981 14435 13209 18408 20858 22330 26854
## 2021 14327 19648 22914 19021 14684 20417 23117 21052 22824 23340 23616 25312
## 2022 17391 19199 20837 20622 22411 23306 23233 24386 23871 22577 22625 21880
## 2023 13852 15761 17244 13740 15674 14364 13091 14801 15525 13817 18497 19856
## 2024 11581 15597 13347 15291 14805 14543 16497 16498 17117 18521 21824 25331
## 2025 14396 17103 18347 17415 19707 18038 23872 21285 24862 25254 23791 30135

ICC INDICE DE CONFIANZA DEL CONSUMIDOR

##         Jan    Feb    Mar    Apr    May    Jun    Jul    Aug    Sep    Oct
## 2012  32.70  26.80  24.40  26.60  26.50  20.60  23.20  18.10  25.00  25.60
## 2013  23.10  14.90  14.80  23.70  20.10  27.40  25.10  13.40  14.60  22.30
## 2014  27.30  15.70  18.50  18.50  23.90  26.50  26.60  20.50  17.50  21.70
## 2015  17.90  14.00   2.30   8.20  13.70  14.70   2.60  -0.40   4.30   6.80
## 2016 -21.30 -21.00 -20.10 -13.00 -12.50 -11.30 -14.90  -6.60  -2.10  -3.20
## 2017 -30.20 -24.30 -21.10 -12.80 -16.90 -11.70  -9.50 -15.90 -10.30 -10.60
## 2018  -5.40  -7.80  -3.20   1.50   8.90  15.50   9.80   4.70  -0.70  -1.30
## 2019  -2.80  -5.60   1.20  -9.60  -5.00  -6.30  -5.11 -11.80 -10.70  -9.80
## 2020  -1.20 -11.20 -23.80 -41.30 -34.00 -33.10 -32.70 -25.40 -21.60 -18.60
## 2021 -20.80 -14.60 -11.40 -34.20 -34.30 -22.30  -7.50  -8.20  -3.00  -1.30
## 2022 -13.50 -17.50 -17.80 -17.50 -14.70   2.90 -10.40  -2.40 -11.50 -19.50
## 2023 -28.60 -27.80 -28.50 -28.80 -22.80 -14.10 -17.40 -18.80 -17.90 -14.00
## 2024  -7.90  -9.40 -13.00 -11.40 -14.10 -12.70  -9.00 -15.30 -16.00  -3.70
## 2025  -1.10 -12.00  -7.10  -8.60  -3.80   2.20   5.30  -2.40   1.60  13.60
##         Nov    Dec
## 2012  25.30  21.50
## 2013  23.70  22.80
## 2014  24.50  22.40
## 2015   6.70   1.10
## 2016  -4.60 -10.70
## 2017 -10.00  -6.00
## 2018 -19.60  -8.30
## 2019 -14.40  -9.50
## 2020  13.60  10.40
## 2021  -1.40  -7.00
## 2022 -24.80 -22.30
## 2023 -20.90 -17.30
## 2024  -5.70  -3.40
## 2025  17.00  19.90

TRM

##           Jan      Feb      Mar      Apr      May      Jun      Jul      Aug
## 2012 1847.516 1786.543 1767.793 1773.893 1795.907 1788.877 1784.903 1807.772
## 2013 1770.024 1794.198 1813.454 1830.091 1853.722 1910.188 1900.163 1904.411
## 2014 1964.111 2042.631 2017.022 1936.680 1915.203 1887.066 1858.366 1899.140
## 2015 2400.168 2422.994 2593.465 2492.766 2444.315 2561.667 2743.140 3027.064
## 2016 3287.158 3356.246 3124.169 2992.575 3002.174 2985.018 2971.474 2956.525
## 2017 2941.918 2880.985 2941.717 2876.237 2920.387 2966.522 3034.359 2971.017
## 2018 2866.496 2860.524 2842.387 2765.226 2863.577 2893.081 2885.532 2965.266
## 2019 3160.838 3112.360 3131.566 3158.608 3311.943 3250.837 3212.277 3419.289
## 2020 3321.721 3415.273 3908.308 3973.602 3853.472 3701.386 3659.323 3788.981
## 2021 3494.952 3551.997 3618.259 3654.614 3737.572 3687.401 3835.867 3882.250
## 2022 4002.746 3934.644 3799.549 3800.747 4015.570 3950.261 4389.145 4324.015
## 2023 4715.023 4822.552 4759.074 4530.264 4536.510 4205.262 4054.683 4077.895
## 2024 3922.445 3931.981 3899.277 3871.303 3867.880 4059.680 4038.110 4068.280
## 2025 4300.310 4131.950 4133.480 4273.880 4202.300 4115.800 4047.290 4051.590
##           Sep      Oct      Nov      Dec
## 2012 1802.369 1805.740 1819.583 1791.352
## 2013 1917.924 1884.893 1923.471 1933.276
## 2014 1976.424 2048.908 2133.388 2351.757
## 2015 3074.955 2923.116 3007.221 3243.241
## 2016 2919.149 2938.747 3109.397 3003.960
## 2017 2917.878 2960.133 3014.114 2990.191
## 2018 3033.467 3092.217 3198.373 3216.620
## 2019 3403.978 3431.769 3412.555 3366.764
## 2020 3756.742 3832.831 3674.118 3461.582
## 2021 3823.625 3768.999 3906.607 3969.679
## 2022 4445.920 4726.851 4920.763 4793.103
## 2023 4007.122 4227.934 4035.887 3948.097
## 2024 4193.890 4266.350 4412.060 4386.390
## 2025 3924.240 3881.440 3780.340 3794.930

CART Cartera del sector bancario

Descomposición de las variables y análisis gráfico original

Ventas de vehículos nuevos-Original

El mercado automotriz está lleno de picos y valles. Por esa razón no miramos únicamente al serie original, sino que Descomponemos las ventas. esto nos ayuda a ver si el sector realmente está creciendo o si solo está viviendo de momentos específicos del año.

Extracción señales Vehiculos Nuevos

Descomposición Ventas de Vehículos Nuevos (Nacional):

Serie Original: En lo que respecta a la serie original la volatilidad es alta ya que hemos visto meses de 40.000 unidades y otros donde el registro fue casi nulo. En los últimos meses de 2024, la serie parece haber encontrado un equilibrio cerca de las 22.000 unidades.

Tendencia: El mercado ha perdido gran parte de su dinamismo mostrado en su pico registrado en 2016, la actividad comenzó a declinar y hoy se estabiliza en torno a las 20.000 unidades mensuales. Es una cifra que evidencia, con claridad, cuánto se ha reducido la capacidad de absorción del sector en comparación con la de hace ocho años.

Estacionalidad: Los finales de año son determinantes, con saltos de hasta \(5.000\) unidades estando por encima del promedio, lo que demuestra que el sector depende críticamente de lo que suceda en el último trimestre.

Residuo: El dato más fuerte aquí es la caída de 2020, donde el residuo negativo fue de 10.000 unidades. Es la prueba de que un choque externo puede frenar en seco la inercia de ventas, sin importar qué tan buena sea la temporada.

Gráfico inicial del ICC -Original

Dado que la serie original del ICC suele presentar fluctuaciones muy bruscas mes a mes, es fundamental descomponerla para entender qué parte responde a un sentimiento real de largo plazo y qué es simple ruido momentáneo.

Extracción señales ICC

Descomposición ICC :

Serie Original: Se mueve en un rango bastante amplio, oscilando entre los \(+30\) y \(-40\) puntos. Lo que más llama la atención es cómo los mínimos históricos de 2020 y 2021 marcaron un antes y un después, dejando la serie atrapada mayoritariamente en terreno negativo.

Tendencia: Aquí es donde se ve el cambio real. Desde 2015, el consumidor colombiano dejó atrás el optimismo y entró en una etapa de contracción estructural. Actualmente, la tendencia parece estancada entre los \(-10\) y \(-20\) puntos, sin señales claras de querer volver a niveles positivos.

Estacionalidad: El comportamiento cíclico es muy predecible, con variaciones de \(\pm 4\) unidades que se repiten con precisión casi matemática. El optimismo cada fin de año y el impacto rezagado de los primeros trimestres de año cuando toca responder por las obligaciones adquiridas en el auge de diciembre, reflejando los momentos del calendario donde las familias se sienten tradicionalmente más o menos seguras financieramente.

Residuo: En este apartado destacan los picos de volatilidad atípica entre 2020 y 2022. Son movimientos que no responden ni a la tendencia ni al ciclo anual, sino a eventos externos que sacudieron la confianza de forma imprevista.

Gráfico inicial TRM -Original

La Serie Original Ha tenido un crecimiento sustancial, duplicando su valor en apenas una década. Hemos visto cómo ha llegado a probar niveles por encima de los \(5.000\) en momentos de mucha tensión, para luego buscar soportes más bajos. Para evidenciar con mayor claridad el comportamiento real de la variable dada la volatilidad realizamos la descomposición.

Extracción señales TRM

Descomposición TRM:

Tendencia: Lo que vemos es un cambio de piso definitivo. Pasamos de una TRM estable de \(3.000\) antes de 2019 a una realidad donde la tendencia se ha consolidado por encima de los $4.000. Es una pendiente alcista que ha redefinido los costos de toda la economía.

Estacionalidad: Existen presiones cambiarias que ocurren siempre en las mismas fechas, con rangos que van desde los -$40 hasta los $80 pesos. Es un ciclo recurrente que ayuda a predecir cuándo el dólar tiende a encarecerse por factores estacionales.

Residuo: Aquí se hacen evidentes los choques fuertes, especialmente en 2020 y entre 2022-2023, con desviaciones de más de $200 pesos que rompen cualquier previsión y responden puramente a la incertidumbre del momento.

Grafico Original Venta de Cartera del sector bancario

Al ser una variable que acumula saldos, la cartera puede parecer siempre al alza. Por eso, descomponerla es vital para notar el comportamiento real

Extracción señales Venta de Cartera del sector bancario

Descomposición Cartera del Sector Bancario:

Tendencia:Tuvo una subida constante hasta 2022, llegando un poco más de 5 billones de pesos. Sin embargo, lo más reciente muestra que ese volumen se ha estancado e incluso ha empezado a bajar ligeramente.

Estacionalidad: El crédito también tiene temporadas. Hay movimientos cíclicos de hasta 4 billones de pesos, esto se presenta en el ultimo trimestre del año, lo cual nos dice en qué en estos meses se aumenta el numero de creditos realizado y por ende aumenta el valor de la cartera, por el contrario en los primeros trimestres es cuándo hay más recaudo.

Residuo: La volatilidad aquí es menor que en las ventas de carros, pero los ruidos han crecido en los últimos años. Esto sugiere que el sistema bancario ha tenido que lidiar con más imprevistos relacionados con las tasas y el comportamiento de pago de los clientes.

Extracción de las variables ajustada por estacionalidad

Se crea la variable1 ajustada por estacionalidad

Se crea la variable2 ajustada por estacionalidad

Se crea la variable3 ajustada por estacionalidad

Se crea la variable4 ajustada por estacionalidad

Gráfico serie original VS ajustada Venta de Vehiculos nuevos

Interpretación

La serie de ventas de autos, tanto la original como la que se ajusta por estacionalidad, presenta una conducta a través del tiempo muy parecida. No obstante, la serie original muestra fluctuaciones más marcadas en ciertos meses, lo que pone de manifiesto los patrones estacionales de la venta de vehículos. Por el contrario, la serie ajustada elimina el efecto estacional y suaviza estas oscilaciones, lo cual hace más fácil apreciar la progresión subyacente de las ventas.

Aunque la variabilidad muestra diferencias, las dos series coinciden en los cambios más notables del período de estudio. Se percibe una caída significativa alrededor del año 2018, posiblemente por las caídas de precios del petróleo y justes fiscales que se realizaron años antes y redujo la demanda.

Gráfico serie original VS ajustada Variable ICC

Interpretación

El ICC tiene un comportamiento similar en ambas series de tiempo, lo que puede deducir que la estacionalidad no se ve relejada en la variable y que se ve afectada por factores externos, en ambos casos en los últimos años el índice a mejorado, pero en retrospectiva aun no ha sido demasiado favorecedor.

Gráfico serie original VS ajustada TRM

Interpretación

Comparando la serie original vs ajustada, en el caso de la variable TRM, ambas tienen un comportamiento similar, como una tendencia creciente con el paso del tiempo, pasando por valores que rondan los 2.000 pesos colombianos hasta llegar algunos alrededores de los 4.000 pesos en los últimos años, la serie ajustada por su parte tiene un comportamiento más “suave” eliminando ligeras variaciones. Al haber diferencias pequeñas se puede decir que la TRM no sufre mucho de estacionalidad por lo que es una variable más afecta por otros factores, como macroeconómicos y financieros.

Gráfico serie original VS ajustada Cartera Bancaria

Interpretación

la series originale y las ajustada por estacionalidad tienen un comportamiento muy parecido, ambas líneas tienden a superponerse que en el tiempo. Esto señala que la variable no tiene un componente estacional fuerte, lo que significa que no hay patrones que se reproduzcan de manera sistemática en ciertos meses del año.

Que la serie ajustada y la original sean muy parecidas indica que las variaciones en la cartera son mayormente resultado de tendencias a mediano y largo plazo en el sistema financiero, lo que puede tener un impacto directo en la habilidad de los clientes para financiar la adquisición de vehículos.

Zoom por variable de la Serie original VS Tendencia

En este apartado es posible observar con mayor precisión el fenómeno de la relación de la tendencia con el comportamiento original descrito en las interpretaciones de la descomposición temporal por cada una de las variables.

Tasas de crecimiento

###Tasa de crecimiento de la serie original vs tendencia:

Señales Convergentes y Fiabilidad: Al cierre de 2024, la serie original y la tendencia permanecen en terreno positivo, confirmando la recuperación del sector. Sin embargo, la tendencia comienza a moderar su pendiente, lo que sugiere una desaceleración en el ritmo de expansión. En consecuencia, el mercado mantiene crecimiento, pero con señales de menor impulso hacia el cierre del periodo.

Puntos de Inflexión y Ciclos:

2016 (Auge): Se observa un punto de inflexión donde la tendencia alcanzó su máximo histórico por encima de las 27.500 unidades mensuales. Este pico estuvo impulsado por condiciones de crédito favorables y la renovación del parque automotor antes de cambios tributarios.

2022 (El Gran Choque): La serie experimentó una caída vertical sin precedentes. Este quiebre se explica por la crisis global de suministros (escasez de microchips) y el encarecimiento drástico de los vehículos debido a la TRM y las tasas de interés.

Estacionalidad: Identificamos un patrón sumamente marcado donde los meses de noviembre y diciembre generan impactos positivos de hasta +5.000 unidades sobre el promedio. En contraste, los primeros meses del año actúan como valles recurrentes, una dinámica que se ha mantenido rígida incluso en los años de post-pandemia.

Serie Original vs. Ajustada: Dado que la serie original presenta picos tan pronunciados por ferias y promociones de fin de año, trabajamos con la serie ajustada (tendencia) para entender la verdadera salud del mercado. La original suele inflar la percepción de éxito en diciembre, ocultando si el mercado estructuralmente está perdiendo o ganando fuerza.

Aclaración metodo de calculo: Usamos la diferencia en puntos porque el ICC cruza por cero y tiene valores negativos. Matemáticamente, calcular una tasa de crecimiento (división) cuando la base es cercana a cero genera resultados infinitos o escalas distorsionadas que arruinan la gráfica. La diferencia absoluta permite medir el cambio real en el sentimiento del consumidor sin errores de magnitud.

Señales Convergentes: Al cierre del periodo se observa una mejora en la dinámica del indicador. Tanto la serie original como la tendencia presentan una trayectoria ascendente y se ubican en terreno positivo. Aunque persiste volatilidad de corto plazo, la coincidencia entre el repunte observado y la tendencia suavizada sugiere una recuperación más consistente en la confianza del consumidor. POr lo tanto concluimos que La demanda de autos mantiene una trayectoria de recuperación y podría seguir aumentando, aunque a un ritmo más moderado.

Puntos de Inflexión y Cambio de Régimen: Visualmente se identifica una ruptura en la dinámica alrededor de 2015, caracterizada por una contracción pronunciada y mayor variabilidad posterior. No obstante, no puede afirmarse un régimen pesimista permanente, pues la serie muestra ciclos alternados y una tendencia positiva reciente.

Ruido y Choques Atípicos: El componente residual identifica niveles de ruido extremos en 2020 y 2021. Estas desviaciones (picos de hasta \(+20\) y caídas de \(-20\) en el residuo) reflejan la alta sensibilidad de la confianza a noticias sobre la pandemia y la posterior reactivación, rompiendo cualquier patrón usual de comportamiento.*

Estacionalidad: *Se confirma un ciclo sumamente rígido con impactos positivos recurrentes hacia el cierre de cada año. Este patrón estacional explica por qué, incluso en años de crisis, hay un repunte de ánimo en diciembre que el sector automotriz aprovecha para sus metas de ventas.

Serie Original vs. Ajustada: Debido a la enorme volatilidad y el ruido presente en la serie original (que llega a tocar mínimos de \(-40\) puntos), es imperativo trabajar con la serie ajustada (tendencia) para el análisis estratégico. La original suele sobrerreaccionar a eventos de corto plazo, lo que podría llevar a conclusiones erróneas sobre la salud real del consumo.

Señales Convergentes En el tramo final de 2024 se observa una convergencia temporal entre la serie original y la tendencia en dirección descendente, lo que sugiere un episodio transitorio de presión devaluacionista. Sin embargo, hacia el cierre del periodo la tendencia revierte y retorna a terreno negativo, indicando que dicho movimiento no se consolida como un proceso estructural de depreciación del peso colombiano frente al dólar. Por lo tanto, concluimos que se encuentra en un periodo de apreciación relativa del peso con alta volatilidad.

Puntos de Inflexión y Cambios de Régimen:

2015: Se identifica un punto de inflexión crítico donde la TRM rompió el soporte histórico de los $2.000. Este salto se explica por el desplome de los precios internacionales del petróleo, que redujo drásticamente el ingreso de divisas al país.

2022-2023: La tendencia alcanzó un máximo histórico cercano a los $5.000. Este régimen de alta volatilidad estuvo impulsado por la incertidumbre política interna tras las elecciones presidenciales y el endurecimiento de la política monetaria en Estados Unidos (alza de tasas de la FED).

Ruido y Eventos Atípicos: El componente de residuo revela choques que rompen el comportamiento usual, especialmente en 2020 (inicio de la crisis global por pandemia) y durante la volatilidad política de 2022. Estas desviaciones, que superan los $200 pesos, representan momentos donde factores no sistémicos dominaron la formación del precio.

Serie Original vs. Ajustada: Dada la volatilidad residual observada en las gráficas, se recomienda trabajar con la serie ajustada (tendencia) para el análisis de costos a largo plazo. La serie original, aunque útil para el flujo de caja inmediato, está “contaminada” por ruidos especulativos que no reflejan necesariamente la salud real del tipo de cambio.

Señales Convergentes (Recuperación Moderada): Al cierre del periodo, la serie original y la tendencia presentan una trayectoria ascendente conjunta. Esta convergencia sugiere que la cartera bancaria mantiene una fase de recuperación a nivel nacional, aunque a un ritmo moderado y aún por debajo de los niveles de expansión observados en ciclos anteriores.

Puntos de Inflexión y Estabilización: Tras superar el desplome crítico de 2022 (donde la tasa rozó el -100%), la serie experimentó un rebote agresivo. Sin embargo, la actual forma lateral de la tendencia sugiere un nuevo punto de inflexión hacia la estabilidad, el mercado está dejando de “recuperarse” para entrar en una fase de crecimiento maduro y constante.

La serie ha pasado de una volatilidad extrema a una zona de normalización. El hecho de que la tendencia logre mantenerse por encima de la línea de cero es una señal positiva de supervivencia del sector, aunque la lateralización actual nos advierte que el margen para nuevas aceleraciones es limitado si no cambian variables externas como las tasas de interés o el ICC.

Modelo ARIMA

Para este informe,se aplicará la metodología Box-Jenkins en la cual nuestra variable a predecir va a ser la venta de vehiculos a nivel nacional (VEH).

1. División conjunto de entrenamiento y prueba

Dentro del total de la base de datos excluimos los ultimos dos meses para darle mayor robustez al modelo. por lo cual la muestra de testeo del pronostico se conforma de los ultimos 2 meses de 2025.

2. Identificación de Modelo

Análisis de Estacionariedad

Metodo gráfico

Visualmente, la serie presenta alta volatilidad, posibles cambios estructurales y una caída atípica pronunciada alrededor de 2020, seguida de recuperación parcial. Además, no se observa una oscilación estable alrededor de una media constante durante todo el periodo. Por ello, existe evidencia visual de que la serie no es estacionaria, ya que su media y posiblemente su varianza cambian a lo largo del tiempo.

Metodo estadistico - Test de Dickey-Fuller

El test de Dickey-Fuller aumentado (ADF) se usa para verificar si una serie temporal es estacionaria, es decir, si sus propiedades estadísticas (media y varianza) permanecen constantes en el tiempo.

HO: Serie no estacionaria HI: Serie estacionaria

Si el p-valor es bajo (< 0.05) → Rechazamos la hipótesis nula y concluimos que la serie es estacionaria.

Si el p-valor es alto (> 0.05) → No podemos rechazar la hipótesis nula, lo que indica que la serie no es estacionaria.

## 
##  Augmented Dickey-Fuller Test
## 
## data:  train_ts
## Dickey-Fuller = -4.3401, Lag order = 5, p-value = 0.01
## alternative hypothesis: stationary

El test ADF arrojó un p-value igual a 0.01, este valor es menor a 0.05, rechazamos la hipotesis nula y por tanto la serie es estacionaria.

Interpretación En este caso apesar que estadisticamente el test indica que la serie es estacionaria priorizamos lo observado en el metodo grafico, por lo cual es necesario realizar diferenciación.

Diferenciación en niveles

Se realizará la primera diferenciación, buscando volver la serie estacionaria.

Justificación de elección - 1 diferenciación

Graficamente podemos ver que una sola diferencia en niveles es suficiente para estabilizar la media y centrar los datos en cero, convirtiendo los valores en tasas de crecimiento fácilmente interpretables para un modelo económico. Optar por una segunda diferencia o diferenciación en logaritmos no sería lo optimo ya que se estaría sobre-diferenciación,no elimina el valor atípico de 2020, y si añade ruido innecesario que complicaría los pronósticos, haciendo que el modelo sea menos preciso y menos parsimonioso.

Comprobación de estacionariedad en la serie diferenciada

## 
##  Augmented Dickey-Fuller Test
## 
## data:  train_diff
## Dickey-Fuller = -6.5473, Lag order = 5, p-value = 0.01
## alternative hypothesis: stationary

El p-value es menor a 0.05 con una primera diferencia por tanto, se confirma que el valor que puede tomar d es igual a 1.

Identificación manual de p y q

Determinamos el parámetro p por medio del PACF (Partial Autocorrelation Function) el cual Muestra la correlación parcial entre la serie y un rezago específico, eliminando el efecto de rezagos intermedios.

Determinamos el parámetro q por medio del ACF (Autocorrelation Function), el cual muestra la correlación de la serie con sus rezagos.

Interpretación correlogramas

Se puede observar que los valores que podrian tomar p y q serian:

p= 1 , p= 2, p=3, p=4

q= 1

Ya que exceden las bandas de significancia

Posibles modelos

Modelo (1,1,1) Modelo (2,1,1)

Estimación manual de los posibles modelos

Criterio de evaluación: Mean Absolute Percentage Error (MAPE), indicador que expresa el error en términos relativos, como porcentaje del valor real.

Regla general: MAPE 10% → Muy buen modelo 10%-20% → Modelo aceptable 20%-50% → Modelo pobre 50% → Modelo muy malo

MODELO (1,1,1)

## Series: train_ts 
## ARIMA(1,1,1) 
## 
## Coefficients:
##          ar1      ma1
##       0.2793  -0.8346
## s.e.  0.2031   0.1605
## 
## sigma^2 = 17979412:  log likelihood = -1377.12
## AIC=2760.24   AICc=2760.41   BIC=2769.08
## 
## Training set error measures:
##                     ME     RMSE      MAE      MPE     MAPE      MASE
## Training set -26.79542 4195.184 2935.444 -60.0997 71.75322 0.7757469
##                     ACF1
## Training set -0.03391291
## 
## z test of coefficients:
## 
##     Estimate Std. Error z value  Pr(>|z|)    
## ar1  0.27933    0.20305  1.3756    0.1689    
## ma1 -0.83465    0.16049 -5.2006 1.987e-07 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

En este caso, un MAPE de 71.75% indica que el error porcentual absoluto promedio del modelo es elevado, por lo que su capacidad predictiva resulta limitada. Adicionalmente, en la prueba de significancia de coeficientes, únicamente el parámetro MA(1) es estadísticamente significativo (p < 0.01), mientras que el coeficiente AR(1) no es significativo (p = 0.1689). Esto sugiere que la dinámica del modelo está explicada principalmente por el componente de media móvil y que podría evaluarse un modelo más parsimonioso.

## 
##  Ljung-Box test
## 
## data:  Residuals from ARIMA(1,1,1)
## Q* = 99.839, df = 22, p-value = 6.882e-12
## 
## Model df: 2.   Total lags used: 24

El diagnóstico de residuos del modelo ARIMA(1,1,1) sugiere que el ajuste no es completamente satisfactorio. Aunque los residuos oscilan alrededor de cero, se observan picos pronunciados y episodios de alta volatilidad, especialmente alrededor de 2020, lo que indica presencia de valores atípicos o shocks no capturados por el modelo. Además, la función de autocorrelación de los residuos presenta rezagos significativos, particularmente en los múltiplos de 12, evidenciando dependencia temporal remanente y posible estacionalidad no modelada. Finalmente, el histograma muestra una distribución con colas amplias y cierta desviación respecto a la normalidad. En conjunto, estos resultados sugieren que los residuos no se comportan completamente como ruido blanco y que podría considerarse un modelo alternativo.

Pronostico Modelo (1,1,1)

El pronóstico manual no refleja el comportamiento observado. Mientras la serie real muestra una tendencia creciente de aproximadamente 23.8 mil a 30.1 mil microempresas, el modelo proyecta una leve caída de 22.5 mil a 21.8 mil. La divergencia entre ambas trayectorias evidencia subestimación sistemática y baja capacidad predictiva para el periodo evaluado.

MODELO (2,1,1)

## Series: train_ts 
## ARIMA(2,1,1) 
## 
## Coefficients:
##           ar1      ar2     ma1
##       -0.5563  -0.2805  0.0184
## s.e.   0.4092   0.1860  0.4356
## 
## sigma^2 = 18272724:  log likelihood = -1377.56
## AIC=2763.11   AICc=2763.41   BIC=2774.91
## 
## Training set error measures:
##                    ME     RMSE      MAE       MPE     MAPE     MASE
## Training set 49.77002 4214.024 2914.542 -53.05731 65.77968 0.770223
##                      ACF1
## Training set -0.001933299
## 
## z test of coefficients:
## 
##     Estimate Std. Error z value Pr(>|z|)
## ar1 -0.55633    0.40918 -1.3596   0.1739
## ar2 -0.28052    0.18601 -1.5081   0.1315
## ma1  0.01841    0.43557  0.0423   0.9663

En este caso, un MAPE de 65.77% indica que el error porcentual absoluto promedio del modelo es elevado, por lo que su capacidad predictiva resulta limitada. Adicionalmente, en la prueba de significancia de coeficientes, ningún parametro resultó ser estadísticamente significativo.

## 
##  Ljung-Box test
## 
## data:  Residuals from ARIMA(2,1,1)
## Q* = 98.902, df = 21, p-value = 4.511e-12
## 
## Model df: 3.   Total lags used: 24

El diagnóstico de residuos del modelo ARIMA(2,1,1) sugiere que el ajuste no es completamente satisfactorio. Aunque los residuos oscilan alrededor de cero, se siguen observando picos pronunciados y episodios de alta volatilidad, la función de autocorrelación de los residuos presenta rezagos significativos, particularmente en los múltiplos de 12, evidenciando dependencia temporal remanente y posible estacionalidad no modelada. Finalmente, el histograma muestra una distribución con colas amplias y cierta desviación respecto a la normalidad. En conjunto, estos resultados sugieren que los residuos no se comportan completamente como ruido blanco y que podría considerarse un modelo alternativo.

Pronostico Modelo (2,1,1)

El pronóstico manual no representa fielmente el comportamiento observado. Mientras la serie real muestra una tendencia creciente, el modelo se queda lejos de poder acercase a los niveles del comportamiento real. La divergencia entre ambas trayectorias evidencia subestimación sistemática y baja capacidad predictiva para el periodo evaluado.

Modelo ARIMA automático

## Series: train_ts 
## ARIMA(1,1,2) 
## 
## Coefficients:
##          ar1     ma1     ma2
##       0.7962  -1.395  0.4099
## s.e.  0.1080   0.136  0.1249
## 
## sigma^2 = 17271840:  log likelihood = -1374.12
## AIC=2756.25   AICc=2756.54   BIC=2768.04
## 
## Training set error measures:
##                     ME     RMSE      MAE       MPE     MAPE      MASE
## Training set -350.2672 4096.988 2819.345 -61.59494 71.19438 0.7450655
##                     ACF1
## Training set -0.03368095

Significancia de coeficientes

## 
## z test of coefficients:
## 
##     Estimate Std. Error  z value  Pr(>|z|)    
## ar1  0.79623    0.10795   7.3758 1.634e-13 ***
## ma1 -1.39504    0.13599 -10.2586 < 2.2e-16 ***
## ma2  0.40986    0.12491   3.2813  0.001033 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Modelo automatico (1,1,2), Si bien los parametros resultan significativos en el modelo automatico vemos que la capacidad predictiva del modelo es bastante pobre (MAPE: 71%)

## Series: train_ts 
## ARIMA(1,1,2) 
## 
## Coefficients:
##          ar1     ma1     ma2
##       0.7962  -1.395  0.4099
## s.e.  0.1080   0.136  0.1249
## 
## sigma^2 = 17271840:  log likelihood = -1374.12
## AIC=2756.25   AICc=2756.54   BIC=2768.04
## 
## Training set error measures:
##                     ME     RMSE      MAE       MPE     MAPE      MASE
## Training set -350.2672 4096.988 2819.345 -61.59494 71.19438 0.7450655
##                     ACF1
## Training set -0.03368095

## 
##  Ljung-Box test
## 
## data:  Residuals from ARIMA(1,1,2)
## Q* = 96.796, df = 21, p-value = 1.059e-11
## 
## Model df: 3.   Total lags used: 24

Pronostico Arima automatico (1,1,2)

El modelo autoARIMA(1,1,2) no captura completamente la serie. Los residuos están centrados en cero, pero presentan picos atípicos. La ACF muestra autocorrelaciones significativas en los rezagos 12, 24 y 36, señal de estacionalidad no modelada. Por ello, los residuos no son ruido blanco y conviene probar un SARIMA.

Modelo SARIMA automático

Este modelo actua como una solución o mejora al modelo arima tradicional ya que recoge el efecto estacional de las variables, es recomendable por tanto para datos que si tienen un componente estacional fuerte.

## Series: train_ts 
## ARIMA(1,0,1)(0,1,1)[12] 
## 
## Coefficients:
##          ar1      ma1     sma1
##       0.8746  -0.2985  -0.7394
## s.e.  0.0605   0.1185   0.0924
## 
## sigma^2 = 8324787:  log likelihood = -1223.75
## AIC=2455.5   AICc=2455.82   BIC=2466.97

El modelo Sarima identificado es (1,0,1)(0,1,1)[12]

## Series: train_ts 
## ARIMA(1,0,1)(0,1,1)[12] 
## 
## Coefficients:
##          ar1      ma1     sma1
##       0.8746  -0.2985  -0.7394
## s.e.  0.0605   0.1185   0.0924
## 
## sigma^2 = 8324787:  log likelihood = -1223.75
## AIC=2455.5   AICc=2455.82   BIC=2466.97
## 
## Training set error measures:
##                     ME     RMSE      MAE       MPE  MAPE      MASE         ACF1
## Training set -322.1784 2728.628 1825.859 -50.98308 58.55 0.4825179 0.0009821262

## 
##  Ljung-Box test
## 
## data:  Residuals from ARIMA(1,0,1)(0,1,1)[12]
## Q* = 17.954, df = 21, p-value = 0.6519
## 
## Model df: 3.   Total lags used: 24

El modelo SARIMA ARIMA(1,0,1)(0,1,1)[12] muestra una mejora clara frente a los modelos anteriores. Los residuos están más concentrados alrededor de cero y la ACF presenta menos autocorrelaciones significativas, aunque aún persisten algunos rezagos aislados y un choque atípico en 2020. El histograma se aproxima mejor a una distribución normal. En conjunto, el ajuste es más sólido y la incorporación del componente estacional captura mejor la dinámica de la serie, aunque todavía no elimina completamente todas las irregularidades.

Pronostico SARIMA(1,0,1)(0,1,1)[12]

El pronóstico reproduce la dirección creciente de la serie observada, pero subestima su magnitud. Aunque ambas trayectorias son ascendentes, el valor proyectado crece más lentamente y termina por debajo del observado. Esto indica una capacidad predictiva moderada, con sesgo a la baja en el periodo evaluado.

Modelos Sarima Ajustados

Realizando un analisis de los rezagos significativos, se consideró los valores p= 3 y p=4 ya que se acercaban considerablemente a sobrepasar las bandas de significancia. De la misma forma se consideró usar el valor q= 2 propuesto por el modelo automatico. Posteriormente, se hizo diferentes pruebas tanto en modelos ARIMA y SARIMA.

Los dos que obtuvieron una mejor capacidad de pronostico fueron los siguientes:

Sarima (4,1,1)(0,1,1)[12] y Sarima (4,1,2)(0,1,1)[12]

## Series: train_ts 
## ARIMA(4,1,1)(0,1,1)[12] 
## 
## Coefficients:
##           ar1      ar2      ar3      ar4     ma1     sma1
##       -1.0895  -0.5005  -0.2474  -0.1317  0.7546  -0.7317
## s.e.   0.1780   0.1369   0.1300   0.0905  0.1675   0.0967
## 
## sigma^2 = 8811301:  log likelihood = -1216.19
## AIC=2446.37   AICc=2447.3   BIC=2466.39
## 
## Training set error measures:
##                    ME     RMSE      MAE       MPE     MAPE      MASE
## Training set 78.13262 2762.666 1892.127 -46.34084 56.64467 0.5000305
##                      ACF1
## Training set -0.003682808

## 
##  Ljung-Box test
## 
## data:  Residuals from ARIMA(4,1,1)(0,1,1)[12]
## Q* = 14.415, df = 18, p-value = 0.7017
## 
## Model df: 6.   Total lags used: 24

El modelo ARIMA(4,1,1)(0,1,1)[12] mejora ligeramente el ajuste MAPE = 56.64% frente al anterior. Los residuos están centrados en cero, pero aún aparecen algunos rezagos significativos y un choque atípico en 2020. En general, captura mejor la dinámica de la serie, aunque no elimina totalmente las irregularidades.

Pronostico SARIMA (4,1,1)(0,1,1)[12]

Nota: El analisis de los pronosticos se realizó en una tabla comparativa en el parte de abajo.

SARIMA AJUSTADO (4,1,2)(0,1,1)[12]

## Series: train_ts 
## ARIMA(4,1,2)(0,1,1)[12] 
## 
## Coefficients:
##           ar1      ar2      ar3      ar4     ma1     ma2     sma1
##       -1.8985  -1.6917  -0.6916  -0.2560  1.6069  0.9999  -0.7710
## s.e.   0.0877   0.1813   0.1816   0.0867  0.0344  0.0370   0.0954
## 
## sigma^2 = 8329886:  log likelihood = -1214.35
## AIC=2444.7   AICc=2445.9   BIC=2467.58
## 
## Training set error measures:
##                    ME     RMSE      MAE      MPE     MAPE      MASE        ACF1
## Training set 73.33781 2675.194 1882.308 -45.2076 55.53071 0.4974357 -0.01589241

## 
##  Ljung-Box test
## 
## data:  Residuals from ARIMA(4,1,2)(0,1,1)[12]
## Q* = 13.905, df = 17, p-value = 0.6738
## 
## Model df: 7.   Total lags used: 24

El modelo ARIMA(4,1,2)(0,1,1)[12] presenta el mejor ajuste hasta ahora (AIC = 2444.7; MAPE = 55.53%). Los residuos se concentran alrededor de cero y muestran menor autocorrelación, aunque persiste un choque atípico en 2020 y algunos rezagos aislados. En conjunto, es el modelo más sólido entre los evaluados.

Pronostico SARIMA (4,1,2)(0,1,1)[12]

Comparativa de Desempeño - Dentro de la Muestra

Comparativa de Desempeño (Dentro de la Muestra - 2 Meses)
Fecha Real Pronóstico Modelo Dif. Absoluta MAPE %
2025-11-01 23791 26215.55 SARIMA (4,1,1) 2424.55 10.19
2025-12-01 30135 30346.85 SARIMA (4,1,1) 211.85 0.70
26963 28281.20 Promedio SARIMA (4,1,1) 1318.20 5.45
2025-11-01 23791 26146.08 SARIMA (4,1,2) 2355.08 9.90
2025-12-01 30135 30758.50 SARIMA (4,1,2) 623.50 2.07
26963 28452.29 Promedio SARIMA (4,1,2) 1489.29 5.98

Por ende el Modelo escogido como optimo es el SARIMA (4,1,1)(0,1,1)[12] ya que tanto su diferencia absoluta como Mape son menores a los otros modelos analizados.

Pronostico fuera de muestra SARIMA (4,1,1)(0,1,1)[12]

## [1] "Pronóstico Venta de Vehiculos a nivel nacional para Enero de 2026: 2026 = 19117.614500541"

Desiciónes Estrategicas