Mazda Motor Corporation es una empresa japonesa fabricante de automóviles fundada en 1920 en Hiroshima, Japón, bajo el nombre de Toyo Cork Kogyo Co., Ltd. Con más de un siglo de historia, la compañía ha evolucionado desde la producción de maquinaria industrial hasta convertirse en uno de los fabricantes de vehículos más reconocidos a nivel mundial. A lo largo de su trayectoria, Mazda ha destacado por su filosofía de diseño e ingeniería conocida como “Jinba Ittai” (unidad entre el jinete y el caballo), que refleja su compromiso por crear vehículos que ofrezcan una experiencia de conducción única, emocionante y centrada en el conductor. Esta visión se materializa en su línea de diseño KODO – Soul of Motion, caracterizada por formas dinámicas, elegantes y con una fuerte identidad visual. Mazda también es reconocida por su espíritu innovador, siendo pionera en el desarrollo y uso comercial del motor rotativo Wankel, y más recientemente, por su tecnología de motor de combustión SKYACTIV, orientada a maximizar la eficiencia energética sin sacrificar el rendimiento. En línea con las tendencias globales de movilidad sostenible, la marca ha incursionado en la electrificación de su gama con modelos híbridos y completamente eléctricos. Con presencia en más de 130 países y una red global de producción y distribución, Mazda combina la precisión y calidad japonesas con una propuesta de valor diferenciada que la distingue en el competitivo mercado automotriz mundial.
El sector automotor en el Valle del Cauca constituye un componente relevante dentro de la dinámica comercial y de consumo del departamento, al estar estrechamente ligado al comportamiento económico de los hogares y al desempeño general de la economía. En este contexto, la comercialización de vehículos nuevos refleja no solo las condiciones del mercado, sino también la capacidad adquisitiva, las expectativas de los consumidores y la evolución de distintos indicadores macroeconómicos. De acuerdo con información del gremio ANDEMOS, el comportamiento de las matrículas de vehículos en la región ha presentado fluctuaciones importantes en los últimos años, como se evidencia en el gráfico de líneas, donde se observan periodos de crecimiento, caídas significativas (especialmente alrededor de 2020) y posteriores procesos de recuperación. Para el desarrollo de este análisis se ha seleccionado como objeto específico de estudio la marca Mazda, cuyas ventas en el Valle del Cauca permiten ilustrar de manera detallada la dinámica del mercado automotor regional. La información mensual presentada evidencia patrones estacionales en la demanda, así como variaciones interanuales que responden tanto a factores económicos como a cambios en las preferencias del consumidor. Este enfoque permite no solo analizar el comportamiento histórico de la marca, sino también entender su sensibilidad frente a cambios en el entorno económico.
Importancia de las variables seleccionadas
ICC: El Índice de Confianza del Consumidor es una variable clave para pronosticar la venta de vehículos, ya que refleja la percepción que tienen los hogares sobre su situación económica actual y futura, así como su disposición a realizar compras importantes. Al tratarse de un bien duradero y de alto valor, la compra de vehículos está altamente influenciada por el nivel de optimismo o pesimismo de los consumidores.
Ventas de vehiculos Valle: La variable de Ventas de vehículos nuevos del Valle es la variable objetivo principal del modelo de pronóstico, ya que representa de manera directa el número de vehículos comercializados en el departamento durante cada periodo analizado. Esta variable, reportada por Fenalco, refleja el comportamiento real del mercado automotor regional y sintetiza la respuesta del consumidor frente a factores económicos, financieros y de confianza. Su importancia radica en que permite identificar tendencias históricas, patrones estacionales, ciclos de crecimiento o desaceleración y posibles cambios estructurales en el consumo de vehículos desde 2012 hasta 2025.
ISE: El Índice de Seguimiento a la Economía Nacional es una variable importante dentro del modelo de pronóstico porque permite medir el comportamiento mensual de la actividad económica del país, funcionando como un indicador similar a un PIB de alta frecuencia.
Matriz de correlación entre variables
> Interpretación: La correlación entre el ISE y los
vehículos nuevos tiende a ser positiva: en períodos de mayor actividad
económica general se registran más matrículas. El ICC, al ser un índice
de expectativas subjetivas, puede anticiparse algunos meses al
movimiento real de ventas.
Analisis: El mercado de vehículos en el Valle del Cauca ha mostrado una volatilidad significativa marcada por choques externos y ciclos económicos. Tras alcanzar un máximo histórico en enero de 2012 (2,876.3 unidades), impulsado por el optimismo del TLC con Estados Unidos, el sector enfrentó su primer punto crítico en agosto de 2012 (2,319.9 unidades) debido a ajustes en las tasas de interés locales. La caída más drástica ocurrió en junio de 2020 (1,611.8 unidades), consecuencia directa de los confinamientos por la pandemia del COVID-19 que paralizaron la actividad comercial. Posteriormente, el registro de septiembre de 2023 (1,299.1 unidades) reflejó el impacto de la alta inflación y la devaluación del peso, que encarecieron los vehículos importados. No obstante, desde finales de 2023 se observa un cambio de ciclo positivo, consolidando una tendencia al alza que proyecta una recuperación sostenida hasta octubre de 2025, favorecida por la estabilización de los tipos de interés y una demanda represada que comienza a dinamizar nuevamente el ecosistema comercial de la región.
Gráfico variable original y tendencia variable 1: tasa de crecimiento anual
Interpretación: El comportamiento de la tasa de crecimiento refleja una transición crítica desde una contracción profunda hacia una fase de estabilización positiva. En julio de 2023, el sector registró una caída severa del -35.41%, un punto mínimo influenciado por las tasas de interés en su nivel más alto de la década y una inflación persistente que deprimió el consumo en el Valle del Cauca. Sin embargo, a partir de ese momento se observa una recuperación exponencial durante 2024, alcanzando un crecimiento del 20.29% en septiembre de 2024. Este repunte responde a una corrección del mercado y al inicio de la flexibilización en la política monetaria. Hacia el cierre del periodo, el crecimiento entra en una etapa de madurez más pausada, logrando un 28.40% en octubre de 2025. Este crecimiento más lento pero constante sugiere que el mercado ha superado el choque de años anteriores, moviéndose hacia una expansión orgánica apoyada en una mayor confianza del consumidor y mejores condiciones de financiación.
Tasa de crecimiento de la serie original vs tendencia: variable 2
Interpretación: Cuando el ICC cae sistemáticamente por debajo de cero, los consumidores perciben que su situación económica empeora, lo que se traduce en postergación de compras de bienes durables como los vehículos.
Tasa de crecimiento de la serie original vs tendencia: variable 3
Conclusión de señales: La correlación positiva entre las tres variables es robusta en el largo plazo, pero en el corto plazo el ICC actúa como indicador adelantado. Un ISE dinámico no garantiza por sí solo ventas altas si la confianza del consumidor no acompaña.
Se elige VEH_V (vehículos nuevos Valle) como variable objetivo del pronóstico, ya que es el indicador más directo de las ventas de Mazda y el que permite decisiones concretas de inventario y financiamiento.
Metodología Box-Jenkins
Se realiza una división de entrenamiento y pruebas entre enero 2012 - sep 2025 (Entrenamiento) y Octubre - Diciembre 2025 (Prueba)
## Observaciones en entrenamiento: 165
## Observaciones en prueba : 3
Se aplica el test ADF (Dickey-Fuller) para validar estacionariedad en el conjunto de entrenamiento de la variable 1, que es la elegida para pronosticar:
##
## Augmented Dickey-Fuller Test
##
## data: train_ts
## Dickey-Fuller = -4.3422, Lag order = 5, p-value = 0.01
## alternative hypothesis: stationary
El p-valor del test ADF es menor a 0.05 → la serie es estacionaria. d = 1 para todos los modelos ARIMA.
Modelo: El ACF muestra un corte significativo en el rezago 1–2, lo que sugiere q ∈ {1, 2}. El PACF presenta caída gradual, compatible con p = 1, 2. Se estima como punto de partida un ARIMA(1,1,2).
## Series: train_ts
## ARIMA(1,1,2)
##
## Coefficients:
## ar1 ma1 ma2
## -0.6000 0.1572 -0.5493
## s.e. 0.1467 0.1550 0.0854
##
## sigma^2 = 140790: log likelihood = -1203.61
## AIC=2415.21 AICc=2415.46 BIC=2427.61
##
## Training set error measures:
## ME RMSE MAE MPE MAPE MASE
## Training set -7.365402 370.6445 266.1281 -240.9326 251.6814 0.6966465
## ACF1
## Training set 0.02230483
Significancia de coefientes
##
## z test of coefficients:
##
## Estimate Std. Error z value Pr(>|z|)
## ar1 -0.599968 0.146683 -4.0902 4.309e-05 ***
## ma1 0.157184 0.154958 1.0144 0.3104
## ma2 -0.549295 0.085396 -6.4323 1.257e-10 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Al realizar el coeftest para verificar la significancia de los parámetros, se observa que los coeficientes ar1 y ma2 son altamente significativos y tiene un gran impacto en el modelo (p-value < 0.05), representados con tres estrellas ***
##
## Ljung-Box test
##
## data: Residuals from ARIMA(1,1,2)
## Q* = 74.997, df = 21, p-value = 5.439e-08
##
## Model df: 3. Total lags used: 24
Diagnóstico: En esta gráfica para que el modelo sea bueno, ninguna de las líneas verticales negras debería sobrepasar las líneas punteadas azules (que representan el límite de significancia estadística). Si los residuos son ruido blanco, no debería haber correlación. Sin embargo, se observa que hay líneas que sobresalen claramente de los límites azules, específicamente en los rezagos (lags) 12, 24 y 36. Por último, respecto a la gráfica de la derecha, de distribución, la línea naranja tiene forma de campana (Distribución Normal) y está centrada en el cero. Esto significa que el modelo no se equivoca sistemáticamente hacia un lado (no siempre predice por encima ni siempre por debajo), sino que sus errores son equilibrados.
La distancia vertical entre las dos líneas representa el error de pronóstico. Hacia el final del período, esta distancia es muy amplia, lo que indica que la magnitud de los errores de predicción es muy grande. Un modelo de buena calidad debería tener errores pequeños y aleatorios, con las líneas de pronóstico y observado siguiendo de cerca la una a la otra.
## Series: train_ts
## ARIMA(0,1,2)
##
## Coefficients:
## ma1 ma2
## -0.4636 -0.2689
## s.e. 0.0807 0.0956
##
## sigma^2 = 142585: log likelihood = -1205.18
## AIC=2416.37 AICc=2416.52 BIC=2425.67
##
## Training set error measures:
## ME RMSE MAE MPE MAPE MASE
## Training set -13.43009 374.1563 270.3888 -265.9302 276.4697 0.7077997
## ACF1
## Training set -0.002894499
Significancia de coeficientes
##
## z test of coefficients:
##
## Estimate Std. Error z value Pr(>|z|)
## ma1 -0.463565 0.080660 -5.7471 9.076e-09 ***
## ma2 -0.268911 0.095604 -2.8128 0.004912 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
El modelo ARIMA(0,1,2) utiliza la información de los errores cometidos en los dos períodos anteriores para mejorar la predicción actual. Esto se sabe porque el número “2” indica que se tienen en cuenta los últimos dos errores del modelo. En este caso, los valores MA1 (-0.4636) y MA2 (-0.2689) muestran que ambos errores influyen en el resultado actual. Ambos son valores significativos dado que son valores menores a 0.05 en el test ADF lo que significa que es estacional. Esto significa que el modelo no se basa en los valores pasados de la variable, sino en qué tan equivocado estuvo en predicciones anteriores, usando esa información para corregirse y mejorar sus resultados en el presente.
##
## Ljung-Box test
##
## data: Residuals from ARIMA(0,1,2)
## Q* = 85.619, df = 22, p-value = 1.886e-09
##
## Model df: 2. Total lags used: 24
Diagnostico: En esta gráfica ACF, se observa que al reducir el modelo a un ARIMA (0,1,2), los residuos han dejado de ser aleatorios. Ahora hay una cantidad significativa de retardos que superan los límites de significancia, especialmente en los ciclos de 12 meses. Esto indica que el modelo es insuficiente para capturar la realidad del mercado, ya que está dejando ‘pistas’ o patrones de comportamiento sin explicar. El histograma de los residuos para el modelo ARIMA (0,1,2) muestra una distribución que intenta aproximarse a la normalidad pero la campana de barras grises está un ligeramente más amontonada hacia el lado derecho del cero. Esto significa que el modelo tiene un pequeño sesgo positivo: tiende a predecir, en promedio, un poco menos de lo que realmente se vende en el Valle. Además, sigue habiendo barras muy lejos hacia la izquierda (cerca de -1000). Esos son los meses con comportamientos fuera de lo normal (como la pandemia) que el modelo simplemente no puede procesar correctamente.
# Generar pronóstico para el conjunto de prueba
forecast_arima_auto <- forecast(darima_auto, h = length(test_ts)) # Predecir los valores futuros
# Crear dataframe para gráfico interactivo del pronóstico
forecast_data_auto <- data.frame(Tiempo = time(forecast_arima_auto$mean),
Pronostico = as.numeric(forecast_arima_auto$mean),
Observado = as.numeric(test_ts))
# Graficar pronóstico junto con los valores observados reales
p4auto <- ggplot(forecast_data_auto, aes(x = Tiempo)) +
geom_line(aes(y = Pronostico, color = "Pronóstico")) +
geom_line(aes(y = Observado, color = "Observado")) +
ggtitle("Pronóstico vs Observado") +
xlab("Tiempo") + ylab("variable1")
ggplotly(p4auto) # Convertir el gráfico en interactivo
## Series: train_ts
## ARIMA(0,1,2)(0,0,2)[12]
##
## Coefficients:
## ma1 ma2 sma1 sma2
## -0.3820 -0.2243 0.3151 0.1779
## s.e. 0.0807 0.0931 0.0793 0.0758
##
## sigma^2 = 122809: log likelihood = -1192.61
## AIC=2395.21 AICc=2395.59 BIC=2410.71
##
## Ljung-Box test
##
## data: Residuals from ARIMA(0,1,2)(0,0,2)[12]
## Q* = 22.388, df = 20, p-value = 0.3198
##
## Model df: 4. Total lags used: 24
Diagnostico: A diferencia de los modelos anteriores, la gráfica ACF muestra que las autocorrelaciones estacionales (en los lags 12 y 24) han sido eliminadas, integrándose correctamente dentro de los límites de significancia. Esto confirma que el modelo ha procesado con éxito la estacionalidad del mercado automotriz en el Valle. Al usar un modelo estacional, las líneas han desaparecido casi por completo. En cuanto a la campana esta es, probablemente, la mejor campana de todas las anteriores. Está muy bien centrada en el cero y la línea naranja encaja casi perfectamente con las barras grises. Esto demuestra que los errores son “ruido blanco”. Es decir, el modelo no tiene favoritismos: no se equivoca siempre hacia arriba ni siempre hacia abajo. Sus errores son puramente aleatorios.
| Modelo | AIC | BIC |
|---|---|---|
| ARIMA Manual (1,1,2) | 2415.21 | 2427.61 |
| ARIMA Auto (sin estacional) | 2416.37 | 2425.67 |
| SARIMA Auto (con estacional) | 2395.21 | 2410.71 |
Criterio de selección: Al momento de seleccionar el modelo adecuado para hacer el pronostico, se toma en cuenta el menor AIC/BIC el cual indica mejor ajuste penalizado por complejidad. El modelo con menor AIC se usará para el pronóstico final.
| Período | Observado | ARIMA_Manual | ARIMA_Auto | SARIMA_Auto |
|---|---|---|---|---|
| 2025.75 | 2227 | 2110 | 2028 | 2153 |
| 2025.8333 | 2165 | 1977 | 1908 | 2135 |
| 2025.9167 | 2573 | 2057 | 1908 | 2235 |
| Modelo | MAE | RMSE | MAPE |
|---|---|---|---|
| ARIMA Manual (1,1,2) | 273.83 | 324.37 | 11.34 |
| ARIMA Auto (sin estacional) | 373.84 | 427.43 | 15.56 |
| SARIMA Auto (con estacional) | 147.32 | 200.46 | 5.95 |
Pronóstico con el modelo SARIMA
Analisís: A diferencia de los modelos más simples, el SARIMA logra detectar el punto de inflexión hacia el final del periodo (después de 2025.85). El modelo “entiende” que después de la caída viene un repunte, lo cual es un éxito de los términos estacionales que incluimos. En contraste con los demás modelos, este tiene una mayor cercanía entre el punto de inflexión entre el prónostico y lo observado. Sin embargo, sigue habiendo un espacio grande entre estas dos líneas después del punto de inflexión
Esto se debe a que el modelo SARIMA es intrínsecamente conservador: basa sus predicciones en el promedio del comportamiento histórico y los ciclos estacionales previos. La separación de las líneas indica que la realidad del mercado automotriz en el Valle del Cauca está experimentando una aceleración excepcional que supera los patrones registrados en años anteriores.
| Período | Pronostico | IC_Inferior_80 | IC_Superior_80 | IC_Inferior_95 | IC_Superior_95 |
|---|---|---|---|---|---|
| 2025.75 | 2153 | 1704 | 2602 | 1466 | 2840 |
| 2025.8333 | 2135 | 1607 | 2663 | 1328 | 2943 |
| 2025.9167 | 2235 | 1678 | 2792 | 1384 | 3087 |
| 2026 | 1984 | 1400 | 2568 | 1090 | 2877 |
## === PRONÓSTICO ENERO 2026 ===
## Vehículos nuevos estimados (VEH_V): 1984 unidades
## Intervalo de confianza 95%: [ 1090 – 2877 ]
Tasa anual = comparación enero 2026 pronosticado vs enero 2025 real: 1.983 − 1.280/1.280 × 100 = 54,9% La tasa de crecimiento anual entre enero de 2025 y enero de 2026 es de 54,9%. Es decir, existe un gran crecimiento anualmente Tasa mensual = comparación enero 2026 pronosticado vs diciembre 2025 real: 2.5731.983−2.573×100= −22,9% Hubo una caída mensual entre diciembre de 2025 a enero de 2026. Sin embargo, el crecimiento sigue siendo ascendente por el registro anual.
El mercado automotor en el Valle del Cauca muestra una tendencia de largo plazo positiva (más matrículas en 2023–2025 que en 2012), pero con mayor volatilidad desde la pandemia. La desaceleración del ICC sugiere que los consumidores son más selectivos y tardan más en decidir una compra de alto valor.
1. Consolidar el liderazgo en SUV antes de que la competencia lo haga
Mazda ocupa el 3er lugar nacional en enero 2026 con 1.623 unidades y un crecimiento del 29,5%. Pero el segmento que más creció en enero fue precisamente el SUV: 11.270 unidades a nivel nacional, +43,5%. El modelo más vendido de Mazda fue el CX-30 (4° lugar nacional con 584 unidades, +37,4%), seguido del CX-5 (14° lugar, 358 unidades, +113,1%**). El CX-5 es la señal más importante: un crecimiento de 113% indica demanda reprimida que se está liberando. La recomendación es priorizar el inventario y la gestión comercial hacia el portafolio SUV (CX-30, CX-5, CX-50 si disponible) en el Valle del Cauca, especialmente en el primer semestre, que históricamente es el de mayor dinamismo relativo según la tendencia de la serie.
2. Diseñar una estrategia específica para Cali como plaza prioritaria
Cali fue la 3ª ciudad del país en ventas de vehículos nuevos en enero 2026 con 1.593 unidades y un crecimiento del 36,6%. El Valle como departamento registró 1.779 unidades (+39%), lo que indica que Cali concentra aproximadamente el 89% de las ventas del departamento. Esto significa que casi todo el volumen del Valle pasa por los concesionarios de Cali. La recomendación es diseñar campañas de inicio de año (enero–febrero) orientadas específicamente a Cali, aprovechando que el modelo muestra que enero es el mes de mayor caída mensual pero de crecimiento anual robusto: es el momento ideal para captar clientes que no cerraron compra en diciembre con planes de cuota inicial diferida o financiamiento blando para el primer mes del año.
3. Usar el ICC_V como termómetro de alerta temprana
La matriz de correlación del análisis muestra que el ICC tiene una correlación de 0,55 con las ventas de vehículos en el Valle, mientras que el ISE tiene una correlación negativa de -0,26. Esto significa que las ventas en el Valle no siguen el PIB nacional, sino el “ánimo” del consumidor local. La recomendación práctica es que los tomadores de decisión de Mazda en el Valle monitoreen el ICC mensualmente. Si el índice cae por debajo de su promedio histórico durante dos meses consecutivos, es una señal anticipada de que las ventas caerán antes de que el impacto se refleje en el RUNT. Eso da tiempo para ajustar inventario, tasas de financiación y estrategia de precios.