Intruducción
El sector automotriz en Colombia es uno de lo más importantes para lograr comprender cómo es el comportamiento de la economía del país. En este ámbito, cuando las ventas de vehículos bajan o suben, es una señal de que los colombianos tienen capital para adquirir o no un automóvil, lo cual puede estar relacionado directamente con el Producto Interno Bruto del país, la tasa de empleo o desempleo y las tasas de interés de un credito para dicha compra, un ejemplo claro es cuando el PIB crece y el desempleo baja; las familias colombianas aumentan su capacidad de compra y el mercado automotor tiene mayor dinamismo.
Ante este comportamiento, es necesario estudiar la evolución de estas ventas en una línea de tiempo, no solo nos permite entender qué pasó en el mercado frente a comportamientos inusuales, sino que también lograr hacer previsiones sobre futuras ventas y así tomar decisiones frente a periodos de recisión económica.
Este artículo analiza dos series tomadas de la base de datos pública del Departamento Administrativo Nacional de Estadística (DANE) de Colombia, en la sección de comercio de vehículos. https://www.dane.gov.co/index.php/estadisticas-por-tema/comercio-interno/comercio-de-vehiculos
La primera serie corresponde a la cantidad vendida de automóviles particulares de fabricación nacional cada trimestre desde el año 1997 hasta el primer trimestre del año 2014, y la segunda serie registra las ventas de vehículos de transporte público de fabricación nacional. Con un total de 69 trimestre evaluados, durante este periodo ocurrieron eventos económicos importantes para Colombia, como la crisis a finales de los noventa, la recuperación de los años 2000 y otra crisis financiera en el 2008.
Justificación
Entender este sector de la economía colombiana y analizarlo mediante dos series en el tiempo desde una perspectiva estadística permite comprender patrones en el comportamiento de las ventas de vehículos, como la tendencia, la estacionalidad de las ventas y el impacto de las crisis financieras.
Finalmente, proponer un modelo de series de tiempo permite describir lo que ocurrío durante este lapso de tiempo si no que también ofrecer una previsión de como va hacer el compotamiento de las ventas a futuro teniendo en cuenta hechos históricos para la toma de decisiones frente a periodos de mayor y menor ventas.
Primera Serie: Comportamiento de las Ventas Trimestrales de Automóviles Particulares de Producción Nacional en Colombia: Un Análisis de Series de Tiempo 1997–2014
## Qtr1 Qtr2 Qtr3 Qtr4
## 1997 8102 9713 10153 10609
## 1998 8372 7919 6402 5226
## 1999 3898 4424 5399 6242
## 2000 6063 8301 8781 9097
## 2001 8842 11111 13915 14043
## 2002 11819 14205 13762 11968
## 2003 9062 9996 9951 11073
## 2004 10796 14507 16296 19270
## 2005 16026 19492 19747 20274
## 2006 20911 21036 25281 28495
## 2007 28889 33659 35889 37379
## 2008 20683 21354 23744 24086
## 2009 16107 16779 18966 21864
## 2010 19693 23250 28184 31830
## 2011 33159 34311 29226 29061
## 2012 25888 29256 19234 20407
## 2013 17811 20601 19478 21532
## 2014 18554
| Trimestre | Media | Mediana | Min | Max | DE |
|---|---|---|---|---|---|
| 1 | 15815.28 | 16066.5 | 3898 | 33159 | 8177.87 |
| 2 | 17642.00 | 16779.0 | 4424 | 34311 | 8948.07 |
| 3 | 17906.35 | 18966.0 | 5399 | 35889 | 8607.79 |
| 4 | 18968.00 | 20274.0 | 5226 | 37379 | 9339.90 |
| año | Media | Mediana | Min | Max | Total |
|---|---|---|---|---|---|
| 1997 | 9644.25 | 9933.0 | 8102 | 10609 | 38577 |
| 1998 | 6979.75 | 7160.5 | 5226 | 8372 | 27919 |
| 1999 | 4990.75 | 4911.5 | 3898 | 6242 | 19963 |
| 2000 | 8060.50 | 8541.0 | 6063 | 9097 | 32242 |
| 2001 | 11977.75 | 12513.0 | 8842 | 14043 | 47911 |
| 2002 | 12938.50 | 12865.0 | 11819 | 14205 | 51754 |
| 2003 | 10020.50 | 9973.5 | 9062 | 11073 | 40082 |
| 2004 | 15217.25 | 15401.5 | 10796 | 19270 | 60869 |
| 2005 | 18884.75 | 19619.5 | 16026 | 20274 | 75539 |
| 2006 | 23930.75 | 23158.5 | 20911 | 28495 | 95723 |
| 2007 | 33954.00 | 34774.0 | 28889 | 37379 | 135816 |
| 2008 | 22466.75 | 22549.0 | 20683 | 24086 | 89867 |
| 2009 | 18429.00 | 17872.5 | 16107 | 21864 | 73716 |
| 2010 | 25739.25 | 25717.0 | 19693 | 31830 | 102957 |
| 2011 | 31439.25 | 31192.5 | 29061 | 34311 | 125757 |
| 2012 | 23696.25 | 23147.5 | 19234 | 29256 | 94785 |
| 2013 | 19855.50 | 20039.5 | 17811 | 21532 | 79422 |
| 2014 | 18554.00 | 18554.0 | 18554 | 18554 | 18554 |
Al analizar detalladamente las ventas por trimestre, se puede identificar un patrón estacional a lo largo de la serie. Las ventas en promedio para los primeros trimestres registran los valores más bajos con 15.815 unidades vendidas, mientras tanto para las ventas en promedio para el cuarto trimestre, es decir cierre de año se registran las ventas más altas con 18.968 unidades de vehículo particulares, este comportamiento puede traducirse en que para los últimos meses del año los ingresos aumentan por pagos de primas, bonificaciones en el trabajo y estrategias comerciales para alcanzar las metas anuales.
Figura 1: Serie Original de las ventas de vehículos particulares por
trimeste(1997-2014-1)
la gráfica que describe como son las ventas de automóviles particulares por trimestres nos permite ver cómo es la evolución de las ventas a lo largo de casi 17 años. Desde el primer trimestre del año 1997 hasta el primer trimestre del año 1999 las ventas decrecen ya que Colombia estaba enfrentando una de sus peores crisis económicas, superada esta crisis viene un aumento en las ventas entre los trimestres de los años 2000 hasta el cuarto trimestre del 2007 donde se registró la mayor venta de vehículos particulares con un total de 37.379 unidades. Por último, vemos que para los cuatro trimestres del año 2008 se registra una nueva caída en la venta proveniente de la crisis económica mundial en el cual este sector se vio afectado. Después de este hecho histórico las ventas intentan mejorar, pero no logra ese pico alto ocurrido a finales del cuarto trimestre del año 2007.
Figura 2: Descomposición de la serie Original
AL comparar las dos descomposiciones clásicas como lo es la aditiva y multiplicativa, ambas tienen resultados similares, sin embargo, con la naturaleza de los datos el modelo multiplicativo es el adecuado para describir la tendencia creciente ocurrida antes de la crisis del 2008 y la recuperación después de esta crisis, ambas tendencias acompañadas de caídas. Lo que confirma que la serie requiere diferenciación, la estacionalidad se repite cada año, primero para el primer trimestre de cada año con las ventas más bajas y el cuarto con las ventas más altas. Finalmente, analizando estos comportamientos es importante ajustar un modelo que capture este tipo de comportamiento.
Figura 3: FAC Y FACP de la serie Original
La función de autocorrelación (FAC) permite ver que de cae lento y tarda varios rezagos para entrar en las bandas de confianza, lo que indica que hay una memoria larga, es decir, lo que ocurre en los trimestres actuales esta influenciado por lo ocurrido varios periodos atrás e incluso trimestres después del actual. Esto se traduce en que las ventas de un trimestre no son independientes de lo que paso antes, por su parte, la función de autocorrelación parcial (FACP) muestra un pico alto en el primer rezago y una caída bruscamente lo que confirma lo anterior dicho.
Figura 4: Histograma de los datos originales Histograma:
La distribución de las ventas refleja que no se comporta de forma simétrica, si no que presenta agrupaciones una antes de la media y otra después, también se observa que la mediana y la media acompañada de una cola hacia la derecha que refleja las ventas altas que superan la media.
Figura 5: Boxplot por Trimestre Boxplot por trimestre: El primer
trimestre es el de menores ventas con la mediana más baja de los cuatro,
mientras que tercer y cuarto presentan las medianas más altas y las
cajas mas grandes, lo que indica no solo mayores ventas sino también
mayor variabilidad. Este comportamiento confirma la presencia de un
patrón estacional donde las ventas se activa en los dos ultimos
trimestres de cada año, alcanzando las mayores ventas hacia el cierre de
cada período anual.
Figura 6: Mapa de calor ventas trimestrales Mapa de calor: El mapa de
calor confirma visualmente las tres fases del mercado. Los colores más
oscuros se concentran en 2007 y 2011, lo que identifica las mayores
ventas de automóviles particulares para esos años, mientras que los
tonos más claros dominan el período 1997–2000, los años más críticos.
Figura 7: Boxplot por año Boxplot por año:
El boxplot por año muestra la tendencia creciente que ya se mencionó y la caída posterior en consecuencia con las crisis, acompañado de valores atípicos en los años 2000, 2003 y 2005 lo que indica caídas drásticas en las ventas para el comienzo del primer trimestre de cada año.
Identificación del problema
La serie que explica las ventas trimestrales de vehículos particulares de producción nacional durante el periodo de 1997 hasta 2014 evidencia un problema de tendencia y estacionalidad que se traduce en un problema a raíz de los choques económicos externos que impactaron de forma significativa en el mercado automotor. Durante 1998 y 1999 las ventas registraron caídas pronunciadas como consecuencia por la crisis económica colombiana, posteriormente con una recuperación económica con su trimestre más productivo en el 2007 con una posterior caída en los trimestres del año 2008 en consecuencia con la crisis mundial.
Esta volatilidad tiene implicaciones en el análisis estadístico para la toma de decisiones en el sector automotor. Por esta razón es fundamental aplicar pruebas estadísticas para ajustar un modelo que capture esta dinámica del mercado para garantizar previsiones confiables para la planeación frente a situaciones anormales de la economía que afectan al mercado automotor.
Prueba de Hipotesis
Prueba ADF:
\[H_0: \text{La serie posee raíz unitaria (no es estacionaria)}\] \[H_1: \text{La serie es estacionaria}\]
Prueba KPSS:
\[H_0: \text{La serie es estacionaria}\] \[H_1: \text{La serie no es estacionaria (posee raíz unitaria)}\]
##
## Augmented Dickey-Fuller Test
##
## data: autos_ts
## Dickey-Fuller = -3.7, Lag order = 4, p-value = 0.03139
## alternative hypothesis: stationary
##
## #######################
## # KPSS Unit Root Test #
## #######################
##
## Test is of type: mu with 3 lags.
##
## Value of test-statistic is: 1.281
##
## Critical value for a significance level of:
## 10pct 5pct 2.5pct 1pct
## critical values 0.347 0.463 0.574 0.739
##
## #######################
## # KPSS Unit Root Test #
## #######################
##
## Test is of type: tau with 3 lags.
##
## Value of test-statistic is: 0.1546
##
## Critical value for a significance level of:
## 10pct 5pct 2.5pct 1pct
## critical values 0.119 0.146 0.176 0.216
Al aplicar las pruebas de estacionariedad en la serie original se obtuvieron resultados contradictorios entre los test, la prueba de ADF arroja un p-value de 0.031 al ser comparado con un nivel de significancia del 0.05 la hipótesis nula se rechaza, es decir la serie es estacionaria, sin embargo la prueba KPSS con tendencia registra un estadístico de 0.1546 en comparación con el valor crítico del 5% de 0.146 se rechaza la hipótesis nula lo que se concluye que la serie no es estacionaria, de igual manera la prueba KPSS sin tendencia también rechaza la hipótesis nula indicando presencia de no estacionariedad. Ante esta contradicción en las pruebas dan indicio de que la serie no es estacionaria, por lo que requiere diferenciación de d=1 para eliminar la tendencia y D=1 para eliminar el patrón de estacionariedad.
La diferenciación para la tendencia queda expresado de la siguiente manera:
\[\Delta y_t = y_t - y_{t-1}\] le resta a cada observación trimestral la del mismo trimestre del año anterior
La diferenciación para eliminar la estacionariedad queda expresado de la siguiente manera:
\[\Delta_4 y_t = y_t - y_{t-4}\] Es decir, al primer trimestre de 2005 le resta el primer trimestre de 2004, al segundo de 2005 le resta el segundo de 2004, y así sucesivamente. Con esto se elimina el patrón que se repetía cada año.
El modelo con las dos diferenciaciones aplicadas queda expresado de la siguiente manera:
\[SARIMA(p,1,q)(P,1,Q)_4\]
La ecuación general del modelo es:
\[\Phi_P(B^4)\phi_p(B)(1-B)(1-B^4)y_t = \Theta_Q(B^4)\theta_q(B)\varepsilon_t\]
##
## Augmented Dickey-Fuller Test
##
## data: autos_diff1
## Dickey-Fuller = -3.3472, Lag order = 4, p-value = 0.07169
## alternative hypothesis: stationary
##
## #######################
## # KPSS Unit Root Test #
## #######################
##
## Test is of type: mu with 3 lags.
##
## Value of test-statistic is: 0.097
##
## Critical value for a significance level of:
## 10pct 5pct 2.5pct 1pct
## critical values 0.347 0.463 0.574 0.739
##
## #######################
## # KPSS Unit Root Test #
## #######################
##
## Test is of type: tau with 3 lags.
##
## Value of test-statistic is: 0.0637
##
## Critical value for a significance level of:
## 10pct 5pct 2.5pct 1pct
## critical values 0.119 0.146 0.176 0.216
| Prueba | Estadístico | Val..crítico.5. | p.value | Conclusión |
|---|---|---|---|---|
| ADF | -3.3472 | — | 0.0717 | No se rechaza H0 |
| KPSS (sin tendencia) | 0.0970 | 0.463 | — | No se rechaza H0 |
| KPSS (con tendencia) | 0.0637 | 0.146 | — | No se rechaza H0 |
Para ADF Como 0.071 > 0.05 no se rechaza H₀, lo que significa que aún hay algo de evidencia de no estacionariedad.
Para KPSS sin tendencia: Como 0.097 < 0.463 (valor crítico al 5%) no se rechaza H₀, es decir la serie ya es estacionaria después de aplicar d=1.
Para KPSS con tendencia: Como 0.063 < 0.146 (valor crítico al 5%) no se rechaza H₀, confirmando que la serie ya es estacionaria incluso cuando se considera la tendencia.
##
## Augmented Dickey-Fuller Test
##
## data: autos_diff_est
## Dickey-Fuller = -4.7771, Lag order = 3, p-value = 0.01
## alternative hypothesis: stationary
##
## #######################
## # KPSS Unit Root Test #
## #######################
##
## Test is of type: mu with 3 lags.
##
## Value of test-statistic is: 0.03
##
## Critical value for a significance level of:
## 10pct 5pct 2.5pct 1pct
## critical values 0.347 0.463 0.574 0.739
##
## #######################
## # KPSS Unit Root Test #
## #######################
##
## Test is of type: tau with 3 lags.
##
## Value of test-statistic is: 0.0299
##
## Critical value for a significance level of:
## 10pct 5pct 2.5pct 1pct
## critical values 0.119 0.146 0.176 0.216
| Prueba | Estadístico | Val. crítico 5% | p-value | Decisión | Conclusión |
|---|---|---|---|---|---|
| ADF | -4.7771 | — | < 0.01 | Se rechaza H0 | ESTACIONARIA |
| KPSS (sin tendencia) | 0.0300 | 0.463 | — | No se rechaza H0 | ESTACIONARIA |
| KPSS (con tendencia) | 0.0299 | 0.146 | — | No se rechaza H0 | ESTACIONARIA |
Al aplicar ambas diferenciaciones ya se tiene una serie sin tendencia y
que es estacionaria, que se puede confirmar con el análisis de FAC y
FACP que ahora la mayoría de los valores caen dentro de la banda de
confianza después del lag 1. Esto confirma que las dos diferenciaciones
eliminaron exitosamente tanto la tendencia como la estacionalidad.
Por lo tanto proponemos tres modelos para modelar la serie diferenciada.
El Modelo 1 corresponde a un \(SARIMA(1,1,0)(1,1,0)_4\)
El Modelo 2 corresponde a un \(SARIMA(0,1,1)(0,1,1)_4\)
El Modelo 3 corresponde al modelo seleccionado automáticamente por el criterio AIC, \(SARIMA(3,1,1)(1,0,0)_4\)
| Modelo | AIC | BIC | RMSE |
|---|---|---|---|
| SARIMA(1,1,0)(1,1,0)[4] | 1231.52 | 1237.99 | 3343.06 |
| SARIMA(0,1,1)(0,1,1)[4] | 1219.32 | 1225.80 | 2953.57 |
| auto.arima | 1287.09 | 1300.41 | 2806.10 |
La comparación bajo el criterio AIC Y BIC arroja como modelo ganador el \(SARIMA(0,1,1)(0,1,1)_4\) con un AIC= 1219.32 Y BIC= 1225.80, este modelo captura gráficamente de la mejor manera el comportamiento de la serie original y se confirma graficando las dos series, la original y la del modelo ganador que captura hasta las caídas de las ventas en los periodos donde la economía colombiana fue afectada.
Figura 8: Series original vs modelo SARIMA ganador
##
## Ljung-Box test
##
## data: Residuals from ARIMA(0,1,1)(0,1,1)[4]
## Q* = 13.181, df = 6, p-value = 0.04025
##
## Model df: 2. Total lags used: 8
##
## Box-Ljung test
##
## data: residuals(modelo2)
## X-squared = 32.529, df = 20, p-value = 0.03798
## ME RMSE MAE MPE MAPE MASE
## Training set -20.68343 2953.565 1690.681 -0.02208556 10.26183 0.328696
## ACF1
## Training set 0.00153157
Figura(9, 10, 11, 12): Gráficos de los residuos La gráfica confirma que después de aplicar la diferenciación de tendencia (d=1) y la diferenciación estacional (D=1), la serie ya no presenta tendencia ni patrones estacionales visibles. Los valores oscilan alrededor de cero de manera irregular, lo que es exactamente el comportamiento esperado de una serie estacionaria.
Grafica FAC: la mayoría de residuales se encuentran dentro de las bandas de confianza, con algunos picos por fuera lo que indica que nuestro residuales se comportan como un ruido blanco.
Histograma de residuales: La distribución tiene un comportamiento de forma aproximadamente normal y centrada en cero, aunque con una pequeña cola larga causada por los valores extremos de la crisis de 2008.
QQ-Plot: La mayor parte de los puntos siguen la línea roja de normalidad, confirmando que los residuales se distribuyen de manera aproximadamente normal. Los valores atípicos que se alejan en la cola izquierda corresponden nuevamente a los trimestres de la crisis de 2008.
Figura 13: Gráfica de previsión para los cuatros trimestres futuros El
modelo SARIMA(0,1,1)(0,1,1)[4] muestra una previsión de las ventas de
automóviles particulares la cual continuara con un comportamiento
decreciente para los próximos cuatro trimestres, con la venta más baja
de 18.103 para el comienzo del primer trimestre del año 2015 y un
aumento en las ventas de 21.164 para el cuarto trimestre del año 2014.
Esta tendencia es consistente al comportamiento posterior a la caída que
traía el mercado desde 2012, Esta proyección de las ventas es señal
clara de que este mercado automotor es sensible a factores externos e
internos que basándose en un modelo estadístico estos pronósticos deben
ser una referencia y no como una predicción exacta.
Segunda Serie: Comportamiento de las Ventas Trimestrales de Vehículos de Transporte Público de Producción Nacional en Colombia: Un Análisis de Series de Tiempo 1997–2014
## Qtr1 Qtr2 Qtr3 Qtr4
## 1997 2640 2818 3336 3437
## 1998 2555 2641 1866 1403
## 1999 1175 1271 1224 1035
## 2000 1096 1121 1292 1320
## 2001 1395 1877 1236 1672
## 2002 1785 1686 2649 2764
## 2003 3260 2526 2970 2483
## 2004 2176 2027 1703 1324
## 2005 1078 923 964 787
## 2006 2147 2398 4964 4096
## 2007 3578 2818 2765 2435
## 2008 1720 1548 1903 1712
## 2009 2139 1665 1642 1311
## 2010 1559 1576 1461 1280
## 2011 1271 954 1427 1331
## 2012 1230 1041 1059 829
## 2013 897 1408 1330 1059
## 2014 1509
Figura 14: serie original de vehículos de transporte público La serie
original de vehículos de transporte público tiene un comportamiento sin
tendencia marcada, pero hay un patrón que se se repite durnate todo el
tiempo (decreciente, creciente, decreciente y crece explosivamente) que
se repite a lo largo de los trimestres, durante los primeros trimestres
del año 1998 las ventas caen progresivamente hasta llegar a su registro
más bajo en el cuarto trimestre del año 1999 con 1035 unidades vendidas
como consecuencia de la crisis financiera que Colombia atravesaba, con
una leve recuperación desde el primer trimestre del año 2000 hasta
finales del 2002. El comportamiento más irregular ocurre en Entre
2005-IV y 2006-III donde las ventas tocan su punto más bajo con un total
de 787 y un crecimiento histórico de 4.964 unidades vendidas de
vehículos de transporte público.
Por último, después de este hecho histórico, las ventas caen sin mostrar ningún trimestre con señales claras de recuperación.
| Trimestre | Media | Mediana | Min | Max | DE |
|---|---|---|---|---|---|
| 1 | 1845.00 | 1639.5 | 897 | 3578 | 768.87 |
| 2 | 1782.24 | 1665.0 | 923 | 2818 | 652.74 |
| 3 | 1987.71 | 1642.0 | 964 | 4964 | 1045.00 |
| 4 | 1781.06 | 1331.0 | 787 | 4096 | 942.60 |
| año | Media | Mediana | Min | Max | Total |
|---|---|---|---|---|---|
| 1997 | 3057.75 | 3077.0 | 2640 | 3437 | 12231 |
| 1998 | 2116.25 | 2210.5 | 1403 | 2641 | 8465 |
| 1999 | 1176.25 | 1199.5 | 1035 | 1271 | 4705 |
| 2000 | 1207.25 | 1206.5 | 1096 | 1320 | 4829 |
| 2001 | 1545.00 | 1533.5 | 1236 | 1877 | 6180 |
| 2002 | 2221.00 | 2217.0 | 1686 | 2764 | 8884 |
| 2003 | 2809.75 | 2748.0 | 2483 | 3260 | 11239 |
| 2004 | 1807.50 | 1865.0 | 1324 | 2176 | 7230 |
| 2005 | 938.00 | 943.5 | 787 | 1078 | 3752 |
| 2006 | 3401.25 | 3247.0 | 2147 | 4964 | 13605 |
| 2007 | 2899.00 | 2791.5 | 2435 | 3578 | 11596 |
| 2008 | 1720.75 | 1716.0 | 1548 | 1903 | 6883 |
| 2009 | 1689.25 | 1653.5 | 1311 | 2139 | 6757 |
| 2010 | 1469.00 | 1510.0 | 1280 | 1576 | 5876 |
| 2011 | 1245.75 | 1301.0 | 954 | 1427 | 4983 |
| 2012 | 1039.75 | 1050.0 | 829 | 1230 | 4159 |
| 2013 | 1173.50 | 1194.5 | 897 | 1408 | 4694 |
| 2014 | 1509.00 | 1509.0 | 1509 | 1509 | 1509 |
El Tercer trimestre es el que registra mayor promedio de ventas con 1.988 unidades, pero también el más volátil, influenciado directamente por el pico extraordinario ocurrido en el tercer trimestre del año 2006 con 4.964 unidades. Los trimestres dos y cuarto presentan comportamientos similares con medias alrededor de 1.782 unidades.
Figura 15, 16, 17 y 18: Gráficas descriptivas
Histograma: La districución de los datos está concentrada entre 1.000 y 2.000 unidades vendidas de vehículos de transporte público, la media supera claramente a la mediana, lo que confirma una districución asimétrica hacia a la derecha arrastrado por los valores atípicos del tercer trimestre del año 2006 y el del primer trimestre del 2007.
Boxplot por año: El año 2006 es visualmente el más atípico ya que registra el trimestre con mayor venta durante toda la serie, con la caja más alta y amplia, en el 2007 y 2008 presentan valores atípicos lo que indica una venta inusualmente mayor al comportamiento que se venia presentando. A partir de 2008 las cajas se vuelven progresivamente más pequeñas y bajas, reflejando el decrecimiento del mercado.
Boxplot por trimestre: Los tres primeros trimestres tienen medianas muy similares alrededor de 1.600 unidades, lo que sugiere que en esta serie la estacionalidad no es tan marcada, para cuarto trimestre la mediana es un poco más baja alrededor de 1.300 unidades. El tercer trimestre presenta el valor atípico más alto de 4.964 unidades y el Q1 también muestra un outlier en 3.578, ambos correspondientes al período 2006-2007.
Mapa de calor: Confirma visualmente que tercer y cuarto trimestre del año 2006 son los trimestres más oscuros de toda la serie con 4.964 y 4.096 unidades respectivamente, seguidos de los trimestres de 1997 y 2003.
Problema identificado Al analizar la serie para la venta de vehículos de transporte publico nacional en Colombia presenta un problema a causa de las caídas del mercado financiero y políticas implementadas para la renovación de vehículos que cumplen la vida útil, esta intervención gubernamental, acompañada de las caídas de en los trimestres a finales de los 90 y la del 2008 hace que la serie no tenga una tendencia marcada ni una clara estacionalidad, lo que pueda dificultar ajustar un modelo que capture los comportamientos irregulares.
Posible solución:
Para abordar este problema se recomienda modelar una serie que capture el dato atípico del tercer trimestre del año 2006, incorporando variables que no intenten explicar ese comportamiento como parte de la dinámica natural del mercado. Teniendo en cuenta las políticas públicas, las ayudas gubernamentales y aportar resultados para implementar programas de renovación de flota sin generar inestabilidad en las ventas de vehículos de transporte público.
Figura 19: Descomposición de la serie original
Al comparar las dos descomposiciones clásica de la serie, se puede ver que el modelo más adecuado es el aditivo, ya que las flutuaciones estacionales se comportan similar sin crecer la tendencia.
Figura 20: FAC Y FACP serie Original La FAC Y FACP muestran un
decrecimiento mas marcado con memoria corta, es decir las ventas de un
trimestre esta relacionado con la de dos o tres trimestres atras, pero
esta relación se debilita rapiadamente.
Prueba de Hipotesis
La prueba ADF evalúa:
\[H_0: \text{La serie de ventas de vehículos de transporte público posee raíz unitaria (no es estacionaria)}\] \[H_1: \text{La serie de ventas de vehículos de transporte público es estacionaria}\]
La prueba KPSS evalúa:
\[H_0: \text{La serie de ventas de vehículos de transporte público es estacionaria}\] \[H_1: \text{La serie de ventas de vehículos de transporte público no es estacionaria (posee raíz unitaria)}\]
##
## Augmented Dickey-Fuller Test
##
## data: transp_ts
## Dickey-Fuller = -3.2529, Lag order = 4, p-value = 0.08662
## alternative hypothesis: stationary
##
## #######################
## # KPSS Unit Root Test #
## #######################
##
## Test is of type: mu with 3 lags.
##
## Value of test-statistic is: 0.2482
##
## Critical value for a significance level of:
## 10pct 5pct 2.5pct 1pct
## critical values 0.347 0.463 0.574 0.739
##
## #######################
## # KPSS Unit Root Test #
## #######################
##
## Test is of type: tau with 3 lags.
##
## Value of test-statistic is: 0.112
##
## Critical value for a significance level of:
## 10pct 5pct 2.5pct 1pct
## critical values 0.119 0.146 0.176 0.216
Los resultados sobre la serie original fueron:
\[\text{ADF: } p\text{-value} = 0.0866 > 0.05 \Rightarrow \text{No se rechaza } H_0\] Lo que indica que la serie no estacionaria
\[\text{KPSS}_\text{estadístico} = 0.2482 < 0.347 \Rightarrow \text{No se rechaza } H_0\] Lo que indica que la serie es estacionaria
\[\text{KPSS}_{\tau}: \text{estadístico} = 0.112 < 0.119 \Rightarrow \text{No se rechaza } H_0\] Lo que indica que la serie es estacionaria
Analizando los resultados de los test aplicado a la serie original, identificamos que necesita una diferenciación para eliminar la tendencia $ d= 1 $
##
## Augmented Dickey-Fuller Test
##
## data: transp_diff1
## Dickey-Fuller = -3.9456, Lag order = 4, p-value = 0.01745
## alternative hypothesis: stationary
##
## #######################
## # KPSS Unit Root Test #
## #######################
##
## Test is of type: mu with 3 lags.
##
## Value of test-statistic is: 0.0383
##
## Critical value for a significance level of:
## 10pct 5pct 2.5pct 1pct
## critical values 0.347 0.463 0.574 0.739
##
## #######################
## # KPSS Unit Root Test #
## #######################
##
## Test is of type: tau with 3 lags.
##
## Value of test-statistic is: 0.038
##
## Critical value for a significance level of:
## 10pct 5pct 2.5pct 1pct
## critical values 0.119 0.146 0.176 0.216
\[\text{ADF: } DF = -3.9456, \quad p\text{-value} = 0.0175 < 0.05 \Rightarrow \text{Se rechaza } H_0\]
\[\text{KPSS}_{mu}: \text{estadístico} = 0.0383 < 0.347 \Rightarrow \text{No se rechaza } H_0\]
\[\text{KPSS}_{\tau}: \text{estadístico} = 0.0380 < 0.119 \Rightarrow \text{No se rechaza } H_0\]
Observando los resultados de la primera diferenciación para eliminar la tendencia que se identifico gráficamente, la serie ya es estacionaria.
Figura 21: FAC Y FACP aplicando diferencias
Analizando los FAC Y FACP de la serie ya estacionaria, vemos que después
del primer lag todas las lineas caen dentro de la banda de confianza. Lo
que da indicio a proponer los siguientes modelos:
El Modelo 1 corresponde a un \(SARIMA(2,1,0)(1,0,0)_4\)
El Modelo 2 corresponde a un \(SARIMA(0,1,1)(0,0,1)_4\)
El Modelo 3 corresponde al modelo seleccionado automáticamente por el criterio AIC, cuya forma general es:
\[SARIMA(p,1,q)(P,0,Q)_4\]
| Modelo | AIC | BIC | RMSE |
|---|---|---|---|
| SARIMA(2,1,0)(1,0,0)[4] | 1044.88 | 1053.76 | 491.13 |
| SARIMA(0,1,1)(0,0,1)[4] | 1047.81 | 1054.47 | 509.80 |
| auto.arima | 1050.50 | 1061.67 | 450.22 |
Teniendo en cuenta el criterio de selección \(AIC Y BIC\) el modelo ganador es \(SARIMA(2,1,0)(1,0,0)_4\) con un AIC= 1044.88 BIC= 1053.76 en comparación con los dos modelos restantes \(SARIMA(0,1,1)(0,0,1)_4\) AIC= 1047.81 Y BIC= 1054.47 y por último \[SARIMA(p,1,q)(P,0,Q)_4\] con un AIC= 1050.50 Y BIC= 1061.67.
##
## Ljung-Box test
##
## data: Residuals from ARIMA(2,1,0)(1,0,0)[4]
## Q* = 5.7187, df = 5, p-value = 0.3346
##
## Model df: 3. Total lags used: 8
Figura 22, 23, 24, 25 y 26: Gráficos de los residuos
Modelo ajustado vs Serie original:
El modelo \(SARIMA(2,1,0)(1,0,0)[4]\) se ajusta de manera adecuada al comportamiento de la serie original durante todo su recorrido. Sin embargo en los cambios brusco que sufre la serie, el modelo intenta ajustarse a esa dificultad.
Gráfico de residuales:
Los residuos del modelo ganador oscilan alrededor de la media de cero durante mayor parte del recorrido, sin embargo en hay cierto valor atípico que se le atribuye a la historica ventas del tercer trimestre del año 2006, despues de esta fluctuación vuelve a oscilar alrededor de la media.
FAC de residuales:
El comportamiento en la FAC describe que todos los picos se encuentran dentro de las bandas de confianza y esto puede traducirse que los residuales se comportan como un ruido blanco.
Histograma de residuales:
La distribución se asemeja normal, la mayoria de los residuos estan centrados en cero con un pequeña cola hacia la derecha como consecuencia a los valores atípicos registrados.
QQ-Plot:
La mayoria de los puntos siguen la linea roja de referencia a la normalidad, aunque hay pocos puntos que se salen de esa referencia y una pequeña barriga que se forma en la mitad de los residuos, pero se puede confirmar que la distribución de los residuos es aproximadamente normal.
## Point Forecast Lo 80 Hi 80 Lo 95 Hi 95
## 2014 Q2 1350.200 701.71474 1998.686 358.4273 2341.973
## 2014 Q3 1485.625 605.06732 2366.182 138.9284 2832.321
## 2014 Q4 1469.630 300.17711 2639.083 -318.8938 3258.154
## 2015 Q1 1466.466 81.69039 2851.242 -651.3655 3584.297
Figura 27: Gráfica de previsiones de los 4 trimestres futuros Las
previsiones del modelo para los siguientes cuatros trimestres fueron
(2014-2= 1350, 2014-3= 1485, 2014-4= 1469 y 2015-1= 1466 unidades de
vehículos de transporte público vendidos) este comportamiento es normal
teniendo en cuenta el decreciemiento y el intento de estabilización de
este sector. A corto plazo la serie no captura una recuperación
importante en las ventas dado el comportamiento históricamente volátil e
irregular de esta serie, es decir que las previsiones hechas son
sensibles a intervención en la renovación de la flota de estos vehículos
por parte del gobierno.
Conclusión General
Los resultados de ambas series revelan que hay dinámicas que los modelos intentan capturar, pero ese mercado automotor es muy sensible a cambios en el tiempo, lo cual se ve reflejado, para la serie que modela las ventas de vehículos particulares respondió a los cambios del mercado, ya que este mercado es un poco mas solido a comparación al de vehículos de transporte público, ya que este último esta marcado por desiciones de políticas públicas para la renovación de flotas lo que lo hace más dificíl y sensible de pronosticar.
Estos resultados son útiles porque evidencian las limitaciones que hay en estos modelos como consecuencia a pronosticar un mercado tan sensible, los SARIMA asumen que el futuro seguira un comportamiento similar al pasado, la base de datos solo cubre hasta el primer trimestre del año 2014, seria recomendable analizar periodos como la alza en el precio de los combustibles, la consolidación de marcas extranjeras, la llegada de vehículos electricos. Finalmente un análsis univariado no incluye estas variables explicativas y factores que claramente inciden sobre las ventas de vehículos de fabricación nacional.
Referencias
Torres, A. (2011). La crisis colombiana de finales del siglo XX: ¿Un choque real o financiero? Perfil de Coyuntura Económica, (18), 79–96. http://www.scielo.org.co/pdf/pece/n18/n18a4.pdf
Uribe Medina, A. F. (2011). Ciclos económicos en Colombia: bonanzas y recesión (Boletín No. 10). Ministerio de Hacienda y Crédito Público de Colombia. https://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=&ved=2ahUKEwiz57qr9c6UAxUJmbAFHaU9Bg4QFnoECC4QAQ&url=https%3A%2F%2Fwww.minhacienda.gov.co%2Fdocuments%2Fd%2Fportal%2Fboletin-11-ciclos-economicos-en-colombia-bonanzas-y-recesion-1%3Fdownload%3Dtrue&usg=AOvVaw29H-zmEjs7BjSkTD1hFBRM&opi=89978449
Departamento Administrativo Nacional de Estadística [DANE]. (2014). Serie de vehículos, I trimestre de 2014 [Archivo de Excel]. Departamento Administrativo Nacional de Estadística. https://www.dane.gov.co/files/investigaciones/boletines/vehiculos/serie_vehi_Itrim14.xls
Congreso de Colombia. (2001). Ley 688 de 2001: Por medio de la cual se crea el Fondo Nacional para la Reposición del Parque Automotor del Servicio Público de Transporte Terrestre y se dictan otras disposiciones. Departamento Administrativo de la Función Pública. https://www.funcionpublica.gov.co/eva/gestornormativo/norma.php?i=4165