Ventas de autos en México

En México uno de los sectores más importantes es la industria automotriz, específicamente la del ensamble de autos. Las industrias más importantes del mundo tienen armadoras en Estados como Puebla, Guanajuato, Querétaro, entre otros. Debido a que existen niveles importantes de producción de automóviles es de interés saber cuál es el nivel de ventas de autos en el País. Las ventas de automóviles pueden depender de varios factores, como lo son el tipo de cambio, planes de financiamiento, niveles de producción, precio de los factores de producción, políticas comerciales, etc., por eso que es la serie seleccionada para distinguir y analizar sus componentes. La serie fue extraída del BIE del INEGI presenta el número de unidades vendidas por mes, es decir la frecuencia es mensual desde 1988, hasta julio de 2018 lo que nos brinda 127 observaciones, la liga en la que se pueden observar dichos datos, es la siguiente: Sin embargo, solo consideramos un periodo de tiempo de los últimos 10 años. El INEGI, toma la información de la Asociación Mexicana de la Industria Automotriz. A continuación, se muestra el comportamiento del total de las ventas de automóviles, incluyendo los compactos, subcompactos, de lujo, deportivos e importados, excluyendo a los camiones.La serie puede ser consultada en el siguiente link: http://www.inegi.org.mx/sistemas/bie/.

library(readxl)
library(ggplot2)
library(gridExtra)
library(forecast)
library (fpp2)
## Loading required package: fma
## Loading required package: expsmooth
library(MASS)
## 
## Attaching package: 'MASS'
## The following objects are masked from 'package:fma':
## 
##     cement, housing, petrol
library(season)
## Loading required package: survival
library(TSA)
## 
## Attaching package: 'TSA'
## The following objects are masked from 'package:stats':
## 
##     acf, arima
## The following object is masked from 'package:utils':
## 
##     tar
Autos <- read.csv("C:/Users/MX120031/Desktop/Autos.csv", sep="")
VAutos=ts(Autos, frequency = 12,start = c(2008,1))
autoplot(VAutos)

Como se puede observar, el nivel más bajo de ventas se ubicó en los meses de 2009, a niveles de 30,000 unidades. Por otro lado, en diciembre de 2017 se presentaron los niveles más altos de ventas. A primera instancia se observa que la serie de ventas presenta tendencia y componente estacional ya que a finales de cada año suelen darse los mayores niveles de ventas. Esto se asocia a las estaciones y a que por lo regular las ventas determinados bienes y servicios son mayores que en otros meses del año.

monthplot(VAutos, labels=month.abb, ylab="Ventas de autos en México")

La tendencia observada es positiva hasta finales de 2017 y comienza a ser negativa. Esto podría derivarse de los efectos del tipo de cambio en los precios de los automóviles, así como de las alzas del precio de acero durante 2017, lo que genera un efecto en el aumento de precio de los vehículos y por ende en la disminución de su demanda.

¿Las ventas de autos presentan estacionalidad?

En el siguiente grafico se muestra que en los 8 años de observaciones hay un aumento de las ventas de autos en diciembre, seguido de noviembre, julio, agosto, marzo, y septiembre, por otro lado, en todos los años en los meses de enero y febrero se presentan los menores niveles de las ventas.

ggseasonplot(VAutos,polar=T)

MA, Modelo aditivo y Modelo multiplicativo

El modelo aditivo se asume como \(Yt=St+Tt+EtYt=St+Tt+Et\) el cual es apropiado cuando las magnitudes de las fluctuaciones estacionales o la variación alrededor del componente tendencia-ciclo no varía con el nivel de la serie de tiempo. El modelo multiplicativo se presenta como \(YT=St∗Tt∗EtYT=St∗Tt∗Et\) el cual es más común en series económicas ya que se transforma los datos hasta que la variación en la serie sea estable en el tiempo. Ya seleccionado el modelo para describir las ventas de autos en México se pretende calcular la tendencia \(TtTt\) y el componente estacional \(StSt\) por medio del error. Por medio de un modelo no paramétrico asumiremos que hay suavidad entre la estacionalidad con el tiempo, por medio de las medias móviles no pares 3, 5, 7 y 9. Los datos quedan de la siguiente manera:

ma(VAutos,order=3)
##            Jan       Feb       Mar       Apr       May       Jun       Jul
## 2008        NA  50701.33  47520.33  47507.00  48165.33  48865.67  48293.67
## 2009  45144.67  37920.00  34194.33  32411.67  30948.00  32411.00  33632.67
## 2010  42650.67  38324.33  37626.00  37809.33  37059.33  37838.67  39178.67
## 2011  50821.00  44988.33  43481.33  44042.67  43470.33  45010.33  47036.00
## 2012  58848.00  52001.67  50619.67  51056.00  49552.33  51032.00  51768.67
## 2013  61294.33  55790.33  55602.00  56850.00  56537.33  56738.00  56458.33
## 2014  61260.67  54434.67  52588.00  54895.33  54962.67  60032.33  63323.33
## 2015  74382.67  68462.67  66368.00  66950.67  67628.33  71452.33  74424.00
## 2016  83098.33  75147.33  75550.00  78061.00  82925.00  87341.33  92003.67
## 2017  96118.67  83382.67  80408.67  80108.67  78084.67  80147.33  80715.67
## 2018  78558.33  70357.67  70447.67  71322.00  71468.33  73388.67        NA
##            Aug       Sep       Oct       Nov       Dec
## 2008  47243.00  46638.67  45333.00  50282.33  48015.00
## 2009  34002.67  36451.33  37505.67  43502.67  42738.00
## 2010  40388.33  42678.33  44384.67  52144.00  52017.67
## 2011  48776.00  50183.33  51392.67  60132.33  60193.67
## 2012  52105.33  53406.33  55810.67  62785.00  63606.67
## 2013  54817.00  54682.33  57151.33  65594.33  65484.00
## 2014  64097.33  64050.67  65259.00  74922.00  76451.00
## 2015  75027.00  75585.33  77258.67  86284.67  86268.00
## 2016  91170.33  90034.67  93025.00 106061.33 104000.00
## 2017  77341.33  76544.67  80481.67  89218.33  86090.33
## 2018
ma(VAutos,order=5)
##           Jan      Feb      Mar      Apr      May      Jun      Jul
## 2008       NA       NA  49802.2  48020.8  47832.8  48357.6  47854.4
## 2009  43473.2  40461.4  34676.8  33233.0  32821.2  32104.4  33118.0
## 2010  40896.8  40780.4  37811.8  37489.6  37893.2  38324.4  39147.0
## 2011  49116.2  47976.0  44118.4  43987.8  44489.6  45347.0  47164.6
## 2012  57328.8  55604.8  50697.8  50944.0  50915.2  50558.0  51835.4
## 2013  60317.6  59303.0  56265.4  56076.0  56569.2  56666.2  55605.0
## 2014  60770.2  57946.0  54481.4  54457.4  57209.0  59814.6  61363.0
## 2015  72944.0  71244.2  67380.8  67650.4  69486.0  70957.6  72845.8
## 2016  81482.4  80748.0  76644.4  79476.6  83293.8  86758.2  88848.8
## 2017  96089.6  90106.0  80215.6  80540.4  80523.2  78615.4  78700.0
## 2018  80430.4  75589.2  70046.0  71657.2  72487.4       NA       NA
##           Aug      Sep      Oct      Nov      Dec
## 2008  47311.8  46658.2  48704.4  47144.6  45399.2
## 2009  35245.0  36039.0  39773.0  40708.2  41227.8
## 2010  40814.6  42719.6  47730.2  48518.0  48979.2
## 2011  48174.0  50100.4  56237.8  56068.6  56143.6
## 2012  52325.4  54313.0  58887.2  59428.2  59826.4
## 2013  55268.6  57034.6  60918.8  60684.0  60900.8
## 2014  62702.2  65992.4  70296.8  70578.8  72163.6
## 2015  74666.8  76735.8  81745.2  81773.2  81578.6
## 2016  90478.0  92818.2 100080.8  97675.8  95787.2
## 2017  78384.8  80053.6  84142.6  81609.6  80783.8
## 2018
ma(VAutos,order=7)
##           Jan      Feb      Mar      Apr      May      Jun      Jul
## 2008       NA       NA       NA 49379.14 48199.43 47405.57 47638.00
## 2009 41981.29 39570.00 37984.14 34322.14 33406.14 33209.00 33692.71
## 2010 40298.43 39795.71 39781.71 37871.00 38270.29 38812.14 39737.00
## 2011 47473.29 47315.43 47053.57 44416.00 45180.43 46177.14 46642.43
## 2012 54599.71 54875.43 54412.14 50699.57 51264.71 51522.43 51301.57
## 2013 58823.43 59363.43 58584.14 56231.86 56299.86 55808.14 55757.00
## 2014 58636.00 58993.43 57750.43 56252.29 58067.43 58966.14 60373.43
## 2015 70555.86 70890.86 70767.00 69068.86 70022.14 71043.14 72121.43
## 2016 80334.00 80741.71 82067.57 80786.86 83199.86 85527.00 87167.14
## 2017 91587.14 90196.86 87429.43 80481.14 80217.86 79382.00 77550.57
## 2018 78027.14 77329.86 74984.14 71243.00       NA       NA       NA
##           Aug      Sep      Oct      Nov      Dec
## 2008 47262.00 48595.00 47573.57 45667.29 44149.14
## 2009 34825.29 37962.29 38745.57 39213.71 39973.00
## 2010 41166.86 44955.57 46147.71 46730.71 47445.43
## 2011 48571.00 53072.71 53809.57 54501.43 55200.86
## 2012 53489.43 56549.14 57324.86 57887.57 58272.71
## 2013 56963.86 59555.71 59591.29 58902.14 58688.43
## 2014 63497.86 67549.00 69582.71 69648.00 69751.57
## 2015 74689.57 79329.14 80109.86 79680.71 79639.14
## 2016 90689.14 97527.14 96199.29 94450.86 93832.43
## 2017 80249.14 83286.14 80981.57 79568.14 78847.00
## 2018
ma(VAutos,order=9)
##           Jan      Feb      Mar      Apr      May      Jun      Jul
## 2008       NA       NA       NA       NA 48703.22 47674.89 47044.56
## 2009 40963.11 39716.78 38206.78 37063.00 34290.22 34352.22 34516.67
## 2010 39321.89 39628.78 39400.89 39879.56 38590.67 39381.00 40457.56
## 2011 46416.11 46867.56 46836.44 47299.89 45744.89 46225.00 47490.44
## 2012 53765.56 53895.44 53948.44 53890.89 51219.78 51686.00 52878.44
## 2013 57985.00 58370.89 58648.89 58200.89 55714.89 55674.11 56819.89
## 2014 57769.11 58330.56 59368.11 59826.44 57831.56 58890.33 61159.22
## 2015 68864.11 70337.67 71423.78 71919.11 70372.67 71135.22 72877.78
## 2016 79472.67 81452.33 83053.11 84387.67 83080.89 84308.67 87696.56
## 2017 89750.78 89176.22 88185.33 85647.67 79602.89 79033.56 80435.33
## 2018 76787.33 77014.78 76642.22       NA       NA       NA       NA
##           Aug      Sep      Oct      Nov      Dec
## 2008 48563.56 47839.78 46257.11 45148.44 42949.33
## 2009 36151.11 37200.11 37929.67 38609.89 38938.44
## 2010 43197.22 44178.22 44794.78 45840.22 46059.11
## 2011 50792.89 51795.78 52425.56 53636.67 53665.56
## 2012 54814.22 56015.00 56291.22 56893.56 57538.33
## 2013 58982.89 58968.11 58290.11 58282.00 57584.78
## 2014 64660.67 66844.67 67655.00 69160.67 68956.56
## 2015 76313.33 77768.56 78260.33 78819.67 79134.44
## 2016 93385.56 93792.00 93715.78 93538.11 91481.11
## 2017 81548.11 80927.44 79918.56 78972.44 77694.22
## 2018

Con la finalidad de estimar el componente tendencia-ciclo, se aplican las MA (3), MA (5), MA (7) y MA (9), las cuales son de orden impar y con las cuales se muestra simetría como se presenta en los gráficos siguientes:

p1<-autoplot(VAutos,series="VAutos")+autolayer(ma(VAutos,3),series="3-MA")+ xlab("Año")+ylab("Unidades vendidas")+ggtitle("Ventas anules de autos en México")
p2<-autoplot(VAutos,series="VAutos")+autolayer(ma(VAutos,5),series="5-MA")+ xlab("Año")+ylab("Unidades vendidas")+ggtitle("Ventas anules de autos en México")
p3<-autoplot(VAutos,series="VAutos")+autolayer(ma(VAutos,7),series="7-MA")+ xlab("Año")+ylab("Unidades vendidas")+ggtitle("Ventas anules de autos en México")
p4<-autoplot(VAutos,series="VAutos")+autolayer(ma(VAutos,9),series="9-MA")+ xlab("Año")+ylab("Unidades vendidas")+ggtitle("Ventas anules de autos en México")
grid.arrange(p1,p2,p3,p4)
## Warning: Removed 2 rows containing missing values (geom_path).
## Warning: Removed 4 rows containing missing values (geom_path).
## Warning: Removed 6 rows containing missing values (geom_path).
## Warning: Removed 8 rows containing missing values (geom_path).

Debido a que las fluctuaciones estaciones se observan simétricas, se usa el método aditivo, en el cual se observa los siguientes componentes:

fit<-decompose(VAutos, type="additive")
autoplot(fit)

En primera instancia, el termino de error no muestra ruido blanco, es decir no es un proceso estacionario, se observa estacionalidad simétrica y tendencia positiva en general sin embargo es más evidente el componente estacional. Debido a lo anterior, el grafico siguiente muestra la serie original y la serie desestacionalizada.

autoplot(VAutos, series="Ventas")+autolayer(seasadj(fit),series="Estacionalidad Ventas")+xlab("Año")+ylab("Indice de nuevos periodos")+ggtitle("Venta autos en México")

Estimación del modelo de regresión

En los apartados anteriores, mediante la descomposición de la serie se observa que la serie de las ventas de autos presenta estacionalidad, tendencia y un cambio de la tendencia en los últimos periodos de la serie. Por lo anterior, a continuación, se presenta la estimación del modelo de regresión de las ventas en función del tiempo, del tiempo al cuadrado y con medias estacionales para evaluar el tiempo, el cambio de tendencia en el tiempo y la estacionalidad respectivamente. El modelo estimado sería el siguiente:

\(V_t = B_0+{B_1}*t+ {B_2}* t^2+{B_3}* MA+ut\)

Donde: \(V_t\)=Ventas de autos \(B_0\)=Constante, en la que seria las ventas de autos en el tiempo 0, coeficiente que no tendría explicación lógica en para efectos de dicha estimación. \(B_1\)=Coeficiente de cambio del tiempo \(B_2\)=Coeficiente de cambio del tiempo al cuadrado \(B_3\)=Coeficiente de cambio del efecto estacional \(t\)=tiempo \(t^2\)=tiempo al cuadrado \(MA\)=media estacional \(ut\)=termino de error

Ventasmes=season(VAutos)
VentasAutos2<-lm(VAutos~time(VAutos)+I(time(VAutos)^2)+Ventasmes)
summary(VentasAutos2)
## 
## Call:
## lm(formula = VAutos ~ time(VAutos) + I(time(VAutos)^2) + Ventasmes)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -18394.5  -4694.9   -959.1   3542.2  27766.0 
## 
## Coefficients:
##                      Estimate Std. Error t value Pr(>|t|)    
## (Intercept)         1.040e+09  3.475e+08   2.993  0.00340 ** 
## time(VAutos)       -1.038e+06  3.452e+05  -3.006  0.00326 ** 
## I(time(VAutos)^2)   2.589e+02  8.573e+01   3.020  0.00312 ** 
## VentasmesFebruary  -3.203e+03  3.420e+03  -0.936  0.35109    
## VentasmesMarch     -1.024e+02  3.420e+03  -0.030  0.97616    
## VentasmesApril     -5.861e+03  3.421e+03  -1.713  0.08941 .  
## VentasmesMay       -2.607e+03  3.421e+03  -0.762  0.44769    
## VentasmesJune      -1.378e+03  3.422e+03  -0.403  0.68800    
## VentasmesJuly      -6.913e+02  3.422e+03  -0.202  0.84027    
## VentasmesAugust     2.384e+03  3.508e+03   0.680  0.49814    
## VentasmesSeptember -1.917e+03  3.508e+03  -0.546  0.58583    
## VentasmesOctober    1.238e+03  3.509e+03   0.353  0.72478    
## VentasmesNovember   6.382e+03  3.509e+03   1.819  0.07160 .  
## VentasmesDecember   2.186e+04  3.509e+03   6.230 8.23e-09 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 8021 on 113 degrees of freedom
## Multiple R-squared:  0.8252, Adjusted R-squared:  0.805 
## F-statistic: 41.02 on 13 and 113 DF,  p-value: < 2.2e-16

Los resultados son los siguientes: \(V_t = B_0+{B_1}*t+ {B_2}* t^2+{B_3}* MA+ut\) Los resultados son los siguientes: \(V_t = 1.040+e+09-1.038e+0.6*t+2.589e+02t^2+MA\) Lo anterior explica que, por un aumento de \(t\), es decir del tiempo en una unidad(mes), las ventas disminuyen en 1-038e+0.6 unidades; por un aumento de \(t^2\) las ventas se incrementan en \(2.589e+06\) y donde \(MA\) se explica en el cuadro de arriba, cuando es diciembre, por ejemplo, las ventas aumentan en \(2.186e+04\).

Prueba de significancia estadística

Se plantea con la siguiente hipótesis:

\(H_0=B_0=0\) \(H_1=B_0\not =0\)

Lo que se pretende es rechazar a H0, siendo que cada coeficiente sea distinto a cero, siendo así que las variables sean estadísticamente significativas.

En el cuadro de resultados de la regresión se observa que solo tres primeras probabilidades correspondientes al intercepto tiempo y tiempo al cuadrado son menores a \(α = 5%\) por lo que se rechaza la hipótesis nula, dando que las estimaciones fueron correctas. En cuanto a las demás al ser mayores \(α = 5%\), se acepta \(H_0\). Sin embargo, se puede concluir que la prueba es estadísticamente significativa en un 82%, debido a que el \(R^2\) es de .8252, por lo que en las variables consideradas explican en un 82% a las ventas de autos.

En la justificación del modelo esperamos que el valor de cada coeficiente sea diferente de cero, en los resultados se observa que el valor de F es de .41 y el pvalue es mayor a 5% lo que nos indica que el nivel de significancia, es decir la varianza del tiempo, del tiempo al cuadrado un del componente estacional no explican a las varianzas del la variable dependiente ventas de autos.

Análisis de los residuos

A continuación, se presentan los análisis de los residuos mediante el histograma, el correlograma, los gráficos cuantil-cuantil y la grafica en el tiempo.

Las siguientes dos gráficas, de los residuos, analizan el componente estocástico no observado \({x_t}\), si nuestro modelo de tendencia es correcto, los residuales deben comportarse como un proceso estocástico, es decir como ruido blanco y nos indicaría que el componente estocástico fue modelado adecuadamente.

par(mfrow=c(1,1))
autoplot(VAutos)+geom_smooth(method="lm", se=FALSE)

autoplot(VAutos)+geom_smooth()
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

plot(y=rstandard(VentasAutos2),x=as.vector(time(VAutos)),xlab="Tiempo",ylab="Residuales estandarizados",type="o")
points(y=rstandard(VentasAutos2),x=as.vector(time(VAutos)),pch=as.vector(season(VAutos)))

Se puede observar que no presentan un comportamiento como un proceso estocástico, lo cual indica con base en las gráficas una mala especificación del modelo.

Gráficos cuantil-cuantil

La normalidad del modelo estimado se evalúa también con los siguientes gráficos, que siguen una distribución normal teórica. El de la izquierda muestra la distribución del modelo y el de la derecha el de los residuos. Podemos observar que el modelo se distribuye como una moral, mas no los residuos ya que en las colas se aleja.

par(mfrow=c(1,2))
qqnorm(VAutos);qqline((VAutos),col="red")
qqnorm(rstandard(VentasAutos2));qqline(rstandard(VentasAutos2),col="green")

Histograma, Shapiro test y Jarque-Bera

El histograma se observa con forma mesocúrtica, es decir la curva se estira y hay una desviación estándar de más de menos x con respecto a la media.

hist(rstandard(VentasAutos2),xlab="Residuales estandarizados")

Se plantea la siguiente hipótesis con respecto a la prueba Shapiro test y Jarque-Bera, donde se busca aceptar H0 para saber si el componente estocástico esta normalmente distribuido.

\(H_0=N\) (existe normalidad en los residuales) \(H_1\not =N\) N (No existe normalidad en los residuales)

shapiro.test(rstandard(VentasAutos2))
## 
##  Shapiro-Wilk normality test
## 
## data:  rstandard(VentasAutos2)
## W = 0.96814, p-value = 0.004326
library(normtest)
ajb.norm.test(rstandard(VentasAutos2))
## 
##  Adjusted Jarque-Bera test for normality
## 
## data:  rstandard(VentasAutos2)
## AJB = 16.6, p-value = 0.007

Para el valor de Shapiro test el pvalue es menor el 5% por lo que se dice que el modelo se distribuye como una normal. Mientras que para el caso del Jarque-Bera tenemos que el pvalue es de igual manera mejor el 5%. Ambas pruebas nos indican que los datos se distribuyen como una normal.

Autocorrelacion muestral (Correlograma)

En el siguiente grafico se observan las líneas discontinuas que nos indican una fuerte autocorrelación, lo que se sustenta con la prueba Durbin-Watson, buscando un valor cercano a 2 tenemos que el valor es de 0.34397 indicando autocorrelación en los errores.

ggAcf(rstandard(VentasAutos2))

require(lmtest)
## Loading required package: lmtest
## Loading required package: zoo
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
dwtest(VentasAutos2)
## 
##  Durbin-Watson test
## 
## data:  VentasAutos2
## DW = 0.34397, p-value < 2.2e-16
## alternative hypothesis: true autocorrelation is greater than 0

La mayorria de las pruebas indican una mala especificacion del modelo, entendiendo que hay variables que no estamos considerando que podrian explical la venta de autos en mayor medida que unamente el tiempo, su tendencia y el componnete estacional. Sin embargo en esta practica no se analizara una variable mas que explique a las ventas.