Abstract
abstractEn México uno de los sectores más importantes es la industria automotriz, específicamente la del ensamble de autos. Las industrias más importantes del mundo tienen armadoras en Estados como Puebla, Guanajuato, Querétaro, entre otros. Debido a que existen niveles importantes de producción de automóviles es de interés saber cuál es el nivel de ventas de autos en el País. Las ventas de automóviles pueden depender de varios factores, como lo son el tipo de cambio, planes de financiamiento, niveles de producción, precio de los factores de producción, políticas comerciales, etc., por eso que es la serie seleccionada para distinguir y analizar sus componentes. La serie fue extraída del BIE del INEGI presenta el número de unidades vendidas por mes, es decir la frecuencia es mensual desde 1988, hasta julio de 2018 lo que nos brinda 127 observaciones, la liga en la que se pueden observar dichos datos, es la siguiente: Sin embargo, solo consideramos un periodo de tiempo de los últimos 10 años. El INEGI, toma la información de la Asociación Mexicana de la Industria Automotriz. A continuación, se muestra el comportamiento del total de las ventas de automóviles, incluyendo los compactos, subcompactos, de lujo, deportivos e importados, excluyendo a los camiones.La serie puede ser consultada en el siguiente link: http://www.inegi.org.mx/sistemas/bie/.
library(readxl)
library(ggplot2)
library(gridExtra)
library(forecast)
library (fpp2)
## Loading required package: fma
## Loading required package: expsmooth
library(MASS)
##
## Attaching package: 'MASS'
## The following objects are masked from 'package:fma':
##
## cement, housing, petrol
library(season)
## Loading required package: survival
library(TSA)
##
## Attaching package: 'TSA'
## The following objects are masked from 'package:stats':
##
## acf, arima
## The following object is masked from 'package:utils':
##
## tar
Autos <- read.csv("C:/Users/MX120031/Desktop/Autos.csv", sep="")
VAutos=ts(Autos, frequency = 12,start = c(2008,1))
autoplot(VAutos)
Como se puede observar, el nivel más bajo de ventas se ubicó en los meses de 2009, a niveles de 30,000 unidades. Por otro lado, en diciembre de 2017 se presentaron los niveles más altos de ventas. A primera instancia se observa que la serie de ventas presenta tendencia y componente estacional ya que a finales de cada año suelen darse los mayores niveles de ventas. Esto se asocia a las estaciones y a que por lo regular las ventas determinados bienes y servicios son mayores que en otros meses del año.
monthplot(VAutos, labels=month.abb, ylab="Ventas de autos en México")
La tendencia observada es positiva hasta finales de 2017 y comienza a ser negativa. Esto podría derivarse de los efectos del tipo de cambio en los precios de los automóviles, así como de las alzas del precio de acero durante 2017, lo que genera un efecto en el aumento de precio de los vehículos y por ende en la disminución de su demanda.
En el siguiente grafico se muestra que en los 8 años de observaciones hay un aumento de las ventas de autos en diciembre, seguido de noviembre, julio, agosto, marzo, y septiembre, por otro lado, en todos los años en los meses de enero y febrero se presentan los menores niveles de las ventas.
ggseasonplot(VAutos,polar=T)
El modelo aditivo se asume como \(Yt=St+Tt+EtYt=St+Tt+Et\) el cual es apropiado cuando las magnitudes de las fluctuaciones estacionales o la variación alrededor del componente tendencia-ciclo no varía con el nivel de la serie de tiempo. El modelo multiplicativo se presenta como \(YT=St∗Tt∗EtYT=St∗Tt∗Et\) el cual es más común en series económicas ya que se transforma los datos hasta que la variación en la serie sea estable en el tiempo. Ya seleccionado el modelo para describir las ventas de autos en México se pretende calcular la tendencia \(TtTt\) y el componente estacional \(StSt\) por medio del error. Por medio de un modelo no paramétrico asumiremos que hay suavidad entre la estacionalidad con el tiempo, por medio de las medias móviles no pares 3, 5, 7 y 9. Los datos quedan de la siguiente manera:
ma(VAutos,order=3)
## Jan Feb Mar Apr May Jun Jul
## 2008 NA 50701.33 47520.33 47507.00 48165.33 48865.67 48293.67
## 2009 45144.67 37920.00 34194.33 32411.67 30948.00 32411.00 33632.67
## 2010 42650.67 38324.33 37626.00 37809.33 37059.33 37838.67 39178.67
## 2011 50821.00 44988.33 43481.33 44042.67 43470.33 45010.33 47036.00
## 2012 58848.00 52001.67 50619.67 51056.00 49552.33 51032.00 51768.67
## 2013 61294.33 55790.33 55602.00 56850.00 56537.33 56738.00 56458.33
## 2014 61260.67 54434.67 52588.00 54895.33 54962.67 60032.33 63323.33
## 2015 74382.67 68462.67 66368.00 66950.67 67628.33 71452.33 74424.00
## 2016 83098.33 75147.33 75550.00 78061.00 82925.00 87341.33 92003.67
## 2017 96118.67 83382.67 80408.67 80108.67 78084.67 80147.33 80715.67
## 2018 78558.33 70357.67 70447.67 71322.00 71468.33 73388.67 NA
## Aug Sep Oct Nov Dec
## 2008 47243.00 46638.67 45333.00 50282.33 48015.00
## 2009 34002.67 36451.33 37505.67 43502.67 42738.00
## 2010 40388.33 42678.33 44384.67 52144.00 52017.67
## 2011 48776.00 50183.33 51392.67 60132.33 60193.67
## 2012 52105.33 53406.33 55810.67 62785.00 63606.67
## 2013 54817.00 54682.33 57151.33 65594.33 65484.00
## 2014 64097.33 64050.67 65259.00 74922.00 76451.00
## 2015 75027.00 75585.33 77258.67 86284.67 86268.00
## 2016 91170.33 90034.67 93025.00 106061.33 104000.00
## 2017 77341.33 76544.67 80481.67 89218.33 86090.33
## 2018
ma(VAutos,order=5)
## Jan Feb Mar Apr May Jun Jul
## 2008 NA NA 49802.2 48020.8 47832.8 48357.6 47854.4
## 2009 43473.2 40461.4 34676.8 33233.0 32821.2 32104.4 33118.0
## 2010 40896.8 40780.4 37811.8 37489.6 37893.2 38324.4 39147.0
## 2011 49116.2 47976.0 44118.4 43987.8 44489.6 45347.0 47164.6
## 2012 57328.8 55604.8 50697.8 50944.0 50915.2 50558.0 51835.4
## 2013 60317.6 59303.0 56265.4 56076.0 56569.2 56666.2 55605.0
## 2014 60770.2 57946.0 54481.4 54457.4 57209.0 59814.6 61363.0
## 2015 72944.0 71244.2 67380.8 67650.4 69486.0 70957.6 72845.8
## 2016 81482.4 80748.0 76644.4 79476.6 83293.8 86758.2 88848.8
## 2017 96089.6 90106.0 80215.6 80540.4 80523.2 78615.4 78700.0
## 2018 80430.4 75589.2 70046.0 71657.2 72487.4 NA NA
## Aug Sep Oct Nov Dec
## 2008 47311.8 46658.2 48704.4 47144.6 45399.2
## 2009 35245.0 36039.0 39773.0 40708.2 41227.8
## 2010 40814.6 42719.6 47730.2 48518.0 48979.2
## 2011 48174.0 50100.4 56237.8 56068.6 56143.6
## 2012 52325.4 54313.0 58887.2 59428.2 59826.4
## 2013 55268.6 57034.6 60918.8 60684.0 60900.8
## 2014 62702.2 65992.4 70296.8 70578.8 72163.6
## 2015 74666.8 76735.8 81745.2 81773.2 81578.6
## 2016 90478.0 92818.2 100080.8 97675.8 95787.2
## 2017 78384.8 80053.6 84142.6 81609.6 80783.8
## 2018
ma(VAutos,order=7)
## Jan Feb Mar Apr May Jun Jul
## 2008 NA NA NA 49379.14 48199.43 47405.57 47638.00
## 2009 41981.29 39570.00 37984.14 34322.14 33406.14 33209.00 33692.71
## 2010 40298.43 39795.71 39781.71 37871.00 38270.29 38812.14 39737.00
## 2011 47473.29 47315.43 47053.57 44416.00 45180.43 46177.14 46642.43
## 2012 54599.71 54875.43 54412.14 50699.57 51264.71 51522.43 51301.57
## 2013 58823.43 59363.43 58584.14 56231.86 56299.86 55808.14 55757.00
## 2014 58636.00 58993.43 57750.43 56252.29 58067.43 58966.14 60373.43
## 2015 70555.86 70890.86 70767.00 69068.86 70022.14 71043.14 72121.43
## 2016 80334.00 80741.71 82067.57 80786.86 83199.86 85527.00 87167.14
## 2017 91587.14 90196.86 87429.43 80481.14 80217.86 79382.00 77550.57
## 2018 78027.14 77329.86 74984.14 71243.00 NA NA NA
## Aug Sep Oct Nov Dec
## 2008 47262.00 48595.00 47573.57 45667.29 44149.14
## 2009 34825.29 37962.29 38745.57 39213.71 39973.00
## 2010 41166.86 44955.57 46147.71 46730.71 47445.43
## 2011 48571.00 53072.71 53809.57 54501.43 55200.86
## 2012 53489.43 56549.14 57324.86 57887.57 58272.71
## 2013 56963.86 59555.71 59591.29 58902.14 58688.43
## 2014 63497.86 67549.00 69582.71 69648.00 69751.57
## 2015 74689.57 79329.14 80109.86 79680.71 79639.14
## 2016 90689.14 97527.14 96199.29 94450.86 93832.43
## 2017 80249.14 83286.14 80981.57 79568.14 78847.00
## 2018
ma(VAutos,order=9)
## Jan Feb Mar Apr May Jun Jul
## 2008 NA NA NA NA 48703.22 47674.89 47044.56
## 2009 40963.11 39716.78 38206.78 37063.00 34290.22 34352.22 34516.67
## 2010 39321.89 39628.78 39400.89 39879.56 38590.67 39381.00 40457.56
## 2011 46416.11 46867.56 46836.44 47299.89 45744.89 46225.00 47490.44
## 2012 53765.56 53895.44 53948.44 53890.89 51219.78 51686.00 52878.44
## 2013 57985.00 58370.89 58648.89 58200.89 55714.89 55674.11 56819.89
## 2014 57769.11 58330.56 59368.11 59826.44 57831.56 58890.33 61159.22
## 2015 68864.11 70337.67 71423.78 71919.11 70372.67 71135.22 72877.78
## 2016 79472.67 81452.33 83053.11 84387.67 83080.89 84308.67 87696.56
## 2017 89750.78 89176.22 88185.33 85647.67 79602.89 79033.56 80435.33
## 2018 76787.33 77014.78 76642.22 NA NA NA NA
## Aug Sep Oct Nov Dec
## 2008 48563.56 47839.78 46257.11 45148.44 42949.33
## 2009 36151.11 37200.11 37929.67 38609.89 38938.44
## 2010 43197.22 44178.22 44794.78 45840.22 46059.11
## 2011 50792.89 51795.78 52425.56 53636.67 53665.56
## 2012 54814.22 56015.00 56291.22 56893.56 57538.33
## 2013 58982.89 58968.11 58290.11 58282.00 57584.78
## 2014 64660.67 66844.67 67655.00 69160.67 68956.56
## 2015 76313.33 77768.56 78260.33 78819.67 79134.44
## 2016 93385.56 93792.00 93715.78 93538.11 91481.11
## 2017 81548.11 80927.44 79918.56 78972.44 77694.22
## 2018
Con la finalidad de estimar el componente tendencia-ciclo, se aplican las MA (3), MA (5), MA (7) y MA (9), las cuales son de orden impar y con las cuales se muestra simetría como se presenta en los gráficos siguientes:
p1<-autoplot(VAutos,series="VAutos")+autolayer(ma(VAutos,3),series="3-MA")+ xlab("Año")+ylab("Unidades vendidas")+ggtitle("Ventas anules de autos en México")
p2<-autoplot(VAutos,series="VAutos")+autolayer(ma(VAutos,5),series="5-MA")+ xlab("Año")+ylab("Unidades vendidas")+ggtitle("Ventas anules de autos en México")
p3<-autoplot(VAutos,series="VAutos")+autolayer(ma(VAutos,7),series="7-MA")+ xlab("Año")+ylab("Unidades vendidas")+ggtitle("Ventas anules de autos en México")
p4<-autoplot(VAutos,series="VAutos")+autolayer(ma(VAutos,9),series="9-MA")+ xlab("Año")+ylab("Unidades vendidas")+ggtitle("Ventas anules de autos en México")
grid.arrange(p1,p2,p3,p4)
## Warning: Removed 2 rows containing missing values (geom_path).
## Warning: Removed 4 rows containing missing values (geom_path).
## Warning: Removed 6 rows containing missing values (geom_path).
## Warning: Removed 8 rows containing missing values (geom_path).
Debido a que las fluctuaciones estaciones se observan simétricas, se usa el método aditivo, en el cual se observa los siguientes componentes:
fit<-decompose(VAutos, type="additive")
autoplot(fit)
En primera instancia, el termino de error no muestra ruido blanco, es decir no es un proceso estacionario, se observa estacionalidad simétrica y tendencia positiva en general sin embargo es más evidente el componente estacional. Debido a lo anterior, el grafico siguiente muestra la serie original y la serie desestacionalizada.
autoplot(VAutos, series="Ventas")+autolayer(seasadj(fit),series="Estacionalidad Ventas")+xlab("Año")+ylab("Indice de nuevos periodos")+ggtitle("Venta autos en México")
En los apartados anteriores, mediante la descomposición de la serie se observa que la serie de las ventas de autos presenta estacionalidad, tendencia y un cambio de la tendencia en los últimos periodos de la serie. Por lo anterior, a continuación, se presenta la estimación del modelo de regresión de las ventas en función del tiempo, del tiempo al cuadrado y con medias estacionales para evaluar el tiempo, el cambio de tendencia en el tiempo y la estacionalidad respectivamente. El modelo estimado sería el siguiente:
\(V_t = B_0+{B_1}*t+ {B_2}* t^2+{B_3}* MA+ut\)
Donde: \(V_t\)=Ventas de autos \(B_0\)=Constante, en la que seria las ventas de autos en el tiempo 0, coeficiente que no tendría explicación lógica en para efectos de dicha estimación. \(B_1\)=Coeficiente de cambio del tiempo \(B_2\)=Coeficiente de cambio del tiempo al cuadrado \(B_3\)=Coeficiente de cambio del efecto estacional \(t\)=tiempo \(t^2\)=tiempo al cuadrado \(MA\)=media estacional \(ut\)=termino de error
Ventasmes=season(VAutos)
VentasAutos2<-lm(VAutos~time(VAutos)+I(time(VAutos)^2)+Ventasmes)
summary(VentasAutos2)
##
## Call:
## lm(formula = VAutos ~ time(VAutos) + I(time(VAutos)^2) + Ventasmes)
##
## Residuals:
## Min 1Q Median 3Q Max
## -18394.5 -4694.9 -959.1 3542.2 27766.0
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1.040e+09 3.475e+08 2.993 0.00340 **
## time(VAutos) -1.038e+06 3.452e+05 -3.006 0.00326 **
## I(time(VAutos)^2) 2.589e+02 8.573e+01 3.020 0.00312 **
## VentasmesFebruary -3.203e+03 3.420e+03 -0.936 0.35109
## VentasmesMarch -1.024e+02 3.420e+03 -0.030 0.97616
## VentasmesApril -5.861e+03 3.421e+03 -1.713 0.08941 .
## VentasmesMay -2.607e+03 3.421e+03 -0.762 0.44769
## VentasmesJune -1.378e+03 3.422e+03 -0.403 0.68800
## VentasmesJuly -6.913e+02 3.422e+03 -0.202 0.84027
## VentasmesAugust 2.384e+03 3.508e+03 0.680 0.49814
## VentasmesSeptember -1.917e+03 3.508e+03 -0.546 0.58583
## VentasmesOctober 1.238e+03 3.509e+03 0.353 0.72478
## VentasmesNovember 6.382e+03 3.509e+03 1.819 0.07160 .
## VentasmesDecember 2.186e+04 3.509e+03 6.230 8.23e-09 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 8021 on 113 degrees of freedom
## Multiple R-squared: 0.8252, Adjusted R-squared: 0.805
## F-statistic: 41.02 on 13 and 113 DF, p-value: < 2.2e-16
Los resultados son los siguientes: \(V_t = B_0+{B_1}*t+ {B_2}* t^2+{B_3}* MA+ut\) Los resultados son los siguientes: \(V_t = 1.040+e+09-1.038e+0.6*t+2.589e+02t^2+MA\) Lo anterior explica que, por un aumento de \(t\), es decir del tiempo en una unidad(mes), las ventas disminuyen en 1-038e+0.6 unidades; por un aumento de \(t^2\) las ventas se incrementan en \(2.589e+06\) y donde \(MA\) se explica en el cuadro de arriba, cuando es diciembre, por ejemplo, las ventas aumentan en \(2.186e+04\).
Se plantea con la siguiente hipótesis:
\(H_0=B_0=0\) \(H_1=B_0\not =0\)
Lo que se pretende es rechazar a H0, siendo que cada coeficiente sea distinto a cero, siendo así que las variables sean estadísticamente significativas.
En el cuadro de resultados de la regresión se observa que solo tres primeras probabilidades correspondientes al intercepto tiempo y tiempo al cuadrado son menores a \(α = 5%\) por lo que se rechaza la hipótesis nula, dando que las estimaciones fueron correctas. En cuanto a las demás al ser mayores \(α = 5%\), se acepta \(H_0\). Sin embargo, se puede concluir que la prueba es estadísticamente significativa en un 82%, debido a que el \(R^2\) es de .8252, por lo que en las variables consideradas explican en un 82% a las ventas de autos.
En la justificación del modelo esperamos que el valor de cada coeficiente sea diferente de cero, en los resultados se observa que el valor de F es de .41 y el pvalue es mayor a 5% lo que nos indica que el nivel de significancia, es decir la varianza del tiempo, del tiempo al cuadrado un del componente estacional no explican a las varianzas del la variable dependiente ventas de autos.
A continuación, se presentan los análisis de los residuos mediante el histograma, el correlograma, los gráficos cuantil-cuantil y la grafica en el tiempo.
Las siguientes dos gráficas, de los residuos, analizan el componente estocástico no observado \({x_t}\), si nuestro modelo de tendencia es correcto, los residuales deben comportarse como un proceso estocástico, es decir como ruido blanco y nos indicaría que el componente estocástico fue modelado adecuadamente.
par(mfrow=c(1,1))
autoplot(VAutos)+geom_smooth(method="lm", se=FALSE)
autoplot(VAutos)+geom_smooth()
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
plot(y=rstandard(VentasAutos2),x=as.vector(time(VAutos)),xlab="Tiempo",ylab="Residuales estandarizados",type="o")
points(y=rstandard(VentasAutos2),x=as.vector(time(VAutos)),pch=as.vector(season(VAutos)))
Se puede observar que no presentan un comportamiento como un proceso estocástico, lo cual indica con base en las gráficas una mala especificación del modelo.
La normalidad del modelo estimado se evalúa también con los siguientes gráficos, que siguen una distribución normal teórica. El de la izquierda muestra la distribución del modelo y el de la derecha el de los residuos. Podemos observar que el modelo se distribuye como una moral, mas no los residuos ya que en las colas se aleja.
par(mfrow=c(1,2))
qqnorm(VAutos);qqline((VAutos),col="red")
qqnorm(rstandard(VentasAutos2));qqline(rstandard(VentasAutos2),col="green")
El histograma se observa con forma mesocúrtica, es decir la curva se estira y hay una desviación estándar de más de menos x con respecto a la media.
hist(rstandard(VentasAutos2),xlab="Residuales estandarizados")
Se plantea la siguiente hipótesis con respecto a la prueba Shapiro test y Jarque-Bera, donde se busca aceptar H0 para saber si el componente estocástico esta normalmente distribuido.
\(H_0=N\) (existe normalidad en los residuales) \(H_1\not =N\) N (No existe normalidad en los residuales)
shapiro.test(rstandard(VentasAutos2))
##
## Shapiro-Wilk normality test
##
## data: rstandard(VentasAutos2)
## W = 0.96814, p-value = 0.004326
library(normtest)
ajb.norm.test(rstandard(VentasAutos2))
##
## Adjusted Jarque-Bera test for normality
##
## data: rstandard(VentasAutos2)
## AJB = 16.6, p-value = 0.007
Para el valor de Shapiro test el pvalue es menor el 5% por lo que se dice que el modelo se distribuye como una normal. Mientras que para el caso del Jarque-Bera tenemos que el pvalue es de igual manera mejor el 5%. Ambas pruebas nos indican que los datos se distribuyen como una normal.
En el siguiente grafico se observan las líneas discontinuas que nos indican una fuerte autocorrelación, lo que se sustenta con la prueba Durbin-Watson, buscando un valor cercano a 2 tenemos que el valor es de 0.34397 indicando autocorrelación en los errores.
ggAcf(rstandard(VentasAutos2))
require(lmtest)
## Loading required package: lmtest
## Loading required package: zoo
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
dwtest(VentasAutos2)
##
## Durbin-Watson test
##
## data: VentasAutos2
## DW = 0.34397, p-value < 2.2e-16
## alternative hypothesis: true autocorrelation is greater than 0
La mayorria de las pruebas indican una mala especificacion del modelo, entendiendo que hay variables que no estamos considerando que podrian explical la venta de autos en mayor medida que unamente el tiempo, su tendencia y el componnete estacional. Sin embargo en esta practica no se analizara una variable mas que explique a las ventas.