library(readxl)
## Warning: package 'readxl' was built under R version 3.4.4
library(forecast)
## Warning: package 'forecast' was built under R version 3.4.4
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 3.4.4
library(gridExtra)
## Warning: package 'gridExtra' was built under R version 3.4.4
library(fpp2)
## Warning: package 'fpp2' was built under R version 3.4.4
## Loading required package: fma
## Warning: package 'fma' was built under R version 3.4.4
## Loading required package: expsmooth
## Warning: package 'expsmooth' was built under R version 3.4.4
library(TSA)
## Warning: package 'TSA' was built under R version 3.4.4
##
## Attaching package: 'TSA'
## The following objects are masked from 'package:stats':
##
## acf, arima
## The following object is masked from 'package:utils':
##
## tar
Miel <- library(readxl)
Miel <- read_excel("C:/Users/UDI/Desktop/Miel.xls")
View(Miel)
Se eligio la producción mensual de miel en México por toneladas en un periodo de quince años (2001-2016)
st<-ts(Miel$Produccion,frequency=12,start=c(2003,1))
plot(st,col="darkgreen",ylab="Producción en toneladas",xlab="Años",lwd=.5,main="Producción mensual de miel en México (2003-2016)",type="l",pch=5)
monthplot(st)
fit<-decompose(st)
plot(fit,col="brown",ylab="eje y",xlab="eje x",lwd=.5,type="l",pch=5)
La serie muestra una una tendencia negativa en el periodo de 2002 a 2004 y de 2004 en adelante mantiene una tendencia positiva.Solo presenta esos dos ciclos a lo largo del lapso observado.
En la última gráfica (random) podemos apreciar que las variables que construyen la serie son independientes, aleatorias e identicamente distribuidas.
Con base en la gráfica de la estacionalidad se puede apreciar que lo largo del año, la producción de miel alcanza dos temporadas altas.
ggseasonplot(st)
Fuente: http://www.inegi.org.mx/sistemas/bie/
p1<-autoplot(st, series="Producción")+autolayer(ma(st,3),series="3-MA")+xlab("Años")+ylab("Produccón en toneladas")+ggtitle("Producción mensual de miel en México (2001-2016)")
p2<-autoplot(st, series="Producción")+autolayer(ma(st,5),series="5-MA")+xlab("Años")+ylab("Produccón en toneladas")+ggtitle("Producción mensual de miel en México (2001-2016)")
p3<-autoplot(st, series="Producción")+autolayer(ma(st,7),series="7-MA")+xlab("Años")+ylab("Produccón en toneladas")+ggtitle("Producción mensual de miel en México (2001-2016)")
p4<-autoplot(st, series="Producción")+autolayer(ma(st,9),series="9-MA")+xlab("Años")+ylab("Produccón en toneladas")+ggtitle("Producción mensual de miel en México (2001-2016)")
grid.arrange(p1,p2,p3,p4)
## Warning: Removed 2 rows containing missing values (geom_path).
## Warning: Removed 4 rows containing missing values (geom_path).
## Warning: Removed 6 rows containing missing values (geom_path).
## Warning: Removed 8 rows containing missing values (geom_path).
fit2<-decompose(st, type = "additive")
autoplot(fit2)
Si existe evidencia de estacionalidad en la serie por lo que se procedera a realizar la gráfica de los datos estacionalmente ajustados
autoplot(st, series="Produccion")+autolayer(seasadj(fit), series="Seasonally adj. data") +xlab("Años") + ylab("Producción en toneladas")+ggtitle("Producción mensual de miel en México (2003-2016)")
De esta manera podemos hacer una comparación razonable de la produccion mensual de miel entre los años observados.
mes. <- season(st)
modelo1 <- lm(st ~ mes. + time(st) + I(time(st)^2))
summary(modelo1)
##
## Call:
## lm(formula = st ~ mes. + time(st) + I(time(st)^2))
##
## Residuals:
## Min 1Q Median 3Q Max
## -2407.75 -565.59 -22.22 512.61 2882.35
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 2.109e+07 2.243e+07 0.940 0.348653
## mes.February 7.604e+02 3.427e+02 2.219 0.028091 *
## mes.March 2.714e+03 3.427e+02 7.919 6.26e-13 ***
## mes.April 5.122e+03 3.428e+02 14.942 < 2e-16 ***
## mes.May 4.730e+03 3.428e+02 13.798 < 2e-16 ***
## mes.June 1.697e+03 3.428e+02 4.950 2.07e-06 ***
## mes.July -1.228e+03 3.429e+02 -3.583 0.000466 ***
## mes.August -1.586e+03 3.429e+02 -4.624 8.37e-06 ***
## mes.September -6.066e+02 3.430e+02 -1.769 0.079064 .
## mes.October 2.660e+03 3.430e+02 7.754 1.57e-12 ***
## mes.November 6.075e+03 3.431e+02 17.707 < 2e-16 ***
## mes.December 4.608e+03 3.432e+02 13.429 < 2e-16 ***
## time(st) -2.102e+04 2.232e+04 -0.942 0.347912
## I(time(st)^2) 5.240e+00 5.555e+00 0.943 0.347111
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 873.8 on 142 degrees of freedom
## Multiple R-squared: 0.9029, Adjusted R-squared: 0.8941
## F-statistic: 101.6 on 13 and 142 DF, p-value: < 2.2e-16
La regresión señala que únicamente los meses marzo, abril, mayo, junio, julio, agosto, octubre, noviembre y diciembre son estadisticamente significativos para explicar el comportamiento de la serie de produccion de miel a través del tiempo.
La estacionalidad queda tambien reflejada en la falta de significancia estadística en el resto de los meses.Abril y mayo son los coeficientes mas altos de la serie y guardan una relacion positiva con el intercepto de 5.1% y 4.7% respectivamente en cada aumento del 2.1%
En promedio las medias estacionales explican en .89 la variacion de la produccion anual de miel en México segun el resultado de la R cuadrada
plot(y=rstandard(modelo1), x=time(st), type='l')
Esta es la gráfica de la regresión con media ajustada de la serie de producción de miel
qqnorm(rstandard(modelo1)); qqline(rstandard(modelo1))
ggAcf(rstandard(modelo1))
Estas dos gráficas muestran el grado de la correlacion que guardan los coeficientes estimados en la regresion. Podemos observar que hay tres momentos en los que los errores se salen de la media 0.
El gráfico de Q-q normal ratifica la conclusión anterior, ya que los valores observados no se situan sobre la recta esperada bajo el supuesto de normalidad.
hist(rstandard(modelo1))
La distribución de los errores mantienen normaldidad como podemos observar con la curtosis en forma de campana de la gráfica, sin embargo, se concentran más hacia la izquierda
shapiro.test(rstandard(modelo1))
##
## Shapiro-Wilk normality test
##
## data: rstandard(modelo1)
## W = 0.98439, p-value = 0.07605
El valor de P es mayor a 0.05 por lo que los errores mantienen una distribucion de normalidad por lo que se no puede ser rechazada la hipotesis nula de que el componente estocastico no presenta normalidad
\[ Produccion De Miel=\beta_0+\beta_1meses+\beta_2tiempo^2+U \]
La serie observada es una serie de tiempo estacionaria, mantiene estacionalidad, con tendencias tanto negativas como positivas al igual que sus ciclos. No guarda normalidad en la distribucion de sus residuos.