Los datos del archivo adjunto corresponden a datos reales de ventas de un supermercado. Realice una análisis de los datos para determinar el tipo de serie de tiempo de cada producto y sus características.
Publique sus resultados en informe en Rpubs con el procedimiento que desarrolló, sus resultados y análisis. Comparta el vínculo de la publicación en el campo disponible.
En el archivo hay datos de los siguientes productos:
Aunque no lo indica explícitamente en el archivo de Excel, por las características del mismp asumiremos que se refieren a ventas diarias.
Lo primero que vamos a hacer es cargar las bibliotecas que usaremos en el taller.
## Warning: package 'tidyverse' was built under R version 3.6.2
## Warning: package 'forecast' was built under R version 3.6.2
## Warning: package 'readxl' was built under R version 3.6.2
df <- read_excel("DATOS SUPERMERCADO.xlsx")
cafe <- ts(df$`CAFÉ MOLIDO BOLSA X 250 G`, frequency = 7, start = c(1,5), end = c(52,5))
chocolate_amargo <- ts(df$`CHOCOLATE AMARGO EN BARRA X 250 G`,frequency = 7, start = c(1,5), end = c(52,5))
aceite <- ts(df$`ACEITE VEGETAL SOLIDO EN BARRA X 500 G`, frequency = 7, start = c(1,5), end = c(52,5))
chocolate_clavo <- ts(df$`CHOCOLATE CLAVOS Y CANELA EN BARRA X 250 G`, frequency = 7, start = c(1,5), end = c(52,5))
salsa_tomate <- ts(df$`SALSA DE TOMATE DOYPACK X 200 G`, frequency = 7, start = c(1,5), end = c(52,5))
azucar <- ts(df$`AZUCAR BLANCO X 2500 G`, frequency = 7, start = c(1,5), end = c(52,5))
#Gráfia de la serie
autoplot(cafe)
La gráfica de la serie cafe no parece mostrar una tendencia, en cuanto a la estacionalidad, pereciera que si hubiese una apariencia que tiene esete componente, para verificarlo vamos a usar la función mstl() graficando la descomposición de la serie de tiempo
#Descomposición de la serie
autoplot(mstl(cafe))
Como lo anticipamos en eefecto no se observa una tendencia en las ventas del producto, pero su un componente estacional de cada siete (7) días. Los residuos observados sugieren tener un componente aleatorio.
Grafiquemos el autocorrelograma y las sub-series para la serie café
#Autocorrelograma de la serie
ggAcf(cafe)
#Gráfica de las sub series
ggsubseriesplot(cafe)
El autocorrelograma comfirma la existencia de estacionalidad cada siete (7) días, se puede ver como la autocorrelación en los días 7, 14 y 21 supera el límete establecio para la variación de la autocorrelación. Seria conveniente revisar algunos posibles atípicos en las ventas de los domingos y lunes.
Luego las ventas de CAFÉ MOLIDO BOLSA X 250 G es una serie temporal estacionaria, sin tendencia, con un componentes estacional de que se repite con frecuencia igual a cada siete (7) días
#Gráfia de la serie
autoplot(chocolate_amargo)
Al observar la gráfica de la serie no se observa una tendencia en las ventas de la serie, sin embargo se ven unos picos que se repiten sin una frecuencia específica por lo que estos valores, puede ser o atípicos o un componente cíclico que tenga la venta del producto.
Veamos la descomposición de la serie
#Descomposición de la serie
autoplot(mstl(chocolate_amargo))
Al ver la descomposición de la serie se pareciera que se observa una estacionalidad de cada siete días, y en cuanto a los residuos se puede ver un componente aleatorio, con la particularidad que para los días de los valores muy altos los los residuos son también positivos y altos, esto sugiere que tal que se debe revisar si esos picos de venta en efecto corresponde a un componente cíclico o más bien sean atípicos.
Grafiquemos el autocorrelograma y las sub-series para la serie chocolate_amargo
#Autocorrelograma de la serie
ggAcf(chocolate_amargo)
#Gráfica de las sub series
ggsubseriesplot(chocolate_amargo)
En este caso el autocorrelograma, no presenta evidencia de estacionalidad como inicialmente sugueria la descomposición de la serie temporal, el gráfico por sub-series muestra unas ventas promedio muy similares todos los días de la semana, excepto los viernes que es un poco más baja, en cuanto a los picos de ventas, se debe confirmar si en efecto se corresponden con ventas cíclicas o por el contrario son datos atípicos.
En conclusión las ventas de CHOCOLATE AMARGO EN BARRA X 250 G es una serie temporal estacionaria, sin tendencia, que al parecer tiene un componente cíclico (aunque se debe verificar que no sean atípicos)
#Gráfia de la serie
autoplot(aceite)
Al observar las serie pareceiera que las ventas se concentra en algunos días, ya que hay secuencias de ventas cero (0) o abría que verificar si son valores perdidos.
Vemaos la descomposición de la serie para indagar más y entender mejor el patrón que sigue
#Descomposición de la serie
autoplot(mstl(aceite))
La descomposición de la serie sugiere que la serie no tiene un tendencia, aunque si pareciera que hubiese una estacionalidad en las ventas, en cuanto a los residuos, estos no parecen comportarse aleatoriamente, lo que sugiere que la serie no es estacionaria.
Grafiquemos el autocorrelograma y las sub-series para la serie aceite
#Autocorrelograma de la serie
ggAcf(aceite)
#Gráfica de las sub series
ggsubseriesplot(aceite)
Tanto el correlográma como la gráfica de las sub-series, no parecen confirmar la sospecha de la presencia de estacionalidad que mostraba el gráfico de descomposición de la serie. Se puede ver que el promedio en las subseries es similar, sin embargo la varivilidad no parece ser las misma en las distintas subseries.
Por lo que las ventas de ACEITE VEGETAL SOLIDO EN BARRA X 500 G es una serie temporal no estacionariay sin tendencia
#Gráfia de la serie
autoplot(chocolate_clavo)
La serie no presenta una tendencia definda, a continuación graficaremos la descomposición de la serie para entender mejor la estructura de la serie en cuanto a los otros componentes de esta.
#Descomposición de la serie
autoplot(mstl(chocolate_clavo))
La descomposición de la serie en efecto confirma que la misma no presenta tendencia definada, en cuanto a la estacionalidad aunque hay un cierto componente, este no parece repetirse con la misma intensidad, los residuos si bien no tienen un patrón y la mayoría parece estar variando en un rango concreto se presenta algunos picos que pueden sugerir que la serie no sea estacionaria.
Grafiquemos el autocorrelograma y las sub-series para la chocolate_clavo
#Autocorrelograma de la serie
ggAcf(chocolate_clavo)
#Gráfica de las sub series
ggsubseriesplot(chocolate_clavo)
Tanto la gráfica de autocorrelaciones, como la de sub series pareciera confirmar lo que mostraban los residuos, que la serie no es estacionaria, además los sábados en promedio dse vende más que el resto de los días de la semana.
Por lo que las ventas de CHOCOLATE CLAVOS Y CANELA EN BARRA X 250 G es una serie temporal no estacionariay sin tendencia
#Gráfia de la serie
autoplot(salsa_tomate)
La gráfica no muestra una tendencia definida, si pareciera que hubiese una cierta estacionalidad, también se observa unos días donde la venta es cero (0) unidades, lo que sugeriria verificar si en efecto es que no hubo ventas o si por el contrario son valores perdidos, también se observan ciertos picos de ventas que sería conveniente validar que no sean atípicos.
Veamos la descomposición de la serie de “salsa_tomate”
#Descomposición de la serie
autoplot(mstl(salsa_tomate))
La descomposición de la serie temporal parece confirmar la no existencia de tendencia, en cuanto a la estacionalidad parece existir ese componente, los residuos sugieren variar sin un patrón definido.
Grafiquemos el autocorrelograma y las sub-series para la salsa_tomate
#Autocorrelograma de la serie
ggAcf(salsa_tomate)
#Gráfica de las sub series
ggsubseriesplot(salsa_tomate)
Los gráficos de correlograma y de sub-series aportan evidencia en torno a la hipótesis que indica que las ventas de salsa de tomate tiene una componente estacional con frecuencia semanal.
Luego las ventas de SALSA DE TOMATE DOYPACK X 200 G es una serie temporal estacionariay sin tendencia y con componente estacional
#Gráfia de la serie
autoplot(azucar)
La serie de tiempo no muestra una tendencia definida, pero si mucha variabiliad, también se observa al inicio de la serie varios días en las que no hubo ventas, sería bueno validar si en efecto este fue el caso, o por el contrario son datos perdidos o no registrados.
Veamos la descomposición de la serie, para entender si hay o no algún patr;on de estacionalidad presente.
#Descomposición de la serie
autoplot(mstl(azucar))
La no tendencia se ratifica, pareciera que hay un componente estacional en la serie, los residuos sugieren algunos picos de variabilidad fuera del rango que probablemente indiquen que la serie no es estacionaria.
Grafiquemos el autocorrelograma y las sub-series para la azucar
#Autocorrelograma de la serie
ggAcf(azucar)
#Gráfica de las sub series
ggsubseriesplot(azucar)
Los gráficos de autocorrelacion y de subseries, parecen confirmar la presencia de estacionalidad, en concreto los días sábados se vende más en promedio más que azúcar blanca que el resto de los días de la semana. Otra conclusión que se obtiene de los gráficos anteriores es la no estacionareidad de la serie de tiempo, puede verse como al menos las cuatro primera autocorrelaciones nos superiores al límite superior de referencia.
Por lo que las ventas de AZUCAR BLANCO X 2500 G es una serie temporal no estacionariay sin tendencia y con componente estacional