En este informe se hace un analisis de series temporales y pronostico de la empresa Bucanero S.A, una de las empresas con mayor participación en producción y ventas de Aves tanto a nivel nacional, como a nivel Valle del Cauca.
Pollos Bucaneros es una destaca empresa Colombiana, especializada en la producción y comercialización de productos alimenticios nutritivos, principalmente pollo. Es una de las avicolas lideres en Colombia y forma parte desde el año 2017 del gigante global de la industria Cargill.
Pollos Bucanero ofrece una alta gama de productos de productos de pollo, entre los que se encuentran, pollo fresco y congelado, producotos de valor agregado, opciones saborizadas y visceras
Instalar/Cargar librerias necesarias para el análisis
#Cargar librerías necesarias
library(readxl) # Para leer archivos Excel
library(tseries) # Para pruebas de estacionariedad
library(forecast) # Para modelado ARIMA y pronósticos
library(ggplot2) # Para visualización de datos
library(plotly) # Para gráficos interactivos
library(timetk) #timetk simplifica y acelera el análisis exploratorio, visualización, y preparación de datos temporales para modelado. Es ideal para quienes trabajan con series temporales en un flujo de trabajo "tidy" y buscan integrar análisis visuales, detección de patrones y forecasting en un solo paquete.
Cargar base de datos
library(readxl)
data_col <- read_excel("C:/Users/Geovani Zamora/OneDrive/Escritorio/CASO 2 R/Datos Caso 2.xlsx", col_types = c("date",
"numeric", "numeric", "numeric", "numeric",
"numeric", "numeric", "numeric", "numeric",
"numeric", "numeric", "numeric", "numeric",
"numeric", "numeric", "numeric", "numeric",
"numeric", "numeric", "numeric", "numeric",
"numeric", "numeric", "numeric", "numeric",
"numeric", "numeric", "numeric", "numeric",
"numeric", "numeric", "numeric", "numeric",
"numeric", "numeric", "numeric", "numeric",
"numeric", "numeric", "numeric", "numeric",
"numeric", "numeric", "numeric", "numeric",
"numeric", "numeric", "numeric", "numeric",
"numeric", "numeric", "numeric", "numeric",
"numeric", "numeric", "numeric", "numeric",
"numeric", "numeric", "numeric", "numeric",
"numeric"))
Las variables seleccionadas para efectur el analisis y pronostico de los desempeño de la compañia son Variable 1 importación de cereales, Variable 2 producción de Pollos a nivel nacional y Varible 3 (producción de Pollos en el Valle del Cauca).
Las tres variables seleccionadas en primera instancia, se podria indicar que presentar una relacion directa y fuerte, con una dependencia considerable. Dado, que segun cifras de la ANDI, la industria avicola es el mayo consumidor de alimentos para alimentos, representando el 65% del total de importaciones de alimentos para animales, destacando el consumo de maiz amarillo, cereal con mayor uso en al alimentación de las aves.
PASO INDISPENSABLE: Declarar la (s) variable (s) como serie (s) temporal (es):
Variable Importación de Cereales
# Convertir/declarar variable 1=Importación de Cereales en serie de tiempo mensual
variable1_ts <- ts(data_col$M_CEREAL, start = c(2012, 1), frequency = 12)
variable1_ts
## Jan Feb Mar Apr May Jun Jul
## 2012 130488.68 170760.24 150305.77 112970.29 171028.68 173377.41 130779.12
## 2013 174878.60 148872.59 102558.49 203834.71 143799.75 140773.61 228355.85
## 2014 105236.84 125248.74 146145.21 238881.10 231599.26 179125.59 92573.43
## 2015 181346.01 138858.00 166598.35 180075.91 199772.41 98064.31 96163.32
## 2016 140790.90 136539.24 153555.26 245910.28 157028.00 57305.22 88277.80
## 2017 145475.11 116937.84 214756.32 204681.76 75436.90 97989.00 96763.43
## 2018 154842.08 99009.76 150132.47 188181.24 182990.25 156560.18 104369.47
## 2019 182837.33 122823.96 143154.85 187626.02 181138.52 114712.02 158222.13
## 2020 226081.46 206790.11 133135.30 194238.41 195012.50 140688.95 127811.57
## 2021 168362.03 175159.63 241602.31 216342.77 203543.60 214196.52 189115.07
## 2022 231997.90 176420.62 377815.90 275554.59 316034.78 330913.11 267161.17
## 2023 232492.41 253829.89 336580.50 248993.64 220930.55 185685.56 206086.04
## 2024 202870.30 179162.77 217248.34 236529.82 262284.36 177963.37 123368.40
## Aug Sep Oct Nov Dec
## 2012 209066.36 154539.70 162266.56 177411.83 179662.26
## 2013 165477.74 129904.20 146619.12 136963.24 130192.23
## 2014 106245.69 155162.32 145195.89 75898.77 88385.75
## 2015 121567.49 133577.01 114400.86 108865.64 110490.03
## 2016 119695.30 136907.56 133528.75 100765.46 84857.12
## 2017 112388.61 140841.41 125074.25 92688.23 87718.28
## 2018 137571.35 113941.63 145878.28 124574.62 109430.60
## 2019 239728.89 168349.34 114161.10 146884.46 116240.81
## 2020 166267.17 133404.40 144408.08 163827.69 130209.92
## 2021 236088.30 191084.91 303131.61 203863.59 227212.86
## 2022 317699.79 242911.52 273134.00 241116.53 273212.27
## 2023 283608.77 161500.03 183800.39 163547.31 252087.78
## 2024 234965.51 166055.79 208222.38 199493.94 205484.87
Variable Producción de Pollos a Nivel Nacional
# Convertir/declarar la Variable Pollo en serie de tiempo mensual
variable2_ts <- ts(data_col$POLLO, start = c(2012, 1), frequency = 12)
variable2_ts
## Jan Feb Mar Apr May Jun Jul
## 2012 91721.61 94142.30 88748.18 92013.41 93279.24 91314.75 85934.76
## 2013 102363.98 102875.96 98330.23 96164.43 102075.96 108350.85 104104.91
## 2014 106197.36 110133.59 103197.17 105954.06 109403.32 112677.66 111061.74
## 2015 115792.62 118873.07 113713.78 119043.57 120466.53 113405.45 113300.36
## 2016 124206.78 120032.40 117024.65 121569.62 119589.96 120656.25 119707.67
## 2017 131659.80 130484.69 121952.89 123962.79 122845.66 126745.99 130163.07
## 2018 126092.16 128869.53 125704.17 133765.31 137389.12 141774.82 137681.85
## 2019 134114.63 135908.08 129794.01 131683.46 140610.05 147000.19 139211.72
## 2020 143717.95 147147.06 137739.46 136479.81 116092.75 102369.20 118464.78
## 2021 133650.94 134213.48 129669.19 145854.17 147160.96 128269.37 129431.15
## 2022 148780.18 147752.77 139974.80 148835.06 150382.43 152736.19 149930.18
## 2023 152778.62 154942.57 141342.54 146778.12 138725.93 143836.02 151160.53
## 2024 146670.25 151062.12 145678.30 146285.84 152650.08 157002.95 148202.52
## Aug Sep Oct Nov Dec
## 2012 90465.71 95904.98 91873.01 97307.48 99554.95
## 2013 109811.58 113429.54 110209.13 114715.85 111837.83
## 2014 116671.17 116616.51 121499.06 126515.35 119226.47
## 2015 118715.14 119359.22 119806.21 125709.60 126202.13
## 2016 118099.12 126959.91 130587.16 129761.49 130727.74
## 2017 128387.97 136740.14 134601.16 138998.94 137064.01
## 2018 138700.74 143771.77 134467.86 140107.07 141334.79
## 2019 139890.73 149043.48 143802.26 152612.96 149506.78
## 2020 138648.94 143973.52 144064.42 148785.46 142301.21
## 2021 141917.90 150464.44 149214.12 150818.57 153670.57
## 2022 149606.80 156882.57 160015.22 158998.13 156231.77
## 2023 152113.55 160168.91 156991.78 161527.41 156763.90
## 2024 152107.76 156103.22 151683.90 158293.69 156027.51
Variable Producción de Pollos en el Valle del Cauca
# Convertir/declarar las ventas de POLLO en el Valle en serie de tiempo mensual
variable3_ts <- ts(data_col$POLLO_V, start = c(2012, 1), frequency = 12)
variable3_ts
## Jan Feb Mar Apr May Jun Jul Aug
## 2012 13518.16 13579.57 13502.11 14575.28 14565.48 13434.11 12662.66 13002.30
## 2013 14003.60 13598.02 17994.93 15756.23 15247.82 15302.08 15560.96 16787.54
## 2014 17160.85 18042.63 17530.63 18583.41 18531.03 19541.67 19007.82 19535.39
## 2015 21967.08 22318.20 20011.13 21414.71 21776.54 21331.25 20859.23 21857.07
## 2016 25419.39 23836.67 23425.54 25223.50 24874.07 24428.70 24432.43 24351.71
## 2017 26767.99 27349.59 25185.77 25243.04 25288.09 26999.44 27039.38 27198.80
## 2018 26888.51 27943.05 26847.86 28596.43 28700.71 32243.89 31172.15 30795.92
## 2019 28648.63 28152.79 27272.11 27203.26 28599.35 30283.57 29120.47 29407.24
## 2020 29349.13 29540.82 27833.77 25791.75 21732.97 18630.33 22950.05 27290.86
## 2021 25884.72 25811.36 24460.44 27693.47 27901.31 17622.96 20657.57 27045.41
## 2022 29200.71 30401.75 26620.46 28501.35 27980.21 30308.21 28577.47 30309.97
## 2023 30902.26 30673.37 26606.57 29190.77 26320.95 28955.32 29441.06 29927.85
## 2024 31190.50 30788.20 29047.01 28744.59 30447.01 30274.53 30194.80 30826.10
## Sep Oct Nov Dec
## 2012 13811.78 12623.49 14419.18 13997.19
## 2013 17165.77 16901.55 18339.54 17439.61
## 2014 18206.56 19826.65 22212.84 20839.27
## 2015 21643.92 22028.13 22155.39 25570.60
## 2016 26439.72 26252.85 26615.81 26619.36
## 2017 29612.29 29085.95 28658.94 29722.71
## 2018 31105.56 28728.88 29415.70 28665.26
## 2019 30889.64 28887.32 30416.51 29872.71
## 2020 28458.63 28632.59 29462.15 27626.71
## 2021 29695.43 29012.25 29864.17 30304.56
## 2022 30967.86 33589.17 31595.13 32182.50
## 2023 31185.45 31502.72 29734.15 31056.28
## 2024 32768.56 32987.00 33245.00 33140.00
Gráfico inicial de la variable Importación de Cereales en niveles -Original
library(ggplot2)
library(plotly)
# Convertir la serie temporal a un vector numérico para lograr graficar con ggplot2
data_col$variable1 <- as.numeric(variable1_ts)
# Crear el gráfico
grafico_serie <- ggplot(data_col, aes(x = seq.Date(from = as.Date("2012-01-01"), by = "month", length.out = nrow(data_col)),
y = variable1)) +
geom_line(color = "grey", linewidth = 0.4) + # Cambiado 'size' por 'linewidth'
geom_point(color = "black", size = 0.1) +
ggtitle("Variable 1: Serie original") +
xlab("Tiempo") +
ylab("Unidad Variable 1") +
theme_minimal()
ggplotly(grafico_serie)
Extracción señales variable Importación de Cereales
# Cargar librerías necesarias
library(ggplot2)
library(plotly)
# Descomposición de la serie temporal
stl_decomp_var1 <- stl(variable1_ts, s.window = "periodic")
# Convertir la descomposición a un data frame para graficar con ggplot2
stl_df_var1 <- data.frame(
Time = rep(time(variable1_ts), 4), # Tiempo repetido para cada componente (son 4 componentes)
Value = c(stl_decomp_var1$time.series[, "seasonal"],
stl_decomp_var1$time.series[, "trend"],
stl_decomp_var1$time.series[, "remainder"],
variable1_ts),
Component = rep(c("Estacional", "Tendencia", "Residuo", "Serie Original"), each = length(variable1_ts))
)
# Crear gráfico con ggplot2
p <- ggplot(stl_df_var1, aes(x = Time, y = Value, color = Component)) +
geom_line() +
facet_wrap(~Component, scales = "free_y", ncol = 1) +
theme_minimal() +
labs(title = "Descomposición temporal de la variable 1",
x = "Tiempo",
y = "Valor")
# Convertir a gráfico interactivo con plotly
ggplotly(p)
Extracción señales variable Producción de Pollo a Nivel Nacional
# Cargar librerías necesarias
library(ggplot2)
library(plotly)
# Descomposición de la serie temporal
stl_decomp_var2 <- stl(variable2_ts, s.window = "periodic")
# Convertir la descomposición a un data frame para graficar con ggplot2
stl_df_var2 <- data.frame(
Time = rep(time(variable2_ts), 4), # Tiempo repetido para cada componente
Value = c(stl_decomp_var2$time.series[, "seasonal"],
stl_decomp_var2$time.series[, "trend"],
stl_decomp_var2$time.series[, "remainder"],
variable2_ts),
Component = rep(c("Estacional", "Tendencia", "Residuo", "Serie Original"), each = length(variable2_ts))
)
# Crear gráfico con ggplot2
p <- ggplot(stl_df_var2, aes(x = Time, y = Value, color = Component)) +
geom_line() +
facet_wrap(~Component, scales = "free_y", ncol = 1) +
theme_minimal() +
labs(title = "Descomposición temporal de la variable 2",
x = "Tiempo",
y = "Valor")
# Convertir a gráfico interactivo con plotly
ggplotly(p)
Extracción señales variable Producción de Pollo en el Valle
# Cargar librerías necesarias
library(ggplot2)
library(plotly)
# Descomposición de la serie temporal
stl_decomp_var3 <- stl(variable3_ts, s.window = "periodic")
# Convertir la descomposición a un data frame para graficar con ggplot2
stl_df_var3 <- data.frame(
Time = rep(time(variable3_ts), 4), # Tiempo repetido para cada componente
Value = c(stl_decomp_var3$time.series[, "seasonal"],
stl_decomp_var3$time.series[, "trend"],
stl_decomp_var3$time.series[, "remainder"],
variable3_ts),
Component = rep(c("Estacional", "Tendencia", "Residuo", "Serie Original"), each = length(variable3_ts))
)
# Crear gráfico con ggplot2
p <- ggplot(stl_df_var3, aes(x = Time, y = Value, color = Component)) +
geom_line() +
facet_wrap(~Component, scales = "free_y", ncol = 1) +
theme_minimal() +
labs(title = "Descomposición temporal de la variable 3",
x = "Tiempo",
y = "Valor")
# Convertir a gráfico interactivo con plotly
ggplotly(p)
Se crea la variable1 ajustada por estacionalidad
# Extraer los componentes de la descomposición
variable1_sa <- variable1_ts - stl_decomp_var1$time.series[, "seasonal"]
variable1_sa
## Jan Feb Mar Apr May Jun Jul
## 2012 124003.77 182286.03 125191.30 72932.71 146333.62 185436.31 155366.06
## 2013 168393.70 160398.38 77444.03 163797.13 119104.69 152832.51 252942.79
## 2014 98751.93 136774.53 121030.75 198843.52 206904.19 191184.49 117160.37
## 2015 174861.11 150383.79 141483.89 140038.33 175077.35 110123.20 120750.26
## 2016 134306.00 148065.03 128440.79 205872.70 132332.94 69364.11 112864.74
## 2017 138990.21 128463.63 189641.86 164644.18 50741.84 110047.90 121350.37
## 2018 148357.18 110535.55 125018.00 148143.66 158295.19 168619.07 128956.41
## 2019 176352.43 134349.75 118040.38 147588.45 156443.46 126770.92 182809.07
## 2020 219596.55 218315.90 108020.83 154200.83 170317.44 152747.85 152398.51
## 2021 161877.13 186685.42 216487.85 176305.19 178848.54 226255.42 213702.01
## 2022 225512.99 187946.41 352701.43 235517.01 291339.72 342972.01 291748.11
## 2023 226007.51 265355.68 311466.04 208956.07 196235.48 197744.45 230672.98
## 2024 196385.40 190688.56 192133.88 196492.25 237589.30 190022.27 147955.34
## Aug Sep Oct Nov Dec
## 2012 192426.40 170789.35 165903.84 201941.46 200046.05
## 2013 148837.77 146153.85 150256.40 161492.87 150576.02
## 2014 89605.72 171411.97 148833.17 100428.40 108769.54
## 2015 104927.52 149826.65 118038.14 133395.27 130873.82
## 2016 103055.34 153157.21 137166.03 125295.09 105240.91
## 2017 95748.64 157091.06 128711.53 117217.86 108102.07
## 2018 120931.38 130191.28 149515.56 149104.25 129814.39
## 2019 223088.93 184598.99 117798.38 171414.09 136624.60
## 2020 149627.20 149654.04 148045.36 188357.32 150593.71
## 2021 219448.33 207334.55 306768.89 228393.22 247596.64
## 2022 301059.82 259161.17 276771.28 265646.15 293596.06
## 2023 266968.80 177749.67 187437.67 188076.94 272471.57
## 2024 218325.54 182305.44 211859.66 224023.57 225868.66
Se crea la variable2 ajustada por estacionalidad
# Extraer los componentes de la descomposición
variable2_sa <- variable2_ts - stl_decomp_var2$time.series[, "seasonal"]
variable2_sa
## Jan Feb Mar Apr May Jun Jul
## 2012 92409.75 93814.55 95270.61 94628.05 96081.33 94765.75 90284.85
## 2013 103052.12 102548.21 104852.66 98779.07 104878.04 111801.86 108454.99
## 2014 106885.49 109805.84 109719.60 108568.71 112205.40 116128.66 115411.83
## 2015 116480.76 118545.32 120236.22 121658.22 123268.61 116856.45 117650.45
## 2016 124894.91 119704.64 123547.09 124184.26 122392.05 124107.26 124057.75
## 2017 132347.93 130156.93 128475.32 126577.43 125647.74 130197.00 134513.16
## 2018 126780.29 128541.77 132226.60 136379.96 140191.20 145225.83 142031.94
## 2019 134802.77 135580.33 136316.44 134298.10 143412.13 150451.19 143561.80
## 2020 144406.08 146819.31 144261.90 139094.45 118894.84 105820.21 122814.86
## 2021 134339.07 133885.72 136191.62 148468.81 149963.04 131720.37 133781.23
## 2022 149468.32 147425.02 146497.23 151449.71 153184.51 156187.19 154280.27
## 2023 153466.75 154614.81 147864.97 149392.76 141528.01 147287.02 155510.62
## 2024 147358.38 150734.37 152200.73 148900.48 155452.16 160453.96 152552.61
## Aug Sep Oct Nov Dec
## 2012 90733.65 90744.67 88656.81 90193.87 94676.51
## 2013 110079.51 108269.23 106992.93 107602.24 106959.39
## 2014 116939.11 111456.21 118282.85 119401.74 114348.03
## 2015 118983.08 114198.91 116590.01 118595.99 121323.69
## 2016 118367.06 121799.61 127370.96 122647.88 125849.30
## 2017 128655.91 131579.83 131384.95 131885.33 132185.56
## 2018 138968.68 138611.46 131251.66 132993.46 136456.34
## 2019 140158.66 143883.17 140586.06 145499.35 144628.34
## 2020 138916.87 138813.21 140848.21 141671.85 137422.77
## 2021 142185.84 145304.13 145997.91 143704.96 148792.12
## 2022 149874.74 151722.26 156799.01 151884.52 151353.32
## 2023 152381.49 155008.60 153775.58 154413.79 151885.45
## 2024 152375.70 150942.92 148467.69 151180.08 151149.06
Se crea la variable3 ajustada por estacionalidad
# Extraer los componentes de la descomposición
variable3_sa <- variable3_ts - stl_decomp_var3$time.series[, "seasonal"]
variable3_sa
## Jan Feb Mar Apr May Jun Jul Aug
## 2012 13246.13 13339.90 14589.57 14989.95 15440.57 14607.12 13754.40 12909.68
## 2013 13731.57 13358.34 19082.40 16170.90 16122.90 16475.09 16652.71 16694.93
## 2014 16888.82 17802.95 18618.09 18998.08 19406.11 20714.68 20099.57 19442.77
## 2015 21695.04 22078.52 21098.59 21829.38 22651.62 22504.26 21950.98 21764.45
## 2016 25147.36 23597.00 24513.01 25638.17 25749.15 25601.71 25524.17 24259.10
## 2017 26495.96 27109.91 26273.24 25657.71 26163.18 28172.45 28131.13 27106.19
## 2018 26616.47 27703.37 27935.33 29011.10 29575.80 33416.90 32263.90 30703.31
## 2019 28376.59 27913.11 28359.57 27617.93 29474.44 31456.58 30212.22 29314.62
## 2020 29077.10 29301.15 28921.23 26206.42 22608.05 19803.34 24041.79 27198.25
## 2021 25612.68 25571.68 25547.90 28108.14 28776.39 18795.97 21749.32 26952.79
## 2022 28928.67 30162.08 27707.93 28916.02 28855.30 31481.22 29669.21 30217.36
## 2023 30630.22 30433.69 27694.04 29605.44 27196.03 30128.33 30532.80 29835.23
## 2024 30918.47 30548.52 30134.47 29159.26 31322.10 31447.54 31286.55 30733.48
## Sep Oct Nov Dec
## 2012 12769.04 11840.06 13282.08 12922.82
## 2013 16123.03 16118.11 17202.43 16365.24
## 2014 17163.82 19043.21 21075.74 19764.90
## 2015 20601.18 21244.69 21018.29 24496.23
## 2016 25396.98 25469.42 25478.70 25544.99
## 2017 28569.55 28302.51 27521.84 28648.35
## 2018 30062.82 27945.44 28278.60 27590.89
## 2019 29846.90 28103.89 29279.41 28798.34
## 2020 27415.90 27849.16 28325.04 26552.35
## 2021 28652.69 28228.81 28727.07 29230.19
## 2022 29925.12 32805.73 30458.03 31108.13
## 2023 30142.71 30719.29 28597.04 29981.91
## 2024 31725.83 32203.56 32107.90 32065.63
Gráfico serie original VS ajustada Variable 1
# Crear vector de fechas correctamente alineado con la serie
fechas_var1 <- seq.Date(from = as.Date("2012-01-01"), by = "month", length.out = length(variable1_ts))
# Gráfico mejorado con fechas en el eje X
grafico_ajustada_var1 <- ggplot() +
geom_line(aes(x = fechas_var1, y = variable1_ts), color = "grey", size = 0.5, linetype = "solid", name = "Serie Original") +
geom_line(aes(x = fechas_var1, y = variable1_sa), color = "black", size = 0.6, linetype = "solid", name = "Serie Ajustada") +
ggtitle("Variable 1:Serie Original vs Serie Ajustada por Estacionalidad") +
xlab("Tiempo") +
ylab("Unidad de medida variable 1") +
theme_minimal() +
theme(axis.text.x = element_text(angle = 45, hjust = 1)) # Rotar etiquetas para mejor visualización
# Convertir a gráfico interactivo
ggplotly(grafico_ajustada_var1)
Gráfico serie original VS ajustada Variable 2
# Crear vector de fechas correctamente alineado con la serie
fechas_var2 <- seq.Date(from = as.Date("2012-01-01"), by = "month", length.out = length(variable2_ts))
# Gráfico mejorado con fechas en el eje X
grafico_ajustada_var2 <- ggplot() +
geom_line(aes(x = fechas_var2, y = variable2_ts), color = "grey", size = 0.5, linetype = "solid", name = "Serie Original") +
geom_line(aes(x = fechas_var2, y = variable2_sa), color = "black", size = 0.6, linetype = "solid", name = "Serie Ajustada") +
ggtitle("Variable 2:Serie Original vs Serie Ajustada por Estacionalidad") +
xlab("Tiempo") +
ylab("Unidad de medida variable 2") +
theme_minimal() +
theme(axis.text.x = element_text(angle = 45, hjust = 1)) # Rotar etiquetas para mejor visualización
# Convertir a gráfico interactivo
ggplotly(grafico_ajustada_var2)
Gráfico serie original VS ajustada Variable 3
# Crear vector de fechas correctamente alineado con la serie
fechas_var3 <- seq.Date(from = as.Date("2012-01-01"), by = "month", length.out = length(variable3_ts))
# Gráfico mejorado con fechas en el eje X
grafico_ajustada_var3 <- ggplot() +
geom_line(aes(x = fechas_var3, y = variable3_ts), color = "grey", size = 0.5, linetype = "solid", name = "Serie Original") +
geom_line(aes(x = fechas_var3, y = variable3_sa), color = "black", size = 0.6, linetype = "solid", name = "Serie Ajustada") +
ggtitle("Variable 3:Serie Original vs Serie Ajustada por Estacionalidad") +
xlab("Tiempo") +
ylab("Unidad de medida variable 3") +
theme_minimal() +
theme(axis.text.x = element_text(angle = 45, hjust = 1)) # Rotar etiquetas para mejor visualización
# Convertir a gráfico interactivo
ggplotly(grafico_ajustada_var3)
Ahora graficamos serie original vs tendencia
Primero se debe obtener la tendencia de cada variable y luego graficarla
Tendencia Variable 1
library(ggplot2)
library(plotly)
# Convertir la serie a un vector numérico
variable1_vec <- as.numeric(variable1_ts)
tendencia_var1 <- as.numeric(stl_decomp_var1$time.series[, "trend"])
# Asegurar que 'fechas' tenga la misma longitud
fechas <- seq.Date(from = as.Date("2012-01-01"), by = "month", length.out = length(variable1_ts))
# Gráfico interactivo de la serie original vs tendencia
grafico_tendencia_var1 <- ggplot() +
geom_line(aes(x = fechas, y = variable1_vec, color = "Serie Original"), size = 0.7, linetype = "solid") +
geom_line(aes(x = fechas, y = tendencia_var1, color = "Tendencia"), size = 0.8, linetype = "solid") +
scale_color_manual(values = c("Serie Original" = "grey", "Tendencia" = "black")) +
ggtitle("Variable 1: Serie Original vs Tendencia") +
xlab("Tiempo") +
ylab("Unidad de medida Variable 1") +
theme_minimal() +
theme(axis.text.x = element_text(angle = 45, hjust = 1)) # Rotar etiquetas del eje X
# Convertir a gráfico interactivo con plotly
ggplotly(grafico_tendencia_var1)
Tendencia Variable 2
library(ggplot2)
library(plotly)
# Convertir la serie a un vector numérico
variable2_vec <- as.numeric(variable2_ts)
tendencia_var2 <- as.numeric(stl_decomp_var2$time.series[, "trend"])
# Asegurar que 'fechas' tenga la misma longitud
fechas <- seq.Date(from = as.Date("2012-01-01"), by = "month", length.out = length(variable2_ts))
# Gráfico interactivo de la serie original vs tendencia
grafico_tendencia_var2 <- ggplot() +
geom_line(aes(x = fechas, y = variable2_vec, color = "Serie Original"), size = 0.7, linetype = "solid") +
geom_line(aes(x = fechas, y = tendencia_var2, color = "Tendencia"), size = 0.8, linetype = "solid") +
scale_color_manual(values = c("Serie Original" = "grey", "Tendencia" = "black")) +
ggtitle("Variable 2: Serie Original vs Tendencia") +
xlab("Tiempo") +
ylab("Unidad de medida Variable 2") +
theme_minimal() +
theme(axis.text.x = element_text(angle = 45, hjust = 1)) # Rotar etiquetas del eje X
# Convertir a gráfico interactivo con plotly
ggplotly(grafico_tendencia_var2)
Tendencia Variable 3
library(ggplot2)
library(plotly)
# Convertir la serie a un vector numérico
variable3_vec <- as.numeric(variable3_ts)
tendencia_var3 <- as.numeric(stl_decomp_var3$time.series[, "trend"])
# Asegurar que 'fechas' tenga la misma longitud
fechas <- seq.Date(from = as.Date("2012-01-01"), by = "month", length.out = length(variable3_ts))
# Gráfico interactivo de la serie original vs tendencia
grafico_tendencia_var3 <- ggplot() +
geom_line(aes(x = fechas, y = variable3_vec, color = "Serie Original"), size = 0.7, linetype = "solid") +
geom_line(aes(x = fechas, y = tendencia_var3, color = "Tendencia"), size = 0.8, linetype = "solid") +
scale_color_manual(values = c("Serie Original" = "grey", "Tendencia" = "black")) +
ggtitle("Variable 3: Serie Original vs Tendencia") +
xlab("Tiempo") +
ylab("Unidad de medida Variable 3") +
theme_minimal() +
theme(axis.text.x = element_text(angle = 45, hjust = 1)) # Rotar etiquetas del eje X
# Convertir a gráfico interactivo con plotly
ggplotly(grafico_tendencia_var3)
Ahora calculamos la tasa de crecimiento de la serie original vs tendencia:
Tasa de crecimiento de la serie de tendencia y original para la variable 1
#Cálculo de la tasa de crecimiento anual correctamente alineada
tasa_crecimiento_var1 <- (variable1_ts[(13:length(variable1_ts))] / variable1_ts[1:(length(variable1_ts) - 12)] - 1) * 100
tasa_tendencia_var1 <- (tendencia_var1[(13:length(tendencia_var1))] / tendencia_var1[1:(length(tendencia_var1) - 12)] - 1) * 100
# Crear vector de fechas corregido, es decir que inicie desde enero 2013
fechas_corregidas_var1 <- seq(from = as.Date("2013-01-01"), by = "month", length.out = length(tasa_crecimiento_var1))
# Verificar longitudes
print(length(fechas_corregidas_var1))
## [1] 144
print(length(tasa_crecimiento_var1))
## [1] 144
print(length(tasa_tendencia_var1))
## [1] 144
*Gráfico variable original y tendencia variable 1: tasa de crecimiento anual**
library(ggplot2)
library(plotly)
# Gráfico de la tasa de crecimiento anual variable 1
grafico_crecimiento_var1 <- ggplot() +
geom_line(aes(x = fechas_corregidas_var1, y = tasa_crecimiento_var1), color = "grey", size = 0.7) +
geom_line(aes(x = fechas_corregidas_var1, y = tasa_tendencia_var1), color = "black", size = 0.8, linetype = "dashed") +
ggtitle("Variable1: Tasa de crecimiento anual % de la serie Original y la tendencia") +
xlab("Tiempo") +
ylab("% de Crecimiento Anual") +
theme_minimal()
# Convertir a gráfico interactivo
ggplotly(grafico_crecimiento_var1)
Ahora calculamos la tasa de crecimiento de la serie original vs tendencia: variable 2
#Cálculo de la tasa de crecimiento anual correctamente alineada
tasa_crecimiento_var2 <- (variable2_ts[(13:length(variable2_ts))] / variable2_ts[1:(length(variable2_ts) - 12)] - 1) * 100
tasa_tendencia_var2 <- (tendencia_var2[(13:length(tendencia_var2))] / tendencia_var2[1:(length(tendencia_var2) - 12)] - 1) * 100
# Crear vector de fechas corregido
fechas_corregidas_var2 <- seq(from = as.Date("2013-01-01"), by = "month", length.out = length(tasa_crecimiento_var2))
# Verificar longitudes
print(length(fechas_corregidas_var2))
## [1] 144
print(length(tasa_crecimiento_var2))
## [1] 144
print(length(tasa_tendencia_var2))
## [1] 144
# Gráfico de la tasa de crecimiento anual variable 2
grafico_crecimiento_var2 <- ggplot() +
geom_line(aes(x = fechas_corregidas_var2, y = tasa_crecimiento_var2), color = "grey", size = 0.7) +
geom_line(aes(x = fechas_corregidas_var2, y = tasa_tendencia_var2), color = "black", size = 0.8, linetype = "dashed") +
ggtitle("Variable2: Tasa de crecimiento anual % de la serie Original y la Tendencia") +
xlab("Tiempo") +
ylab("% de Crecimiento Anual") +
theme_minimal()
# Convertir a gráfico interactivo
ggplotly(grafico_crecimiento_var2)
Ahora calculamos la tasa de crecimiento de la serie original vs tendencia: variable 3
#Cálculo de la tasa de crecimiento anual correctamente alineada
tasa_crecimiento_var3 <- (variable3_ts[(13:length(variable3_ts))] / variable3_ts[1:(length(variable3_ts) - 12)] - 1) * 100
tasa_tendencia_var3 <- (tendencia_var3[(13:length(tendencia_var3))] / tendencia_var3[1:(length(tendencia_var3) - 12)] - 1) * 100
# Crear vector de fechas corregido
fechas_corregidas_var3 <- seq(from = as.Date("2013-01-01"), by = "month", length.out = length(tasa_crecimiento_var3))
# Verificar longitudes
print(length(fechas_corregidas_var3))
## [1] 144
print(length(tasa_crecimiento_var3))
## [1] 144
print(length(tasa_tendencia_var3))
## [1] 144
# Gráfico de la tasa de crecimiento anual variable 2
grafico_crecimiento_var3 <- ggplot() +
geom_line(aes(x = fechas_corregidas_var3, y = tasa_crecimiento_var3), color = "grey", size = 0.7) +
geom_line(aes(x = fechas_corregidas_var3, y = tasa_tendencia_var3), color = "black", size = 0.8, linetype = "dashed") +
ggtitle("Variable3: Tasa de crecimiento anual % de la serie Original y la tendencia") +
xlab("Tiempo") +
ylab("% de Crecimiento Anual") +
theme_minimal()
# Convertir a gráfico interactivo
ggplotly(grafico_crecimiento_var3)
Analizar la tasa de crecimiento anual ayuda a detectar cambios en el entorno económico que afectan el sector. Se pueden prever crisis o períodos de auge y prepararse para ellos.
División en conjunto de entrenamiento y prueba para la variable 3 (Producción de Pollo en el Valle) que es la elegida para pronosticar
El código siguiente divide una serie temporal (variable3_ts) en dos subconjuntos:
Conjunto de entrenamiento (train): Datos desde enero de 2012 hasta septiembre de 2024. Conjunto de prueba (test): Datos desde octubre de 2024 hasta diciembre de 2024.
Esto se hace para evaluar el desempeño de modelos de predicción en datos no vistos.
train_size <- length(variable3_ts) - 12 # Se deja fuera los últimos 12 valores para usarlos como set de prueba.
train_ts <- window(variable3_ts, end = c(2023, 12)) # Entrenamiento hasta noviembre 2024
test_ts <- window(variable3_ts, start = c(2024, 1)) # Prueba inicia desde diciembre 2024
Identificación automática del modelo ARIMA
library(forecast)
# Ajustar un modelo ARIMA automático sin estacionalidad, por eso se pone seasonal=FALSE
auto_arima_model_no_seasonal <- auto.arima(train_ts, seasonal = FALSE)
# Mostrar el modelo seleccionado
summary(auto_arima_model_no_seasonal)
## Series: train_ts
## ARIMA(2,1,2) with drift
##
## Coefficients:
## ar1 ar2 ma1 ma2 drift
## 1.5763 -0.7390 -1.8570 0.9340 112.0795
## s.e. 0.0716 0.0699 0.0451 0.0471 66.5356
##
## sigma^2 = 2951659: log likelihood = -1266.5
## AIC=2545 AICc=2545.62 BIC=2562.78
##
## Training set error measures:
## ME RMSE MAE MPE MAPE MASE
## Training set -2.288793 1681.866 1132.138 -0.288442 4.816199 0.4622445
## ACF1
## Training set -0.04520703
Estimación del modelo identificado automatico y validación de Significancia de coeficientes
library(lmtest)
# Evaluar la significancia estadística de los coeficientes del modelo ARIMA
coeftest(auto_arima_model_no_seasonal)
##
## z test of coefficients:
##
## Estimate Std. Error z value Pr(>|z|)
## ar1 1.576286 0.071616 22.0103 < 2e-16 ***
## ar2 -0.739024 0.069882 -10.5754 < 2e-16 ***
## ma1 -1.857007 0.045123 -41.1547 < 2e-16 ***
## ma2 0.933992 0.047054 19.8493 < 2e-16 ***
## drift 112.079516 66.535564 1.6845 0.09208 .
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
El modelo muuestra una alta significancia
# Ajuste del modelo ARIMA(1,1,2) automático sin parte estacional y crearlo como variable darima_auto para luego poder graficarlo y crear la tabla
darima_auto <- Arima(train_ts,
order = c(2, 1, 2)) # Especificamos directamente (p=4, d=1, q=2)
# Mostrar resumen del modelo ajustado
summary(darima_auto)
## Series: train_ts
## ARIMA(2,1,2)
##
## Coefficients:
## ar1 ar2 ma1 ma2
## 1.5912 -0.7417 -1.8669 0.9444
## s.e. 0.0688 0.0697 0.0391 0.0401
##
## sigma^2 = 2983157: log likelihood = -1267.8
## AIC=2545.61 AICc=2546.04 BIC=2560.42
##
## Training set error measures:
## ME RMSE MAE MPE MAPE MASE
## Training set 216.1118 1696.931 1158.031 0.6512176 4.887072 0.4728163
## ACF1
## Training set -0.04851695
Validación de residuales o errores del modelo
# Diagnóstico del modelo (los residuos deben ser ruido blanco)
checkresiduals(darima_auto) # Verificar si los residuos son aleatorios y no presentan patrones
##
## Ljung-Box test
##
## data: Residuals from ARIMA(2,1,2)
## Q* = 28.522, df = 20, p-value = 0.0976
##
## Model df: 4. Total lags used: 24
Pronóstico modelo ARIMA automático dentro de muestra o en el set de prueba (2,1,2)
# Generar pronóstico para el conjunto de prueba
forecast_arima_auto <- forecast(darima_auto, h = length(test_ts)) # Predecir los valores futuros
# Crear dataframe para gráfico interactivo del pronóstico
forecast_data_auto <- data.frame(Tiempo = time(forecast_arima_auto$mean),
Pronostico = as.numeric(forecast_arima_auto$mean),
Observado = as.numeric(test_ts))
# Graficar pronóstico junto con los valores observados reales
p4auto <- ggplot(forecast_data_auto, aes(x = Tiempo)) +
geom_line(aes(y = Pronostico, color = "Pronóstico")) +
geom_line(aes(y = Observado, color = "Observado")) +
ggtitle("Pronóstico vs Observado") +
xlab("Tiempo") + ylab("variable3")
ggplotly(p4auto) # Convertir el gráfico en interactivo
Interpretación modelo automatico (2,1,2):El modelo automático (2,1,2) parece pronosticar de forma aceptable dentro de la prueba, arrojando en la prueba pronostico que se encuentran por debajo de los observados. se percibe captura de los los puntos de quiebre. Es un modelo tentativo adecuado para pronpostico fuera de muestra o a futuro.
Pronóstico automático dentro del set de prueba como tabla
# Cargar librerías necesarias
library(forecast)
library(dplyr)
# Generar pronóstico con el modelo ARIMA identificado
arima_forecast_auto <- forecast(auto_arima_model_no_seasonal, h = length(test_ts))
# Crear un dataframe con los valores observados y pronosticados
forecast_table_auto <- data.frame(
Tiempo = time(arima_forecast_auto$mean), # Extraer las fechas del pronóstico
Observado = as.numeric(test_ts), # Valores reales
Pronosticado = as.numeric(arima_forecast_auto$mean) # Valores pronosticados
)
# Mostrar la tabla
print(forecast_table_auto)
## Tiempo Observado Pronosticado
## 1 2024.000 31190.50 30225.75
## 2 2024.083 30788.20 29534.82
## 3 2024.167 29047.01 29077.75
## 4 2024.250 28744.59 28886.12
## 5 2024.333 30447.01 28940.09
## 6 2024.417 30274.53 29185.01
## 7 2024.500 30194.80 29549.44
## 8 2024.583 30826.10 29961.12
## 9 2024.667 32768.56 30358.96
## 10 2024.750 32987.00 30700.07
## 11 2024.833 33245.00 30961.98
## 12 2024.917 33140.00 31140.98
Ahora pronosticamos con el modelo automatico fuera del periodo de análisis, es decir enero 2025
# Cargar librerías necesarias
library(forecast)
# Hacer un pronóstico para el siguiente trimestre (1 período adicional)
next_forecast_auto <- forecast(auto_arima_model_no_seasonal, h = length(test_ts) + 1)
# Extraer el pronóstico del próximo trimestre
next_month_forecast_auto <- data.frame(
Tiempo = time(next_forecast_auto$mean), # Extraer la fecha del pronóstico
Pronostico = as.numeric(next_forecast_auto$mean) # Valor pronosticado
)
# Mostrar el pronóstico completo
print(next_month_forecast_auto)
## Tiempo Pronostico
## 1 2024.000 30225.75
## 2 2024.083 29534.82
## 3 2024.167 29077.75
## 4 2024.250 28886.12
## 5 2024.333 28940.09
## 6 2024.417 29185.01
## 7 2024.500 29549.44
## 8 2024.583 29961.12
## 9 2024.667 30358.96
## 10 2024.750 30700.07
## 11 2024.833 30961.98
## 12 2024.917 31140.98
## 13 2025.000 31247.82
# Extraer solo el valor del trimestre adicional (último de la tabla)
next_month <- tail(next_month_forecast_auto, 1)
print(paste("Pronóstico para enero 2025:", next_month$Tiempo, "=", next_month$Pronostico))
## [1] "Pronóstico para enero 2025: 2025 = 31247.8153108169"
El modelo automático ARIMA(2,1,2) en un pronostico para el mes de enero de 2025, presenta un valor superior al pronostico de prueba arrojado para el mes de diciemnbre de 2024, pero se encuentra por debajo del dato observado para el mes de diciembre de 2024. Destacó por su mayor precisión en la captura de los puntos de quiebre, lo que lo hace el más confiable.