En este taller se realizará el análisis por medio de una regresión simple y otra múltiple de una base de datos financiera de la empresa de energía eléctrica colombiana Celsia. El plazo que tiene esta base de datos es desde señtiembre del 2012 hasta diciembre de 2024.

Variables

precioc: Es el precio con el que cerró la acción de Celsia a final de cada trimestre. EBITDA: Mide la utilidad operativa de Celsia antes de restar intereses, impuestos, depreciaciones y amortizaciones. Quick_Ratio: Mide la capacidad Celsia para pagar sus deudas a corto plazo con sus activos más líquidos, excluyendo inventarios. Margen_EBITDA: Muestra el EBITDA como porcentaje de las Ventas, muestra qué tan eficiente es Celsia para generar este tipo de utilidad. Margen_Bruto: Muestra la Utilidad Bruta como porcentaje de las Ventas, muestra qué tan eficiente es Celsia para generar este tipo de utilidad. ROA: Mide la Utilidad Neta de Celsia en relación con sus Activos Totales, indica qué tan eficientes son sus Activos para generar utilidades. ROE: Mide la Utilidad Neta de Celsia en relación con su Patrimonio, indica qué tan eficiente es su Patrimonio para generar utilidades. Ingresos: Mide la entrada de dinero por la venta de bienes o servicios de Celsia. Utilidad_Oper: Es la ganancia que obtiene Celsia después de restar sus costos y gastos Activos: Son los recursos que posee una empresa y tienen valor económico. Pasivos: Son las obligaciones financieras que Celsia.

Análisis exploratorio de las variables

##            Qtr1       Qtr2       Qtr3       Qtr4
## 2012                        521549000  531418000
## 2013  588857000  588543000  576794000  626922000
## 2014  577332000  804103000  561316000  660548410
## 2015  790707000  765009000  796798000 1339183827
## 2016 1363090000  861840729  776568243  793411365
## 2017  741926530  743334759  784872462  823902247
## 2018  846798634  820506680  851527449  905597239
## 2019  861239316  913207244  984008564  967306876
## 2020  928393634  891068600  819008472  897536295
## 2021  980476205  939896770  977714697 1212647328
## 2022 1309468303 1208005339 1299873398 1767198959
## 2023 1506530375 1584709654 1481331324 1657350645
## 2024 1375395723 1925126512 1408393402 2097753364
##         Min        Max      Media   Mediana DesviacionEstandar   CoefVar
## 1 521549000 2097753364 1000721951 876454664          378276982 0.3780041

Extracción de señales

Graficamos serie original VS ajustada por estacionalidad

Graficamos la serie original VS tendencia

Graficamos la tasa de crecimiento de la serie original VS tendencia

## [1] 46
## [1] 46
## [1] 46

Modelo ARIMA

Metodología Box-Jenkins

train_size <- length(ingresos_ts) - 2
train_ts <- window(ingresos_ts, end = c(2024, 1))  
test_ts <- window(ingresos_ts, start = c(2024, 2))  

Paso 1: Identificación del modelo

Identificar estacionariedad

adf_test <- adf.test(train_ts)
print(adf_test)
## 
##  Augmented Dickey-Fuller Test
## 
## data:  train_ts
## Dickey-Fuller = -2.0064, Lag order = 3, p-value = 0.5715
## alternative hypothesis: stationary
if (adf_test$p.value > 0.05 && length(train_ts) > 1) {
  train_diff <- diff(train_ts, differences = 1)
}

Diferenciación en niveles

adf_test <- adf.test(train_ts)
print(adf_test)
## 
##  Augmented Dickey-Fuller Test
## 
## data:  train_ts
## Dickey-Fuller = -2.0064, Lag order = 3, p-value = 0.5715
## alternative hypothesis: stationary
 adf_test_diff <- adf.test(train_diff)
  print(adf_test_diff)
## 
##  Augmented Dickey-Fuller Test
## 
## data:  train_diff
## Dickey-Fuller = -2.9519, Lag order = 3, p-value = 0.1955
## alternative hypothesis: stationary
adf_test_diff_log <- adf.test(train_diff_log)
  print(adf_test_diff_log)
## 
##  Augmented Dickey-Fuller Test
## 
## data:  train_diff_log
## Dickey-Fuller = -3.0535, Lag order = 3, p-value = 0.1551
## alternative hypothesis: stationary

Paso 2: Estimación del modelo

Cálculo manual del modelo ARIMA

manual_arima_model <- Arima(train_ts, order = c(3,1,4))
summary(manual_arima_model)
## Series: train_ts 
## ARIMA(3,1,4) 
## 
## Coefficients:
##          ar1     ar2     ar3      ma1      ma2      ma3     ma4
##       0.0223  0.4621  0.5136  -0.0546  -0.7294  -0.7399  0.5363
## s.e.  0.1701  0.1859  0.2013   0.1995   0.1774   0.1679  0.1895
## 
## sigma^2 = 2.219e+16:  log likelihood = -929.62
## AIC=1875.24   AICc=1879.13   BIC=1889.87
## 
## Training set error measures:
##                    ME      RMSE      MAE      MPE     MAPE      MASE
## Training set 21638086 135682057 93833052 1.168663 9.561753 0.5303573
##                     ACF1
## Training set -0.05863739

Significancia de coefcientes

coeftest(manual_arima_model)
## 
## z test of coefficients:
## 
##      Estimate Std. Error z value  Pr(>|z|)    
## ar1  0.022293   0.170097  0.1311  0.895725    
## ar2  0.462120   0.185875  2.4862  0.012912 *  
## ar3  0.513588   0.201269  2.5518  0.010718 *  
## ma1 -0.054569   0.199516 -0.2735  0.784462    
## ma2 -0.729429   0.177446 -4.1107 3.944e-05 ***
## ma3 -0.739948   0.167873 -4.4078 1.044e-05 ***
## ma4  0.536331   0.189519  2.8300  0.004655 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## MAE Manual:  335064560
## RMSE Manual:  379997226
##    Tiempo  Observado Pronosticado
## 1 2024.25 1925126512   1563128478
## 2 2024.50 1408393402   1511701531
## 3 2024.75 2097753364   1557865848
##    Tiempo Pronostico
## 1 2024.25 1563128478
## 2 2024.50 1511701531
## 3 2024.75 1557865848
## 4 2025.00 1572415332
## [1] "Pronóstico para el primer trimestre 2025: 2025 = 1572415332.01708"