S využitím databázy Global Economic Indicators (2010–2025)- World bank

Pri ďalšej práci budeme používať knižnice

library(zoo)
library(tseries)
library(lmtest)
library(sandwich)
library(car)
rm(list=ls())

1. Úvod a údaje

Údaje o makroekonomických premenných sú usporiadané v súbore csv, stĺpce sú oddelené znakom “;” a používajú desatinnú bodku.

Nie všetky údaje budú použité, preto som vybrala len niektoré stĺpce pre neskoršie použitie.

1.1 Úvod do problému, stanovenie hypotéz

Rozhodla som sa modelovať mieru inflácie Inflation_CPI v závislosti od troch vysvetľujúcich premenných, a to HDP v bežných cenách GDP_Current_USD, príjmy verejnej správy Tax_Revenue a verejný dlh Public_Debt.

Naša pracovná hypotéza hovorí o štatisticky významnom vplyve všetkých troch vysvetľujúcich premenných. Očakávame, že rast HDP bude spojený so znižovaním inflácie (negatívny koeficient), keďže vyšší ekonomický výkon tlmí cenové tlaky. Naopak, rast verejných príjmov môže súvisieť s pozitívnym vplyvom na infláciu (kladný koeficient) v dôsledku fiškálnych politík. Pri premennej Public_Debt predpokladáme pozitívny vplyv na infláciu (kladný koeficient), keďže vyšší dlh môže zvyšovať cenové tlaky a rizikovú prémia krajiny.

1.2 Príprava databázy, úprava údajov

udaje <- read.csv("data.csv",dec=".",sep=";",header = TRUE)
# vyberieme iba relevantné premenné
udajeSK <- udaje[, c("Inflation_CPI", 
                     "GDP_Current_USD", 
                     "Tax_Revenue", 
                     "Public_Debt", 
                     "year")]
# nastavíme rok ako názvy riadkov
rownames(udajeSK) <- udajeSK$year

# zoradíme podľa roku
udajeSK <- udajeSK[order(udajeSK$year), ]

udajeSK
NA

2. Lineárna regresia v základnom tvare

library(ggplot2)

# Lineárna regresia v základnom tvare
model <- lm(Inflation_CPI ~ GDP_Current_USD + Tax_Revenue + Public_Debt, data = udajeSK)
summary(model)

Call:
lm(formula = Inflation_CPI ~ GDP_Current_USD + Tax_Revenue + 
    Public_Debt, data = udajeSK)

Residuals:
    Min      1Q  Median      3Q     Max 
-2.1536 -1.8433 -0.2947  0.4521  4.9545 

Coefficients:
                  Estimate Std. Error t value Pr(>|t|)  
(Intercept)     -2.359e+01  9.930e+00  -2.376   0.0415 *
GDP_Current_USD  2.725e-10  9.430e-11   2.890   0.0179 *
Tax_Revenue      8.803e-01  8.310e-01   1.059   0.3170  
Public_Debt     -2.689e-01  1.235e-01  -2.177   0.0574 .
---
Signif. codes:  
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 2.494 on 9 degrees of freedom
Multiple R-squared:  0.5951,    Adjusted R-squared:  0.4601 
F-statistic: 4.409 on 3 and 9 DF,  p-value: 0.03615

Model je štatisticky významný (F-test p = 0.036) a vysvetľuje približne 60 % variability inflácie (R² = 0.595). Jedinou jasne významnou premennou je GDP_Current_USD, ktoré má pozitívny a štatisticky preukázateľný vplyv na infláciu (p = 0.0179). Premenná Public_Debt vykazuje slabú, hraničnú štatistickú významnosť (p ≈ 0.057) a jej odhadovaný účinok je negatívny. Premenná Tax_Revenue nie je štatisticky významná (p = 0.317). Konštanta je významná a negatívna. Model teda naznačuje, že inflácia na Slovensku bola v sledovanom období najviac ovplyvnená vývojom HDP, zatiaľ čo dlh a daňové príjmy zohrávali menšiu alebo nepreukázateľnú úlohu.

3 Autokorelácia rezíduí

V tejto časti sa pozrieme na ďalší dôležitý predpoklad klasického lineárneho regresného modelu – nezávislosť rezíduí. V časových radoch sa často stáva, že chyba v čase \(t\) je systematicky spätá s chybou v čase \(t-1\), čo nazývame autokoreláciou rezíduí.

library(ggplot2)

# add fitted values to the dataframe
udajeSK$fitted <- fitted(model)

# scatterplot + regression line + spline smoother
ggplot(udajeSK, aes(x = year, y = Inflation_CPI)) +
  geom_point(color = "steelblue", size = 2) +
  
  # regression fitted line
  geom_line(aes(y = fitted), color = "red", size = 1) +
  

  labs(
    title = "Inflácia na Slovensku: Empirical Data (blue) vs. Fitted Data (Red)",
    x = "Rok",
    y = "Inflation CPI"
  ) +
  theme_minimal()

Graf ukazuje porovnanie skutočnej inflácie so hodnotami predpovedanými regresným modelom. Model zachytáva základný trend – nízku infláciu v rokoch 2014–2016 a jej postupný nárast po roku 2017, no viditeľne nedokáže presne vystihnúť prudké výkyvy, najmä rýchle zrýchlenie inflácie v rokoch 2021–2022. To naznačuje, že lineárny model vysvetľuje časť variability, ale nezachytáva dynamické šoky a nelineárne zmeny v inflácii.


res <- residuals(model)

ACF graf (Autocorrelation Function)

Táto funkcia priradzuje odhad korelácie, ktorá je medzi jednotlivými rezíduami v aktuálnom období a období posunutom (Lag) o \(k\) období späť.

acf(res, lag.max = 4,main = "Autokorelačná funkcia rezíduí")

Na grafe je modrou prerušovanou čiarou zobrazený 95 % interval spoľahlivosti pre hodnoty autokorelačných koeficientov pri jednotlivých oneskoreniach (lagoch). Pokiaľ odhadnutý koeficient autokorelácie zostáva v rámci týchto hraníc, nepovažujeme ho za štatisticky významný.

Z grafu vidíme, že všetky hodnoty autokorelačných koeficientov pri posune lag ≥ 1 zostávajú v intervale spoľahlivosti. To znamená, že pre tieto oneskorenia neexistujú dôkazy o štatisticky významnej autokorelácii rezíduí.

Celkovo teda môžeme konštatovať, že reziduá modelu nevykazujú významnú autokoreláciu, čo je priaznivý výsledok a podporuje platnosť predpokladu nezávislosti chýb v klasickom lineárnom regresnom modeli.


Durbin–Watsonov test

library(lmtest)
dwtest(model)

    Durbin-Watson test

data:  model
DW = 1.8762, p-value = 0.1606
alternative hypothesis: true autocorrelation is greater than 0

Durbin–Watsonov test skúma, či sú reziduá lineárneho regresného modelu pozitívne autokorelované. Testovacou štatistikou je hodnota DW = 1.8762, ktorá sa nachádza blízko teoretickej hodnoty 2, čo predstavuje stav bez autokorelace.

Hodnota p-value = 0.1606 je vyššia než obvyklé hladiny významnosti (0.05 alebo 0.10). Preto nezamietame nulovú hypotézu o neprítomnosti pozitívnej autokorelácie rezíduí.


Breusch–Godfreyov test (BG test)

Hypotézy

Nulová hypotéza \(H_0\): žiadna sériová korelácia

Alternatívna hypotéza \(H_1\): sériová korelácia prítomná


bgtest(model, order = 1)

    Breusch-Godfrey test for serial correlation of
    order up to 1

data:  model
LM test = 0.86532, df = 1, p-value = 0.3523

Breusch–Godfreyho test bol použitý na overenie prítomnosti sériovej autokorelácie rezíduí prvého rádu. Výsledná hodnota testovacej štatistiky LM = 0.86532 je relatívne nízka a zodpovedá jej aj vysoká p-hodnota na úrovni 0.3523. Keďže p-hodnota výrazne prevyšuje bežnú hladinu významnosti 0.05, nulovú hypotézu o neprítomnosti autokorelácie rezíduí nezamietame. Test teda neposkytuje dôkazy o tom, že by reziduá vykazovali sériovú autokoreláciu. Tento výsledok podporuje platnosť predpokladu nezávislosti chýb v rámci odhadovaného regresného modelu.

Ako riešiť autokoreláciu

Odstraňovanie problému autokorelácie rezíduí

Odhad Koyckovho modelu v R


library(dplyr)

udajeSK <- udajeSK %>%
  arrange(year) %>%
  mutate(
    Inflation_CPI_lag1 = lag(Inflation_CPI)
  )

model_koyck <- lm(Inflation_CPI ~ GDP_Current_USD + Tax_Revenue + Public_Debt +  Inflation_CPI_lag1, 
                  data = udajeSK)

summary(model_koyck)

Call:
lm(formula = Inflation_CPI ~ GDP_Current_USD + Tax_Revenue + 
    Public_Debt + Inflation_CPI_lag1, data = udajeSK)

Residuals:
    Min      1Q  Median      3Q     Max 
-3.6521 -1.2398  0.4219  0.7437  3.5313 

Coefficients:
                     Estimate Std. Error t value Pr(>|t|)
(Intercept)        -2.395e+01  1.075e+01  -2.228   0.0611
GDP_Current_USD     1.395e-10  1.179e-10   1.183   0.2755
Tax_Revenue         1.801e+00  9.921e-01   1.815   0.1124
Public_Debt        -3.356e-01  1.224e-01  -2.742   0.0288
Inflation_CPI_lag1  1.143e+00  6.559e-01   1.743   0.1249
                    
(Intercept)        .
GDP_Current_USD     
Tax_Revenue         
Public_Debt        *
Inflation_CPI_lag1  
---
Signif. codes:  
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 2.304 on 7 degrees of freedom
  (1 observation deleted due to missingness)
Multiple R-squared:  0.7256,    Adjusted R-squared:  0.5688 
F-statistic: 4.627 on 4 and 7 DF,  p-value: 0.03831
dwtest(model_koyck)

    Durbin-Watson test

data:  model_koyck
DW = 1.4671, p-value = 0.0415
alternative hypothesis: true autocorrelation is greater than 0

Dynamizovaný model neidentifikuje väčšinu regresorov ako štatisticky významných; výnimkou je len premenná Public_Debt, ktorá zostáva významná na hladine 5 %. Koeficient pri oneskorenej inflácii Inflation_CPI_lag1 je kladný a väčší ako 1, čo naznačuje silný a potenciálne nestabilný zotrvačný efekt inflácie z predchádzajúceho obdobia. Z porovnania Adjusted R-squared vyplýva, že dynamizovaný model má nižšiu vysvetľovaciu schopnosť než pôvodná špecifikácia, a teda neprináša zlepšenie.

Durbin–Watsonov test s hodnotou DW = 1.4671 a p-hodnotou 0.0415 signalizuje štatisticky významnú pozitívnu autokoreláciu rezíduí. Dynamizácia modelu preto neodstránila problém autokorelácie a model ostáva štatisticky nedostatočný.

Newey–West robustné štandardné chyby

library(sandwich)
library(lmtest)

coeftest(model, vcov = NeweyWest(model, lag = 1))
Error in solve.default(diag(ncol(umat)) - apply(var.fit$ar, 2:3, sum)) : 
  system is computationally singular: reciprocal condition number = 4.59827e-24

Chyba vzniká preto, že model je odhadnutý na veľmi krátkom časovom rade a niektoré vysvetľujúce premenné sú silno korelované. V takých podmienkach je Newey–Westova korekcia numericky nestabilná a kovariancia-matrica sa stane singulárnou, takže ju nie je možné invertovať.

Odporúčaný spôsob robustného odhadu pre krátky časový rad

Pre krátky časový rad (10–12 pozorovaní) je Newey–West nevhodný – je numericky nestabilný a často skolabuje, ako v našom prípade. Pre takto malú vzorku sa odporúča použiť heteroskedasticity-consistent (HC) robustné štandardné chyby, najmä:

HC3 – najstabilnejší v malých vzorkách

HC1 – Vo všeobecnosti bezpečný (ako Whiteova korekcia)

library(lmtest)
library(sandwich)

# HC3 robustné štandardné chyby – najlepšie pre malé vzorky
coeftest(model, vcov = vcovHC(model, type = "HC3"))

t test of coefficients:

                   Estimate  Std. Error t value Pr(>|t|)  
(Intercept)     -2.3592e+01  2.2585e+01 -1.0446  0.32346  
GDP_Current_USD  2.7252e-10  1.3541e-10  2.0126  0.07502 .
Tax_Revenue      8.8033e-01  1.5140e+00  0.5815  0.57520  
Public_Debt     -2.6889e-01  2.2292e-01 -1.2063  0.25847  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Robustný odhad ukazuje, že žiadna premenná nie je štatisticky významná na 5 % hladine. Premenná GDP_Current_USD má síce pozitívny koeficient a slabú hraničnú významnosť (p ≈ 0.075), no stále nejde o preukázaný efekt. Tax_Revenue ani Public_Debt nevykazujú významný vplyv na infláciu a ich odhady sú neisté. Intercept je taktiež nevýznamný. Celkovo robustné štandardné chyby naznačujú, že pri malej veľkosti vzorky sú odhady málo presné a model neposkytuje silné dôkazy o vplyve vysvetľujúcich premenných na infláciu.

4. Záver

Modelovanie inflácie na Slovensku ukázalo, že aj keď sa podarilo zachytiť základné trendy vo vývoji inflácie, krátky časový rad a silná korelácia medzi makroekonomickými premennými obmedzili štatistickú presnosť odhadov. Z hlavných vysvetľujúcich premenných mal HDP najsilnejší a pozitívny vzťah k inflácii, avšak tento efekt nebol pri robustnom odhade jednoznačne preukázaný. Verejné príjmy ani verejný dlh sa neukázali ako štatisticky významné determinanty inflácie. Celkovo výsledky naznačujú, že infláciu v sledovanom období ovplyvňovali aj iné faktory mimo rozsahu modelu a že pre spoľahlivejšie závery by bol potrebný dlhší časový rad alebo rozšírený model.

