S využitím databázy Global
Economic Indicators (2010–2025)- World bank
Pri ďalšej práci budeme používať knižnice
library(zoo)
library(tseries)
library(lmtest)
library(sandwich)
library(car)
rm(list=ls())
1. Úvod a údaje
Údaje o makroekonomických premenných sú usporiadané v súbore
csv, stĺpce sú oddelené znakom “;” a používajú desatinnú
bodku.
Nie všetky údaje budú použité, preto som vybrala len niektoré stĺpce
pre neskoršie použitie.
1.1 Úvod do problému, stanovenie hypotéz
Rozhodla som sa modelovať mieru inflácie Inflation_CPI v
závislosti od troch vysvetľujúcich premenných, a to HDP v bežných cenách
GDP_Current_USD, príjmy verejnej správy Tax_Revenue a
verejný dlh Public_Debt.
Naša pracovná hypotéza hovorí o štatisticky významnom vplyve všetkých
troch vysvetľujúcich premenných. Očakávame, že rast HDP bude spojený so
znižovaním inflácie (negatívny koeficient), keďže vyšší ekonomický výkon
tlmí cenové tlaky. Naopak, rast verejných príjmov môže súvisieť s
pozitívnym vplyvom na infláciu (kladný koeficient) v dôsledku fiškálnych
politík. Pri premennej Public_Debt predpokladáme pozitívny vplyv na
infláciu (kladný koeficient), keďže vyšší dlh môže zvyšovať cenové tlaky
a rizikovú prémia krajiny.
1.2 Príprava databázy, úprava údajov
udaje <- read.csv("data.csv",dec=".",sep=";",header = TRUE)
# vyberieme iba relevantné premenné
udajeSK <- udaje[, c("Inflation_CPI",
"GDP_Current_USD",
"Tax_Revenue",
"Public_Debt",
"year")]
# nastavíme rok ako názvy riadkov
rownames(udajeSK) <- udajeSK$year
# zoradíme podľa roku
udajeSK <- udajeSK[order(udajeSK$year), ]
udajeSK
NA
2. Lineárna regresia v základnom tvare
library(ggplot2)
# Lineárna regresia v základnom tvare
model <- lm(Inflation_CPI ~ GDP_Current_USD + Tax_Revenue + Public_Debt, data = udajeSK)
summary(model)
Call:
lm(formula = Inflation_CPI ~ GDP_Current_USD + Tax_Revenue +
Public_Debt, data = udajeSK)
Residuals:
Min 1Q Median 3Q Max
-2.1536 -1.8433 -0.2947 0.4521 4.9545
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -2.359e+01 9.930e+00 -2.376 0.0415 *
GDP_Current_USD 2.725e-10 9.430e-11 2.890 0.0179 *
Tax_Revenue 8.803e-01 8.310e-01 1.059 0.3170
Public_Debt -2.689e-01 1.235e-01 -2.177 0.0574 .
---
Signif. codes:
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 2.494 on 9 degrees of freedom
Multiple R-squared: 0.5951, Adjusted R-squared: 0.4601
F-statistic: 4.409 on 3 and 9 DF, p-value: 0.03615
Model je štatisticky významný (F-test p = 0.036) a vysvetľuje
približne 60 % variability inflácie (R² = 0.595). Jedinou jasne
významnou premennou je GDP_Current_USD, ktoré má pozitívny a štatisticky
preukázateľný vplyv na infláciu (p = 0.0179). Premenná Public_Debt
vykazuje slabú, hraničnú štatistickú významnosť (p ≈ 0.057) a jej
odhadovaný účinok je negatívny. Premenná Tax_Revenue nie je štatisticky
významná (p = 0.317). Konštanta je významná a negatívna. Model teda
naznačuje, že inflácia na Slovensku bola v sledovanom období najviac
ovplyvnená vývojom HDP, zatiaľ čo dlh a daňové príjmy zohrávali menšiu
alebo nepreukázateľnú úlohu.
3 Autokorelácia rezíduí
V tejto časti sa pozrieme na ďalší dôležitý predpoklad klasického
lineárneho regresného modelu – nezávislosť rezíduí. V
časových radoch sa často stáva, že chyba v čase \(t\) je systematicky spätá s chybou v čase
\(t-1\), čo nazývame
autokoreláciou rezíduí.
library(ggplot2)
# add fitted values to the dataframe
udajeSK$fitted <- fitted(model)
# scatterplot + regression line + spline smoother
ggplot(udajeSK, aes(x = year, y = Inflation_CPI)) +
geom_point(color = "steelblue", size = 2) +
# regression fitted line
geom_line(aes(y = fitted), color = "red", size = 1) +
labs(
title = "Inflácia na Slovensku: Empirical Data (blue) vs. Fitted Data (Red)",
x = "Rok",
y = "Inflation CPI"
) +
theme_minimal()

Graf ukazuje porovnanie skutočnej inflácie so hodnotami
predpovedanými regresným modelom. Model zachytáva základný trend – nízku
infláciu v rokoch 2014–2016 a jej postupný nárast po roku 2017, no
viditeľne nedokáže presne vystihnúť prudké výkyvy, najmä rýchle
zrýchlenie inflácie v rokoch 2021–2022. To naznačuje, že lineárny model
vysvetľuje časť variability, ale nezachytáva dynamické šoky a nelineárne
zmeny v inflácii.
res <- residuals(model)
ACF graf (Autocorrelation Function)
Táto funkcia priradzuje odhad korelácie, ktorá je medzi jednotlivými
rezíduami v aktuálnom období a období posunutom (Lag) o \(k\) období späť.
acf(res, lag.max = 4,main = "Autokorelačná funkcia rezíduí")

Na grafe je modrou prerušovanou čiarou zobrazený 95 % interval
spoľahlivosti pre hodnoty autokorelačných koeficientov pri jednotlivých
oneskoreniach (lagoch). Pokiaľ odhadnutý koeficient autokorelácie
zostáva v rámci týchto hraníc, nepovažujeme ho za štatisticky
významný.
Z grafu vidíme, že všetky hodnoty autokorelačných koeficientov pri
posune lag ≥ 1 zostávajú v intervale spoľahlivosti. To znamená, že pre
tieto oneskorenia neexistujú dôkazy o štatisticky významnej
autokorelácii rezíduí.
Celkovo teda môžeme konštatovať, že reziduá modelu nevykazujú
významnú autokoreláciu, čo je priaznivý výsledok a podporuje platnosť
predpokladu nezávislosti chýb v klasickom lineárnom regresnom
modeli.
Durbin–Watsonov test
library(lmtest)
dwtest(model)
Durbin-Watson test
data: model
DW = 1.8762, p-value = 0.1606
alternative hypothesis: true autocorrelation is greater than 0
Durbin–Watsonov test skúma, či sú reziduá lineárneho regresného
modelu pozitívne autokorelované. Testovacou štatistikou je hodnota DW =
1.8762, ktorá sa nachádza blízko teoretickej hodnoty 2, čo predstavuje
stav bez autokorelace.
Hodnota p-value = 0.1606 je vyššia než obvyklé hladiny významnosti
(0.05 alebo 0.10). Preto nezamietame nulovú hypotézu o neprítomnosti
pozitívnej autokorelácie rezíduí.
Breusch–Godfreyov test (BG test)
Hypotézy
Nulová hypotéza \(H_0\):
žiadna sériová korelácia
Alternatívna hypotéza \(H_1\): sériová korelácia
prítomná
bgtest(model, order = 1)
Breusch-Godfrey test for serial correlation of
order up to 1
data: model
LM test = 0.86532, df = 1, p-value = 0.3523
Breusch–Godfreyho test bol použitý na overenie prítomnosti sériovej
autokorelácie rezíduí prvého rádu. Výsledná hodnota testovacej
štatistiky LM = 0.86532 je relatívne nízka a zodpovedá jej aj vysoká
p-hodnota na úrovni 0.3523. Keďže p-hodnota výrazne prevyšuje bežnú
hladinu významnosti 0.05, nulovú hypotézu o neprítomnosti autokorelácie
rezíduí nezamietame. Test teda neposkytuje dôkazy o tom, že by reziduá
vykazovali sériovú autokoreláciu. Tento výsledok podporuje platnosť
predpokladu nezávislosti chýb v rámci odhadovaného regresného
modelu.
Ako riešiť autokoreláciu
Odstraňovanie problému autokorelácie rezíduí
Odhad Koyckovho modelu v R
library(dplyr)
udajeSK <- udajeSK %>%
arrange(year) %>%
mutate(
Inflation_CPI_lag1 = lag(Inflation_CPI)
)
model_koyck <- lm(Inflation_CPI ~ GDP_Current_USD + Tax_Revenue + Public_Debt + Inflation_CPI_lag1,
data = udajeSK)
summary(model_koyck)
Call:
lm(formula = Inflation_CPI ~ GDP_Current_USD + Tax_Revenue +
Public_Debt + Inflation_CPI_lag1, data = udajeSK)
Residuals:
Min 1Q Median 3Q Max
-3.6521 -1.2398 0.4219 0.7437 3.5313
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -2.395e+01 1.075e+01 -2.228 0.0611
GDP_Current_USD 1.395e-10 1.179e-10 1.183 0.2755
Tax_Revenue 1.801e+00 9.921e-01 1.815 0.1124
Public_Debt -3.356e-01 1.224e-01 -2.742 0.0288
Inflation_CPI_lag1 1.143e+00 6.559e-01 1.743 0.1249
(Intercept) .
GDP_Current_USD
Tax_Revenue
Public_Debt *
Inflation_CPI_lag1
---
Signif. codes:
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 2.304 on 7 degrees of freedom
(1 observation deleted due to missingness)
Multiple R-squared: 0.7256, Adjusted R-squared: 0.5688
F-statistic: 4.627 on 4 and 7 DF, p-value: 0.03831
dwtest(model_koyck)
Durbin-Watson test
data: model_koyck
DW = 1.4671, p-value = 0.0415
alternative hypothesis: true autocorrelation is greater than 0
Dynamizovaný model neidentifikuje väčšinu regresorov ako štatisticky
významných; výnimkou je len premenná Public_Debt, ktorá zostáva významná
na hladine 5 %. Koeficient pri oneskorenej inflácii Inflation_CPI_lag1
je kladný a väčší ako 1, čo naznačuje silný a potenciálne nestabilný
zotrvačný efekt inflácie z predchádzajúceho obdobia. Z porovnania
Adjusted R-squared vyplýva, že dynamizovaný model má nižšiu
vysvetľovaciu schopnosť než pôvodná špecifikácia, a teda neprináša
zlepšenie.
Durbin–Watsonov test s hodnotou DW = 1.4671 a p-hodnotou 0.0415
signalizuje štatisticky významnú pozitívnu autokoreláciu rezíduí.
Dynamizácia modelu preto neodstránila problém autokorelácie a model
ostáva štatisticky nedostatočný.
Newey–West robustné štandardné chyby
library(sandwich)
library(lmtest)
coeftest(model, vcov = NeweyWest(model, lag = 1))
Error in solve.default(diag(ncol(umat)) - apply(var.fit$ar, 2:3, sum)) :
system is computationally singular: reciprocal condition number = 4.59827e-24
Chyba vzniká preto, že model je odhadnutý na veľmi krátkom časovom
rade a niektoré vysvetľujúce premenné sú silno korelované. V takých
podmienkach je Newey–Westova korekcia numericky nestabilná a
kovariancia-matrica sa stane singulárnou, takže ju nie je možné
invertovať.
Odporúčaný spôsob robustného odhadu pre krátky časový rad
Pre krátky časový rad (10–12 pozorovaní) je Newey–West nevhodný – je
numericky nestabilný a často skolabuje, ako v našom prípade. Pre takto
malú vzorku sa odporúča použiť heteroskedasticity-consistent (HC)
robustné štandardné chyby, najmä:
HC3 – najstabilnejší v malých vzorkách
HC1 – Vo všeobecnosti bezpečný (ako Whiteova korekcia)
library(lmtest)
library(sandwich)
# HC3 robustné štandardné chyby – najlepšie pre malé vzorky
coeftest(model, vcov = vcovHC(model, type = "HC3"))
t test of coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -2.3592e+01 2.2585e+01 -1.0446 0.32346
GDP_Current_USD 2.7252e-10 1.3541e-10 2.0126 0.07502 .
Tax_Revenue 8.8033e-01 1.5140e+00 0.5815 0.57520
Public_Debt -2.6889e-01 2.2292e-01 -1.2063 0.25847
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Robustný odhad ukazuje, že žiadna premenná nie je štatisticky
významná na 5 % hladine. Premenná GDP_Current_USD má síce pozitívny
koeficient a slabú hraničnú významnosť (p ≈ 0.075), no stále nejde o
preukázaný efekt. Tax_Revenue ani Public_Debt nevykazujú významný vplyv
na infláciu a ich odhady sú neisté. Intercept je taktiež nevýznamný.
Celkovo robustné štandardné chyby naznačujú, že pri malej veľkosti
vzorky sú odhady málo presné a model neposkytuje silné dôkazy o vplyve
vysvetľujúcich premenných na infláciu.
4. Záver
Modelovanie inflácie na Slovensku ukázalo, že aj keď sa podarilo
zachytiť základné trendy vo vývoji inflácie, krátky časový rad a silná
korelácia medzi makroekonomickými premennými obmedzili štatistickú
presnosť odhadov. Z hlavných vysvetľujúcich premenných mal HDP
najsilnejší a pozitívny vzťah k inflácii, avšak tento efekt nebol pri
robustnom odhade jednoznačne preukázaný. Verejné príjmy ani verejný dlh
sa neukázali ako štatisticky významné determinanty inflácie. Celkovo
výsledky naznačujú, že infláciu v sledovanom období ovplyvňovali aj iné
faktory mimo rozsahu modelu a že pre spoľahlivejšie závery by bol
potrebný dlhší časový rad alebo rozšírený model.
