Rozhodla som sa modelovať infláciu v USA ako funkciu troch vysvetľujúcich premenných:
GDP_Growth — hospodársky rast
Unemployment — miera nezamestnanosti
Interest_Rate — úroková sadzba
Hypotézy:
H1: Vyšší hospodársky rast znižuje infláciu.
H2: Vyššia nezamestnanosť vedie k nižšiemu inflačnému tlaku.
H3: Vyššia úroková sadzba znižuje infláciu.
# Načítanie knižníc
library(zoo)
library(tseries)
library(lmtest)
library(sandwich)
library(car)
library(dplyr)
library(ggplot2)
rm(list = ls())# Načítanie údajov
data <- read.csv("economic_indicators_dataset_2010_2023.csv",
dec = ".", sep = ",", header = TRUE)
# Dátum
data$Date <- as.Date(data$Date)
# Výber USA a užitočných premenných
dataUSA <- data %>%
filter(Country == "USA") %>%
select(Date,
Inflation.Rate....,
GDP.Growth.Rate....,
Unemployment.Rate....,
Interest.Rate....) %>%
arrange(Date)
# Premenovanie
colnames(dataUSA) <- c("Date","Inflation","GDP_Growth","Unemployment","Interest_Rate")
Call:
lm(formula = Inflation ~ GDP_Growth + Unemployment + Interest_Rate,
data = dataUSA)
Residuals:
Min 1Q Median 3Q Max
-5.5414 -2.4185 0.3282 2.1848 4.7028
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 6.52358 1.37798 4.734 1.68e-05 ***
GDP_Growth -0.05513 0.10357 -0.532 0.5967
Unemployment -0.25459 0.14127 -1.802 0.0772 .
Interest_Rate 0.09603 0.12259 0.783 0.4369
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 2.928 on 53 degrees of freedom
Multiple R-squared: 0.09918, Adjusted R-squared: 0.04819
F-statistic: 1.945 on 3 and 53 DF, p-value: 0.1335
Odhadnutý lineárny regresný model vykazuje nízku celkovú vysvetľujúcu silu, o čom svedčí koeficient determinácie (R-squared) 0.099, čo znamená, že premenné spolu vysvetľujú len 9,9 % variability inflácie. Celkový model nie je štatisticky významný (p-hodnota F-štatistiky = 0,134).
Posúdenie hypotéz:
H1: Záporný koeficient (-0,055) je v súlade s hypotézou, no je štatisticky nevýznamný (p=0,597). Hypotéza sa nepotvrdzuje.
H2: Záporný koeficient (-0,255) je v súlade s Phillipsovej krivkou a je slabo významný na hladine 10% (p=0,077). Hypotéza je obmedzene podporená.
H3: Kladný koeficient (0,096) je v priamom protiklade s hypotézou a je štatisticky nevýznamný (p=0,437). Hypotéza sa nepotvrdzuje.
Graf znázorňuje porovnanie empirických (skutočných) hodnôt inflácie v USA s fitovanými hodnotami.
ggplot(dataUSA, aes(x = Date, y = Inflation)) +
geom_point(color = "blue", size = 2) +
geom_line(aes(y = fitted), color = "red", size = 1) +
labs(title = "Inflation USA: Empirical vs Fitted values",
x = "Date", y = "Inflation (%)") +
theme_minimal()Empirické hodnoty -> dosahujú rozsah 0,0 % až 9,7 % – prejavujú vysokú volatilitu.
Fitované hodnoty -> prevažne sa pohybujú okolo priemeru ~5,0 %, čo naznačuje silnú tendenciu k priemeru.
Kľúčové Zlyhanie -> model podceňuje infláciu po roku 2020; skutočné hodnoty sú nad 9,0 %, zatiaľ čo model predikuje len 5,0 % – 6,5 %.
Čiže model je neefektívny a má nízku presnosť pri zachytávaní extrémnych inflačných šokov.
Graf zobrazuje koreláciu medzi rezíduami (chybami modelu) v rôznych časových oneskoreniach (Lag).
Ide o kľúčový test, ktorý určuje, či model zachytil celú časovú závislosť dát.
Empirické hodnoty -> pri oneskoreniach \(Lag \ge 1\) je zjavné, že existuje výrazná negatívna korelácia pri \(Lag = 1\) (približne \(–0,4\)).
Kľúčové Zlyhanie -> pretože stĺpec pri \(Lag = 1\) presahuje dolnú signifikačnú hranicu, rezíduá nie sú nezávislé.
To znamená, že chyba modelu v jednom období silne ovplyvňuje chybu v nasledujúcom období.
Je zrejmé, že koeficient autokorelácie pre posun (\(Lag\) \(k=1\)) je štatisticky významný, keďže jeho hodnota (približne \(-0,4\)) prekračuje dolnú hranicu konfidenčného intervalu (intervalu spoľahlivosti), ktorá je približne \(-0,3\). Ostatné koeficienty sú nevýznamné.
Durbin-Watson test
data: model
DW = 2.8521, p-value = 0.9996
alternative hypothesis: true autocorrelation is greater than 0
To indikuje prítomnosť štatisticky významnej negatívnej autokorelácie prvého rádu v rezíduách modelu.
Breusch-Godfrey test for serial correlation of order up to 1
data: model
LM test = 12.326, df = 1, p-value = 0.0004467
Zistená hodnota p-value (\(0.0004467\)) je extrémne nízka, t. j. je výrazne nižšia ako štandardná hladina významnosti \(\alpha = 0,05\) (alebo \(\alpha = 0,01\)).
Zamietame nulovú hypotézu o absencii sériovej korelácie. Existuje štatisticky vysoko významná autokorelácia prvého rádu v rezíduách.
dataUSA <- dataUSA %>%
mutate(Inflation_lag1 = lag(Inflation))
model_koyck <- lm(Inflation ~ GDP_Growth + Unemployment + Interest_Rate +
Inflation_lag1,
data = dataUSA)
summary(model_koyck)
Call:
lm(formula = Inflation ~ GDP_Growth + Unemployment + Interest_Rate +
Inflation_lag1, data = dataUSA)
Residuals:
Min 1Q Median 3Q Max
-5.5476 -2.0242 0.3046 1.8316 4.9636
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 9.67947 1.68796 5.734 5.33e-07 ***
GDP_Growth -0.08743 0.09804 -0.892 0.37667
Unemployment -0.33972 0.13907 -2.443 0.01808 *
Interest_Rate -0.01099 0.11972 -0.092 0.92724
Inflation_lag1 -0.40149 0.13029 -3.082 0.00332 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 2.735 on 51 degrees of freedom
(1 пропущенное наблюдение удалено)
Multiple R-squared: 0.2342, Adjusted R-squared: 0.1742
F-statistic: 3.9 on 4 and 51 DF, p-value: 0.007722
Durbin-Watson test
data: model_koyck
DW = 2.2805, p-value = 0.8605
alternative hypothesis: true autocorrelation is greater than 0
Hodnota \(p=0,007722\) (z F-testu) potvrdzuje, že je model ako celok štatisticky významný na úrovni \(\alpha=0,01\).
Model vysvetľuje približne \(17,42\%\) variability inflácie (Adjusted \(R^2\)). Táto hodnota je relatívne nízka.
Štatisticky významné sú premenné Nezamestnanosť (\(\text{Unemployment}\), \(p=0,018\)) a Oneskorená inflácia (\(\text{Inflation_lag1}\), \(p=0,003\)). Rast HDP a Úroková sadzba nie sú významné.
Hodnota \(\text{DW} = 2,2805\) je blízka hodnote 2. To signalizuje, že zahrnutie oneskorenej premennej výrazne zlepšilo špecifikáciu modelu a znížilo autokoreláciu rezíduí (v porovnaní s predchádzajúcim modelom).
Model je štatisticky významný a úspešne korigoval problém autokorelácie, avšak jeho celková prediktívna schopnosť je obmedzená (\(R^2 \approx 17\%\)).
t test of coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 6.523581 1.223244 5.3330 2.035e-06 ***
GDP_Growth -0.055135 0.083573 -0.6597 0.51229
Unemployment -0.254587 0.113666 -2.2398 0.02932 *
Interest_Rate 0.096029 0.106435 0.9022 0.37101
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Intercept (Priesečník):
Unemployment (Nezamestnanosť):
Nevýznamné premenné:
Analýza potvrdila, že pôvodný model inflácie bol neadekvátny z dôvodu nízkej vysvetľujúcej sily (\(R^2 \approx 10\%\)) a silnej negatívnej autokorelácie v rezíduách (\(\text{DW}=2,85\)). Zavedenie oneskorenej inflácie (\(\text{Inflation_lag1}\)) problém autokorelácie úspešne eliminovalo (\(\text{DW}=2,28\)), čím sa model stal štatisticky významným.
Model vysvetľuje iba \(17,42\%\) variability inflácie a jedinou robustne významnou premennou je Nezamestnanosť (potvrdenie Phillipsovej krivky), zatiaľ čo \(\text{GDP_Growth}\) a \(\text{Interest_Rate}\) sú nevýznamné. Model je validný, ale má obmedzenú prediktívnu schopnosť a potvrdzuje len negatívny vzťah s nezamestnanosťou.