1. Inštalácia potrebných balíčkov
install.packages("zoo")
install.packages("tseries")
install.packages("lmtest")
install.packages("sandwich")
install.packages("car")
2. Načítanie knižníc
library(zoo)
library(tseries)
library(lmtest)
library(sandwich)
library(car)
3. Načítanie údajov (súbor musí byť v pracovnom priečinku Posit
Cloud)
udaje <- read.csv("economic_indicators_dataset_2010_2023.csv",
dec = ".", sep = ",", header = TRUE, stringsAsFactors = FALSE)
4. Kontrola názvov stĺpcov
print("Názvy stĺpcov:")
print(names(udaje))
5. Prevod Date na Date triedu a vytvorenie stĺpca Year
udaje$Date_parsed <- as.Date(udaje$Date, format = "%Y-%m-%d")
Teraz vytvoríme Year
udaje$Year <- as.numeric(format(udaje$Date_parsed, "%Y"))
Rýchla kontrola dostupných rokov
print("Dostupné roky v dátach:")
print(sort(unique(udaje$Year)))
6. Výber údajov pre rok 2015
udaje.2015 <- subset(udaje, Year == 2015)
7. Výber relevantných stĺpcov podľa tvojich názvov
# Definujeme názvy stĺpcov, ktoré nás zaujímajú
stock_col <- "Stock.Index.Value"
gdp_col <- "GDP.Growth.Rate...."
interest_col <- "Interest.Rate...."
infl_col <- "Inflation.Rate...."
# Overíme, ktoré stĺpce skutočne existujú v dátach
available_cols <- c(stock_col, gdp_col, interest_col, infl_col)
existing_cols <- available_cols[available_cols %in% names(udaje.2015)]
print("Použité stĺpce:")
[1] "Použité stĺpce:"
[1] "Stock.Index.Value" "GDP.Growth.Rate...."
[3] "Interest.Rate...." "Inflation.Rate...."
# Vytvoríme dataframe len s týmito stĺpcami
udaje.2015_sel <- udaje.2015[, existing_cols, drop = FALSE]
8. Prevod všetkých vybraných stĺpcov na numerické (ak ešte nie
sú)
# Konvertujeme každý stĺpec individuálne na numerický
for (col in existing_cols) {
udaje.2015_sel[[col]] <- as.numeric(as.character(udaje.2015_sel[[col]]))
}
9. Kontrola NA / prázdnych stĺpcov pred boxplotom
na_counts <- sapply(udaje.2015_sel, function(x) sum(is.na(x)))
non_na_counts <- sapply(udaje.2015_sel, function(x) sum(!is.na(x)))
print("Počet NA v každom stĺpci:")
[1] "Počet NA v každom stĺpci:"
Stock.Index.Value GDP.Growth.Rate.... Interest.Rate....
0 0 0
Inflation.Rate....
0
print("Počet nenulových hodnôt v každom stĺpci:")
[1] "Počet nenulových hodnôt v každom stĺpci:"
Stock.Index.Value GDP.Growth.Rate.... Interest.Rate....
32 32 32
Inflation.Rate....
32
# Ak niektorý stĺpec obsahuje len NA -> vylúčime ho z ďalších krokov
cols_with_data <- names(udaje.2015_sel)[non_na_counts > 0]
if (length(cols_with_data) == 0) {
stop("Všetky vybrané stĺpce pre vybraný rok sú NA. Skontroluj dáta.")
}
udaje.2015_sel <- udaje.2015_sel[, cols_with_data, drop = FALSE]
10. Doplnenie chýbajúcich hodnôt mediánom
for (col in names(udaje.2015_sel)) {
if (sum(!is.na(udaje.2015_sel[[col]])) > 0) { # kontrola, či sú nejaké non-NA hodnoty
med <- median(udaje.2015_sel[[col]], na.rm = TRUE)
udaje.2015_sel[[col]][is.na(udaje.2015_sel[[col]])] <- med
}
}
11. Boxploty
numeric_cols <- names(udaje.2015_sel)[sapply(udaje.2015_sel, is.numeric)]
if (length(numeric_cols) == 0) {
stop("Žiadne numerické stĺpce na vykreslenie.")
}
# Dynamicky nastaviť rozloženie grafov podľa počtu stĺpcov
plot_rows <- ceiling(length(numeric_cols) / 2)
par(mfrow = c(plot_rows, 2))
par(mar = c(4, 4, 2, 1))
for (col in numeric_cols) {
vals <- udaje.2015_sel[[col]]
if (all(is.finite(vals))) {
boxplot(vals, main = col, xlab = "Hodnota", col = "lightblue")
} else {
warning(paste("Stĺpec", col, "nemá konečné hodnoty. Preskakujem."))
}
}
mtext("Boxploty vybraných premenných (rok 2015)", outer = TRUE, line = -1, cex = 1.2, font = 2)

Štatistické hypotézy
Pre regresný model testujeme nasledovné štatistické hypotézy:
Hlavné hypotézy:
- Hypotéza o vplyve HDP na akciový index:
- H₀: β_GDP = 0 (Rast HDP nemá vplyv na akciový index)
- H₁: β_GDP ≠ 0 (Rast HDP má vplyv na akciový index)
- Hypotéza o vplyve úrokovej sadzby:
- H₀: β_Interest = 0 (Úroková sadzba nemá vplyv na akciový index)
- H₁: β_Interest ≠ 0 (Úroková sadzba má vplyv na akciový index)
- Hypotéza o vplyve inflácie:
- H₀: β_Inflation = 0 (Inflácia nemá vplyv na akciový index)
- H₁: β_Inflation ≠ 0 (Inflácia má vplyv na akciový index)
Celková hypotéza modelu: - H₀: β₁ = β₂ = β₃ = 0
(Žiadna z premenných nevysvetľuje variabilitu akciového indexu) - H₁:
Aspoň jeden β ≠ 0 (Asi jedna premenná vysvetľuje variabilitu akciového
indexu)
Očakávané smerové účinky: - GDP Growth: očakávame
pozitívny vplyv (+) - Interest Rate: očakávame negatívny vplyv (-) -
Inflation Rate: vplyv nejednoznačný (+/-) “)
12. Regresný model
# Skontrolujeme, či máme aspoň Stock Index a jednu vysvetľujúcu premennú
if (!("Stock.Index.Value" %in% names(udaje.2015_sel))) {
stop("Stĺpec 'Stock Index Value' nie je dostupný po filtrovaní.")
}
# Zostavíme formulu dynamicky len z dostupných vysvetľujúcich premenných
response <- "Stock.Index.Value"
predictors <- setdiff(names(udaje.2015_sel), response)
if (length(predictors) == 0) {
stop("Žiadne vysvetľujúce premenné dostupné pre regresiu.")
}
formula_text <- paste(response, "~", paste(predictors, collapse = " + "))
model <- lm(as.formula(formula_text), data = udaje.2015_sel)
print(summary(model))
Call:
lm(formula = as.formula(formula_text), data = udaje.2015_sel)
Residuals:
Min 1Q Median 3Q Max
-22884.0 -6508.6 -291.9 9787.0 17806.9
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 25760.4 5217.1 4.938 3.29e-05 ***
GDP.Growth.Rate.... 523.6 547.4 0.957 0.347
Interest.Rate.... -928.3 652.8 -1.422 0.166
Inflation.Rate.... 243.6 664.0 0.367 0.716
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 12040 on 28 degrees of freedom
Multiple R-squared: 0.09753, Adjusted R-squared: 0.00084
F-statistic: 1.009 on 3 and 28 DF, p-value: 0.4036
13. Diagnostické grafy
par(mfrow = c(2, 2))
plot(model)
par(mfrow = c(1, 1))

14. Testy rezíduí a odľahlých hodnôt
jb_test <- jarque.bera.test(residuals(model))
print(jb_test)
Jarque Bera Test
data: residuals(model)
X-squared = 1.9994, df = 2, p-value = 0.368
print(outlierTest(model))
No Studentized residuals with Bonferroni p < 0.05
Largest |rstudent|:
15. Alternatívny model
# Skúsime model bez krajných hodnôt
if (nrow(udaje.2015_sel) > 10) { # len ak máme dostatok dát
# Odstránime vplyvné body
cooks_dist <- cooks.distance(model)
influential <- cooks_dist > (4 / nrow(udaje.2015_sel))
if (sum(influential) > 0) {
udaje.2015_clean <- udaje.2015_sel[!influential, ]
model_clean <- lm(as.formula(formula_text), data = udaje.2015_clean)
print("Model po odstránení vplyvných pozorovaní:")
print(summary(model_clean))
}
}
[1] "Model po odstránení vplyvných pozorovaní:"
Call:
lm(formula = as.formula(formula_text), data = udaje.2015_clean)
Residuals:
Min 1Q Median 3Q Max
-20974 -4867 -1410 8841 16668
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 27477.5 4934.4 5.569 6.64e-06 ***
GDP.Growth.Rate.... 915.6 540.4 1.694 0.1017
Interest.Rate.... -1228.9 624.5 -1.968 0.0594 .
Inflation.Rate.... 206.7 620.7 0.333 0.7417
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 11250 on 27 degrees of freedom
Multiple R-squared: 0.1944, Adjusted R-squared: 0.1048
F-statistic: 2.171 on 3 and 27 DF, p-value: 0.1146
Správa z analýzy (rok 2015)
Cieľom analýzy bolo preskúmať vplyv makroekonomických premenných na
hodnotu akciového indexu. Použité premenné: Stock Index Value (závislá),
GDP Growth Rate (%), Interest Rate (%), Inflation Rate (%).
Doplnenie chýbajúcich hodnôt: medián príslušnej premennej. Regresný
model: pozri vyššie výpis summary().
Interpretácia: - Ak je koeficient pri raste HDP pozitívny a
štatisticky významný -> rast HDP zvyšuje akciový index. - Ak je
koeficient pri úrokovej sadzbe negatívny -> vyššie úrokové sadzby
znižujú hodnotu akcií. - Inflácia často má slabší alebo nejednoznačný
vplyv.
