1. Inštalácia potrebných balíčkov

install.packages("zoo")
install.packages("tseries")
install.packages("lmtest")
install.packages("sandwich")
install.packages("car")

2. Načítanie knižníc

library(zoo)
library(tseries)
library(lmtest)
library(sandwich)
library(car)

3. Načítanie údajov (súbor musí byť v pracovnom priečinku Posit Cloud)

udaje <- read.csv("economic_indicators_dataset_2010_2023.csv",
                  dec = ".", sep = ",", header = TRUE, stringsAsFactors = FALSE)

4. Kontrola názvov stĺpcov

print("Názvy stĺpcov:")
print(names(udaje))

5. Prevod Date na Date triedu a vytvorenie stĺpca Year

udaje$Date_parsed <- as.Date(udaje$Date, format = "%Y-%m-%d")

Teraz vytvoríme Year

udaje$Year <- as.numeric(format(udaje$Date_parsed, "%Y"))

Rýchla kontrola dostupných rokov

print("Dostupné roky v dátach:")
print(sort(unique(udaje$Year)))

6. Výber údajov pre rok 2015

udaje.2015 <- subset(udaje, Year == 2015)

7. Výber relevantných stĺpcov podľa tvojich názvov

# Definujeme názvy stĺpcov, ktoré nás zaujímajú
stock_col <- "Stock.Index.Value"
gdp_col <- "GDP.Growth.Rate...."
interest_col <- "Interest.Rate...."
infl_col <- "Inflation.Rate...."

# Overíme, ktoré stĺpce skutočne existujú v dátach
available_cols <- c(stock_col, gdp_col, interest_col, infl_col)
existing_cols <- available_cols[available_cols %in% names(udaje.2015)]

print("Použité stĺpce:")
[1] "Použité stĺpce:"
print(existing_cols)
[1] "Stock.Index.Value"   "GDP.Growth.Rate...."
[3] "Interest.Rate...."   "Inflation.Rate...." 
# Vytvoríme dataframe len s týmito stĺpcami
udaje.2015_sel <- udaje.2015[, existing_cols, drop = FALSE]

8. Prevod všetkých vybraných stĺpcov na numerické (ak ešte nie sú)

# Konvertujeme každý stĺpec individuálne na numerický
for (col in existing_cols) {
  udaje.2015_sel[[col]] <- as.numeric(as.character(udaje.2015_sel[[col]]))
}

9. Kontrola NA / prázdnych stĺpcov pred boxplotom

na_counts <- sapply(udaje.2015_sel, function(x) sum(is.na(x)))
non_na_counts <- sapply(udaje.2015_sel, function(x) sum(!is.na(x)))
print("Počet NA v každom stĺpci:")
[1] "Počet NA v každom stĺpci:"
print(na_counts)
  Stock.Index.Value GDP.Growth.Rate....   Interest.Rate.... 
                  0                   0                   0 
 Inflation.Rate.... 
                  0 
print("Počet nenulových hodnôt v každom stĺpci:")
[1] "Počet nenulových hodnôt v každom stĺpci:"
print(non_na_counts)
  Stock.Index.Value GDP.Growth.Rate....   Interest.Rate.... 
                 32                  32                  32 
 Inflation.Rate.... 
                 32 
# Ak niektorý stĺpec obsahuje len NA -> vylúčime ho z ďalších krokov
cols_with_data <- names(udaje.2015_sel)[non_na_counts > 0]
if (length(cols_with_data) == 0) {
  stop("Všetky vybrané stĺpce pre vybraný rok sú NA. Skontroluj dáta.")
}
udaje.2015_sel <- udaje.2015_sel[, cols_with_data, drop = FALSE]

10. Doplnenie chýbajúcich hodnôt mediánom

for (col in names(udaje.2015_sel)) {
  if (sum(!is.na(udaje.2015_sel[[col]])) > 0) {  # kontrola, či sú nejaké non-NA hodnoty
    med <- median(udaje.2015_sel[[col]], na.rm = TRUE)
    udaje.2015_sel[[col]][is.na(udaje.2015_sel[[col]])] <- med
  }
}

11. Boxploty

numeric_cols <- names(udaje.2015_sel)[sapply(udaje.2015_sel, is.numeric)]
if (length(numeric_cols) == 0) {
  stop("Žiadne numerické stĺpce na vykreslenie.")
}

# Dynamicky nastaviť rozloženie grafov podľa počtu stĺpcov
plot_rows <- ceiling(length(numeric_cols) / 2)
par(mfrow = c(plot_rows, 2))
par(mar = c(4, 4, 2, 1))

for (col in numeric_cols) {
  vals <- udaje.2015_sel[[col]]
  if (all(is.finite(vals))) {
    boxplot(vals, main = col, xlab = "Hodnota", col = "lightblue")
  } else {
    warning(paste("Stĺpec", col, "nemá konečné hodnoty. Preskakujem."))
  }
}

mtext("Boxploty vybraných premenných (rok 2015)", outer = TRUE, line = -1, cex = 1.2, font = 2)
par(mfrow = c(1, 1))

Štatistické hypotézy

Pre regresný model testujeme nasledovné štatistické hypotézy:

Hlavné hypotézy:

  1. Hypotéza o vplyve HDP na akciový index:
    • H₀: β_GDP = 0 (Rast HDP nemá vplyv na akciový index)
    • H₁: β_GDP ≠ 0 (Rast HDP má vplyv na akciový index)
  2. Hypotéza o vplyve úrokovej sadzby:
    • H₀: β_Interest = 0 (Úroková sadzba nemá vplyv na akciový index)
    • H₁: β_Interest ≠ 0 (Úroková sadzba má vplyv na akciový index)
  3. Hypotéza o vplyve inflácie:
    • H₀: β_Inflation = 0 (Inflácia nemá vplyv na akciový index)
    • H₁: β_Inflation ≠ 0 (Inflácia má vplyv na akciový index)

Celková hypotéza modelu: - H₀: β₁ = β₂ = β₃ = 0 (Žiadna z premenných nevysvetľuje variabilitu akciového indexu) - H₁: Aspoň jeden β ≠ 0 (Asi jedna premenná vysvetľuje variabilitu akciového indexu)

Očakávané smerové účinky: - GDP Growth: očakávame pozitívny vplyv (+) - Interest Rate: očakávame negatívny vplyv (-) - Inflation Rate: vplyv nejednoznačný (+/-) “)

12. Regresný model


# Skontrolujeme, či máme aspoň Stock Index a jednu vysvetľujúcu premennú
if (!("Stock.Index.Value" %in% names(udaje.2015_sel))) {
  stop("Stĺpec 'Stock Index Value' nie je dostupný po filtrovaní.")
}

# Zostavíme formulu dynamicky len z dostupných vysvetľujúcich premenných
response <- "Stock.Index.Value"
predictors <- setdiff(names(udaje.2015_sel), response)

if (length(predictors) == 0) {
  stop("Žiadne vysvetľujúce premenné dostupné pre regresiu.")
}

formula_text <- paste(response, "~", paste(predictors, collapse = " + "))
model <- lm(as.formula(formula_text), data = udaje.2015_sel)
print(summary(model))

Call:
lm(formula = as.formula(formula_text), data = udaje.2015_sel)

Residuals:
     Min       1Q   Median       3Q      Max 
-22884.0  -6508.6   -291.9   9787.0  17806.9 

Coefficients:
                    Estimate Std. Error t value Pr(>|t|)    
(Intercept)          25760.4     5217.1   4.938 3.29e-05 ***
GDP.Growth.Rate....    523.6      547.4   0.957    0.347    
Interest.Rate....     -928.3      652.8  -1.422    0.166    
Inflation.Rate....     243.6      664.0   0.367    0.716    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 12040 on 28 degrees of freedom
Multiple R-squared:  0.09753,   Adjusted R-squared:  0.00084 
F-statistic: 1.009 on 3 and 28 DF,  p-value: 0.4036

13. Diagnostické grafy


par(mfrow = c(2, 2))
plot(model)
par(mfrow = c(1, 1))

14. Testy rezíduí a odľahlých hodnôt


jb_test <- jarque.bera.test(residuals(model))
print(jb_test)

    Jarque Bera Test

data:  residuals(model)
X-squared = 1.9994, df = 2, p-value = 0.368
print(outlierTest(model))
No Studentized residuals with Bonferroni p < 0.05
Largest |rstudent|:

15. Alternatívny model

# Skúsime model bez krajných hodnôt
if (nrow(udaje.2015_sel) > 10) {  # len ak máme dostatok dát
  # Odstránime vplyvné body
  cooks_dist <- cooks.distance(model)
  influential <- cooks_dist > (4 / nrow(udaje.2015_sel))
  
  if (sum(influential) > 0) {
    udaje.2015_clean <- udaje.2015_sel[!influential, ]
    model_clean <- lm(as.formula(formula_text), data = udaje.2015_clean)
    print("Model po odstránení vplyvných pozorovaní:")
    print(summary(model_clean))
  }
}
[1] "Model po odstránení vplyvných pozorovaní:"

Call:
lm(formula = as.formula(formula_text), data = udaje.2015_clean)

Residuals:
   Min     1Q Median     3Q    Max 
-20974  -4867  -1410   8841  16668 

Coefficients:
                    Estimate Std. Error t value Pr(>|t|)    
(Intercept)          27477.5     4934.4   5.569 6.64e-06 ***
GDP.Growth.Rate....    915.6      540.4   1.694   0.1017    
Interest.Rate....    -1228.9      624.5  -1.968   0.0594 .  
Inflation.Rate....     206.7      620.7   0.333   0.7417    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 11250 on 27 degrees of freedom
Multiple R-squared:  0.1944,    Adjusted R-squared:  0.1048 
F-statistic: 2.171 on 3 and 27 DF,  p-value: 0.1146

Správa z analýzy (rok 2015)

Cieľom analýzy bolo preskúmať vplyv makroekonomických premenných na hodnotu akciového indexu. Použité premenné: Stock Index Value (závislá), GDP Growth Rate (%), Interest Rate (%), Inflation Rate (%).

Doplnenie chýbajúcich hodnôt: medián príslušnej premennej. Regresný model: pozri vyššie výpis summary().

Interpretácia: - Ak je koeficient pri raste HDP pozitívny a štatisticky významný -> rast HDP zvyšuje akciový index. - Ak je koeficient pri úrokovej sadzbe negatívny -> vyššie úrokové sadzby znižujú hodnotu akcií. - Inflácia často má slabší alebo nejednoznačný vplyv.

