Úvod

V tejto úlohe vykonávam jednoduchú lineárnu regresiu na databáze, ktorú používam aj v predchádzajúcom zadaní – dataset EuStockMarkets zo základnej inštalácie R.

Použijem:

Cieľ: Zistiť, či a ako nemecký index DAX ovplyvňuje britský index FTSE.

Načítanie dát

data("EuStockMarkets")

stocks <- as.data.frame(EuStockMarkets)
head(stocks)
##       DAX    SMI    CAC   FTSE
## 1 1628.75 1678.1 1772.8 2443.6
## 2 1613.63 1688.5 1750.5 2460.2
## 3 1606.51 1678.6 1718.0 2448.2
## 4 1621.04 1684.1 1708.1 2470.4
## 5 1618.16 1686.6 1723.1 2484.7
## 6 1610.61 1671.6 1714.3 2466.8

Vizualizácia vzťahu (scatterplot)

plot(
  stocks$DAX,
  stocks$FTSE,
  pch = 19,
  col = "darkblue",
  main = "Vzťah medzi indexmi DAX a FTSE",
  xlab = "DAX",
  ylab = "FTSE"
)

Interpretácia

Body sú zoradené takmer lineárne, čo naznačuje silný pozitívny vzťah: - keď DAX rastie, - FTSE má tendenciu rásť tiež.

To naznačuje, že lineárna regresia bude vhodným modelom.

Odhad regresného modelu

model <- lm(FTSE ~ DAX, data = stocks)
summary(model)
## 
## Call:
## lm(formula = FTSE ~ DAX, data = stocks)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -755.13 -143.29   37.25  167.78  372.18 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 1.344e+03  1.273e+01   105.5   <2e-16 ***
## DAX         8.780e-01  4.625e-03   189.8   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 216.3 on 1858 degrees of freedom
## Multiple R-squared:  0.951,  Adjusted R-squared:  0.9509 
## F-statistic: 3.604e+04 on 1 and 1858 DF,  p-value: < 2.2e-16

Interpretácia výsledkov

1. Odhadované parametre

  • Intercept (β₀): hodnota FTSE, keď je DAX = 0
    (čisto technický parameter, ekonomický význam nemá, lebo DAX nikdy nie je 0)

  • Sklonová koeficient (β₁) pri DAX:
    predstavuje, o koľko bodov sa zmení FTSE, ak sa DAX zvýši o 1 bod.

Ak je napr. β₁ = 0.92, interpretácia je:

Ak sa DAX zvýši o 1 bod, index FTSE sa priemerne zvýši o 0,92 bodu.

2. Štatistická významnosť

Zo summary sledujeme:

  • p-value pri DAX
    → ak je p < 0.05, koeficient je štatisticky významný
    → v praxi skoro určite bude < 2e−16 (extrémne významné)

3. R-squared

Hodnota vyjadruje, koľko % variability vo FTSE model vysvetľuje pomocou DAX.

Pri EuStockMarkets býva:

  • R² ≈ 0.90 – 0.97 → veľmi silný vzťah
  • Model je veľmi dobrým prediktorom FTSE.

Vizualizácia regresnej priamky

plot(
  stocks$DAX,
  stocks$FTSE,
  pch = 19,
  col = "darkgreen",
  xlab = "DAX",
  ylab = "FTSE",
  main = "Regresná priamka: FTSE ~ DAX"
)

abline(model, col = "red", lwd = 2)

Interpretácia

Regresná priamka veľmi dobre kopíruje usporiadanie bodov →
lineárny model je vhodný.

Diagnostika rezíduí

par(mfrow=c(2,2))
plot(model)

par(mfrow=c(1,1))

Interpretácia

  • Rezíduá sú rovnomerne rozptýlené okolo 0 → homoskedasticita OK
  • Normal Q-Q plot: body sú blízko priamky → rezíduá sú približne normálne
  • Scale–Location plot → stabilný rozptyl
  • Cook’s distance → žiadne extrémne odľahlé hodnoty

Model je teda po diagnostike v poriadku a použiteľný.

Záver

Na základe odhadu lineárneho modelu:

Záver:
Britský akciový index FTSE sa veľmi úzko vyvíja spolu s nemeckým indexom DAX.
Lineárna regresia je vhodným a dobre fungujúcim modelom na opis tohto vzťahu.