V tejto úlohe vykonávam jednoduchú lineárnu regresiu na databáze, ktorú používam aj v predchádzajúcom zadaní – dataset EuStockMarkets zo základnej inštalácie R.
Použijem:
Cieľ: Zistiť, či a ako nemecký index DAX ovplyvňuje britský index FTSE.
data("EuStockMarkets")
stocks <- as.data.frame(EuStockMarkets)
head(stocks)
## DAX SMI CAC FTSE
## 1 1628.75 1678.1 1772.8 2443.6
## 2 1613.63 1688.5 1750.5 2460.2
## 3 1606.51 1678.6 1718.0 2448.2
## 4 1621.04 1684.1 1708.1 2470.4
## 5 1618.16 1686.6 1723.1 2484.7
## 6 1610.61 1671.6 1714.3 2466.8
plot(
stocks$DAX,
stocks$FTSE,
pch = 19,
col = "darkblue",
main = "Vzťah medzi indexmi DAX a FTSE",
xlab = "DAX",
ylab = "FTSE"
)
Body sú zoradené takmer lineárne, čo naznačuje silný pozitívny vzťah: - keď DAX rastie, - FTSE má tendenciu rásť tiež.
To naznačuje, že lineárna regresia bude vhodným modelom.
model <- lm(FTSE ~ DAX, data = stocks)
summary(model)
##
## Call:
## lm(formula = FTSE ~ DAX, data = stocks)
##
## Residuals:
## Min 1Q Median 3Q Max
## -755.13 -143.29 37.25 167.78 372.18
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1.344e+03 1.273e+01 105.5 <2e-16 ***
## DAX 8.780e-01 4.625e-03 189.8 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 216.3 on 1858 degrees of freedom
## Multiple R-squared: 0.951, Adjusted R-squared: 0.9509
## F-statistic: 3.604e+04 on 1 and 1858 DF, p-value: < 2.2e-16
Intercept (β₀): hodnota FTSE, keď je DAX =
0
(čisto technický parameter, ekonomický význam nemá, lebo DAX nikdy nie
je 0)
Sklonová koeficient (β₁) pri DAX:
predstavuje, o koľko bodov sa zmení FTSE, ak sa DAX zvýši o 1
bod.
Ak je napr. β₁ = 0.92, interpretácia je:
Ak sa DAX zvýši o 1 bod, index FTSE sa priemerne zvýši o 0,92 bodu.
Zo summary sledujeme:
Hodnota R² vyjadruje, koľko % variability vo FTSE model vysvetľuje pomocou DAX.
Pri EuStockMarkets býva:
plot(
stocks$DAX,
stocks$FTSE,
pch = 19,
col = "darkgreen",
xlab = "DAX",
ylab = "FTSE",
main = "Regresná priamka: FTSE ~ DAX"
)
abline(model, col = "red", lwd = 2)
Regresná priamka veľmi dobre kopíruje usporiadanie bodov →
lineárny model je vhodný.
par(mfrow=c(2,2))
plot(model)
par(mfrow=c(1,1))
Model je teda po diagnostike v poriadku a použiteľný.
Na základe odhadu lineárneho modelu:
Záver:
Britský akciový index FTSE sa veľmi úzko vyvíja spolu s nemeckým indexom
DAX.
Lineárna regresia je vhodným a dobre fungujúcim modelom na opis tohto
vzťahu.