Prediktívna analýza trendov na finančnom trhu

Cieľ práce

Cieľom tejto bakalárskej práce je preskúmať využitie algoritmov strojového učenia pri predpovedaní trendov na finančnom trhu s cieľom umožniť informovanejšie investičné rozhodnutia a optimalizovať správu portfólia1.

Objekt skúmania

V našej práci budeme pracovať so sekundárnymi dátami, ktoré budeme čerpať z databázy Yahoo Finance2. Zameriame sa na historické údaje zatváracích cien akcií najväčších akciových firiem a trhových indexových fondov. Pomocou týchto dát si vypočítame logaritmické výnosy vybraných aktív, ktoré nám umožňujú dôkladnú analýzu trendov a vývoja na finančných trhoch.
Logaritmické výnosy vypočítame pomocou vzorca: \[LogReturns = ln\left(\frac{Close_t}{Close_{t-1}}\right)\]

Použité modely a metódy vyhodnocovania

Na základe charakteru objektu skúmania a cieľa práce sme zvolili viaceré prístupy z oblasti kvantitatívnych a strojovo-učiacich metód. Konkrétne sme použili:
1. lineárnu regresiu
2. model náhodného lesa
3. model neurónových sietí

Na vyhodnotenie presnosti predikčných modelov sme použili metriky:
*R2
*MAE
Koeficient determinácie (R2) vyjadruje, aká veľká časť variability závislej premennej je vysvetlená modelom, pričom vyššia hodnota naznačuje lepšiu predikčnú schopnosť. Stredná kvadratická chyba (MSE) meria priemernú veľkosť odchýlky medzi predikovanými a skutočnými hodnotami bez ohľadu na smer chyby. Kombinácia týchto dvoch metrík nám umožňuje komplexnejšie posúdiť kvalitu modelov.

Výsledky práce

Modely sme si porovnali na základe výsledkov R2 pre jednotlivé aktíva.

Lineárna regresia R2 (%) Náhodný les R2 (%) Neurónová sieť R2 (%)
Aktívum
AAPL 41,53 28,98 33,12
DIA 55,15 34,59 32,27
KO 55,87 44,45 43,04
META 21,3 30,51 35,68
NKE 42,72 32,73 39,03
PFE 42,73 24,63 40,58
PG 57,35 37,05 31,66
QQQ 48,31 32,7 37,35
SPY 55,15 35,26 37,56
XOM 44,04 32,14 27,96

Grafické porovnanie výsledkov práce sme si predstavili na nasledujúcom grafe:

Ako môžeme vidieť na Grafe, najvyššie hodnoty koeficientu determinácie dosahujú aktíva spoločností Apple (AAPL), Dow Jones (DIA), Coca-Cola (KO), Nike (NKE), Pfizer (PFE), The Procter & Gamble (PG), NASDAQ (QQQ), S&P 500 (SPY) a Exxon Mobil (XOM) pri modeli lineárnej regresie, čo naznačuje, že aj napriek jednoduchosti modelu bola táto metóda najúčinnejšia. Môžeme teda predpokladať, že medzi premennými boli lineárne alebo len málo nelineárne vzťahy. Jediné aktívum, ktoré dosiahlo vyššiu hodnou R2 pri modeli neurónovej siete ako pri lineárnej regresií boli akcie spoločnosti Meta (META), čo môže naznačovať, že v tomto prípade boli v dátach prítomné zložitejšie vzory, ktoré neurónová sieť dokázala lepšie zachytiť.

Záver

Záverom možno konštatovať, že práca úspešne naplnila stanovené ciele a prispela k hlbšiemu pochopeniu možností, ale aj obmedzení prediktívnej analýzy trendov na finančných trhoch pomocou algoritmov strojového učenia. Ukázalo sa, že aj jednoduché modely, ako je lineárna regresia, môžu dosahovať uspokojivé výsledky, pokiaľ sú vhodne nastavené a aplikované na správne štruktúrované údaje. Zároveň však bola zdôraznená potreba realistického prístupu pri interpretácií výsledkov a nutnosť neustáleho testovania, ladenia a overovania použiteľnosti zvolených metód v podmienkach vysoko dynamického a komplexného prostredia, akým finančný trh bezpochyby je3.

„Neexistuje žiadna technika, ktorá by dokázala s úplnou presnosťou predpovedať budúci vývoj na trhoch.“4


  1. Vedúci práce: Mgr. Peter Pšenák, PhD.↩︎

  2. https://finance.yahoo.com↩︎

  3. Ďakujem za prečítanie↩︎

  4. Bansal a kol. (2022)↩︎