Cieľom tejto bakalárskej práce je preskúmať využitie algoritmov strojového učenia pri predpovedaní trendov na finančnom trhu s cieľom umožniť informovanejšie investičné rozhodnutia a optimalizovať správu portfólia1.
V našej práci budeme pracovať so sekundárnymi dátami, ktoré budeme
čerpať z databázy Yahoo Finance2. Zameriame sa na historické údaje
zatváracích cien akcií najväčších akciových firiem a trhových indexových
fondov. Pomocou týchto dát si vypočítame logaritmické výnosy vybraných
aktív, ktoré nám umožňujú dôkladnú analýzu trendov a vývoja na
finančných trhoch.
Logaritmické výnosy vypočítame pomocou vzorca: \[LogReturns =
ln\left(\frac{Close_t}{Close_{t-1}}\right)\]
Na základe charakteru objektu skúmania a cieľa práce sme zvolili
viaceré prístupy z oblasti kvantitatívnych a strojovo-učiacich metód.
Konkrétne sme použili:
1. lineárnu regresiu
2. model náhodného lesa
3. model neurónových sietí
Na vyhodnotenie presnosti predikčných modelov sme použili
metriky:
*R2
*MAE
Koeficient determinácie (R2) vyjadruje, aká veľká časť
variability závislej premennej je vysvetlená modelom, pričom vyššia
hodnota naznačuje lepšiu predikčnú schopnosť. Stredná kvadratická chyba
(MSE) meria priemernú veľkosť odchýlky medzi predikovanými a skutočnými
hodnotami bez ohľadu na smer chyby. Kombinácia týchto dvoch metrík nám
umožňuje komplexnejšie posúdiť kvalitu modelov.
Modely sme si porovnali na základe výsledkov R2 pre jednotlivé aktíva.
Lineárna regresia R2 (%) | Náhodný les R2 (%) | Neurónová sieť R2 (%) | |
---|---|---|---|
Aktívum | |||
AAPL | 41,53 | 28,98 | 33,12 |
DIA | 55,15 | 34,59 | 32,27 |
KO | 55,87 | 44,45 | 43,04 |
META | 21,3 | 30,51 | 35,68 |
NKE | 42,72 | 32,73 | 39,03 |
PFE | 42,73 | 24,63 | 40,58 |
PG | 57,35 | 37,05 | 31,66 |
QQQ | 48,31 | 32,7 | 37,35 |
SPY | 55,15 | 35,26 | 37,56 |
XOM | 44,04 | 32,14 | 27,96 |
Grafické porovnanie výsledkov práce sme si predstavili na nasledujúcom grafe:
Ako môžeme vidieť na Grafe, najvyššie hodnoty koeficientu determinácie dosahujú aktíva spoločností Apple (AAPL), Dow Jones (DIA), Coca-Cola (KO), Nike (NKE), Pfizer (PFE), The Procter & Gamble (PG), NASDAQ (QQQ), S&P 500 (SPY) a Exxon Mobil (XOM) pri modeli lineárnej regresie, čo naznačuje, že aj napriek jednoduchosti modelu bola táto metóda najúčinnejšia. Môžeme teda predpokladať, že medzi premennými boli lineárne alebo len málo nelineárne vzťahy. Jediné aktívum, ktoré dosiahlo vyššiu hodnou R2 pri modeli neurónovej siete ako pri lineárnej regresií boli akcie spoločnosti Meta (META), čo môže naznačovať, že v tomto prípade boli v dátach prítomné zložitejšie vzory, ktoré neurónová sieť dokázala lepšie zachytiť.
Záverom možno konštatovať, že práca úspešne naplnila stanovené ciele a prispela k hlbšiemu pochopeniu možností, ale aj obmedzení prediktívnej analýzy trendov na finančných trhoch pomocou algoritmov strojového učenia. Ukázalo sa, že aj jednoduché modely, ako je lineárna regresia, môžu dosahovať uspokojivé výsledky, pokiaľ sú vhodne nastavené a aplikované na správne štruktúrované údaje. Zároveň však bola zdôraznená potreba realistického prístupu pri interpretácií výsledkov a nutnosť neustáleho testovania, ladenia a overovania použiteľnosti zvolených metód v podmienkach vysoko dynamického a komplexného prostredia, akým finančný trh bezpochyby je3.
„Neexistuje žiadna technika, ktorá by dokázala s úplnou presnosťou predpovedať budúci vývoj na trhoch.“4