Wstęp

Za początki strategii inwestycyjnej pair trading uznaje się wczesne lata 80., kiedy to grupa matematyków, fizyków i informatyków, pracujących w banku inwestycyjnym Morgan Stanley, miała za zadanie zaprojektować pod przewodnictwem Nunzio Tartaglii nowoczesną strategię arbitrażową, która byłaby oparta na całkowicie zautomatyzowanych algorytmach (Hoel 2013: s. 3).

Strategia pair trading opiera się na stosunkowo prostej idei sprzedaży akcji przewartościowanych i zakupie niedowartościowanych. W praktyce taka strategia jest jednak problematyczna w realizacji, w związku z trudnością w wyznaczeniu prawdziwej ceny akcji. Pair trading stara się zaadresować ten problem, opierając strategię inwestycyjną na relacji między cenami papierów wartościowych, zamiast ich wartości absolutnych: akcje relatywnie przewartościowane są sprzedawane, natomiast relatywnie niedowartościowane – kupowane (Andrade et. al. 2005: s.2; Vidyamurthy 2004: s. 73-74).

Hoel (2013: s. 1-2) zaznacza, że strategia pair trading należy do grupy strategii statystycznego arbitrażu, który oznacza szansę zysku w związku z nieprawidłową względną statystyczną wyceną papierów wartościowych. W przeciwieństwie do zwykłego arbitrażu, który jest pozbawiony ryzyka, arbitraż statystyczny niesie za sobą niebezpieczeństwo straty.

Pierwsze sukcesy w stosowaniu omawianej strategii Tartaglia odniósł już w 1987 roku, jednak po kilku latach członkowie jego grupy, którzy byli odpowiedzialni za jej zaprojektowanie, odeszli z Morgan Stanley do innych instytucji zajmujących się inwestycjami na rynku giełdowym. Od tego czasu pair trading jest stosowany nie tylko przez fundusze hedge, ale także przez inwestorów instytucjonalnych. Mimo tego, strategia ta jest w stosunkowo niewielkim stopniu przedmiotem zainteresowań środowiska akademickiego. (Hoel 2013: s. 3; Vidyamurthy 2004: s. 74).

Celem niniejszego opracowania jest przetestowanie strategii typu pair trading, która jest oparta na kointegracji cen dwóch spółek, notowanych na Giełdzie Papierów Wartościowych w Warszawie. Praca ma następującą strukturę: w następnej sekcji omówiono wariant zastosowanej strategii oraz metodologię. W kolejnej części przeprowadzono wstępną analizę kointegracji na podstawie wszystkich spółek notowanych na GPW w okresie in-sample. Posłużyła ona wyłonieniu pięciu par spółek, których ceny są ze sobą skointegrowane w tym okresie; na ich podstawie oparto omówioną wyżej strategię. Wyniki estymacji oraz zyskowność strategii omawia następny rozdział. Ostatnim elementem jest analiza rentowności portfela złożonego ze wszystkich rozpatrywanych par.

1. Opis strategii, metodologia, dane

Założenia strategii opierają się na wytycznych do projektu z Zaawansowanej analizy szeregów czasowych, (zob. projekt):

Dodatkowo założono, wzorem literatury, że jeżeli pozycja pozostaje otwarta do końca rozpatrywanego okresu, a nie ma sygnału do jej zamknięcia, to jest ona automatycznie zamykana według cen zamknięcia ostatniego dnia notowań dla danego okresu; dotyczy to zarówno próby in-sample, jak i out-of-sample (por. Kishore 2012: s. 7).

Analiza została oparta na podstawie danych dostępnych na stronie Stooq. Pod uwagę zostały wzięte tylko te spółki, które zadebiutowały na GPW przed końcem okresu in-sample, czyli 454 z obecnie notowanych 480 spółek. Do wyliczenia dodatkowych statystyk (współczynniki \(\beta\) i Sharpe’a) skorzystano z notowań indeksu WIG20 oraz WIBOR3M (te ostatnie wymagały konwersji na dzienne stopy).

Istnieje szereg metodologii związanych z implementacją strategii pair trading. Literatura (zob. Hoel 2013: s. 6) wyróżnia podejście oparte na odległości między cenami akcji (distance approach), podejście stochastyczne (stochastic approach), oraz podejście będące przedmiotem niniejszego opracowania, które opiera się na koncepcji kointegracji między szeregami czasowymi rozpatrywanych papierów wartościowych. W takim przypadku analiza opiera się na regresji, która niekiedy nazywana jest równaniem równowagi długookresowej (Enders 2015: s. 361; Hoel 2013: s. 8): \[ y_{t} = \beta_{0} + \beta_{1} x_{t} + \varepsilon_{t}, \] a jej celem jest zbadanie własności reszt z takiego modelu, tj. czy są one stacjonarne. Ze względu na to, że zamysłem pracy jest wykorzystanie tak uzyskanych reszt do stworzenia strategii inwestycyjnej, a nie estymacja modelu korekty błędem, do sprawdzenia, czy rozpatrywane szeregi są ze sobą skointegrowane, posłużono się nieco uproszczoną metodologią Engle-Grangera (pominięto aspekty związane z estymacją modelu ECM), która składała się w tym wypadku z dwóch kroków (z czterech pierwotnych; por. Enders 2015: s. 360-363):

  1. Przetestowano stopień integracji obu rozpatrywanych szeregów za pomocą testu Dickeya-Fullera (i jego rozszerzonej wersji). Celem było znalezienie takich spółek notowanych na GPW, których ceny zamknięcia w okresie in-sample były zintegrowane w stopniu pierwszym, czyli były zmiennymi \(\sim I(1)\).
  2. Jeżeli wyniki testu na integrację wskazywały na to, że zarówno {\(y_{t}\)}, jak i {\(x_{t}\)} są \(\sim I(1)\), wówczas szacowano wcześniej przytoczone równanie regresji za pomocą MNK. Reszty z tego równania również poddano analizie integracji, w celu sprawdzenia, czy są one stacjonarne. Odrzucenie hipotezy zerowej testu Dickeya-Fullera o niestacjonarności {\(\hat{\varepsilon}_{t}\)} implikuje, że oba szeregi są skointegrowane w stopniu (1,1). Warto zwrócić uwagę na to, że analiza stacjonarności reszt w takim przypadku opiera się na specjalnych wartościach krytycznych testu, które uwzględniają liczbę zmiennych po prawej stronie równania równowagi długookresowej (wliczając w to stałą).

Zgodnie z założeniami strategii, na podstawie cen zamknięcia zdefiniowano sygnały otwarcia i zamknięcia pozycji. Przekształcając nieco pierwotne równanie regresji użyte podczas analizy kointegracji i zmieniając notację (\(P_{i,t}\) - cena akcji spółki \(i\) w okresie \(t\)), można otrzymać: \[ P_{A,t} - \beta_{0} - \beta_{1} P_{B,t} = \varepsilon_{t}. \]

Ponownie odwołując się do wcześniej przedstawionych założeń strategii, jeżeli \(\hat{\varepsilon}_{t} \geq 1.01\sigma_{\hat{\varepsilon}}\), to pozycja zostaje otwarta - cena akcji spółki \(A\) jest relatywnie przeszacowana (pozycja krótka), a cena akcji spółki \(B\) względnie niedoszacowana (pozycja długa). Przeciwne pozycje są przyjmowane w sytuacji, gdy \(\hat{\varepsilon}_{t} \leq -1.01\sigma_{\hat{\varepsilon}}\) (por. Hoel 2013: s. 8, 14).

Modelowanie w okresie out-of-sample ma nieco inny charakter: zamiast ponownej analizy kointegracji dla danych z tego okresu próby i estymacji modelu, reszty wyznaczane są na podstawie wektora kointegrującego z okresu in-sample i cen out-of-sample, natomiast sam próg otwierania pozycji również pochodzi z próby in-sample (por. Dunis et. al. 2010; s. 15).

W celu analizy zyskowności strategii posłużono się kilkoma statystykami:

2. Wstępna analiza kointegracji

Ze względu na dużą liczbę spółek notowanych na GPW, wydaje się, że optymalnym rozwiązaniem jest automatyzacja procedury pobierania wszystkich notowań ze strony Stooq oraz znalezienia skointegrowanych par. Zautomatyzowany proces poszukiwania takich par spółek, których notowania są ze sobą skointegrowane w okresie in-sample oparto na wcześniej przytoczonej procedurze Engle-Granger’a. Hipotezy dotyczące stopnia zintegrowania szeregów, stacjonarności reszt i w konsekwencji występowania zjawiska kointegracji weryfikowano na 5% poziomie istotności. W tym celu użyto odpowiednich wartości krytycznych dla testu Dickeya-Fullera (zob. Mycielski 2010: s. 363).

Procedura znalezienia skointegrowanych par spółek zajęła R’owi:

## Time difference of 5.192965 mins

a podczas samej pętli przeanalizowano:

## 5518

par (liczba ta uwzględnia zdublowane pary). Ostatecznie, na przyjętym poziomie istotności, uzyskano:

## 133

pary spółek, których ceny są ze sobą skointegrowane w okresie in-sample. Ze względu na ich dużą liczbę, te spółki, które zostaną poddane dalszej analizie, wylosowano:

para 1. spółka 2. spółka
1 Tauron PE JW Construction
2 Grupa Azoty PZU
3 ING Bank Śląski MONNARI Trade
4 PEKAO AMICA Wronki
5 SOHO Development Mobile Internet Technology

Tabela 2.1. Wylosowane pary spółek.
Źródło: Opracowanie własne na podstawie danych stooq.com.

3. Analiza strategii pair trading na przykładzie wybranych par spółek

3.1. Tauron PE SA (TPE) i JW Construction SA (JWC)

Do pierwszej z rozpatrywanych par należą: Tauron Polska Energia SA, który jest drugim co do wielkości wytwórcą i dystrybutorem energii elektrycznej w Polsce, oraz JW Construction SA - holding skupiony głównie na działalności deweloperskiej; inwestuje w kraju oraz za granicą (zob. TPE, JWC).

3.1.1. Opis danych

Rysunek 3.1.1. Szeregi czasowe cen zamknięcia oraz histogramy stóp zwrotu.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Ceny zamknięcia obu spółek w okresie in-sample (pionowa, przerywana linia oddziela obie próby) wydaje się wiązać relacja kointegrująca, chociaż gdzieś od połowy 2012 roku widoczne są odchylenia od tego związku. Z kolei w przedziale czasu przypadającym na out-of-sample szeregi ewidentnie charakteryzują trendy zmierzające w innym kierunku.

Histogramy stóp zwrotu w obu przypadkach wydają się odbiegać od gęstości rozkładu normalnego - wyraźna jest koncentracja obserwacji wokół średniej; potwierdza to także dodatnia nadwyżkowa kurtoza. Oba rysunki charakteryzuje również wydłużone lewe ramię - rozkłady są lewostronnie asymetryczne (ujemne współczynniki skośności). Test Jarque-Bera odrzuca hipotezę zerową o normalności rozkładu stóp zwrotu dla spółki Tauron [280.83, 0], jak i JW Construction [456.22, 0] (przyjęto 5% poziom istotności, w nawiasach podano statystykę testową oraz p-value).

Średnia dzienna stopa zwrotu jest kilkukrotnie wyższa dla spółki Tauron, ale w obu przypadkach jest ona ujemna. Dyspersja jest natomiast większa dla stóp JW Construction, co widać po odchyleniu standardowym oraz wielkościach maksimum i minimum.

Ceny zamknięcia TPE Ceny zamknięcia JWC Stopy zwrotu TPE Stopy zwrotu JWC
Liczba obserwacji 1119.0000 1119.0000 1119.0000 1119.0000
Braki danych 0.0000 0.0000 1.0000 1.0000
Minimum 3.4227 2.3400 -0.0972 -0.1681
Pierwszy kwartyl 4.1093 3.3906 -0.0096 -0.0152
Mediana 4.4314 4.0731 0.0000 0.0000
Trzeci kwartyl 4.8687 5.9770 0.0095 0.0129
Maksimum 5.5144 14.9660 0.0789 0.1444
Średnia 4.4752 5.5802 -0.0001 -0.0009
Odchylenie standardowe 0.4750 3.5024 0.0164 0.0296
Skośność 0.1023 1.6409 -0.2471 -0.0933
Kurtoza -0.8633 1.3571 2.3953 3.1130

Tabela 3.1.1. Podstawowe statystyki opisowe (dla całej próby).
Źródło: Opracowanie własne na podstawie danych stooq.com.

3.1.2. Analiza kointegracji
3.1.2.1. Stopień zintegrowania zmiennych

Rysunek 3.1.2. Ceny zamknięcia (a) oraz ich pierwsze różnice (b) dla spółki Tauron PE w okresie in-sample.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Ceny zamknięcia dla spółki Tauron wydają się być procesem niestacjonarnym: szereg oscyluje najpierw wokół jednego poziomu, a potem następuje spadek (około ósmego miesiąca 2011) i wahania na nieco niższym poziomie cen; szczególnie w tym drugim okresie, po spadku, notowania przypominają błądzenie przypadkowe. Amplituda wahań również zdaje się być zmienna; kowariancja jest oczywiście nieobserwowalna na wykresie.

Pierwsze różnice cen zamknięcia przebiegają wokół stałego poziomu, natomiast trudno jednoznacznie ocenić wahania szeregu; wydają się być relatywnie stałe. Szereg poddany jednokrotnemu różnicowaniu zdaje się przypominać proces stacjonarny.

opoznienie adfTestowa adfKrytyczna bgTestowa bgPValue
0 -2.4580 -2.86 0.5868 0.4437
1 -2.5374 -2.86 0.0009 0.9764
2 -2.4337 -2.86 0.0014 0.9699
3 -2.4527 -2.86 0.0002 0.9884
4 -2.3057 -2.86 0.0003 0.9865
5 -2.3425 -2.86 0.0002 0.9888

Tabela 3.1.2. Wyniki testu ADF dla cen zamknięcia Tauron PE.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Wyniki testu Breuscha-Godfreya na autokorelację wskazują na to, że wystarczy zwykły test DF w przypadku cen zamknięcia na 5% poziomie istotności (p-value: 0.4437, brak podstaw do odrzucenia \(H_{0}\) o braku autokorelacji pierwszego rzędu). Z kolei test DF sygnalizuje, że szereg jest co najmniej \(\sim I(1)\): statystyka testowa (-2.458) jest większa od krytycznej (-2.86), w związku z czym brak jest podstaw do odrzucenia hipotezy zerowej o niestacjonarności szeregu.

opoznienie adfTestowa adfKrytyczna bgTestowa bgPValue
0 -26.5977 -2.86 0.0008 0.9778
1 -19.1210 -2.86 0.0010 0.9754
2 -16.0595 -2.86 0.0007 0.9796
3 -14.7087 -2.86 0.0001 0.9931
4 -12.9655 -2.86 0.0002 0.9901
5 -11.8019 -2.86 0.0011 0.9741

Tabela 3.1.3. Wyniki testu ADF dla pierwszych różnic cen zamknięcia Tauron PE.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Podobnie jak w przypadku poprzedniej analizy integracji, wystarczy zwykły test DF (Breusch-Godfrey, p-value: 0.9778). Wyniki testu DF wskazują na to, że pierwotny szereg wymaga jednokrotnego różnicowania w celu doprowadzenia do stacjonarności na przyjętym poziomie istotności: statystyka testowa (-26.5977) jest mniejsza od krytycznej, więc hipoteza zerowa o niestacjonarności pierwszych różnic zostaje odrzucona.

Rysunek 3.1.3. Ceny zamknięcia (a) oraz ich pierwsze różnice (b) dla spółki JW Construction w okresie in-sample.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Przebieg cen zamknięcia dla spółki JW Construction ma bardzo podobny charakter jak w poprzednim analizowanym przypadku; widoczne jest zniesienie, które miało miejsce mniej więcej w trzecim kwartale 2011. Analiza graficzna wydaje się wskazywać na to, że jest to szereg niestacjonarny (brak stałego poziomu, zmienna amplituda wahań).

Notowania poddane jednokrotnemu różnicowaniu zdają się być stacjonarne: poza okresem spadku w 2011, wariancja jest stosunkowo stabilna, a sam szereg oscyluje wokół stałego poziomu.

opoznienie adfTestowa adfKrytyczna bgTestowa bgPValue
0 -2.2897 -2.86 49.2883 0.0000
1 -2.0241 -2.86 0.4812 0.4879
2 -2.1191 -2.86 0.0319 0.8581
3 -2.2108 -2.86 0.0006 0.9798
4 -2.1773 -2.86 0.0002 0.9880
5 -2.1518 -2.86 0.0005 0.9828

Tabela 3.1.4. Wyniki testu ADF dla cen zamknięcia JW Construction.
Źródło: Opracowanie własne na podstawie danych stooq.com.

W przeciwieństwie do poprzednich przykładów, w tym wypadku trzeba skorzystać z testu ADF i jednego opóźnienia w celu eliminacji problemu autokorelacji (Breusch-Godfrey, p-value: 0.0000 < 0.05, hipoteza zerowa zostaje odrzucona). Test ADF, jedno opóźnienie: Breusch-Godfrey, brak podstaw do odrzucenia hipotezy zerowej (p-value: 0.4879); statystyka testowa ADF (-2.0241) jest większa od krytycznej, więc na przyjętym poziomie istotności szereg jest niestacjonarny.

opoznienie adfTestowa adfKrytyczna bgTestowa bgPValue
0 -20.9594 -2.86 0.4715 0.4923
1 -18.1509 -2.86 0.0267 0.8701
2 -15.9674 -2.86 0.0004 0.9842
3 -14.0872 -2.86 0.0001 0.9914
4 -12.1951 -2.86 0.0003 0.9860
5 -10.6689 -2.86 0.0310 0.8603

Tabela 3.1.5. Wyniki testu ADF dla pierwszych różnic cen zamknięcia JW Construction.
Źródło: Opracowanie własne na podstawie danych stooq.com.

W tym wypadku brak jest potrzeby odwoływania się do rozszerzonego testu DF, wystarczy jego zwykła wersja (Breusch-Godfrey, p-value: 0.4923 > 0.05). Statystyka testowa Dickeya-Fullera wynosi -20.9594 i jest mniejsza od krytycznej, więc hipoteza zerowa o niestacjonarności pierwszych różnic zostaje odrzucona.

Na przyjętym poziomie istotności, oba z analizowanych szeregów są zintegrowane w stopniu pierwszym.

3.1.2.2. Kointegracja
## 
## Call:
## lm(formula = na.omit(szeregPierwszy) ~ na.omit(szeregDrugi))
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.69649 -0.14954 -0.00466  0.16752  0.74713 
## 
## Coefficients:
##           Estimate Std. Error t value            Pr(>|t|)    
## Intercept 3.561996   0.017491  203.65 <0.0000000000000002 ***
## JWC       0.117649   0.002261   52.05 <0.0000000000000002 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.2307 on 745 degrees of freedom
## Multiple R-squared:  0.7843, Adjusted R-squared:  0.784 
## F-statistic:  2709 on 1 and 745 DF,  p-value: < 0.00000000000000022

Tabela 3.1.6. Estymacja wektora kointegrującego.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Po wykazaniu, że zarówno {\(TPE_{t}\)}, jak i {\(JWC_{t}\)} są \(\sim I(1)\), oszacowano wektor kointegrujący, który ma postać: [1, -3.56, -0.12]. Ze względu na dosyć restrykcyjne założenia, przy których statystyki testowe mają swoje standardowe asymptotyczne rozkłady dla takiej regresji, pominięto analizę istotności uzyskanych parametrów (zob. Enders 2015: s. 364). Co więcej, na tym etapie trzeba sprawdzić, czy kointegracja rzeczywiście występuje.

Rysunek 3.1.4. Reszty z równania regresji równowagi długookresowej.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Trudno jednoznacznie stwierdzić na podstawie rysunku, czy reszty są procesem stacjonarnym. Przypominają one stacjonarny proces autoregresyjny z parametrem \(\alpha\) bliskim jeden, ale wydaje się, że mogą również kojarzyć się z błądzeniem przypadkowym.

opoznienie adfTestowa adfKrytyczna bgTestowa bgPValue
0 -4.0943 -3.33 0.1106 0.7395
1 -4.0049 -3.33 0.0043 0.9474
2 -4.0510 -3.33 0.0001 0.9918
3 -4.0591 -3.33 0.0008 0.9774
4 -3.8198 -3.33 0.0017 0.9668
5 -3.8504 -3.33 0.0006 0.9800

Tabela 3.1.7. Wyniki testu ADF dla reszt z równania regresji równowagi długookresowej.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Wyniki testu Dickeya-Fullera wskazują na to, że reszty są stacjonarne. Brak jest potrzeby korzystania z jego rozszerzonej wersji (Breusch-Godfrey, p-value: 0.7395 > 0.05, brak podstaw do odrzucenia hipotezy zerowej); statystyka testowa DF (-4.0943) jest mniejsza od krytycznej (-3.33), więc hipoteza zerowa o niestacjonarności zostaje odrzucona. Na przyjętym poziomie istotności, reszty z analizowanej regresji są stacjonarne, w związku z czym mamy do czynienia ze zjawiskiem kointegracji w przypadku rozpatrywanej pary spółek.

3.1.3. Pair Trading
3.1.3.1. Okres in-sample

Rysunek 3.1.5. Sygnały otwarcia i zamknięcia oraz przyjmowane pozycje w okresie in-sample.
Źródło: Opracowanie własne na podstawie danych stooq.com.

W okresie in-sample pozycje są otwierane łącznie 15 razy, a sam czas otwarcia pozycji stanowi 61% analizowanego okresu. 29.7% czasu stanowi krótka pozycja w akcjach spółki Tauron PE i długa w JW Construction, natomiast 31.3% - pozycje przeciwne. Wynika z tego, że dłużej trwają okresy (łącznie), kiedy notowania JW Construction są relatywnie przewartościowane w momencie otwierania pozycji.

3.1.3.2. Okres out-of-sample

Rysunek 3.1.6. Sygnały otwarcia i zamknięcia oraz przyjmowane pozycje w okresie out-of-sample.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Z kolei dla próby out-of-sample mamy do czynienia tylko z 2 sygnałami otwarcia pozycji, ale drugi z nich trwa aż do końca rozpatrywanego okresu. Okres otwarcia pozycji wynosi 94.4% czasu analizowanego okresu, z czego 92.5% przypada na krótką pozycję w spółce Tauron PE i długą w JWC, a 1.9% na pozycje przeciwne. Tym razem spółka Tauron PE jest relatywnie przewartościowana w momencie otwarcia pozycji dokonanego na podstawie drugiego sygnału, dla którego okres czasu jest najdłuższy.

3.1.3.3. Zyskowność strategii

Rysunek 3.1.7. Equity line dla strategii pair trading w okresie in-sample (a) i out-of-sample (b).
Źródło: Opracowanie własne na podstawie danych stooq.com.

W okresie in-sample, equity line dla strategii opartej na inwestycji w skointegrowane pary charakteryzuje się w miarę zadowalającym kształtem: w okolicach połowy trzeciego kwartału 2011 i połowy 2013 roku widoczne są spadki w wartości takiego portfela, ale poza tym wykres charakteryzuje się tendencją wzrostową. Strategia ta przynosi zysk na sam koniec okresu, w przeciwieństwie do benchmark’u (WIG20, kup i trzymaj).

Wykres dla próby out-of-sample wydaje się świadczyć o gorszych wynikach strategii pair trading. Tendencja rozwojowa zdecydowanie nie ma jednostajnego i wzrostowego charakteru, chociaż od 2015 roku trend zdaje się odwrócić w kierunku akumulacji wartości portfela. Ponownie strategia daje lepsze rezultaty pod koniec okresu niż benchmark.

in-sample out-of-sample
Zannualizowana stopa zwrotu (arytmetyczna) 0.1813 0.1115
Zannualizowana stopa zwrotu (geometryczna) 0.1704 0.0883
Zannualizowane odchylenie standardowe 0.2189 0.2325
Współczynnik Sharpe’a 0.0402 0.0241
Współczynnik Beta (wzg. kup i trzymaj WIG20) -0.0234 0.0437
Maksymalne obsunięcie kapitału 0.2387 0.2758

Tabela 3.1.8. Zyskowność strategii pair trading w okresie in-sample i out-of-sample.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Wyniki strategii w okresie in-sample wydaję się być nieco lepsze. Rocznie generuje ona zysk w wysokości 17%, wobec 8.8% w out-of-sample; nieznacznie niższe odchylenie standardowe dla in-sample świadczy również o nieco mniejszym ryzyku. Co więcej, dla tego okresu większa jest również premia za ryzyko na jednostkę ryzyka całkowitego, mierzona współczynnikiem Sharpe’a. Ujemna \(\beta\) dla in-sample, świadczy o tym, że stopa zwrotu zmienia się w przeciwnym kierunku do benchmarku, natomiast w drugim okresie, niewielka, dodatnia wartość tego współczynnika mówi o tym, że jest to strategia defensywna (niewielka reakcja na benchmark). Ryzyko mierzone maksymalnym obsunięciem kapitału jest nieco wyższe dla okresu out-of-sample.

3.2. Grupa Azoty SA (ATT) i PZU SA (PZU)

Na kolejną z analizowanych par składają się: Grupa Azoty SA, której podstawę działalności stanowi produkcja i handel tworzywami konstrukcyjnymi, surowcami służącymi do ich produkcji oraz nawozami mineralnymi, natomiast drugą spółką jest PZU SA - najstarszy zakład ubezpieczeń w Polsce, oferujący usługi w zakresie ubezpieczeń majątkowych i osobowych. (zob. ATT, PZU).

3.2.1. Opis danych

Rysunek 3.2.1. Szeregi czasowe cen zamknięcia oraz histogramy stóp zwrotu.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Oba szeregi wydają się charakteryzować bardzo podobnym przebiegiem w okresie in-sample. Prawdopodobnie występuje między nimi relacja kointegrująca. Co więcej, relacja ta zdaje się również utrzymywać w okresie out-of-sample, chociaż można mieć do co tego pewne obiekcje.

Histogram stóp zwrotu dla Grupy Azoty SA wydaje się w niewielkim stopniu przypominać gęstość rozkładu normalnego: widoczna jest duża koncentracja danych wokół średniej oraz grube ogony; zjawisko leptokurtyczności rozkładu potwierdza również wartość współczynnika kurtozy (2.73). Wyniki testu Jarque-Berra jednoznacznie odrzucają hipotezę zerową o normalności rozkładu [372.6, 0].

W przypadku stóp zwrotu dla PZU widać pewne podobieństwa do gęstości rozkładu normalnego; charakteryzuje się on względną symetrią (wsp. skośności jest stosunkowo bliski zeru), ale rozkład jest leptokurtyczny (1.64), a test Jarque-Bera również odrzuca hipotezę zerową o normalności rozkładu na 5% poziomie istotności [127.41, 0].

Ceny zamknięcia ATT Ceny zamknięcia PZU Stopy zwrotu ATT Stopy zwrotu PZU
Liczba obserwacji 1119.0000 1119.0000 1119.0000 1119.0000
Braki danych 0.0000 0.0000 1.0000 1.0000
Minimum 23.0580 228.9400 -0.1215 -0.0660
Pierwszy kwartyl 33.0705 263.1750 -0.0126 -0.0072
Mediana 54.5530 345.7300 0.0000 0.0000
Trzeci kwartyl 71.0000 418.5750 0.0139 0.0082
Maksimum 87.8000 511.0000 0.1246 0.0641
Średnia 53.2493 350.2167 0.0012 0.0005
Odchylenie standardowe 18.7400 84.7645 0.0251 0.0140
Skośność 0.0227 0.2126 0.3489 0.0449
Kurtoza -1.4124 -1.3250 2.7302 1.6431

Tabela 3.2.1. Podstawowe statystyki opisowe (dla całej próby).
Źródło: Opracowanie własne na podstawie danych stooq.com.

3.2.2. Analiza kointegracji
3.2.2.1. Stopień zintegrowania zmiennych

Rysunek 3.2.2. Ceny zamknięcia (a) oraz ich pierwsze różnice (b) dla Grupy Azoty SA w okresie in-sample.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Ceny zamknięcia (pierwotne dane) na powyższym wykresie przypominają błądzenie przypadkowe z dryfem; systematyczne znoszenie zaczyna się gdzieś w okolicach 2012 roku. Pierwsze różnice tego szeregu oscylują z kolei wokół stałego poziomu; wariancja wydaje się względnie stała, ale poza 2013 rokiem: w okolicach początku drugiego kwartału widoczny jest duży wzrost zmienności.

opoznienie adfTestowa adfKrytyczna bgTestowa bgPValue
0 -1.0211 -2.86 5.4238 0.0199
1 -1.0957 -2.86 0.0287 0.8655
2 -1.0355 -2.86 0.1085 0.7419
3 -0.8792 -2.86 0.0227 0.8801
4 -0.8804 -2.86 0.0009 0.9765
5 -0.9167 -2.86 0.0004 0.9832

Tabela 3.2.2. Wyniki testu ADF dla cen zamknięcia Grupy Azoty.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Określenie stacjonarności pierwotnego szeregu wymaga skorzystania z testu DF rozszerzonego o jedno opóźnienie (Breusch-Godfrey, p-value: 0.0199 < 0.05; z kolei test dla jednego opóźnienia: 0.8655 > 0.05). Zgodnie z testem ADF, na 5% poziomie istotności mamy do czynienia z szeregiem niestacjonarnym. Statystyka testowa (-1.0957) jest większa od krytycznej (-2.86), w związku z czym brak jest podstaw do odrzucenia hipotezy zerowej o niestacjonarności cen zamknięcia Grupy Azoty.

opoznienie adfTestowa adfKrytyczna bgTestowa bgPValue
0 -25.0626 -2.86 0.0289 0.8650
1 -19.7708 -2.86 0.1143 0.7353
2 -19.0532 -2.86 0.0241 0.8766
3 -16.0928 -2.86 0.0009 0.9757
4 -13.3097 -2.86 0.0005 0.9829
5 -12.1765 -2.86 0.0031 0.9554

Tabela 3.2.3. Wyniki testu ADF dla pierwszych różnic cen zamknięcia Grupy Azoty.
Źródło: Opracowanie własne na podstawie danych stooq.com.

W przeciwieństwie do poprzedniego testu, w tym wypadku wystarcza zwykły test DF (Breusch-Godfrey, p-value: 0.865 > 0.05; brak podstaw do odrzucenia hipotezy zerowej o braku autokorelacji pierwszego rzędu.). Wartość statystyki testowej DF jest na tyle mała (-25.0626), że nie pozostawia ona wątpliwości co do odrzucenia hipotezy zerowej o niestacjonarności szeregu przy 5% poziomie istotności.

Ceny zamknięcia Grupy Azoty są zintegrowane w stopniu pierwszym (w okresie in-sample).

Rysunek 3.2.3. Ceny zamknięcia (a) oraz ich pierwsze różnice (b) dla spółki PZU w okresie in-sample.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Wykres cen zamknięcia dla PZU ma podobny przebieg jak w poprzednim rozpatrywanym przypadku, chociaż charakterystyczny dryf pojawia się nieco później, w okolicach połowy 2012 roku. Szereg przypomina realizację procesu niestacjonarnego.

Podobieństwa widoczne są również w przypadku pierwszych różnic. Oscylują one wokół stałego poziomu, chociaż wzrost amplitudy wahań objawia się w tym wypadku w późniejszym okresie, bo dopiero gdzieś od połowy 2013 roku. Widoczny jest także wzrost zmienności w okolicach połowy trzeciego kwartału 2011. Mimo to, szereg poddany jednokrotnemu różnicowaniu wydaje się być stacjonarny.

opoznienie adfTestowa adfKrytyczna bgTestowa bgPValue
0 -0.2615 -2.86 0.0105 0.9185
1 -0.3106 -2.86 0.0000 0.9968
2 -0.1375 -2.86 0.0237 0.8778
3 -0.0167 -2.86 0.0175 0.8948
4 0.0725 -2.86 0.0083 0.9275
5 0.1933 -2.86 0.0000 0.9983

Tabela 3.2.4. Wyniki testu ADF dla cen zamknięcia PZU.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Brak jest podstaw do odrzucenia hipotezy zerowej o braku autokorelacji pierwszego rzędu dla reszt z równania testu DF, w którym nie uwzględniono opóźnień (Breusch-Godfrey, p-value: 0.9185 > 0.05). Statystyka testowa DF (-0.2615) jest większa od krytycznej, więc brak jest podstaw do odrzucenia hipotezy zerowej o niestacjonarności analizowanego szeregu.

opoznienie adfTestowa adfKrytyczna bgTestowa bgPValue
0 -27.2052 -2.86 0.0000 0.9956
1 -21.0517 -2.86 0.0241 0.8766
2 -17.7047 -2.86 0.0175 0.8947
3 -15.9876 -2.86 0.0082 0.9280
4 -14.5452 -2.86 0.0000 0.9977
5 -12.8870 -2.86 0.0000 0.9968

Tabela 3.2.5. Wyniki testu ADF dla pierwszych różnic cen zamknięcia PZU.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Również w przypadku pierwszych różnic cen zamknięcia PZU wystarcza zwykły test DF (Breusch-Godfrey, p-value: 0.9956 > 0.05). Statystyka testowa DF (-27.2052) jest znacznie mniejsza od krytycznej, w związku z czym hipoteza o niestacjonarności rozpatrywanego szeregu zostaje odrzucona.

Podobnie jak w przypadku Grupy Azoty, notowania PZU w okresie in-sample są zintegrowane w stopniu pierwszym.

3.2.2.2. Kointegracja
## 
## Call:
## lm(formula = na.omit(szeregPierwszy) ~ na.omit(szeregDrugi))
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -20.354  -3.706  -0.497   3.404  22.404 
## 
## Coefficients:
##             Estimate Std. Error t value            Pr(>|t|)    
## Intercept -40.211034   1.196936  -33.59 <0.0000000000000002 ***
## PZU         0.283188   0.003887   72.86 <0.0000000000000002 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 6.044 on 745 degrees of freedom
## Multiple R-squared:  0.8769, Adjusted R-squared:  0.8768 
## F-statistic:  5309 on 1 and 745 DF,  p-value: < 0.00000000000000022

Tabela 3.2.6. Estymacja wektora kointegrującego.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Oba z rozpatrywanych szeregów są zintegrowane w tym samym stopniu, który wynosi 1. Stanowi to podstawę do zbadania zjawiska kointegracji, w związku z czym oszacowano równanie równowagi długookresowej. Wektor kointegrujący przyjmuje wartości: [1, 40.21, -0.28]. Kolejnym krokiem analizy kointegracji jest sprawdzenie, czy {\(ATT_{t}\)} i {\(PZU_{t}\)} są \(\sim CI(1,1)\).

Rysunek 3.2.4. Reszty z równania regresji równowagi długookresowej.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Podobnie jak w przypadku poprzedniej rozpatrywanej pary, trudno stwierdzić na podstawie analizy przebiegu reszt, czy są one stacjonarne; wydają się przypominać co najwyżej proces autoregresyjny z parametrem \(\alpha\) bliskim jeden.

opoznienie adfTestowa adfKrytyczna bgTestowa bgPValue
0 -3.5231 -3.33 0.4481 0.5032
1 -3.5423 -3.33 0.0102 0.9196
2 -2.9393 -3.33 0.1102 0.7399
3 -2.5051 -3.33 0.0015 0.9694
4 -2.4129 -3.33 0.0000 0.9947
5 -2.3809 -3.33 0.0001 0.9912

Tabela 3.2.7. Wyniki testu ADF dla reszt z równania regresji równowagi długookresowej.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Wyniki testu Breuscha-Godfreya (p-value: 0.5032) jednoznacznie wskazują na to, że przy 5% poziomie istotności, wystarczający jest test Dickeya-Fullera bez opóźnień, stosowanych w celu eliminacji problemu autokorelacji. Jego statystyka testowa (-3.5231) jest tylko nieznacznie mniejsza od krytycznej, ale nadal stanowi to podstawę do odrzucenia hipotezy zerowej o niestacjonarności reszt z równania regresji równowagi długookresowej.

Na przyjętym poziomie istotności, rozpatrywane szeregi są \(\sim CI(1,1)\).

3.2.3. Pair Trading
3.2.3.1. Okres in-sample

Rysunek 3.2.5. Sygnały otwarcia i zamknięcia oraz przyjmowane pozycje w okresie in-sample.
Źródło: Opracowanie własne na podstawie danych stooq.com.

W okresie in-sample pozycje są otwierane 10 razy i stanowią 52.2% rozpatrywanego okresu. Krótka pozycja w akcjach Grupy Azoty stanowi 28% okresu in-sample, a w przypadku PZU jest to 24.2%. Liczba sygnałów (5), dla których akcje PZU są relatywnie przewartościowane, jest równa liczbie analogicznych sygnałów dla Grupy Azoty (5).

3.2.3.2. Okres out-of-sample

Rysunek 3.2.6. Sygnały otwarcia i zamknięcia oraz przyjmowane pozycje w okresie out-of-sample.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Dla próby out-of-sample pozycje są otwierane tylko 3-krotnie i zawsze jest to pozycja krótka w spółce PZU oraz długa w akcjach Grupy Azoty. Pozycje są otwarte w okresie out-of-sample przez 87.4% rozpatrywanego okresu.

3.2.3.3. Zyskowność strategii

Rysunek 3.2.7. Equity line dla strategii pair trading w okresie in-sample (a) i out-of-sample (a).
Źródło: Opracowanie własne na podstawie danych stooq.com.

Oba wykresy wartości portfela mają nie do końca pożądany kształt. O ile pod koniec obu okresów linia equity znajduje się w prawym, górnym rogu, to nie jest to wzrost jednostajny - szczególnie w okresie out-of-sample widoczne są duże fluktuacje; w przypadku próby in-sample dochodzi do tego jeszcze spadek pod sam koniec rozpatrywanego okresu.

Podobnie jak poprzednia rozpatrywana para spółek, pair trading oparty na akcjach PZU i Grupy Azoty daje lepsze rezultaty niż benchmark.

in-sample out-of-sample
Zannualizowana stopa zwrotu (arytmetyczna) 0.0929 0.1472
Zannualizowana stopa zwrotu (geometryczna) 0.0820 0.1382
Zannualizowane odchylenie standardowe 0.1686 0.1886
Współczynnik Sharpe’a 0.0192 0.0416
Współczynnik Beta (wzg. kup i trzymaj WIG20) 0.1357 0.0944
Maksymalne obsunięcie kapitału 0.1279 0.1850

Tabela 3.2.8. Zyskowność strategii pair trading w okresie in-sample i out-of-sample.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Zyskowność strategii dla rozpatrywanych par spółek wydaje się być nieco wyższa w okresie out-of-sample (13.8% rocznie) niż w in-sample (8.2% rocznie). Wyższe stopy zwrotu są jednak okupione większym ryzykiem: zarówno odchylenie standardowe, jak i maksymalne obsunięcie kapitału przyjmują większe wartości dla próby out-of-sample. W obu przypadkach mamy do czynienia ze strategią defensywną (niewielka reakcja na zmiany indeksu rynkowego), natomiast współczynnik Sharpe’a wskazuje na to, że strategia w okresie out-of-sample daje większą premię za ryzyko względem ryzyka całkowitego.

3.3. ING Bank Śląski SA (ING) i MONNARI Trade SA (MON)

Do trzeciej pary należą ING Bank Śląski SA, świadczący usługi bankowe oraz MONNARI Trade SA - spółka, której działalność koncentruje się na branży odzieżowej; tworzy produkty skierowane głównie do kobiet (zob. ING, MON).

3.3.1. Opis danych

Rysunek 3.3.1. Szeregi czasowe cen zamknięcia oraz histogramy stóp zwrotu.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Występowanie relacji długookresowej między cenami akcji ING Banku Śląskiego i MONNARI Trade w okresie in-sample nie jest wbrew pozorom oczywiste. Dosyć problematyczny wydaję się okres 2012-2013, kiedy to notowania ING podlegają wahaniom, natomiast w przypadku MONNARI szereg zdaje się oscylować na względnie stałym poziomie. W pozostałych podokresach in-sample ceny charakteryzuje raczej podobny przebieg.

Histogram stóp zwrotu dla ING wydaje się być symetryczny, ale relatywnie niewielki współczynnik skośności wskazuje na asymetrie lewostronną. Wzorem poprzednich przykładów, stopy zwrotów również są leptokurtyczne. Test Jarque-Bera odrzuca hipotezę zerową o normalności rozkładu [468.49, 0 < 0.05].

W przypadku MONNARI widać wyraźne odstępstwa od gęstości rozkładu normalnego. Prawe ramię jest wydłużone, a zjawisko leptokurtyczności rozkładu również ma miejsce. Podobnie jak poprzednio, test Jarque-Bera odrzuca hipotezę zerową o normalności rozkładu [5812.62, 0 < 0.05].

Średnia dzienna stopa zwrotu jest ponad trzykrotnie wyższa dla spółki MONNARI, ale wiąże się to również z większą dyspersją wokół średniej. O większym rozrzucie świadczą również wartości minimum i maksimum stóp zwrotów dla tej spółki.

Ceny zamknięcia ING Ceny zamknięcia MON Stopy zwrotu ING Stopy zwrotu MON
Liczba obserwacji 1119.0000 1119.0000 1119.0000 1119.0000
Braki danych 0.0000 0.0000 1.0000 1.0000
Minimum 62.5920 0.7200 -0.0962 -0.2056
Pierwszy kwartyl 78.9320 1.2200 -0.0082 -0.0178
Mediana 84.7700 3.7600 0.0000 0.0000
Trzeci kwartyl 125.5900 8.5250 0.0090 0.0155
Maksimum 150.0000 15.9900 0.0694 0.3231
Średnia 98.6852 5.2866 0.0005 0.0019
Odchylenie standardowe 25.2540 4.3080 0.0171 0.0404
Skośność 0.5176 0.7879 -0.0259 1.7668
Kurtoza -1.2992 -0.4480 3.1598 10.5709

Tabela 3.3.1. Podstawowe statystyki opisowe (dla całej próby).
Źródło: Opracowanie własne na podstawie danych stooq.com.

3.3.2. Analiza kointegracji
3.3.2.1. Stopień zintegrowania zmiennych

Rysunek 3.3.2. Ceny zamknięcia (a) oraz ich pierwsze różnice (b) dla spółki ING Bank Śląski w okresie in-sample.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Szereg cen zamknięcia dla ING nie przypomina procesu stacjonarnego: nie oscyluje wokół stałego poziomu, widoczny jest dryf, a amplituda wahań również nie jest stała. W przypadku pierwszych różnic widać wyraźne zjawisko grupowania wariancji - okresy mniejszej i większej zmienności występują seriami.

opoznienie adfTestowa adfKrytyczna bgTestowa bgPValue
0 -1.1465 -2.86 0.4799 0.4885
1 -1.0817 -2.86 0.0006 0.9797
2 -0.9124 -2.86 0.0107 0.9175
3 -0.7766 -2.86 0.0332 0.8555
4 -0.5433 -2.86 0.0058 0.9394
5 -0.6079 -2.86 0.0009 0.9759

Tabela 3.3.2. Wyniki testu ADF dla cen zamknięcia ING Bank Śląski.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Test Breuscha-Godfreya (p-value: 0.4885) wskazuje na to, że do analizy stacjonarności cen akcji ING można posłużyć się testem DF bez dodatkowych opóźnień. Wartość statystyki testowej takiego testu jest większa od statystyki krytycznej, w związku z czym brak jest podstaw do odrzucenia hipotezy zerowej o niestacjonarności tego szeregu.

opoznienie adfTestowa adfKrytyczna bgTestowa bgPValue
0 -28.0828 -2.86 0.0012 0.9726
1 -20.9086 -2.86 0.0129 0.9095
2 -17.5175 -2.86 0.0372 0.8471
3 -16.3579 -2.86 0.0053 0.9419
4 -13.5843 -2.86 0.0008 0.9781
5 -11.7714 -2.86 0.0015 0.9693

Tabela 3.3.3. Wyniki testu ADF dla pierwszych różnic cen zamknięcia ING Bank Śląski.
Źródło: Opracowanie własne na podstawie danych stooq.com.

W przypadku pierwszych różnic analizowanego szeregu również można posłużyć się standardowym testem DF (Breusch-Godfrey, p-value: 0.9726). Se względu na to, że statystyka testowa (-28.08) jest znacznie mniejsza od krytycznej, hipoteza zerowa o niestacjonarności pierwszych różnic zostaje odrzucona.

Z przeprowadzonych testów wynika, że na 5% poziomie istotności ceny zamknięcia dla banku ING są zintegrowane w stopniu pierwszym w okresie in-sample.

Rysunek 3.3.3. Ceny zamknięcia (a) oraz ich pierwsze różnice (b) dla spółki MONNARI Trade w okresie in-sample.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Podobnie jak we wszystkich poprzednich rozpatrywanych przypadkach, szereg cen zamknięcia spółki MONNARI przypomina proces niestacjonarny: poza rokiem 2012 i początkiem 2013, kiedy to przebiega według relatywnie stałego poziomu, szereg dryfuje w wyniku stochastycznych szoków. Z kolei pierwsze różnice cen zamknięcia oscylują wokół zera, ale widoczna jest zmienna amplituda wahań, szczególnie na początku i na końcu okresu in-sample.

opoznienie adfTestowa adfKrytyczna bgTestowa bgPValue
0 0.1437 -2.86 1.5980 0.2062
1 0.0769 -2.86 0.0015 0.9688
2 0.2357 -2.86 0.0002 0.9897
3 0.2296 -2.86 0.0000 0.9953
4 0.2860 -2.86 0.0040 0.9497
5 0.1277 -2.86 0.0002 0.9897

Tabela 3.3.4. Wyniki testu ADF dla cen zamknięcia MONNARI Trade.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Zgodnie z wynikami testu Breuscha-Godfreya (p-value: 0.2062 > 0.05), nie ma potrzeby korzystania z rozszerzonego testu Dickeya-Fullera. Statysytka testowa DF (0.1437) jest większa od krytycznej, w związku z czym brak jest podstaw do odrzucenia hipotezy zerowej o niestacjonarności notowań MONNARI Trade.

opoznienie adfTestowa adfKrytyczna bgTestowa bgPValue
0 -26.0051 -2.86 0.0015 0.9686
1 -20.1293 -2.86 0.0002 0.9886
2 -16.1522 -2.86 0.0000 0.9949
3 -14.1782 -2.86 0.0038 0.9506
4 -11.6996 -2.86 0.0002 0.9891
5 -10.6367 -2.86 0.0001 0.9920

Tabela 3.3.5. Wyniki testu ADF dla pierwszych różnic cen zamknięcia MONNARI Trade.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Identycznie, jak w przypadku pozostałych analizowanych szeregów, analizę stacjonarności rozpoczęto od wyboru odpowiedniej formy testu DF, aby uniknąć (na przyjętym poziomie istotności) problemów związanych z autokorelacją. Wyniki testu Breuscha-Godfreya (p-value: 0.9686 > 0.05) wyraźnie wskazują na to, że nie ma potrzeby dodawania opóźnień do równania testu DF. Tym razem statystyka testowa DF (-26.0051) jest mniejsza od krytycznej, więc hipoteza zerowa o niestacjonarności pierwszych różnic cen zamknięcia MONNARI Trade zostaje odrzucona.

Podobnie jak w przypadku notowań ING, szereg dla MONNARI wymaga jednokrotnego różnicowania, aby doprowadzić go do stacjonarności.

3.3.2.2. Kointegracja
## 
## Call:
## lm(formula = na.omit(szeregPierwszy) ~ na.omit(szeregDrugi))
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -15.7364  -4.1260  -0.2567   4.4154  13.8401 
## 
## Coefficients:
##           Estimate Std. Error t value            Pr(>|t|)    
## Intercept  69.3186     0.3655  189.63 <0.0000000000000002 ***
## MON         4.9234     0.1107   44.46 <0.0000000000000002 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 5.828 on 745 degrees of freedom
## Multiple R-squared:  0.7263, Adjusted R-squared:  0.7259 
## F-statistic:  1977 on 1 and 745 DF,  p-value: < 0.00000000000000022

Tabela 3.3.6. Estymacja wektora kointegrującego.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Z wyników testów Dickeya-Fullera wynika, że oba szeregi z rozpatrywanej pary są zintegrowane w stopniu pierwszym na przyjętym poziomie istotności, więc oszacowano równanie równowagi długookresowej. Wektor kointegrujący uzyskany na podstawie tego modelu ma postać: [1, -69.32, -4.92].

Rysunek 3.3.4. Reszty z równania regresji równowagi długookresowej.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Wnioski z analizy przebiegu reszt oszacowanego równania są w zasadzie identyczne, jak w przypadku poprzednich par: szereg wydaje się stacjonarny “na granicy”, tj. przypomina proces autoregresyjny z parametrem bliskim jeden, chociaż w tym przypadku oszacowania błędów losowych wydają się nawet bardziej podobne do błądzenia przypadkowego.

opoznienie adfTestowa adfKrytyczna bgTestowa bgPValue
0 -3.5067 -3.33 1.1729 0.2788
1 -3.2810 -3.33 0.0072 0.9324
2 -3.0322 -3.33 0.0037 0.9512
3 -2.9197 -3.33 0.0199 0.8877
4 -2.6666 -3.33 0.0001 0.9919
5 -2.7244 -3.33 0.0006 0.9802

Tabela 3.3.7. Wyniki testu ADF dla reszt z równania regresji równowagi długookresowej.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Test na stacjonarność reszt opiera się na zwykłym teście DF (Breusch-Godfrey, p-value: 0.2788 > 0.05). Jego wyniki wydają się potwierdzać wnioski z analizy przebiegu reszt: statystyka testowa (-3.5067) jest co prawda mniejsza od krytycznej, ale jest to różnica niewielka. Mimo to, na przyjętym poziomie istotności oszacowania błędów losowych są stacjonarne, a rozpatrywana para szeregów - skointegrowana.

3.3.3. Pair Trading
3.3.3.1. Okres in-sample

Rysunek 3.3.5. Sygnały otwarcia i zamknięcia oraz przyjmowane pozycje w okresie in-sample.
Źródło: Opracowanie własne na podstawie danych stooq.com.

W przypadku rozpatrywanej pary pozycje otwierane są 10 razy w okresie in-sample, a czas ich otwarcia to 67.2% tego okresu. Dla 5 sygnałów akcje spółki ING są względnie przewartościowane, a MONNARI niedowartościowane. Czas pozycji krótkiej w akcjach ING i długiej w MONNARI stanowi 251 dni, co ciekawe, tyle samo dni (251) liczy przeciwny przypadek.

3.3.3.2. Okres out-of-sample

Rysunek 3.3.6. Sygnały otwarcia i zamknięcia oraz przyjmowane pozycje w okresie out-of-sample.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Dla próby out-of-sample zdefiniowano tylko 5 punktów otwarcia pozycji, ale są one otwarte przez 88.7% czasu, z czego większość stanowi pozycja krótka w spółce ING i długa w MONNARI (73.4% okresu out-of-sample).

3.3.3.3. Zyskowność strategii

Rysunek 3.3.7. Equity line dla strategii pair trading w okresie in-sample (a) i out-of-sample (a).
Źródło: Opracowanie własne na podstawie danych stooq.com.

O ile linia equity w pierwszym z rozpatrywanych okresów nie charakteryzuje się jednostajnym wzrostem i pojawiają się spadki (np. w okolicach połowy drugiego kwartału 2013), to na sam koniec próby in-sample procentowa różnica wartości portfela wydaje się wskazywać na ponadprzeciętny wynik spośród wszystkich rozpatrywanych dotychczas par.

W przypadku okresu out-of-sample widoczne są duże fluktuację, zwłaszcza do końca 2014 roku. Linia equity kończy swój przebieg w prawej górnej części wykresu, ale strategia jest mniej zyskowna niż w okresie in-sample.

in-sample out-of-sample
Zannualizowana stopa zwrotu (arytmetyczna) 0.3728 0.1520
Zannualizowana stopa zwrotu (geometryczna) 0.3723 0.1374
Zannualizowane odchylenie standardowe 0.3382 0.2160
Współczynnik Sharpe’a 0.0617 0.0377
Współczynnik Beta (wzg. kup i trzymaj WIG20) 0.1837 0.0151
Maksymalne obsunięcie kapitału 0.2265 0.1113

Tabela 3.3.8. Zyskowność strategii pair trading w okresie in-sample i out-of-sample.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Wyniki zyskowności strategii wydają się potwierdzać analizę przebiegu linii equity. W okresie in-sample strategia generuje rocznie 37.2% zysku, natomiast w out-of-sample mniej, bo 13.7%. Pierwszy z rozpatrywanych okresów charakteryzuje się większym ryzykiem (wyższe odch. std. i maximum drawdown), ale jest też lepiej dostosowany względem ryzyka (wyższy wsp. Sharpe’a).

Zarówno w okresie in-sample, jak i out-of-sample strategia słabo reaguje na zmiany względem benchmarku (WIG20, kup i trzymaj).

3.4. PEKAO SA (PEO) i AMICA Wronki SA (AMC)

Do przedostatniej z analizowanych par należą: Bank Pekao SA - instytucja działająca na rynku bankowym od 85 lat, oferująca swoje usługi klientom indywidualnym, małym i średnim przedsiębiorstwom, a także dużym firmom, oraz Amica Wronki, której podstawą działalności jest produkcja dużego i małego sprzętu AGD. Amica jest również właścicielem uznanej duńskiej marki Gram (zob. PEO, AMC).

3.4.1. Opis danych

Rysunek 3.4.1. Szeregi czasowe cen zamknięcia oraz histogramy stóp zwrotu.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Podobny przebieg szeregów cen zamknięcia w okresie in-sample wydaje się wskazywać na to, że rzeczywiście między rozpatrywaną parą istnieje relacja kointegrująca. Co więcej, związek ten zdaje się również mieć miejsce w okresie out-of-sample, ze względu na zbliżone kierunki zmian.

Histogram stóp zwrotu dla banku PEKAO wydaje się mieć symetryczny kształt (w rzeczywistości skośność wskazuje na względnie niewielką, lewostronną asymetrię), ale widoczna jest duża koncentracja obserwacji w środkowej części rozkładu, która ma z kolei asymetryczny charakter. Statystyki opisowe wskazują na istnienie zjawiska leptokurtozy. Test Jarque-Bera odrzuca hipotezę zerową o normalności rozkładu [290.09, 0 < 0.05].

W przypadku zwrotów dla spółki Amica widać wyraźne odstępstwa od gęstości rozkładu normalnego (leptokurtoza), co również potwierdza test Jarque-Bera; podobnie jak w przypadku notowań PEKAO, hipoteza zerowa zostaje odrzucona na 5% poziomie istotności [972.68, 0 < 0.05].

Średnia stopa zwrotu dla Amici jest prawie cztery razy większa od PEKAO, przy stosunkowo niewielkiej różnicy w odchyleniu standardowym.

Ceny zamknięcia PEO Ceny zamknięcia AMC Stopy zwrotu PEO Stopy zwrotu AMC
Liczba obserwacji 1119.0000 1119.0000 1119.0000 1119.0000
Braki danych 0.0000 0.0000 1.0000 1.0000
Minimum 101.0700 18.9530 -0.0927 -0.1085
Pierwszy kwartyl 129.7050 38.9820 -0.0097 -0.0069
Mediana 138.4200 63.2670 0.0000 0.0000
Trzeci kwartyl 168.4300 102.6250 0.0110 0.0099
Maksimum 185.2100 169.2700 0.0965 0.0947
Średnia 146.0346 70.9392 0.0004 0.0015
Odchylenie standardowe 22.1621 37.8896 0.0178 0.0187
Skośność 0.1004 0.5875 -0.1300 -0.2062
Kurtoza -1.3385 -0.6239 2.4721 4.5373

Tabela 3.4.1. Podstawowe statystyki opisowe (dla całej próby).
Źródło: Opracowanie własne na podstawie danych stooq.com.

3.4.2. Analiza kointegracji
3.4.2.1. Stopień zintegrowania zmiennych

Rysunek 3.4.2. Ceny zamknięcia (a) oraz ich pierwsze różnice (b) dla spółki PEKAO w okresie in-sample.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Wykres cen zamknięcia wydaje się być realizacją procesu niestacjonarnego: widoczny jest dryf, stochastyczny trend oraz zmienna amplituda wahań. Z kolei pierwsze różnice przebiegają wokół stałego poziomu, jednak wzorem poprzednich szeregów, można znaleźć na wykresie okresy, kiedy mniejsze i większe fluktuacje występują seriami.

opoznienie adfTestowa adfKrytyczna bgTestowa bgPValue
0 -1.8610 -2.86 1.5870 0.2077
1 -1.7394 -2.86 0.0068 0.9344
2 -1.5150 -2.86 0.1114 0.7386
3 -1.2233 -2.86 0.0014 0.9704
4 -1.1782 -2.86 0.0047 0.9454
5 -1.2751 -2.86 0.0022 0.9625

Tabela 3.4.2. Wyniki testu ADF dla cen zamknięcia PEKAO.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Na podstawie testu Breuscha-Godfreya (p-value: 0.2077 > 0.05) analizę stacjonarności cen zamknięcia dla banku PEKAO oparto na standardowym teście DF. Wartość jego statystyki testowej (-1.861) jest większa od krytycznej, więc brak jest podstaw do odrzucenia hipotezy zerowej o niestacjonarności szeregu.

opoznienie adfTestowa adfKrytyczna bgTestowa bgPValue
0 -28.7348 -2.86 0.0109 0.9168
1 -21.4343 -2.86 0.1313 0.7170
2 -18.9970 -2.86 0.0026 0.9590
3 -15.9557 -2.86 0.0050 0.9436
4 -13.0511 -2.86 0.0016 0.9685
5 -11.4635 -2.86 0.0001 0.9920

Tabela 3.4.3. Wyniki testu ADF dla pierwszych różnic cen zamknięcia PEKAO.
Źródło: Opracowanie własne na podstawie danych stooq.com.

W przypadku pierwszych różnic analizowanego szeregu, ponownie wystarcza zwykły test DF (Breusch-Godfrey, p-value: 0.9168 > 0.05, brak podstaw do odrzucenia hipotezy zerowej o braku autokorelacji pierwszego rzędu). Statystyka testowa Dickeya-Fullera (-28.7348) jest mniejsza od krytycznej, więc hipoteza zerowa o niestacjonarności pierwszych różnic zostaje odrzucona.

Ceny zamknięcia PEKAO są zintegrowane w stopniu pierwszym w okresie in-sample na przyjętym poziomie istotności.

Rysunek 3.4.3. Ceny zamknięcia (a) oraz ich pierwsze różnice (b) dla spółki Amica Wronki w okresie in-sample.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Szereg cen zamknięcia dla spółki Amica Wronki wydaje się być kolejnym przykładem procesu niestacjonarnego. Charakteryzuje go dryf, a także zmienna amplituda wahań. Z kolei pierwsze różnice zdają się być stacjonarne: oscylują wokół stałego poziomu, a amplituda wahań jest względnie stała (co prawda pod koniec okresu in-sample widać jej wyraźny wzrost).

opoznienie adfTestowa adfKrytyczna bgTestowa bgPValue
0 2.0197 -2.86 13.1051 0.0003
1 1.5598 -2.86 0.0600 0.8065
2 1.7910 -2.86 0.0032 0.9547
3 1.8681 -2.86 0.0000 0.9989
4 1.8573 -2.86 0.0001 0.9943
5 1.9384 -2.86 0.0046 0.9457

Tabela 3.4.4. Wyniki testu ADF dla cen zamknięcia Amica Wronki.
Źródło: Opracowanie własne na podstawie danych stooq.com.

W przypadku pierwotnego szeregu trzeba skorzystać z testu ADF uwzględniającego jedno opóźnienie (Breusch-Godfrey dla zwykłego testu DF, p-value: 0.0003 < 0.05; Breusch-Godfrey dla testu ADF z jednym opóźnieniem, p-value: 0.8065 > 0.05). Wyniki testu ADF wskazują na to, że brak jest podstaw do odrzucenia hipotezy zerowej o niestacjonarności szeregu, w związku z czym jest on zintegrowany w stopniu co najmniej pierwszym (1.5598 > -2.86).

opoznienie adfTestowa adfKrytyczna bgTestowa bgPValue
0 -23.3269 -2.86 0.0543 0.8157
1 -18.7671 -2.86 0.0013 0.9714
2 -15.6956 -2.86 0.0000 0.9972
3 -13.4936 -2.86 0.0000 0.9983
4 -12.3151 -2.86 0.0030 0.9562
5 -10.2923 -2.86 0.0148 0.9033

Tabela 3.4.5. Wyniki testu ADF dla pierwszych różnic cen zamknięcia Amica Wronki.
Źródło: Opracowanie własne na podstawie danych stooq.com.

W przeciwieństwie do pierwotnego szeregu, analizę stacjonarności pierwszych różnic można oprzeć na teście Dickeya-Fullera bez rozszerzenia (Breusch-Godfrey, p-value: 0.8157, brak podstaw do odrzucenia hipotezy zerowej o braku autokorelacji pierwszego rzędu). Na 5% poziomie istotności hipoteza zerowa o niestacjonarności pierwszych różnic zostaje odrzucona; statystyka testowa jest mniejsza od krytycznej (-23.3269 < -2.86).

3.4.2.2. Kointegracja
## 
## Call:
## lm(formula = na.omit(szeregPierwszy) ~ na.omit(szeregDrugi))
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -20.2477  -5.6602  -0.4722   6.7493  17.1911 
## 
## Coefficients:
##            Estimate Std. Error t value            Pr(>|t|)    
## Intercept 106.28510    0.66393  160.09 <0.0000000000000002 ***
## AMC         0.54121    0.01201   45.06 <0.0000000000000002 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 7.809 on 745 degrees of freedom
## Multiple R-squared:  0.7316, Adjusted R-squared:  0.7312 
## F-statistic:  2031 on 1 and 745 DF,  p-value: < 0.00000000000000022

Tabela 3.4.6. Estymacja wektora kointegrującego.
Źródło: Opracowanie własne na podstawie danych stooq.com.

W okresie in-sample oba z rozpatrywanych szeregów są zintegrowane w stopniu pierwszym, więc wzorem metodologii Engle-Grangera oszacowano równanie równowagi długookresowej. Na tej podstawie uzyskano wektor kointegrujący: [1, -106.29, -0.54]. Jednak by wykorzystać uzyskane wyniki, przeprowadzono test stacjonarności reszt, w celu potwierdzenia występowania zjawiska kointegracji.

Rysunek 3.4.4. Reszty z równania regresji równowagi długookresowej.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Identycznie jak w przypadku pozostałych par, trudno wstępnie stwierdzić na podstawie analizy graficznej, czy reszty są stacjonarne - ponownie przypominają wcześniej wspomniany proces autoregresyjny (\(\alpha\) bliska 1) lub błądzenie przypadkowe.

opoznienie adfTestowa adfKrytyczna bgTestowa bgPValue
0 -4.4228 -3.33 2.9253 0.0872
1 -4.1557 -3.33 0.0052 0.9426
2 -3.7954 -3.33 0.0529 0.8181
3 -3.3643 -3.33 0.0020 0.9641
4 -3.3775 -3.33 0.0012 0.9725
5 -3.4807 -3.33 0.0014 0.9704

Tabela 3.4.7. Wyniki testu ADF dla reszt z równania regresji równowagi długookresowej.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Do weryfikacji występowania zjawiska kointegracji posłużono się testem DF bez dodatkowych opóźnień, ze względu na to, że dla testu Breuscha-Godfreya brak było podstaw do odrzucenia hipotezy zerowej o braku autokorelacji pierwszego rzędu (p-value: 0.0872). Statystyka testowa Dickeya-Fullera wskazuje na to, że reszty są stacjonarne, co implikuje kointegrację między rozpatrywaną parą szeregów (-4.4228 < -3.33).

3.4.3. Pair Trading
3.4.3.1. Okres in-sample

Rysunek 3.4.5. Sygnały otwarcia i zamknięcia oraz przyjmowane pozycje w okresie in-sample.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Strategia pair trading w okresie in-sample opiera się na 14 sygnałach otwarcia. Pozycje są otwarte przez 71.9% tego okresu. Dla 5 sygnałów akcje banku PEKAO są relatywnie przewartościowane w momencie otwarcia pozycji, a dla pozostałych - akcje Amici. 37.2% czasu próby in-sample stanowi pozycja krótka w akcjach PEKAO i długa w akcjach Amica, natomiast 34.7% - pozycja krótka w Amice i długa w PEKAO.

3.4.3.2. Okres out-of-sample

Rysunek 3.4.6. Sygnały otwarcia i zamknięcia oraz przyjmowane pozycje w okresie out-of-sample.
Źródło: Opracowanie własne na podstawie danych stooq.com.

W przypadku okresu out-of-sample zdefiniowano nieco mniej sygnałów otwarcia, bo 5. Same pozycje są otwarte przez 87.1% rozpatrywanej próby. 3 sygnały to otwarcie pozycji krótkiej w PEKAO i długiej w Amica; takie pozycje stanowią 66.9% out-of-sample, natomiast przeciwny przypadek - 20.2%.

3.4.3.3. Zyskowność strategii

Rysunek 3.4.7. Equity line dla strategii pair trading w okresie in-sample (a) i out-of-sample (a).
Źródło: Opracowanie własne na podstawie danych stooq.com.

W przypadku okresu in-sample widoczny jest spadek wartości portfela mniej więcej po pierwszym kwartale 2011. Tendencja ta jednak odwraca się gdzieś w okolicach połowy lub końcówki trzeciego kwartału i trwa do końca próby. Ostatecznie strategia przynosi w tym okresie zysk.

Fluktuacje linii equity w okresie out-of-sample wydają się mieć podobny przebieg jak w poprzednim analizowanym okresie. Mniej więcej od sierpnia 2014 szereg nie przyjmuje wartości mniejszych od jedności i podobnie jak w okresie in-sample strategia przynosi zysk, chociaż w okolicach początku drugiego kwartału 2015 tendencja ma charakter spadkowy.

W obu przypadkach wynik strategii na koniec okresu jest lepszy niż benchmark, chociaż trafiają się bardzo krótkie okresy, kiedy daje on lepsze rezultaty.

in-sample out-of-sample
Zannualizowana stopa zwrotu (arytmetyczna) 0.0934 0.0906
Zannualizowana stopa zwrotu (geometryczna) 0.0812 0.0814
Zannualizowane odchylenie standardowe 0.1752 0.1573
Współczynnik Sharpe’a 0.0186 0.0272
Współczynnik Beta (wzg. kup i trzymaj WIG20) 0.1211 0.0240
Maksymalne obsunięcie kapitału 0.2384 0.1225

Tabela 3.4.8. Zyskowność strategii pair trading w okresie in-sample i out-of-sample.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Strategia generuje rocznie podobny zysk w obu okresach, który wynosi: 8.12% (in-sample) i 8.14% (out-of-sample). Niektóre z pozostałych statystyk wydają się wskazywać na przewagę okresu out-of-sample: niższe odchylenie standardowe oraz maksymalne obsunięcie kapitału wskazują na mniejsze ryzyko, natomiast wyższa wartość współczynnika Sharpe’a mówi o większej premii za ryzyko na jednostkę ryzyka całkowitego w tym okresie.

Niewielki i dodatni współczynnik \(\beta\) w obu przypadkach wskazuje na defensywny charakter strategii względem indeksu rynkowego.

3.5. SOHO Development SA (SHD) i Mobile Internet Technology SA (MIT)

Ostatnia z wylosowanych par składa się z: SOHO Development, której długoterminowa strategia koncentruje się na działalności deweloperskiej prowadzonej w oparciu o posiadane nieruchomości oraz sprzedaży aktywów niestrategicznych; druga spółka to Mobile Internet Technology - najstarsza firma działająca na polskim rynku technologii kartograficznych; obecnie holding medialny i komunikacyjny skupiający się na mobilnych usługach i marketingu, a także technologiach teleinformatycznych (zob. SHD, MIT).

3.5.1. Opis danych

Rysunek 3.5.1. Szeregi czasowe cen zamknięcia oraz histogramy stóp zwrotu.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Analiza przebiegu obu szeregów wydaje się wskazywać na to, że rzeczywiście są one ze sobą skointegrowane w okresie in-sample. Kierunki zmian i trend wyglądają podobnie. Wydaje się jednak, że relacja ta nie utrzymuje się w okresie out-of-sample, ze względu na inną tendencję do kształtowania się notowań.

W przypadku obu histogramów widać wyraźne odstępstwa od gęstości rozkładu normalnego: wydłużone prawe ramiona wskazują na asymetrię, co więcej jest ona także widoczna w środkowym obszarze rysunków - miejsca koncentracji dużej ilości obserwacji. Statysytki opisowe wskazują prawostronną asymetrię i leptokurtozę. Test Jarque-Bera odrzuca hipotezę zerową o normalności rozkładu stóp zwrotu zarówno dla Soho Development [389.62, 0 < 0.05], jak i Mobile Internet Technology [800.74, 0 < 0.05].

Średnie stopy zwrotu są ujemne dla obu spółek, ale nieco ponad trzykrotnie mniejsza jest ona w przypadku Mobile Internet Technology; akcje tej spółki charakteryzują się także większym rozproszeniem wokół średniej.

Ceny zamknięcia SHD Ceny zamknięcia MIT Stopy zwrotu SHD Stopy zwrotu MIT
Liczba obserwacji 1119.0000 1119.0000 1119.0000 1119.0000
Braki danych 0.0000 0.0000 1.0000 1.0000
Minimum 0.6300 0.1200 -0.1074 -0.1739
Pierwszy kwartyl 1.0600 0.3200 -0.0155 -0.0204
Mediana 1.2400 0.4900 0.0000 0.0000
Trzeci kwartyl 1.4000 0.6850 0.0131 0.0167
Maksimum 2.8400 1.4100 0.1410 0.2353
Średnia 1.3511 0.5564 -0.0003 -0.0010
Odchylenie standardowe 0.4743 0.3281 0.0278 0.0406
Skośność 1.4792 0.9657 0.5790 0.5379
Kurtoza 1.4138 0.2240 2.6393 3.9911

Tabela 3.5.1. Podstawowe statystyki opisowe (dla całej próby).
Źródło: Opracowanie własne na podstawie danych stooq.com.

3.5.2. Analiza kointegracji
3.5.2.1. Stopień zintegrowania zmiennych

Rysunek 3.5.2. Ceny zamknięcia (a) oraz ich pierwsze różnice (b) dla spółki SOHO Development w okresie in-sample.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Notowania cen zamknięcia dla spółki SOHO Development zdecydowanie przypominają proces niestacjonarny, ze względu na wyraźny dryf oraz zmienną amplitudę wahań. Pierwsze różnice charakteryzuje za to przebieg wokół stałego poziomu, natomiast wariancja wydaje się być nieco większa w 2011 roku, a potem jest już relatywnie stała.

opoznienie adfTestowa adfKrytyczna bgTestowa bgPValue
0 -2.2173 -2.86 2.4513 0.1174
1 -2.2514 -2.86 0.0010 0.9747
2 -2.3254 -2.86 0.0006 0.9806
3 -2.2774 -2.86 0.0038 0.9510
4 -2.2347 -2.86 0.0006 0.9800
5 -2.2088 -2.86 0.0007 0.9791

Tabela 3.5.2. Wyniki testu ADF dla cen zamknięcia SOHO Development.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Analizę integracji cen zamknięcia oparto na zwykłym teście DF (Breusch-Godfrey, p-value: 0.1174 > 0.05). Statystyka testowa DF (-2.2173) jest większa od krytycznej, więc brak jest podstaw do odrzucenia hipotezy zerowej o niestacjonarności szeregu. Jest on co najmniej \(\sim I(1)\).

opoznienie adfTestowa adfKrytyczna bgTestowa bgPValue
0 -25.6824 -2.86 0.0005 0.9825
1 -18.6277 -2.86 0.0007 0.9786
2 -16.0831 -2.86 0.0030 0.9566
3 -13.1368 -2.86 0.0004 0.9838
4 -12.0357 -2.86 0.0006 0.9807
5 -10.4907 -2.86 0.0099 0.9206

Tabela 3.5.3. Wyniki testu ADF dla pierwszych różnic cen zamknięcia SOHO Development.
Źródło: Opracowanie własne na podstawie danych stooq.com.

W przypadku pierwszych różnic cen zamknięcia również wystarcza zwykły test DF (Breusch-Godfrey, p-value: 0.9825 > 0.05). Tym razem hipoteza zerowa o niestacjonarności zostaje odrzucona na 5% poziomie istotności (-25.6824 < -2.86), więc pierwsze różnice są stacjonarne, a pierwotny szereg jest zintegrowany w stopniu pierwszym.

Rysunek 3.5.3. Ceny zamknięcia (a) oraz ich pierwsze różnice (b) dla spółki Mobile Internet Technology w okresie in-sample.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Notowania MIT również wydają się być procesem niestacjonarnym; podobnie jak poprzednio, szereg charakteryzuje dryf oraz zmienna wariancja. Pierwsze różnice oscylują wokół stałego poziomu, niemniej jednak wzorzec amplitudy wahań wskazuje na występowanie okresów o mniejszej i większej zmienności seriami.

opoznienie adfTestowa adfKrytyczna bgTestowa bgPValue
0 -2.3535 -2.86 0.3300 0.5657
1 -2.1417 -2.86 0.0194 0.8893
2 -2.0499 -2.86 0.0025 0.9604
3 -2.0636 -2.86 0.0003 0.9855
4 -2.0073 -2.86 0.0000 0.9962
5 -1.9701 -2.86 0.0000 0.9975

Tabela 3.5.4. Wyniki testu ADF dla cen zamknięcia Mobile Internet Technology.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Równanie regresji dla Dickeya-Fullera ponownie zostało dobrane na podstawie wyników testu Breuscha-Godfreya, a te wskazują na to, że nie ma potrzeby uwzględniania dodatkowych opóźnień (p-value: 0.5657 > 0.05, brak podstaw do odrzucenia hipotezy zerowej o braku autokorelacji pierwszego rzędu). Statystyka testowa DF (-2.3535) jest większa od krytycznej, więc brak jest podstaw do odrzucenia hipotezy zerowej o niestacjonarności notowań spółki Mobile Internet Technology.

opoznienie adfTestowa adfKrytyczna bgTestowa bgPValue
0 -27.9218 -2.86 0.0262 0.8714
1 -20.0202 -2.86 0.0020 0.9646
2 -15.5048 -2.86 0.0002 0.9877
3 -13.5435 -2.86 0.0001 0.9910
4 -11.8993 -2.86 0.0000 0.9989
5 -10.8888 -2.86 0.0000 0.9995

Tabela 3.5.5. Wyniki testu ADF dla pierwszych różnic cen zamknięcia Mobile Internet Technology.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Stacjonarność pierwszych różnic analizowanego szeregu również można przetestować za pomocą zwykłego testu DF (Breusch-Godfrey, p-value: 0.8714). Statystyka testowa tak przeprowadzonego testu wynosi -27.9218 i jest mniejsza od statystyki krytycznej. Hipoteza zerowa o niestacjonarności pierwszych różnic zostaje więc odrzucona. Podobnie jak notowania poprzedniej spółki, szereg cen zamknięcia Mobile Internet Technology jest \(I(1)\).

3.5.2.2. Kointegracja
## 
## Call:
## lm(formula = na.omit(szeregPierwszy) ~ na.omit(szeregDrugi))
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.51565 -0.10392 -0.01867  0.10266  0.46759 
## 
## Coefficients:
##           Estimate Std. Error t value            Pr(>|t|)    
## Intercept  0.21902    0.01473   14.87 <0.0000000000000002 ***
## MIT        1.72664    0.01960   88.11 <0.0000000000000002 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.1686 on 745 degrees of freedom
## Multiple R-squared:  0.9124, Adjusted R-squared:  0.9123 
## F-statistic:  7763 on 1 and 745 DF,  p-value: < 0.00000000000000022

Tabela 3.5.6. Estymacja wektora kointegrującego.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Analiza integracji obu szeregów wykazała, że są one zintegrowane w stopniu pierwszym, więc oszacowano równanie równowagi długookresowej. Potencjalny wektor kointegrujący ma postać [1, -0.22, -1.73], ale wzorem poprzednich przykładów, występowanie zjawiska kointegracji trzeba potwierdzić analizując stacjonarność reszt.

Rysunek 3.5.4. Reszty z równania regresji równowagi długookresowej.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Interpretacja wykresu reszt z regresji przeprowadzonej na zmiennych \(\sim I(1)\) jest identyczna, jak w przypadku poprzednich przykładów: szereg przypomina błądzenie przypadkowe albo stacjonarny proces autoregresyjny, dla którego \(\alpha\) jest bliska jedynki. Weryfikacja stacjonarności wymaga przeprowadzenia odpowiedniego testu.

opoznienie adfTestowa adfKrytyczna bgTestowa bgPValue
0 -3.9063 -3.33 2.1468 0.1429
1 -3.6769 -3.33 0.0867 0.7684
2 -3.4400 -3.33 0.0016 0.9686
3 -3.2497 -3.33 0.0022 0.9627
4 -3.3384 -3.33 0.0000 0.9946
5 -3.3311 -3.33 0.0002 0.9894

Tabela 3.5.7. Wyniki testu ADF dla reszt z równania regresji równowagi długookresowej.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Zgodnie z wynikami testu Breuscha-Godfreya (p-value: 0.1429 > 0.05, brak podstaw do odrzucenia hipotezy zerowej o braku autokorelacji pierwszego rzędu), do analizy stacjonarności reszt z równania regresji równowagi długookresowej można posłużyć się testem Dickeya-Fullera bez dodatkowych rozszerzeń. Statystyka testowa DF dla takiego wariantu testu (-3.9063) jest mniejsza od krytycznej, więc na 5% poziomie istotności hipoteza zerowa o niestacjonarności reszt zostaje odrzucona, a w konsekwencji rozpatrywana para szeregów jest skointegrowana w okresie in-sample w stopniu \((1,1)\).

3.5.3. Pair Trading
3.5.3.1. Okres in-sample

Rysunek 3.5.5. Sygnały otwarcia i zamknięcia oraz przyjmowane pozycje w okresie in-sample.
Źródło: Opracowanie własne na podstawie danych stooq.com.

W okresie in-sample pozycje są otwierane 11 razy, a sam okres ich otwarcia stanowi 60.9% próby. W 6 przypadkach przyjmowana jest pozycja krótka w akcjach spółki SOHO Development i długa w akcjach Mobile Internet Technology; czas otwarcia takich pozycji stanowi 29.7% rozpatrywanego okresu. Przeciwny przypadek to 31.2% czasu in-sample.

3.5.3.2. Okres out-of-sample

Rysunek 3.5.6. Sygnały otwarcia i zamknięcia oraz przyjmowane pozycje w okresie out-of-sample.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Dla out-of-sample zdefiniowano niewiele, bo tylko 2 sygnały otwarcia, ale za to same pozycje są otwarte przez 96% próby. Pierwszy sygnał to pozycja krótka w akcjach spółki MIT i długa w SOHO Development (10.2% okresu), natomiast drugi to pozycja przeciwna, która jest z kolei otwarta przez 85.8% próby out-of-sample.

3.5.3.3. Zyskowność strategii

Rysunek 3.5.7. Equity line dla strategii pair trading w okresie in-sample (a) i out-of-sample (a).
Źródło: Opracowanie własne na podstawie danych stooq.com.

W okresie in-sample strategia oparta na skointegrowanej parze notowań SOHO Development i Mobile Internet Technology przynosi zysk w przeciwieństwie do benchmarku. Niemniej jednak zdarzają się okresy, kiedy linia equity ma spadkową tendencję, a wzrost nie ma jednostajnego charakteru.

Mniej więcej na początku trzeciego miesiąca 2014 (okres out-of-sample) widać duży wzrost linii equity, który jest jednak zniwelowany przez spadki mające miejsce w okolicach połowy tego samego roku. Niestety, rozpatrywany okres kończy się stratą dla tej pary. Jest to pierwszy z analizowanych przypadków, kiedy strategia pair trading przynosi stratę i radzi sobie gorzej od benchmarku.

in-sample out-of-sample
Zannualizowana stopa zwrotu (arytmetyczna) 0.2134 -0.1045
Zannualizowana stopa zwrotu (geometryczna) 0.1827 -0.1763
Zannualizowane odchylenie standardowe 0.3019 0.4254
Współczynnik Sharpe’a 0.0358 -0.0188
Współczynnik Beta (wzg. kup i trzymaj WIG20) -0.0924 0.0773
Maksymalne obsunięcie kapitału 0.2425 0.5258

Tabela 3.5.8. Zyskowność strategii pair trading w okresie in-sample i out-of-sample.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Statystyki w okresie out-of-sample potwierdzają słabe wyniki strategii dla tej próby, która generuje rocznie 17.63% strat. Wyższe wartości odchylenia standardowego oraz maksymalnego obsunięcia kapitału sygnalizują również większe ryzyko w porównaniu do okresu in-sample. Ujemny współczynnik Sharpe’a także jednoznacznie wskazuje na nie najlepsze rezulaty out-of-sample, gdyż aktywa pozbawione ryzyka są lepszym rozwiązaniem.

Strategia w okresie in-sample przynosi roczny zysk w wysokości 18.27%, a premia za ryzyko na jednostkę ryzyka całkowitego jest dodatnia (3.58%).

Ujemny współczynnik \(\beta\) dla okresu in-sample wskazuje na zmiany w przeciwnym kierunku względem indeksu rynkowego, natomiast w przypadku out-of-sample analizowana strategia ma charakter defensywny (niewielki i dodatni współczynnik).

3.6. Portfel złożony ze wszystkich rozpatrywanych par spółek

Rysunek 3.6.1. Equity line dla portfela złożonego ze wszystkich par w okresie in-sample (a) i out-of-sample (a).
Źródło: Opracowanie własne na podstawie danych stooq.com.

Sam początek okresu in-sample to relatywnie niewielkie fluktuacje linii equity wokół stałego poziomu. W okolicach połowy trzeciego kwartału 2011 roku widoczny jest względnie jednostajny wzrost, który poprzedza spadek. Wyraźne odchylenie od trendu wzrostowego jest widoczne mniej więcej po pierwszym kwartale 2013 roku. Strategia przynosi zysk w tym okresie i daje lepsze rezultaty niż benchmark (który przynosi straty).

Próbę out-of-sample charakteryzują duże fluktuacje linii equity i zdarzają się okresy, kiedy daje ona gorsze wyniki niż benchmark. Ostatecznie, na sam koniec okresu, strategia oparta na portfelu złożonym ze wszystkich rozpatrywanych par okazuje się zyskowna, w przeciwieństwie do benchmarku.

in-sample out-of-sample
Zannualizowana stopa zwrotu (arytmetyczna) 0.1908 0.0794
Zannualizowana stopa zwrotu (geometryczna) 0.2025 0.0741
Zannualizowane odchylenie standardowe 0.1127 0.1256
Współczynnik Sharpe’a 0.1066 0.0398
Współczynnik Beta (wzg. kup i trzymaj WIG20) 0.0649 0.0509
Maksymalne obsunięcie kapitału 0.0929 0.1671

Tabela 3.6.1. Zyskowność portfela złożonego ze wszystkich par w okresie in-sample i out-of-sample.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Analizowany portfel daje wyraźnie lepsze rezultaty w okresie in-sample (wyższe stopy zwrotu) i jest mniej ryzykowny, ze względu na niższe wartości odchylenia standardowego oraz mniejsze maksymalne obsunięcie kapitału. Większa wartość współczynnika Sharpe’a dla tej próby również wskazuje na lepsze dopasowanie względem ryzyka. W obu przypadkach niewielka i dodatnia wartość \(\beta\) świadczy o defensywnym charakterze portfela względem indeksu rynkowego.

3.7. Podsumowanie

3.7.1. Zestawienie wszystkich strategii

Rysunek 3.7.1. Equity line dla wszystkich strategii w okresie in-sample (a) i out-of-sample (a).
Źródło: Opracowanie własne na podstawie danych stooq.com.

W okresie in-sample wyróżnia się strategia oparta na akcjach banku ING i spółki MONNARI Trade, która generuje największy zwrot. Na sam koniec okresu trochę gorszy wynik daje portfel złożony ze wszystkich par, na których oparto strategię pair trading; wydaje się, że jest to jedyny przypadek, kiedy linia equity ma relatywnie jednostajny przebieg (poza znaczną częścią 2011 roku). Pozostałe pary nie generują strat w tym okresie, co więcej wszystkie rozpatrywane strategie dają lepszy rezultat na koniec próby in-sample w porównaniu do benchmarku.

W przypadku out-of-sample ponownie wyróżnia się para ING i MONNARI, jednak zyskowność strategii nie jest już tak spektakularna, jak w poprzednim przypadku. Podobną rentownością charakteryzuje się pair trading oparty na parze PZU i Grupa Azoty. W analizowanym okresie jest też jedna para, która przynosi straty i radzi sobie gorzej od benchmarku (SOHO Development i Mobile Internet Technology).

TPE i JWC ATT i PZU ING i MON PEO i AMC SHD i MIT Portfel
Zannualizowana stopa zwrotu (arytmetyczna) 0.1813 0.0929 0.3728 0.0934 0.2134 0.1908
Zannualizowana stopa zwrotu (geometryczna) 0.1704 0.0820 0.3723 0.0812 0.1827 0.2025
Zannualizowane odchylenie standardowe 0.2189 0.1686 0.3382 0.1752 0.3019 0.1127
Współczynnik Sharpe’a 0.0402 0.0192 0.0617 0.0186 0.0358 0.1066
Współczynnik Beta (wzg. kup i trzymaj WIG20) -0.0234 0.1357 0.1837 0.1211 -0.0924 0.0649
Maksymalne obsunięcie kapitału 0.2387 0.1279 0.2265 0.2384 0.2425 0.0929

Tabela 3.7.1. Zyskowność wszystkich strategii w okresie in-sample.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Analiza stóp zwrotu potwierdza wnioski uzyskane na podstawie oceny przebiegu linii equity: para ING i MONNARI generuje najwyższe zwroty w okresie in-sample. Jest to też strategia najbardziej ryzykowna (biorąc pod uwagę odch. standardowe), chociaż nie charakteryzuje się najwyższą wartością wskaźnika maximum drawdown (jest jednak w gronie par o największych współczynnikach). Najmniej zyskowne pary to Grupa Azoty i PZU oraz PEKAO i AMICA Wronki.

Wartości współczynnika Sharpe’a wskazują na to, że najwyższa premia za ryzyko na jednostkę ryzyka całkowitego przypada na portfel złożony ze wszystkich rozpatrywanych par, natomiast najniższa - para PEKAO i Amica Wronki. Najbardziej zyskowny pair trading, czyli ING i MONNARI, to drugi pod względem wielkości wsp. Sharpe’a.

Warto również zwrócić uwagę na to, że inwestycja w portfel jest najmniej ryzykowna - opisują go najniższe wartości odchylenia standardowego oraz maksymalnego obsunięcia kapitału spośród wszystkich rozpatrywanych strategii.

Dla dwóch par (TPE i JWC oraz SHD i MIT) \(\beta\) jest ujemna, natomiast pozostałe pary oraz portfel mają charakter defensywny względem indeksu rynkowego.

TPE i JWC ATT i PZU ING i MON PEO i AMC SHD i MIT Portfel
Zannualizowana stopa zwrotu (arytmetyczna) 0.1115 0.1472 0.1520 0.0906 -0.1045 0.0794
Zannualizowana stopa zwrotu (geometryczna) 0.0883 0.1382 0.1374 0.0814 -0.1763 0.0741
Zannualizowane odchylenie standardowe 0.2325 0.1886 0.2160 0.1573 0.4254 0.1256
Współczynnik Sharpe’a 0.0241 0.0416 0.0377 0.0272 -0.0188 0.0398
Współczynnik Beta (wzg. kup i trzymaj WIG20) 0.0437 0.0944 0.0151 0.0240 0.0773 0.0509
Maksymalne obsunięcie kapitału 0.2758 0.1850 0.1113 0.1225 0.5258 0.1671

Tabela 3.7.2. Zyskowność wszystkich strategii w okresie out-of-sample.
Źródło: Opracowanie własne na podstawie danych stooq.com.

Dla próby out-of-sample pod względem rentowności wyróżniają się trzy pary: Grupa Azoty i PZU, ING i MONNARI oraz SOHO Development i Mobile Internet Technology. Dwie pierwsze z nich przynoszą największe zwroty w omawianym okresie, natomiast ostatnia para jako jedyna generuje stratę. Charakteryzuje się ona zresztą najwyższymi wartościami statystyk opisujących ryzyko (odch. std. i maximum drawdown). Jest to o tyle ciekawe, ze względu na to, że w okresie in-sample od pary SOHO i MIT lepszy pod względem rentowności był tylko ING i MONNARI oraz portfel złożony ze wszystkich par.

Najbardziej rentowna para (mierzona geometryczną stopą zwrotu) - Azoty i PZU - to najwyższa premia za ryzyko, liczona wsp. Sharpe’a - jest pod tym względem lepsza niż portfel złożony ze wszystkich par. W przypadku pary przynoszącej straty, bardziej opłacalna jest oczywiście inwestycja w aktywa pozbawione ryzyka.

Spośród tych strategii, które przynoszą zysk w okresie out-of-sample, portfel skonstruowany na podstawie par “pair trading” jest najmniej rentowny, ale także najmniej ryzykowny, biorąc pod uwagę odchylenie standardowe, chociaż maksymalne obsunięcie kapitału nie należy do najmniejszych - pod tym względem lepsza jest jedna z dwóch najbardziej rentownych par (ING i MONNARI).

W wszystkich przypadkach współczynnik \(\beta\) jest dodatni i relatywnie niewielki; rozpatrywane strategie są defensywne względem indeksu rynkowego.

3.7.2. Zakończenie

Celem pracy było przedstawienie i weryfikacja strategii pair trading na przykładzie kilku spółek, których akcje są notowane na warszawskiej Giełdzie Papierów Wartościowych. Strategia ta posiada kilka wariantów i stosownie do założeń projektu, została oparta na koncepcji kointegracji szeregów czasowych.

Zgodnie z tą wersją strategii, pierwszym krokiem było znalezienie par spółek, które są skointegrowane w okresie in-sample. Ze względu na dużą liczbę notowań, procedurę poszukiwania takich par zautomatyzowano w oparciu o metodologię Engle-Grangera, która polegała w tym wypadku na sprawdzeniu stopnia zintegrowania obu szeregów czasowych, estymacji równania równowagi długookresowej, jeżeli rozpatrywane szeregi były zintegrowane w stopniu pierwszym, oraz analiza stacjonarności reszt z takiego równania. W przypadku tych szeregów, dla których reszty były \(\sim I(0)\), stwierdzono występowanie zjawiska kointegracji i były one przedmiotem dalszej analizy.

Po wylosowaniu pięciu par spółek (Tauron i JW Construction, Azoty i PZU, ING i MONNARI, PEKAO i AMICA, SOHO Development i MIT) ponownie przeprowadzono analizę kointegracji i omówiono jej wyniki, aby skontrolować rezultaty uzyskane przez zautomatyzowany algorytm. Jak się okazało, na przyjętym poziomie istotności wszystkie z wylosowanych par są skointegrowane w stopniu \((1,1)\). Na podstawie reszt z równania równowagi długookresowej wyznaczono próg otwarcia pozycji oraz sygnały otwarcia i zamknięcia w okresie in-sample, natomiast w przypadku próby out-of-sample nie przeprowadzano ponownie badania kointegracji, lecz wykorzystano ceny z tego okresu oraz próg i wektor kointegrujący z in-sample do wykonania identycznej analizy.

Wyznaczenie sygnałów umożliwiło obliczenie zyskowności strategii opartej na poszczególnych parach, a także pokazania kilku statystyk opisujących m.in. ryzyko, czy premię z nim związaną. Dodatkowo uwzględniono w obliczeniach portfel złożony ze wszystkich rozpatrywanych par (o równych wagach).

Wyniki w okresie in-sample wskazują na to, że strategia oparta na parze spółek ING Bank Śląski oraz MONNARI Trade charakteryzuje się największą stopą zwrotu, natomiast mniejszy zysk przynosi portfel złożony ze wszystkich par. Daje on jednak najwyższą premię za ryzyko na jednostkę ryzyka całkowitego; jest to też najmniej ryzykowna strategia. W przypadku omawianej próby pod względem rentowności wyróżniają się także takie pary jak: SOHO Development i MIT oraz Tauron i JW Construction.

Próba out-of-sample charakteryzuje się gorszymi wyniki, jeżeli chodzi o zyskowność strategii. Stopy zwrotu nie osiągają takiego pułapu jak w in-sample. Wyróżniające się pary to: Azoty i PZU oraz ING i MONNARI. Co ciekawe, tym razem portfel złożony ze wszystkich par okazuje się najmniej rentowny, ale nie towarzyszy temu najmniejsze ryzyko spośród wszystkich analizowanych par.

Interesujący wydaje się przypadek SOHO Development i Mobile Internet Technology. Jest to para, która generuje drugi lub trzeci pod względem wielkości zwrot (w zależności od miary) w okresie in-sample, natomiast dla out-of-sample jako jedyna przynosi stratę i radzi sobie gorzej od benchmarku. Towarzyszą temu także najwyższe wartości statystyk opisujących ryzyko. Wydaje się to potwierdzać obserwację Hoel (2013) dotyczącą przynależności pair trading do strategii arbitrażu statystycznego, w przypadku których istnieje możliwość poniesienia strat.

Bibliografia

S. C. Andrade et. al. Understanding the Profitability of Pairs Trading. Haas School of Business, University of California Berkeley. Kalifornia 2005.

P. Arendarski, Ł. Postek. Cointegration Based Trading Strategy for Soft Commodities Market. WNE Working Papers 68. Warszawa 2012.

Carl R. Bacon. Practical Portfolio Performance: Measurement and Attribution. John Wiley & Sons, Ltd. 2008.

Z. Bodie et. al.: Index Models. W: Investments. McGraw-Hill Education. 2014.

J. F. Caldeira, G. V. Moura. Selection of a Portfolio of Pairs Based on Cointegration: The Brazilian Case. Federal University of Rio Grande do Sul, Brazylia 2012.

C. L. Dunis et. al. Profitable Pair Trading: A Comparison Using the S&P 100 Constituent Stocks and the 100 Most Liquid ETFs. 2010.

W. Enders: Cointegration and Error-Correction Models. W: Applied Econometric Time Series. John Wiley & Sons, Inc. 2015.

M. Gągolewski. Programowanie i analiza danych w R. Wydział Matematyki i Nauk Informacyjnych, Politechnika Warszawska. Warszawa 2012.

C. H. Hoel. Statistical Arbitrage Pairs: Can Cointegration Capture Market Neutral Profits? Norwegian School of Economics. Bergen 2013.

V. Kishore. Optimizing Pairs Trading of US Equities in a High Frequency Setting. University of Pennsylvania, Wharton Research Scholars. 2012.

J. Mycielski. Ekonometria. 2010.

B. Peterson. Package PerformanceAnalytics: Econometric Tools for Performance and Risk Analysis. 2015.

G. Vidyamurthy: Statistical Arbitrage Pairs, Overview. W: Pairs Trading: Quantitative Methods and Analysis. John Wiley & Sons, Ltd. 2004.

Podstawowe informacje na temat spółek zaczerpnięto ze stron:

AMICA Wronki SA

Grupa Azoty SA

ING Bank Śląski SA

JW Construction SA

Mobile Internet Technology SA

MONNARI Trade SA

PEKAO SA

PZU SA

SOHO Development SA

Tauron Polska Energia SA