wtorek, 29 grudnia 2015

Analiza szeregów czasowychAnaliza szeregów czasowych jest bardzo przydatna w handlu na giełdzie. W uproszczeniu są to modele, w których chcemy przewidzieć zmienną zależną, za pomocą jednej zmiennej niezależnej - czasu. W R mamy klasy "TS", XTS  do analizy lub inne klasy w pakietach, takich jak fseries, quantmod i timeseries.

Jak łatwo zauważyć, jest to temat podobny do postu: Trend jest twoim przyjacielem

Spójrzmy w kod: 
Library(quantmod)
getSymbols ('^ WIG20 ")class(WIG20)
 Wynik:[1] "XTS", "zoo" 

Oznacza to, że mamy dane w formacie szeregów czasowych. Możemy przeczytać w pomocy: 
"Ujednolicenie obsługi różnych klas danych R w oparciu o czas, zwiększa ochronę informacji zawartych w formacie i pozwala na dostosowanie do poziomu użytkownika i rozbudowy, przy jednoczesnym uproszczeniu międzyklasowej interoperacyjności". 

Najważniejsze pakiety w analizie szeregów czasowych:
 • forecasting -narzędzia do przewidywania
 • stats - modele autoregresywne, dekompozycja, filtrowanie
 • tseries - modele garch
 • mfilter - dekompozycja, filtrowanie
 • tseries,urca - stacjonarność
Do poprawnej interpretacji szeregi czasowe powinny być zgodne z tymi zasadami:
 •     Te same wskaźniki.
 •     Te same interwały.
 •     Studiowane wydarzenia powinny być w tych samych jednostkach
 •     Badamy szeregi czasowe między sobą.
W analizie szeregów czasowych istnieją dwa rodzaje metod, jedne oparte na częstotliwości, a drugie na czasie.
Bardzo ważne jest określenie, czy szeregi czasowe są stacjonarne lub niestacjonarne. Oznacza to, że musimy określić czy wariancja jest stała w czasie, czy nieskończona. Bardzo duża ilość metod ekonometrycznych bazuje na założeniu stacjonarności danych. Procesy niestacjonarne są nieprzewidywalne, a stacjonarne mają tendencję do powracania do swoich średnich wartości.

By pozbyć się niestacjonarności możemy zróżnicować dane, dane różnicujemy do momentu aż uzyskamy stacjonarność, jeżeli zrobimy to raz, to mówimy o danych pierwszego rzędu i tak dalej.

Przeprowadzimy więc test na stacjonarność danych, z pakietu tseries wybieramy adf.test.


library('tseries')
adf.test(wig20$Close)

Otrzymujemy wynik:

        Augmented Dickey-Fuller Test

data:  wig20$Close
Dickey-Fuller = -2.5234, Lag order = 17, p-value = 0.3567
alternative hypothesis: stationary

Nie udało się odrzucić hipotezy zerowej, więc zakładamy, że dzienne ceny zamknięcia wig20 są niestacjonarne.

getStooqData('wig20')
wig20 = getStooqData('wig20')
dw20 = diff(wig20$Close)
adf.test(dw20)
Tym razem okazuje się, że możemy prognozować zmiany wartości wig20, przy założeniu stacjonarności.

Jako wynik otrzymaliśmy wektor absolutnych wartości różnic cen zamknięcia poszczególnych dni. W pomocy funkcji widać, że można się bawić różnicując bardziej w tył i zmienić opóźnienia.

Bardzo ciekawym sposobem analizy szeregów czasowych jest ich dekompozycja, dzięki temu możemy uwzględnić efekty sezonowości i anomalii występujących w danych. Do wyboru mamy dwie metody dekompozycji:
 • addytywna- jeśli wariancja jest stała w czasie.
 • multiplikatywna - jeśli wariancja się zwiększa z upływem czasu.
Wpisujemy w R, aby otrzymać miesięczne stopy zwrotu z kghm:
library(quantmod)
library(tseries)
library(timeseries)

kgh = getStooqData('kgh')
prices = kgh[,5]
data = as.Date(kgh[,1])
ts =xts(prices, data)
m.ts= ts(monthlyReturn(ts), start = c(1997,7), end = c(2015,12), frequency = 12)

plot(m.ts)
 zmiany kghmu

Widzimy, że zmiany są mniej więcej równe. Więc użyjemy addytywnej dekompozycji szeregów czasowych:

decompose(m.ts, type = "additive")
Następnie interesuje nas wartość czynników sezonowych:

dekompozycja = decompose(m.ts, type = "additive") 
dekompozycja$seasonal
Dzięki temu możemy zauważyć że w lutym średnio kghm ma wyższą o 2,65 % stopę zwrotu od trendu, a w grudniu przeważnie traci 1,46 %.

Teraz to zobrazujemy:
plot(decompose(m.ts, type = "additive"))
dekompozycja zmian kghmu
Wykres został podzielony na trzy czynniki:
 • trend
 • sezonowość
 • błąd
Teraz widzimy w jakim trendzie znajdują się zmiany miesięczne kghm-u.

Natomiast zauważmy, że do analizy absolutnych wartości cen akcji kghmu, musimy użyć metody muliplikatywnej, z powodu zwiększającej się wariancji.
kgh.monthly <- ts[endpoints(data, on="months", k=1), ]
plot(kgh.monthly)
 wykres cen kghmu
kgh.m= ts(kgh.monthly, start = c(1997,7), end = c(2015,12), frequency = 12)
decompose(kgh.m, type = "multiplicative")
 dekompozcyja wykresu cen kghmu

2 komentarze:

 1. Fajne rzeczy piszesz i dobrze rozumiem że są to rzeczy potrzebne - bo sam czasem pisze u siebie o statystyce kursów, tylko dużo lepiej by było jeśli swoje skrypty robiłbyś w amibrokerze ew. metatraderze. Z prostego powodu - wielu graczy giełdowych je zna i czasem używa a R poza statystykami jest nieznane ;-)

  Ps. Podlinkowałem cię u siebie
  Pozdrawiam Krzabr z marketrevolution.eu

  OdpowiedzUsuń
  Odpowiedzi
  1. Cześć, niestety, nie każdy ma amibrokera i metatradera, a R jest za darmo, i jest lepszy, bo nie ogranicza się tylko do giełdy, Dodatkowo jest prosty i wysokopoziomowy. Dlatego, jeśli ktoś pragnie rozpocząć swoją przygodę z giełdą, lub zacząć robić analizy ilościowe na giełdzie, to jest to dużo lepsze rozwiązanie.

   Dziękuję za komentarz.

   Usuń