czy statystyka to hazard?

przez | 4 listopada 2019

Pojawiły się głosy,. że rozgrywanie statystyk to hazard. Cóż, jeden z głosów to osoba o bardzo dużej wiedzy rynkowej, więc postaram się odnieść do tych kwestii w tymże wpisie i odpowiedzieć na pytanie czy statystyka to hazard?

[otw_is sidebar=otw-sidebar-1]

czym jest statystyka?

W wielkim skrócie swoje statystyki opieram na pracy Larry’ego Williamsa, człowieka który prócz faktu że jest autorem paru książek dotyczących tradingu, to jeszcze wygrał jeden z ogólnoświatowych konkursów osiągając niepobitą dotychczas stopę zwrotu ponad 11 tysięcy procent. Nieco więcej o samym Larrym możecie przeczytać na Comparic’u, a o moim podejściu do statystyk tutaj.

uwagi Dawida

Dawid Spekulant to już praktycznie jedna z legend polskiego tradingu. W sumie sam fakt, że odnosi się do mojej pracy w sposób merytoryczny działa pozytywnie na moje ego 😉 Ale przejdźmy do samych „zarzutów”:

Statystyka nie jest prawdopodobieństwem. Ludzie tego nie rozróżniają. Jeżeli przez 10 lat DAX Futures 1 listopada rosły przez 58% czasu oznacza to mnie więcej tyle, że prawdopodobieństwo wzrostu DAX Futures 1 listopada wynosi 33.33% tyle samo co szansa na spadek.
Jeżeli DAX Futures wzrosną 1 listopada, nie jest to wynik wzrostu DAX Futures 1 listopada w ostatnich 10 latach. Podejmowanie decyzji na podstawie takich informacji to nic innego jak typowy „gambling”. Wyniki są przypadkowe.

Dawid @spklnt

źródło: Twitter Dawida Spekulanta @spklnt

To oczywiście „zbitek” trzech tweet’ów Dawida, oryginał jest na obrazku obok i na Twitterze 🙂 Czymże jest ta statystyka i czy działa?

analiza techniczna

Myślę, że nikomu nie muszę już tłumaczyć czym jest analiza techniczna albo fundamentalna. Warto jednak pokazać pewne różnice w analizie technicznej.

Dla większości ludzi analiza techniczna to zachowanie ceny względem cen w przeszłości (np poziomy wsparć i oporów), tworzenie potencjalnych poziomów na których dojdzie do jakiejś reakcji na cenie (np zewnętrzne poziomy Fibonacciego) czy zachowanie ceny na skutek powstania danej formacji świecowej (głowa z ramionami, „młotek”, spadająca gwiazda etc). To wszystko opiera się na analizie technicznej wykresu.

Statystyka w moim wykonaniu, opartym na pracy Larry’ego, to analiza zachowania ceny w określonym czasie. Z całkowitym pominięciem każdego innego aspektu – ale do tego „pomijania” przejdę później 🙂

Tak więc moja statystyka jest częścią szeroko pojętej analizy technicznej.

na czym bazuje statystyka?

Statystyka bazuje na zachowaniu ceny w określonym czasie. Tworzenie bazy danych w oparciu o dni handlowe a nie dni tygodnia czy kalendarzowe to po prostu jedno z podejść, które pozwala uniknąć nieprzewidywalnych zmiennych takich jak skutki ataku na World Trade Center w 2001 roku.

Co warto podkreślić, sporo osób uznaje że pewne zachowania wynikają z czynników naturalnych, takich jak pora roku, okazje typu równonoc czy fazy księżyca. Jeśli tak jest naprawdę (nie oceniam) to również statystyka oparta na reakcji ceny w konkretnym czasie będzie to odzwierciedlać.

zawarcie transakcji a jej prowadzenie

W dyskusji w komentarzach pod wpisem Dawida padło kilka przykładów, które są rodzajem prowadzenia pozycji a nie czynnikiem wejścia w daną transakcję. Zabezpieczenia pozycji krótkiej opcjami to coś zupełnie innego niż przyczyna wejścia w krótką pozycję.

Statystyka może być maksymalnie jednym z trzech niezbędnych elementów do zarabiania na rynkach, a te elementy to:

źródło: opracowanie własne

Statystyka może być całkowitą strategią, choć może być też wsparciem dla własnej strategii. Wiem, że są osoby co z powodzeniem korzystają ze statystyki jako uzupełnienie swojej strategii:

źródło: Facebook (wrzesień 2019)

Patrząc po liście wpisów z podsumowaniem statystyk za kilka miesięcy kiedy ten projekt wciąż badam, widzimy że transakcje zawierane na podstawie tych danych mają wysoką skuteczność: powyżej 70%! A tych transakcji było już kilkadziesiąt, więc całkiem niezła próba jak na kilka miesięcy. Oczywiście, wyliczenia są przy założeniu kompletnej strategii opartej na statystyce, której podstawy przypomnę na końcu tego wpisu.

statystyka to hazard?

W cytowanym fragmencie padła informacja o hazardzie. W jednym z komentarzy pojawiło się też określenia „wróżenia z fusów”.

Cóż, hazard to (wg jednej z definicji):

ryzykowne przedsięwzięcie, którego wynik zależy od przypadku

Słownik Języka Polskiego PWN

Gdyby się uprzeć to skutek każdej naszej decyzji jest wynikiem przypadku czyli hazardu. Przykład z życia? Wśród wszystkich utonięć około 5-6% to utonięcia w wannie oraz basenie. Dużo czy mało? To nie istotne, ważne jest coś innego – to że przeżyliśmy kąpiel w wannie jest dziełem „przypadku”. Z czego to bardzo naciągana teoria, ale tak samo uważam w powyższej kwestii.

Bo w mojej ocenie wykonanie pracy i znalezienie dowolnej przewagi statystycznej na rynku eliminuje „hazard” z zagrania. Oczywiście o ile inne czynniki też są nie-hazardowe, ale skupmy się na meritum. W momencie w którym zawieramy transakcję bo znaleźliśmy coś, co daje nam przewagę nad rynkiem nie jest hazardem – a po prostu przeprowadzeniem analizy i oszacowaniem prawdopodobieństwa – bo tego w pełni nigdy nie jesteśmy w stanie określić.

Więc przewrotnie zapytam: czy jest jakaś metoda wejścia w dowolną transakcję która nie jest „wróżeniem z fusów” albo hazardem? Jakakolwiek analiza wykonana opiera się na tym co (teoretycznie) wszyscy wiedzą lub widzą – no chyba że mówimy o tzw „inside tradingu” czyli czynności zabronionej prawem w której dysponujemy informacjami z „wewnątrz” spółki czy danego rynku, które nie są dostępne publicznie.

Ale prócz tego założenie, że mniejsza podaż czegokolwiek wpłynie na wyższą cenę tegóż produktu to wróżenie z fusów, bo nie wiemy czy świat się nie przerzuci na tańsze substytuty albo nie odejdzie w ogóle od danego produktu.

Dobre fundamenty spółki mogą się okazać analizą raportu rocznego Enronu z kreatywną księgowością i akcje spółki polecą na łeb na szyję. Może się też okazać, że prezes postanowi w kolejnym roku kupić niesprawdzone złoża ropy w Kazachstanie (przykład z polskiej spółki) i przez to akcje stracą ponad 90% wartości w niecałe 3 lata…

Czy więc to hazard? A może jednak wyjście z założenia, że prawdopodobieństwo wystąpienia takiego zdarzenia jest mniejsze niż 50/50? Czy takie założenie jest dobre? W książce „Najważniejsza rzecz” autor pokazuje, że nigdy nie jesteśmy w stanie przewidzieć wystąpienia wszystkich zmiennych ani tym bardziej prawdopodobieństwa ich pojawienia się.

statystyka a prawdopodobieństwo

Na początek słownik:

statystyka:

1. nauka zajmująca się liczbowym opisem zjawisk masowych oraz ich analizowaniem;
2. zbiory informacji liczbowych

Słownik Języka Polskiego PWN

prawdopodobieństwo:

szansa, że coś będzie miało miejsce; w matematyce: miara zdarzenia losowego

Słownik Języka Polskiego PWN

Myślę, że różnicę widać od ręki. Statystyka nie jest prawdopodobieństwem. Jednak bardzo często na podstawie statystyki możemy stwierdzić, że dane zdarzenie ma większe prawdopodobieństwo wystąpienia niż inne.

Dla przykładu: wiedząc, że w Polsce mamy tradycję odwiedzania grobów 1 listopada i w przeszłości ruch na drodze w okolicach tej daty był zwiększony niż np w okolicy 1 października (statystyka) to czy możemy założyć że 1 listopada 2020 roku także będziemy mieli zwiększony ruch na drogach (prawdopodobieństwo)?

Myślę, że tak. Choć może pojawić się zmienna w postaci np stanu wojennego, która jest bardzo mało prawdopodobna, ale jednak możliwa. Wtedy mimo wysokiego prawdopodobieństwa opartego na statystykach z ostatnich 30 lat okaże się, że drogi są puste…

Takich przykładów można mnożyć. Jednak zakładając powtarzalność na rynku – czyli de facto podstawowe założenie każdej analizy technicznej – to statystyka ma sens i może wpłynąć na ocenę prawdopodobieństwa wystąpienia danego kierunku w danym dniu na danym instrumencie.

pomijanie innych zmiennych

Jak wspomniałem, statystyka pomija inne zmienne na rynku, pokazuje jedynie kierunek ceny danego dnia handlowego w przeszłości. Wynika to oczywiście z pewnej subiektywności większości elementów analizy technicznej – takich jak wyznaczanie linii trendów po szczytach korpusów albo knotów świec dla przykładu. W przypadku statystyki patrzymy na konkretne, zawsze te same dane: ceny otwarcia (open) i zamknięcia (close) dla danego dnia (interwał D1). Nie ma miejsca dla subiektywności, czyste opracowanie danych.

Nawet we wrześniu 2001 roku, gdy giełda w Nowym Jorku była przez kilka dni zamknięta zastanawiałem się czy powinienem to jakoś ująć inaczej. Jednak to byłaby subiektywna ocena, więc po prostu nie zwracałem na to uwagi, podkreślam jedynie przy publikacji, że wrzesień ma to „zaburzenie” wynikające z nieprzewidywalnego czynnika zewnętrznego – bo kto z retail traderów bez dostępu do jakiś inside’ów miał wiedzę, że będzie taki atak i jego konsekwencją będzie zamknięcie giełdy?

zarabianie na statystykach oparte

źródło: opracowanie własnie

Jak na obrazku widzieliście, do zarabiania potrzeba trzech elementów: zarządzania kapitałem, strategii i psychiki. To ostatnie by dwa pierwsze elementy egzekwować – można to wyeliminować algorytmizacją, ale to inna bajka.

Do zarabiania na statystykach stworzyłem spójny system zarządzania kapitałem (ryzykiem) oraz wykorzystania statystyki. Trzeci element z obrazka to już jest zależny od każdego inwestora indywidualnie.

Wykonana praca, która w mojej ocenie jak i obiektywnej ocenie dotychczasowych badań daje przewagę nie jest hazardem.

A założenia strategii i zarządzania kapitałem są proste:

  • rozgrywanie każdej silnej statystyki (>70% dla długiej próby, >80% dla 10-letniej próby) – element strategii
  • otwarcie pozycji wg godziny handlu danym instrumentem – element strategii
  • zamknięcie pozycji na koniec godzin handlu danym instrumentem – element strategii
  • rozmiar pozycji dla każdego instrumentu dostosowany by 1% zmiany ceny instrumentu oznaczał 1% zmiany kwoty na rachunku – element zarządzania kapitałem

I to wystarczy by mieć spójną strategię opartą na mojej pracy statystycznej.

Pamiętajmy, że na rynku szukamy przewagi statystycznej: czy to w strategii czy w zarządzaniu kapitałem. Nasza analiza NIGDY nie jest w stanie uwzględnić wszystkich zmiennych ani określić prawdopodobieństwa ich wystąpienia. Dlatego musimy stosować uproszczenia i szukać innych metod. Jedną z nich może być np hedge czy inne rozwiązania z innymi instrumentami inwestycyjnymi (opcjami, ETF-ami etc). Jednak to wtedy jest tworzenie bardziej rozbudowanej strategii inwestycyjnej. Powyższa strategia jest przykładem jak można rozgrywać moje wyliczenia statystyczne.

I jak pokazuje sprawdzanie tego projektu – działa to. Więc albo mam naprawdę sporo szczęścia (jakoś w Lotto nigdy 6-tki nie trafiłem) albo to jednak nie hazard a przewaga (nie określę czy wynosi ona 51% czy więcej) wynikająca z badań i słuszności założenia, że rynek jest powtarzalny.

4 komentarze do „czy statystyka to hazard?

  1. Dawid

    Hej Bogusz. Na początku należy podkreślić, że statystyka nie jest hazardem i nie w tej kwestii to wypowiadałem. Wiem to Internet, nie wszystko da się opisać mając ograniczoną ilość znaków i można dwojako odebrać daną kwestię😊 „Gambling” odnosił się do kwestii handlu na podstawie tej konkretnej informacji, a nie statystyk całościowo 😊

    Wiesz czym tak naprawdę jest analiza techniczna? Analiza techniczna jest jak mechanika kwantowa. Jest sprzeczna ze wszystkim o czym się mówi i co jest przyjazne ludziom i ich rozumowaniu. Łatwiej jest zrozumieć stwierdzenie „Rynki rosną, bo są dobre dane z gospodarek, super wyniki spółek itp”, niż „rynki rosną, bo została wybita formacja klina”. Czym jest formacja klina? Co to za bzdety? – Tak pomyśli spora część ludzi.Zauważ, że ludzie wypowiadający się o analizie technicznej , po prostu jej nie rozumieją. A jak czegoś nie rozumiemy to najłatwiej jest to zanegować. Oczywistym jest, że rynki nie rosną bo została wybita formacja z klina, ale część uczestników rynku mogła podjąć decyzję o zakupie, bo cena znalazła się powyżej formacji klina. Dlaczego porównanie do mechaniki kwantowej?

    Przez wiele wiele lat ludziom było znacznie wygodniej przyjmować założenia mechaniki klasycznej (newtonowskiej), bo zdawały się logiczne. Jabłko spada, jest przyciąganie. Ziemia się kręci w okół słońca, jest przyciąganie. Coś popchniesz, potoczy się bliżej lub dalej w zależności od użytej siły itd. Aż tu nagle pojawia się znikąd gość Heisenberg i mówi „Panie, Panowie wasze wyobrażenia o prawach rządzących światem i kosmosem są błędne” na dowód daje swoje bardzo skomplikowane wzory matematyczne. Wykazuje, że ruch tego i tamtego nie wynika ze „statystyk” przyjętych dla wszystkiego, a jest kwestią przypadku. Odróżnił statystykę od prawdopodobieństwa. Np. Położenie cząstek jest prawdopodobieństwem, a nie wynikiem jakiejś statystyki.

    Rozumiesz już do czego zmierzam?

    I teraz weźmy na warsztat Twoje podejśćie. Piszesz „Jeśli tak jest naprawdę (nie oceniam) to również statystyka oparta na reakcji ceny w konkretnym czasie będzie to odzwierciedlać.” Zakładasz sobie pewien model np. handel na porę roku, sesję giełdową, fazę księżyca itp. Problem jaki pojawia się w takim założeniu to nie wiesz jak handlować (long/short) np. podczas nowiu, pełni, czy 5 listopada. Sprawdzasz więc zachowanie „ceny” na podstawie „nieistniejącego efektu” w przeszłości. Zauważasz, że podczas pełni/5 listopada DAX rósł przez 80% czasu i jeśli otworzysz pozycję długą to zarobisz. Podczas nowiu/10 listopada DAX spadał przez 80% i jeśli otworzysz pozycję krótką to zarobisz. 12 listopada przez ostatnie x czasu DAX rósł przez 58% czasu – raz byś zarobił, raz stracił.

    Co robisz i co by większość osób zrobiła?

    Wybrała te daty, kiedy DAX rośnie/spada przez 80% czasu. Czyli randomowo wybierasz ten parametr, który dał najlepszy rezultat w przeszłości. Konkluzja dla osób wybierających parametr 80% będzie następująca „To działa!”. Nie wiem jak tu wstawić fotki, ale pod jednym z tweetów wrzuciłem Ci analizę z wykresem, że jest to całkowicie randomowe podejście. Sam fakt, że oparte jest o nieistniejący efekt również stanowi o randomie.
    Piszesz, że bazujesz na założeniach Williamsa i aplikujesz to na wiele rynków. To niestety jest tzw. Heurystyka reprezentatywności ( ciężkie słowo do wymówienia 😊 ). Ale już pomijając to, najistotniejszym błędem, który popełniłeś (najpewniej nieświadomie i jest to coś zupełnie normalnego) to tzw. wątpliwa praktyka badawcza, gdzie kierujesz się zbyt mocną motywacją do tego by wyniki (zysk z long/short) potwierdzał to, że można zarabiać handlując na czynnik niemający jakiegokolwiek znaczenia jakim jest np. faza księżyca. Nie stosujesz niezależnych prób losowych w swoich wynikach, a opierasz się jedynie na wyniku DAX spadał/rósł przez X czasu. Profesjonalnie to się nazywa p-hacking.

    Co byś musiał zrobić aby dokładnie przeanalizować to i dojść do wniosku, że wynik jest randomowy? Najlepiej zrobić test Monte Carlo. Samo osiągnięcie zysku nie jest wynikiem tego, czy coś działa, a może być dowodem że wybrałeś randomowy parametr w ramach tzw. „szczęśliwego trafu”.

    Wracając do przytoczonego na początku prawdopodobieństwa. Co do zasady jakakolwiek strategia może wygenerować trzy pozycje: long/short/neutral. Pomińmy na chwilę aspekt decyzyjności popytu i podaży. Jeżeli są trzy możliwości to bez żadnych ogródek można zastosować diagram Vena, mówiący że prawdopodobieństwo wystąpienia jednego zdarzenia wynosi 1/3. Oczywiście może się zdarzyć, że rynek pójdzie w górę lub w dół wtedy prawdopodobieństwo takiego zdarzenia wynosi 2/3. Neutral zawsze będzie 1/3 bo rynek nie może iść ani w górę, ani w dół by być neutral.
    Cofnijmy się do Heisenberga… Jakie jest prawdopodobieństwo, że DAX rośnie/spada tylko dlatego, że jest piątek xx listopada? 0%. Jeżeli long potraktujesz jako prawdopodobieństwo, bo tym w rzeczywistości jest… to jakie jest prawdopodobieństwo że bid > ask wywoła 33%? 100%. Czy był to wynik piątku xx listopada? Nie. Czy większy bid > ask to wynik wybicia klina? Nie. Natomiast charakterystyka tzw. price discovery na podstawie historycznych wybić klinów przy szczytach/dołkach itd. daje już zupełnie inny kontekst, którego brakuje w randomowym podejściu jakim jest handel na zasadzie „DAX będzie rósł, bo kiedyś rósł w ten dzień”.

    Jest trochę późno i nie wiem, czy to dobrze opisałem. Jak coś niezrozumiale to napisz 😊
    Pozdrawiam

    Odpowiedz
    1. BJK Autor wpisu

      To określenie „Heurystyka reprezentatywności” musiałem sprawdzić w słowniku 🙂

      Co do zasady możesz mieć rację. Tylko teraz jedna kwestia: moje statystyki są generalnie (póki co) czytane przez Polaków i to w zasadzie retaili. Więc oni nie mają wpływu na cenę, zwłaszcza że większość „zasuwa” na CFD. Więc to, że cena rośnie nie wynika z moich statystyk (choć humorystycznie ktoś już napisał, że SPX rośnie pewnego dnia mimo że Trump nic nie tweetnął, ale dlatego że tak wychodzi ze statystyk – nie powiem rozbawiło mnie to :)).
      Wracając do meritum – robiąc statystyki nie miałem pojęcia czy to działa. Larry ma model który twierdzi że działa. Nie udało mi się zreplikować jego modelu, natomiast uznałem, że można sprawdzić czy to działa. I tu się pojawia kwestia matematyki i liczb. Jak długo randomowo można mieć rację? Ile transakcji musi być wykonanych by stwierdzić, że to działa/nie działa? I jak to ocenić obiektywnie?

      Moim zdaniem się nie da. Jak przyjdzie taki moment, że skuteczność transakcji zawarta na podstawie silnych (W mojej ocenie) statystyk będzie w okolicach 50% będzie to oznaczało randomowość. Na przestrzeni kilkudziesięciu transakcji (zapewne jest to liczba już przekraczająca setkę) jest to reprezentatywna próba.

      Patrząc na to co się dzieje na rynku też pewnie nie raz widziałeś, że mimo dobrej informacji ze spółek cena indeksu/spółki spadała – bo ktoś duży kupił plotki o dobrych danych i realizuje zyski. Co oznacza, że poruszanie się ceny na rynku może być irracjonalne i oparte na niewiadomej. Co oznacza, że ciężko jest znaleźć w pełni racjonalną (myślę że to kluczowe) i skuteczną metodę. Sam fakt, że część dużych graczy wtapia kasę, którą zbierają inni duzi gracze inwestujący na tym samym walorze (źródło: https://www.bloomberg.com/news/articles/2018-08-15/deutsche-bank-traders-said-to-reap-35-million-on-turkey-turmoil ). Robiąc badania na żywym rynku przez pewien czas oczywiście jest pewna przypadkowość – ale jak wyniki się powtarzają to spada przypadkowość i rośnie skuteczność metody – no chyba że mimo coraz większej próby badawczej przypadkowość pozostaje na tym samym poziomie?

      I z tego co wiem to na płynnych rynkach nie ma pozycji „neutral”. W godzinach handlowych bardzo rzadko się trafia dzień że cena nie zamknęła się co najmniej 0,01% w górę lub w dół od otwarcia. Trafienie na taką godzinę jest jeszcze mniej prawdopodobne. Więc rozkład po 33% na wzrost, spadek i neutral jest błędnym założeniem. Lata temu, gdy OHLC na interwale D1 miało identyczną wartość było oczywiście inaczej.

      Odpowiedz
  2. Michał

    Bogusz,
    strategia jest interesująca ale dobre wyniki nie wystarczają do potwierdzenia jej skuteczności. Brakuje silnych przesłanek merytorycznych (co ma kalendarz do zachowań inwestorów?). Możemy sobie łatwo wyobrazić, że np. w 2020 nie robimy roku przestępnego. Albo przestawiamy się na kalendarz juliański.

    Moja propozycja jest taka, abyś udostępnił jakiś plik .xls z historią Twoich transakcji (instrument, dzień, long/short, wynik procentowy). Wtedy będziemy mogli łatwo ocenić czy efekty Twojej strategii są przypadkowe czy nie.

    Zakładając losowy model giełdy (50% szans na wzrost, 50% szans na spadek danego dnia), prawdopodobieństwo wygenerowania silnego sygnału (>80%) na próbie 10-letniej wynosi ok. 5.8%. To znaczy, że w ciągu miesiąca (ok. 20 dni handlowych) powinieneś dostać średnio jeden silny sygnał z hakiem (dokładniej 1.16). Czy dostajesz więcej? Ile masz sygnałów na longa a ile na shorta?

    Pozdrawiam

    Odpowiedz

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *