Poniżej prezentujemy oryginalne pytania z Facebooka oraz nasze odpowiedzi. Poprawiliśmy interpunkcję, drobne błędy jednak sens został zachowany.
Pytanie:
Skoro to taka świetna maszynka do robienia pieniędzy, to czemu sami na nim nie zarabiacie a wciskacie je innym?
Odpowiedź:
Niczego nie wciskamy, dostęp do grupy na Facebooku jest dobrowolny i darmowy. W tym momencie naszym celem jest zebranie feedbacku, merytorycznych opinii i uwag, czy nasz sposób predykcji jest ok, czy jest przydatny, co zmienić etc. To nie jest maszynka do robienia pieniędzy. Analiza behawioralna, czym zajmujemy się w ramach usługi Sentistock, może być ważnym wsparciem dla gracza. Jednak opieranie się wyłącznie na nim, uważamy za nierozsądne. Samo Sentimenti ma w swojej ofercie inne usługi, oparte na analizie emocji w tekstach.
Pytanie:
Narzędzie zrobiliście bardzo interesujące. Wierzę, że może mieć ono wiele zastosowań. Fajna robota! Niemniej przewidywanie sentymentów wokół instrumentu finansowego, a zrobienie zarabiającej strategii inwestycyjnej w oparciu o to narzędzie to zupełnie inne tematy. Podawane obecnie 87% skuteczności niewiele znaczy, bo może się okazać, że strata z pozostałych 13% błędnych predykcji będzie taka sama jak wypracowane zyski. Ogólnie podawanie w % trafności przewidywań w przypadku rynków finansowych raczej niewiele mówi o końcowym wyniku.
Odpowiedź:
Dlatego wystawiamy Sentistocka pod ocenę praktyków. Niestety, ale obawiam się, że nie uda nam się zaprognozować 100-procentowej trafności ;). Myślimy jednak, że jako narzędzie wspomagające decyzyjność, podpowiadające (agregujące) emocje na rynku, będzie przydatne dla inwestorów, graczy etc. Taki mamy do tej pory feedback.
Pytanie:
Jestem zdruzgotany, że parę milionów można zrobić tak bezużyteczne narzędzie… Takie rzeczy dofinansowuje tylko unia europejska – jeśli tak to bardzo “mądry projekt” ????????
Odpowiedź:
Czasami myślimy, że dla niektórych zbyt mądry ❤️
Pytanie:
Dlaczego 8, a nie 6 emocji?
Odpowiedź:
To pytanie przypomniało nam dyskusje w gronie naszych naukowców na początku projektu, dlaczego osiem, a nie sześć. Dlaczego emocje wg teorii Roberta Plutchika, a nie Paula Ekmana. Tutaj więcej.
Pytanie:
Odnoszę wrażenie, że właśnie dlatego badacie krypto waluty, bo tam jest ruch czysto spekulacyjny, zależny od artykułów i szumu, a nie realnej użyteczności, 99% krypto to niepotrzebne scamy. Ok a może jesteś w stanie podać Wasze historyczne predykcje z GPW? Tak, żeby pokazać, że to działa i jest jakaś powtarzalność wyników.
Odpowiedź:
W załączonym do artykułu raporcie w PDF masz całe badanie na GPW, pobierz sobie. Dzięki.
Pytanie:
Skąd dokładnie jest data feed, jeśli chodzi o media społecznościowe? To dane z jakichś konkretnych grup/osób? Jakie są kryteria co do jakości tych danych? Zakładam, że opinia byle Janusza, który mówi co innego, a robi co innego (albo w ogóle nie robi) nie jest brana pod uwagę?
Odpowiedź:
Crawlujemy dane z całego Internetu, Twitter, FB, strony, blogi wykop – wszystko, gdzie crawler znajdzie frazę BTC lub/i Bitcoin. Dziennie kilka tysięcy różnych wpisów. W każdym z nich mierzymy 8 emocji, sentyment pozytywny, negatywny i pobudzenie emocjonalne. Te dane zestawiamy przy pomocy modeli wyuczonych z zastosowaniem sztucznej inteligencji z kursami, na danych z dwóch lat – 2018 i 2019. Za każdym razem zestawiamy 3 ostatnie dni i na tej podstawie wyliczamy trend. Więcej szczegółów tutaj.
Pytanie:
W jaki sposób określacie, czy prognoza sprawdziła się, czy nie? Na przykładzie tej podanej na obrazku:
Odpowiedź:
Cały proces jest opisany tutaj
Pytanie:
Za narzędzie, które ma taka skuteczność już dawno by Was ktoś obsypał górą forsy i nie było by potrzeby wrzucać postów na grupach…czy popełniam błąd w rozumowaniu?
Odpowiedź:
Mamy zaproszenia do rund finansowania przez VC…ale nie o to chodzi. Chcemy feedback, co o tym sądzicie, czy nasz sposób predykcji jest ok, czy jest przydatny, co zmienić etc.
Pytanie:
“Po tych i dziesiątkach innych testów tak oto prezentują się wyniki najlepszego z możliwych zestawów zmiennych dla roku 2019, wyuczone na modelu z roku 2018”. Pytam, ponieważ post factum analizując tysiące korelacji może znaleźć korelację bitcoina z wszystkim i uzyskać podobny wynik, który nie ma nic wspólnego z rzeczywistością. Dopiero zafiksowanie zestawu wskaźników z takim pokryciem w 2019 i przeniesienie tego na 2020 i uzyskanie tego samego pokrycia potwierdzi skuteczność modelu… inaczej to chyba nie ma sensu…
Odpowiedź:
Uczyliśmy model na danych z 2018 i 2019, model generalnie jest douczany co jakiś czas. Od marca masz predykcje na naszej grupie, codziennie wstawiane (https://www.facebook.com/groups/sentistocks)
- za styczeń 2020: 88,89%
- za luty 2020: 86,21%
- za marzec 2020: 77,42%
- aktualnie za kwiecień 2020: 73,33%
Pytanie:
Planujecie stworzyć apkę, która wraz z sygnałami dawałaby dostęp do statystyk, umożliwiała komponowanie portfolio, powiadamiała dźwiękami o nowych sygnałach lub zmianach na rynku? Czy w przyszłości zostanie tylko grupa Facebooka?
Odpowiedź:
Dokładnie to planujemy. Taki SaaS dla inwestorów – wybierasz walory, które chcesz obserwować, w panelu masz dostęp do wszystkich wpisów dla obserwowanego waloru, możesz je filtrować sam po emocjach, czytać i sam analizować a jako dodatkową podpowiedź masz też nasz predykcje. Narzędzie do analizy behawioralnej dla swojego portfolio jako rozszerzenie dla własnych analiz – technicznej, fundamentalnej, nosa, cokolwiek.
Pytanie:
Czy udało się wam kiedyś wyłapać większe ruchy, np. 10%? Czy celowo jest to zaniżane do 2-3%? A może warto podzielić to na kilka kategorii ryzyka? Np. szansa na wzrost 2% wynosi 80%, na 4% – 70%, na 10% – 50%?
Odpowiedź:
Zasadniczo przewidujemy trend. Pozostałe dane są pomocnicze i naprawdę nie da się trafić w kurs. Zresztą kto potrafi. Tak, większe zmiany też przewidujemy, np. z 12 na 13 marca 2020 przewidywaliśmy spadek średniego kursu z 7 291,10 USD na 6 431,88 USD, czyli o 11,79%. Ale cóż z tego, jak kurs poleciał niżej, do 5 429,06 USD. Trend przewidzieliśmy, kurs nie.
Dlatego wyliczoną wartość kursu traktujemy jako siłę trendu.
Pytanie:
Czy testowaliście Wasze modele na innych czołowych krypto? ETH, XRP, LTC, etc.? Jak tak, to jak z powtarzalnością przewidywań?
Odpowiedź:
Jesteśmy na ukończeniu wersji wielojęzykowej. Jest ona niezbędna, ponieważ wzmianek dla altów w języku polskim jest dużo mniej niż dla BTC. Po wdrożeniu analizy emocji dla języka angielskiego (jest kluczowy, jeżeli chodzi o ilość wzmianek), będziemy mieli wystarczającą ilość danych do predykcji dla innych walut.
Docelowo planujemy obsługiwać top 10 kryptowalut.
Pytanie:
Na ten moment nie mogę za dużo powiedzieć, jednak sam sposób przekazywania informacji jest ok. Interesuje mnie jak będzie to wyglądało w przypadku predykcji większych ruchów, które pojawiają się w dużo szybszym tempie i raczej ciężko je zawrzeć w prognozie na 24h opierając się na wpisach w Internecie. Oczywiście mogę się mylić ????
Odpowiedź:
Predykcja 24h to na ten moment najkrótszy interwał, pod jakim możemy się podpisać bez szarlatanerii.
Pytanie:
Zastanawia mnie, dlaczego bazujecie akurat na polskich wpisach, przecież polska jest kropelka w bitcoinowym morzu. A lokalne odchylenie geograficzne może być znaczne, biorąc pod uwagę inne realia geopolityczne, szczególnie w aktualnej sytuacji.
Odpowiedź
- dopiero od maja nasz SentiTool (analizator emocji w tekście) zostanie rozszerzony o kolejne 17 języków. A SentiTool jest niezbędny do analizy emocji jako składowej predykcji kursów,
- wyniki pokazują, że nie ma to jednak szczególnego znaczenia. Przyznasz, że trafność predykcji na poziomie 70-80% jest już teraz bardzo wysoka i nie spodziewamy się dużego wzrostu na wzmiankach anglojęzycznych.
Ale na pewno w maju sprawdzimy i damy znać! 🙂
Pytanie:
Jak długo planujecie udostępniać predykcje na tym profilu?
Odpowiedź
Nie stawiamy sobie limitu. W pewnym momencie chcemy przejść na jakiś płatny model, ale na ten moment chcemy przede wszystkim otrzymywać feedback, na ile nasze wskazania są wartościowe w faktycznym zastosowaniu dla traderów
Pytanie:
Ile planujecie analizować wpisów dziennie, jeśli dojdzie kolejne 17 języków.
Odpowiedź
Dla predykcji BTC czy innych walorów kluczowy jest język angielski. Pozostałe języki znajdą zastosowanie w innych usługach Sentimenti.
Pytanie:
W jaki sposób analizujecie te wpisy manualnie czy macie jakiegoś robota, który robi to za was?
Odpowiedź
Wpisy analizujemy automatycznie oceniając emocje. Możesz spróbować, jak to działa, pobierając z naszej strony wtyczkę do przeglądarki i samemu przeanalizować dowolny tekst.
Pytanie:
Czy do predykcji kursu BTC również używacie tylko wpisów powyżej 25 słów?
Odpowiedź
Potrafimy analizować każdej długości tekst, 25 słów to ograniczenie dla zastosowań niekomercyjnych.
Pytanie:
Czy predykcje działają w oparciu AI z wykorzystaniem sieci neuronowych tzn. czy macie AI, które wyciąga wnioski na podstawie skuteczności predykcji?
Odpowiedź
Tak, predykcja odbywa się na wyuczonym na sieciach neuronowych modelu. Każdorazowo dla prognozowanego kursu bierzemy 3 dni wstecz, żeby model miał odpowiednią ilość danych. Model jest douczany co określony czas, żeby zwiększyć skuteczność.
Pytanie:
Czy analizujecie również alty bądź inne rynki i instrumenty na nich zawarte
Odpowiedź
Robiliśmy także testy z predykcją dla GPW, 40 spółek. Będziemy rozszerzać portfolio, tutaj czekamy na angielski, ponieważ np. pozostałe alty, nawet Top 10 mają zdecydowanie mniej wzmianek.
Pytanie:
Jutro weekend i to trend boczny, akurat w 24h się zrealizuje a od poniedziałku zmieni kierunek.
Odpowiedź
Analizujemy również w weekend, jutro i pojutrze będzie także predykcja. BTC jest notowany w trybie ciągłym, więc my też prognozujemy. 🙂
Pytanie:
Pytanie do autora. Czemu ma służyć ten projekt, w czym on pomaga? Jaki produkt dostarcza i sprzedaje? Pytam, bo nie bardzo rozumiem.
Odpowiedź
4 produkty na ten moment. Jeżeli chodzi o Sentistock, czyli finanse behawioralne, chcemy zbudować model predykcji kursów, jak podpowiedź dla inwestorów, traderów, etc.