utworzone przez Agnieszka Czoska | sty 23, 2019 | Okiem badacza
8 emocji podstawowych – tyle analizujemy narzędziami Sentimenti. Co właściwie analiza emocji daje takiego, czego nie nie oferuje analiza sentymentu? Po co nam aż 8 emotek do opisania każdego zagadnienia, którym się zajęliśmy do tej pory? I co one właściwie znaczą?
8 emocji podstawowych. Jakie emocje analizujemy w Sentimenti?
Narzędzia Sentimenti wykorzystują model Plutchika, w którym znajdują się dwie emocje pozytywne: radość i zaufanie, dwie ambiwalentne: zaskoczenie i oczekiwanie, i 4 raczej negatywne: smutek, strach, wstręt i złość. Każda oznacza coś konkretnego, wiążą się z działaniem, pochwałą lub krytyką, potrzebą czy niespodzianką. Omówimy je po kolei.
Dzięki analizowaniu wszystkich emocji podstawowych możemy w pełni ocenić, na przykład, jak bardzo w opinii internautów różnią się najpopularniejsze marki modowe. Możemy także prześledzić zmiany emocji w czasie wyświetlania tak angażujących publiczność seriali jak Zniewolona czy Czarnobyl.
Radość i smutek a analiza sentymentu
Te dwie emocje najsilniej kojarzą się z prostym podziałem na pozytywne i negatywne, czyli analizą sentymentu. Omówimy je jako pierwsze i osobno od pozostałych sześciu, ale nie dlatego, że faktycznie są tożsame z sentymentem. Byłoby to krótkowzroczne uproszczenie wyników działania naszych narzędzi i modelu Plutchika.
Radość dotyczy wszystkich pozytywnych reakcji, wiąże się z uśmiechem, z poczuciem, że coś nam się podoba. Tak zdefiniowana jest dość podobna do “pozytywnego sentymentu”, a jednocześnie niekoniecznie silna. W tym ostatnim aspekcie różni się od potocznie rozumianej radości, która kojarzy się z mocno pozytywną reakcją na coś. W wynikach naszych badań wszelkie pochwały podwyższają słupki radości, ale także codzienna grzeczność.
Smutek oznacza stratę, poczucie osamotnienia. To emocja przeciwstawna do opisanej wyżej, razem z radością tworzą w kole Plutchika kontrastową parę. Oznacza to między innymi, że wyrażanie naraz obu tych emocji w podobnym natężeniu (tu mówimy już o wynikach SentiTool, czyli procentowym podziale na poszczególne emocje) świadczy o konflikcie, bardzo mieszanym nastawieniu autora tekstu (lub autorów) do tematu. W perspektywie psychologicznej, z której wywodzi się model Plutchika, oznaczałoby niezbyt zdrową czy niekomfortową sytuację. Nie da się w ten sposób interpretować porównywalnego natężenie pozytywnego i negatywnego sentymentu.
Interpretacja wyników
Interpretacja radości i smutku może iść nieco innymi ścieżkami niż ta dotycząca sentymentu, ale na ile te miary są od siebie różne? W Sentimenti posługujemy się dwoma modelami wydźwięku tekstu, więc możemy to zmierzyć. W naszych badaniach, policzyliśmy także związki pomiędzy poszczególnymi emocjami i sentymentem. Korelacja (posługujemy się tu miarą r-Pearsona) większa od 0.6 nazywana jest silną, a zbliżona do 0,9 oznacza, że dwie zmienne są w zasadzie tym samym. W analizie dotyczącej KNF ten współczynnik wynosił w przypadku radości 0,88. a smutku 0,47. Z kolei w badaniu nad wzmiankami o Brand24 korelacje były odwrotne: 0.37 i 0.58. Zawsze mówimy tu o relacji pomiędzy radością i pozytywnym sentymentem oraz smutkiem i negatywnym sentymentem.
Jak widać, w zależności od tematu, pozytywny czy negatywny sentyment może brać się prawie w całości z jednej emocji (jak w przypadku radości w KNF), ale może być wynikiem wyrażania przez internautów wielu różnych emocji naraz. Wyniki dotyczące smutku i radości nie muszą wiązać się bezpośrednio z tymi uzyskanymi w analizie sentymentu – co pokazuje także, że jest ona wynikiem występowania w tekstach wielu różnych emocji naraz.
6 pozostałych emocji podstawowych
Jak pokazaliśmy, radość i smutek nie są po prostu “małym sentymentem”. Mówimy tu o dwóch różnych modelach, jednym binarnym, a drugim obejmującym 8 kategorii. Przejdźmy do pozostałych 6 emocji. Pokażemy, że one także niekoniecznie równają się pozytywnemu lub negatywnemu sentymentowi.
Zaufanie to wyrażanie poczucia bezpieczeństwa, spodziewania się, że coś będzie działo się w sposób, jakiego oczekujemy. Wiąże się z poczuciem wspólnoty, bliższymi relacjami, znalezieniem swojego miejsca w grupie. Może kojarzyć się także z odczuwaniem wzajemnego podobieństwa.
Wstręt to wyraz obrzydzenia, bardzo silnej krytyki i niechęci. Wyrażając go wskazujemy, że coś jest dla nas oburzające, obce, niemoralne. To silna emocja wiążąca się z reakcją odrzucania, unikania czegoś. Wiele obraźliwych przezwisk określających nieakceptowane społecznie grupy kojarzy się właśnie ze wstrętem.
Złość – kolejne silne odczucie, bardzo negatywne. Zamiast z unikaniem, wiąże się z atakiem, prowadzi do agresji. W ten sposób wyrażamy groźby, ale także niezadowolenie. Towarzyszą jej przekleństwa i krzyk (w mowie, w piśmie może być wyrażany mocniejszymi słowami).
Strach, jak w życiu, towarzyszy niebezpieczeństwu, zagrożeniu i ryzyku. Kojarzy się z ucieczką, chęcią schowania się. Jest także wołaniem o pomoc.
Zaskoczenie pojawia się w sytuacji, kiedy nasze przewidywania nie spełniają się lub po prostu spotyka nas coś niespodziewanego. W połączeniu z radością daje zachwyt, a ze smutkiem – rozczarowanie. Może mieć bardzo różne natężenie, od lekkiego zdziwienia po (wiążącą się także ze strachem) panikę.
Oczekiwanie – ostatnia z badanych przez nas emocji. Odwrotność zaskoczenia, bo oznacza stawianie predykcji i wiarę w to, że się spełnią. Może w związku z tym wiązać się z niepokojem lub ekscytacją, a więc także jest ambiwalentna.
W zależności od tematu, poszczególne emocje mogą korelować ze sobą nawzajem lub z miarami sentymentu. Na przykład, w danych dotyczących KNF strach umiarkowanie łączył się z negatywnym sentymentem (0,4), a złość wiązała się odwrotnie proporcjonalnie z pozytywnym (-0,44). Co ciekawe, podobnie odwrotnie proporcjonalnie (ok. -0,45) korelowały z radością zaufanie i oczekiwanie. To bardzo intrygujący wynik pokazujący nam, że pozytywne emocje, po pierwsze, nie są wszystkie ze sobą powiązane, i niekoniecznie przyrost jednej przekłada się na wzrost udziału drugiej.
8 emocji ma sens
Opisanie wydźwięku tekstu, portalu czy świadomości marki na skalach 8 emocji daje nam ogrom informacji. Czasem najważniejsze mogą okazać się jedynie trzy emocje z całego modelu, ale dowiemy się tego dopiero mając wgląd w całość.
Emocje w tytułach portPortale informacyjne są bardzo zróżnicowane pod względem wydźwięku strony startowej (więcej w tym wpisie)
Po pierwsze, analiza sentymentu to coś innego niż analiza emocji, mówimy tu o dwóch wspierających się modelach. Na podstawie wyników jednego z nich można przewidzieć do jakiegoś stopnia wyniki drugiego – ale jedynie orientacyjnie. Analiza emocji oferuje znacznie lepszy wgląd w to, co dokładnie komunikują badane teksty i jakie mogą mieć konsekwencje. Na przykład złość jest lepszym katalizatorem konfliktu czy spadku popularności danego produktu niż smutek. Z kolei spadek zaufania jest groźniejszy niż zmniejszenie się radości. Wykres powyżej pokazuje, na jak różne emocje stawiają portale informacyjne w zależności od swojego charakteru i grupy docelowej.
Poszczególne emocje są przez nas nie tylko różnie opisane, ale jakościowo różnią się w odbiorze czytelnika tekstu (zbadaliśmy to na 22 tysiącach osób) oraz w zamyśle jego autora. Więcej zaufania niekoniecznie oznacza więcej radości – to bardzo różne odczucia i czasem może okazać się, że się nawzajem wykluczają. To emocje podstawowe, więc powinny być od siebie niezależne. Jednocześnie tworzą system i czasami wchodzą w interakcje, chociażby jedna wypiera drugą.
Jeśli chcecie wiedzieć więcej o analizie emocji, napisaliśmy także o dobrych praktykach pozwalających na wyciągnięcie wartościowej wiedzy z pomiaru emocji narzędziami Sentimenti.
utworzone przez Agnieszka Czoska | sty 16, 2019 | W mediach
Cała ekipa skupiona wokół projektu Sentimenti rozmawia ze sobą przynajmniej raz na tydzień, a co miesiąc podsumowujemy kolejne sprinty (pracujemy w miesięcznym harmonogramie i metodologii scrum). Większość naszych spotkań odbywamy zdalnie, ale od czasu do czasu organizujemy takie, na którym wreszcie spotykamy się na żywo. W tym tygodniu w naszym poznańskim biurze omówiliśmy efekty prac z ostatniego kwartału i plany na kolejny rok. Jesteśmy w przełomowym momencie, wypracowaliśmy produkt gotowy do puszczenia w świat, więc z dwóch filarów R&D zaczynamy wreszcie stawać pewniej na tym biznesowym. Będziemy rozwijać SentiToola i EmoToola, ale myślimy już też o kolejnych projektach badawczo-rozwojowych.
Szykują się dla nas spore zmiany, bo dotychczasowy biznesplan powoli się kończy. Zwracają się do nas nowi klienci, rozmawiamy z zainteresowanymi, pokazujemy kolejne funkcjonalności SentiToola. Wraz ze wzrostem naszej organizacji rozpoczęto prace nad wprowadzeniem – dla osób zaangażowanych w projekcie Sentimenti – programu pozwalającego na kapitałową partycypację w jego efektach.
Zespół Sentimenti, od lewej: Jan Kocoń, Katarzyna Klessa, Grzegorz Stefański, Małgorzata Wierzba, Agnieszka Czoska, Konrad Juszczyk, Dariusz Gall, Damian Grimling i Maciej Piasecki
Sukcesy projektu
SentiTool był najważniejszym tematem naszego spotkania. Rozwijamy go nie tylko dokładając kolejne rozwiązania techniczne, ale także gromadząc wiedzę. Właśnie kończy się kolejne z naszych badań, prowadzona we współpracy z panelem Ariadna “ewaluacja emocjonalna” kilkudziesięciu tysięcy polskich słów. Wyniki naszych analiz sentymentu i emocji w tekstach staną się dzięki nim jeszcze trafniejsze, bardziej odpowiadające prawdziwym reakcjom ludzi na to, co czytają. Jednocześnie przygotowaliśmy już kolejne badanie, którego uczestnicy będą oceniać wydźwięk dłuższych tekstów. Niektóre z nich zawierają emotikony, więc pogłębimy naszą znajomość tej “pisanej intonacji”, której zaczęliśmy się przyglądać już kilka miesięcy temu.
Etyka w badaniu emocji
Poruszyliśmy też temat, który wyłonił się w naszych rozmowach niedawno. Zajmowanie się emocjami wymaga od nas nie tylko rzetelności, ale także etycznego postępowania. Wiemy, że SentiTool może przeanalizować każdy tekst na dowolny temat. Jednocześnie uważamy, że nie powinniśmy brać na warsztat osobistych tragedii, nawet szeroko dyskutowanych w mediach. Analizy emocji związanych z żałobą nie będą przez nas publikowane. Zastanawialiśmy się także, jakie stanowisko przyjąć w stosunku do tak aktualnych zjawisk jak hejt czy mowa nienawiści, zwłaszcza że jednym z flagowych celów SentiToola jest wykrywanie potencjalnych konfliktów między rozmówcami.
Plany na przyszłość
Chcemy zrobić coś naprawdę wielkiego. Przygotowujemy się do otwarcia kolejnych projektów biznesowo-naukowych. Nie możemy póki co zdradzić szczegółów, ale pogłębimy i poszerzymy SentiToola, może stworzymy kolejne narzędzia do jeszcze bardziej zaawansowanej analizy emocji w tekście.
Z bliższych planów – dodamy kolejne funkcjonalności do naszych narzędzi, żeby powoli wyłaniała się z nich całość, którą będzie można oferować jako aplikację SaaS. W międzyczasie sprzedajemy usługi – przeprowadzane przez nas analizy emocji, raporty i interpretacje (np. podpowiedzi, jaki tekst ma najlepszy efekt na odbiorcę, wnioski z monitoringu mediów społecznościowych). Szykujemy także publikacje naukowe i popularnonaukowe opisujące wyniki naszych badań.
Chwalimy się koszulką Sentimenti podczas spotkania w poznańskim biurze projektu
utworzone przez Agnieszka Czoska | sty 8, 2019 | Okiem badacza
Rozmowa z Moniką Riegel i Małgorzatą Wierzbą, psycholożkami z z LOBI (Pracownia Obrazowania Mózgu – Laboratory of Brain Imaging) współpracującymi z nami w projekcie SENTIMENTI.
W LOBI zajmujecie się obrazowaniem mózgu, a czym się różni praca dla Sentimenti od pracy w Laboratorium?
W LOBI realizujemy głównie tzw. badania podstawowe w celu zdobywania nowej wiedzy o podstawach zjawisk, bez nastawienia na bezpośrednie praktyczne zastosowanie lub charakter użytkowy. Tymczasem w ramach projektu Sentimenti prowadzimy działalność badawczo-rozwojową. Właściwie dążymy do osiągnięcia kompromisu: przy zachowaniu całej poprawności metodologicznej trzeba zastanowić się, na jakie innowacyjne elementy jest zapotrzebowanie i jak wyniki naszych badań przełożyć na produkt, w sposób maksymalnie przyjazny użytkownikowi.
Jak doświadczenia z LOBI pomagają w Sentimenti?
W Sentimenti występujemy w roli ekspertów od badań nad emocjami oraz ich wpływem na różne procesy psychiczne. Z naszego punktu widzenia, to jakie emocje wywołują w ludziach słowa, możemy badać dwojako. Podstawowym źródłem wiedzy na temat emocji odczuwanych przez uczestników badań są dane deklaratywne, czyli samoopisowe. Z drugiej strony, o emocjach możemy wnioskować też na podstawie wiedzy o towarzyszących im procesach fizjologicznych i neuronalnych. Prowadzimy zatem także badania z zastosowaniem takich metod psychofizjologicznych jak okulografia (ang. eye-tracking, ET) oraz metody neuroobrazowania takie jak funkcjonalny rezonans magnetyczny (ang. functional magnetic resonance, fMRI).
Zupełnie innym aspektem pracy w LOBI, który bardzo nam pomaga w realizacji projektu Sentimenti, jest umiejętność pracy w interdyscyplinarnym zespole. Ponieważ neuronauka leży właściwie na pograniczu dziedzin, prowadzenie badań w LOBI wymaga współpracy wielu specjalistów z różnym zapleczem wiedzy i umiejętności. Mamy w swoim zespole psychologów, biologów, statystyków, fizyków, programistów, itd. Dzięki temu łatwiej nam odnaleźć się w projekcie Sentimenti, który wymaga owocnej współpracy naszego zespołu z inżynierami, lingwistami, programistami oraz przedstawicielami biznesu.
A co was w projekcie Sentimenti zaskoczyło?
Zupełną nowością było dla nas zarządzanie projektem w ramach metodyki scrum. Przyjęcie jej pozwala nam realizować ogromny projekt, w który zaangażowani są członkowie różnych zespołów, nie tylko zajmujący się odmiennymi dyscyplinami, ale także pracujący w różnych miastach, a nawet okresowo w różnych strefach czasowych i na różnych kontynentach. Zgodnie z metodyką scrum dzielimy rozwój projektu na iteracje w określonych ramach czasowych, po których dostarczamy kolejne, coraz bardziej dopracowane wersje finalnego produktu. Duży nacisk położony jest na organizację pracy zespołu projektowego, przy czym niejednokrotnie przyszli użytkownicy produktu włączani są w proces jego powstawania.
Wasze doświadczenia w LOBI obejmują między innymi opracowanie bazy słów emocjonalnych – jak te doświadczenia przydają się w Sentimenti?
Rozpoczynając w LOBI badania nad emocjami wyszliśmy z założenia, że podstawowym zadaniem dla badaczy procesów emocjonalnych jest dobór odpowiedniego materiału, który w sposób kontrolowany wywoływałby określone emocje. Dlatego zdecydowaliśmy się stworzyć bazę polskich słów emocjonalnych Nencki Affective Word List (NAWL), która zawiera prawie trzy tysiące polskich słów opisanych pod względem tzw. wymiarów emocji, czyli znaku emocji (czy coś jest negatywne czy pozytywne) oraz pobudzenia (jak bardzo coś jest pobudzające). Ponadto słowa zawarte w bazie NAWL zostały opisane pod względem intensywności konkretnych kategorii emocji, a więc: radości, złości, smutku, strachu i wstrętu. Zarówno dane zawarte w bazie NAWL, jak i dane zawarte w Słowosieci (tj. wordnecie stworzonym przez zespół z Politechniki Wrocławskiej) zostały wykorzystane na początkowym etapie projektu. Porównywaliśmy wtedy dane zawarte w obu bazach z wynikami realizowanych w ramach Sentimenti badań CAPI i CAWI, gdzie ocenialiśmy rzetelność zbieranych danych.
Z naukowego punktu widzenia – jaka jest wartość badań realizowanych w Sentimenti?
O wartości naukowej badań w Sentimenti najlepiej będzie świadczyło to, że wyniki projektu zostaną opublikowane w czasopismach naukowych o zasięgu międzynarodowym oraz będą prezentowane na konferencjach naukowych. W ten sposób oferujemy dostęp do wyników projektu zarówno badaczom, jak i wszystkim innym zainteresowanym osobom.
Wartość naukowa badań prowadzonych w projekcie jest tym wyższa, że badania prowadzone są przez zespoły ekspertów z różnych dziedzin, a więc są interdyscyplinarne. Dzięki łączeniu metodologii badań psychologicznych w LOBI z metodologią badań z zakresu lingwistyki obliczeniowej na Politechnice Wrocławskiej, jesteśmy w stanie czerpać z doświadczeń wyniesionych z obu dziedzin i badać emocje wyrażane w języku polskim na wielu poziomach.
Zajmujecie się związkami pomiędzy emocjami i pamięcią. Jakie emocje was interesują?
W swoich badaniach nad wpływem emocji na pamięć, w oparciu o koncepcję tzw. emocji podstawowych skupiliśmy się na kilku uwarunkowanych biologicznie i uniwersalnych kulturowo emocjach, wśród których wyróżniamy: radość, złość, smutek, strach i wstręt. W szczególności interesowało nas porównanie wpływu wybranych kategorii emocji na pamięć, niezależnie od znaku emocji i poziomu pobudzenia emocjonalnego. Aktualnie wykorzystujemy na przykład bodźce wyrażające wstręt i strach, ale w równym stopniu negatywne i pobudzające. Jednocześnie wstręt i strach różnią się ze względu na funkcję ewolucyjną, reakcję fizjologiczną naszego organizmu, a także wpływ na procesy psychiczne takie, jak na przykład pamięć. Różnice te wykazano jednak dotychczas tylko na poziomie behawioralnym, nas natomiast interesowały związane z nimi mózgowe mechanizmy.
Jak emocje wpływają na pamięć?
W badaniach, o których przed chwilą wspomniałam, zaobserwowaliśmy odmienny wpływ różnych kategorii emocji na pamięć – mianowicie wstręt pamiętany był lepiej niż strach, niezależnie od różnic w poziomie pobudzenia emocjonalnego. Ten wynik zdaje się podkreślać, że wstręt jest niezwykle silną emocją angażującą wiele zmysłów, i wpływającą na trwałość procesów pamięciowych.
Oczywiście mowa tutaj o wynikach konkretnego badania, w którym zastosowaliśmy bodźce werbalne, i być może wywoływaliśmy w ten sposób w uczestnikach naszego badania pewien specyficzny aspekt tych kategorii emocji. Z całą pewnością czym innym jest emocjonalna reakcja strachu odczuwana bezpośrednio w sytuacji zagrożenia, a czym innym rozumienie emocji strachu, wymagające złożonego przetwarzania na poziomie semantycznym. Ponadto w badaniach eksperymentalnych na ogół wykorzystujemy materiał językowy o bardzo uproszczonym charakterze, a więc słowa czy pary słów. Zupełnie inny może być wpływ emocji na pamięć słów osadzonych w pewnym kontekście, np. w przekazie reklamowym, czy w treści wpisu na Facebooku.
Czy tekst reklamowy lub wpis na Facebooku może zostać lepiej zapamiętany, jeśli zadbać o wyrażone w nim emocje?
Oczywiście odpowiedź na to pytanie jest złożona – gdybyśmy byli w stanie prosto na nie odpowiedzieć jako badacze tego tematu już dawno nie mielibyśmy co robić! Wpływ emocji na pamięć zależy od tego, po upływie jakiego czasu sprawdzamy pamięć, jakiego rodzaju materiałem wywołujemy emocje oraz czy zadbamy o to, by przekazywana informacja była osadzona w odpowiednim kontekście.
W projekcie Sentimenti badamy nie tylko to, z jakimi emocjami wiążą się poszczególne słowa, ale także to jak emocjonalna wartość poszczególnych słów przenosi się na szerszy kontekst, np. treść przekazu reklamowego, czy wpisu na Facebooku. W zamierzeniu narzędzie, które tworzymy, może dostarczyć klientom biznesowym informacji na temat wizerunku ich marki, czy opinii na temat ich produktów. Nasze rozwiązanie w tej chwili skoncentrowane jest głównie na badaniu opinii, a nie stopniu ich utrwalenia w świadomości odbiorcy. Jest to jednak prawdopodobnie jeden z kierunków, w którym rozwiązania z zakresu sentiment analysis będą się rozwijać.
Myślicie, że SentiTool może przydać się do dalszych badań nad emocjami i pamięcią?
SentiTool będzie efektem naszego projektu przeznaczonym do celów biznesowych, nie zaś naukowych. Potencjalnie daje on jednak duże możliwości, jeśli chodzi o realizację badań na pograniczu nauki i biznesu, albo po prostu badań komercyjnych – i w takich badaniach z całą pewnością SentiTool znajdzie zastosowanie. Narzędzie SentiTool daje unikalną możliwość prowadzenia badań o dużym stopniu trafności ekologicznej, tj. tego w jakim stopniu sytuacja eksperymentalna odzwierciedla realne życie. Zamiast pojedynczych słów, badamy także frazy, zdania czy całe teksty, które wzbudzają określone emocje. Z tego względu dysponowanie tekstami, co do których mamy pewność, jakie wywołują emocje, byłoby niezwykle użyteczne.
A czy SentiTool może pomóc tworzyć teksty, które będą lepiej zapamiętywane?
Tym pytaniem wybiegamy w przyszłość i być może jest to pomysł na kolejny projekt, którym będzie zainteresowane Narodowe Centrum Badań i Rozwoju! Działanie SentiToola póki co zorientowane jest na analizę emocji w tekście. Dopiero tak scharakteryzowane teksty mogłyby zostać użyte w badaniach jako materiał pamięciowy i w jeszcze dalszej perspektywie wnioski z tych badań mogłyby posłużyć jako wskazówki do tworzenia tekstów lepiej zapadających w pamięć. Z pewnością z marketingowego punktu widzenia takie działania mają ogromne znaczenie i dzięki Sentimenti podjęliśmy pierwsze kroki w tym kierunku.
utworzone przez Agnieszka Czoska | gru 24, 2018 | Polityka i społeczeństwo, Styl życia
Last Christmas – na pewno coś poczuliście widząc ten tytuł na naszym blogu. Niektórzy zaczęli się uśmiechać, inni raczej krzywić. A przecież to ten utwór towarzyszy nam w każde święta od 32 lat! I zaraz pokażemy, że
odbijają się w nim wszystkie emocje związane z Bożym Narodzeniem
Przeanalizowaliśmy, jak o niej pisano w polskojęzycznym Internecie od początku grudnia.
Mogłoby się wydawać, że piosenka wywołuje sporo negatywnych emocji, ale jak widać powyżej, mimo popularności akcji “W tym roku nie usłyszę Last Christmas” jeśli już używamy tego tytułu, to prawie dwa razy częściej towarzyszy mu pozytywny sentyment. Jaki?
Najczęściej po prostu radość i zaufanie, nic dziwnego, że zjawisko powtarzające się od ponad ćwierćwiecza napełnia nas poczuciem bezpieczeństwa i wywołuje oczekiwanie. Jeśli chodzi o negatywne emocje, to głównie smutek i złość. O ile smutek może wiązać się z nostalgią, wspominaniem minionych świąt abo wzruszeniem romantyczną historią opowiadaną przez Wham!, złość wydaje się być bezpośrednio związana z tym, że przebój słyszymy wszędzie… Czy na pewno?
Oto fragment chmury słów najsilniej wiążących się z emocją złości w przeanalizowanych przez nas wpisach. Oblężenie, rozgardiasz, nerwy… To chyba jednak reakcje na przedświąteczną lub świąteczną bieganinę.
Przyjrzyjmy się jeszcze chmurze słów niosących radość. Przeuroczy, kojarzyć się, aura… Chyba dotyczą piosenki, ale mogą być też stwierdzeniami dotyczącymi samego Bożego Narodzenia. Widać także, że dyskusja o Last Christmas nie jest zbyt melancholijna, pojawiają się w niej kozak, szał, szalony. Na ilustrację załapały się także kontrowersyjne wyrazy jedynie leciutko pozytywne we fragmencie swojego znaczenia (patrz: przypuszczalnie komplement w prawym górnym rogu).
Pokazaliśmy tu tylko niewielki procent wszystkich słów naładowanych emocjami, w których kontekście został wspomniany tytuł Last Christmas. Piosenka wciąż dobrze się kojarzy, do tego z bardzo konkretnym momentem w roku, co działa także w drugą stronę. Frustrację ze sklepowych kolejek, ale także uśmiech na widok śniegu, kojarzymy z przebojem Wham! I dlatego zaryzykujemy tu stwierdzenie, że
znaleźliśmy małe, kieszonkowe, skompresowane lusterko grudniowych nastrojów.
utworzone przez Agnieszka Czoska | lis 29, 2018 | Okiem badacza
Dr Jan Kocoń jest inżynierem języka naturalnego – to on odpowiada za uczenie maszynowe zamknięte w SentiToolu, naszym narzędziu do analizy emocji w tekście. Koordynuje prace zespołu językoznawczego, integruje poszczególne elementy narzędzia, ściśle współpracuje z zespołem informatycznym.
Kiedy masz komuś pierwszy raz opowiedzieć o Sentimenti i naszych narzędziach, co mówisz najpierw?
Sentimenti jest projektem, w którym zajmujemy się analizą emocji w tekście. W odróżnieniu od rozwiązań konkurencji, w których rozpoznaje się wyłącznie wydźwięk tekstu (pozytywny, neutralny, negatywny), nasze narzędzia są w stanie zrozumieć tekst, przypisać wyrazom w tekście konkretne znaczenia oraz emocje, jakie ludzie odczuwają w związku z tymi znaczeniami. Emocje te stanowią z kolei bazę wiedzy dla mechanizmu uczenia maszynowego, który dokonuje automatycznego rozpoznawania emocji na poziomie zdań oraz całego tekstu.
Co to znaczy, że analizujemy emocje w tekście?
W badaniach prowadzonych w projekcie zaadaptowaliśmy model Plutchika, obejmujący osiem emocji podstawowych: radość, smutek, zaufanie, wstręt, oczekiwanie, strach, zaskoczenie oraz złość. Jesteśmy w stanie oszacować, w jakim stopniu te emocje są wyrażone w tekście.
Skąd wiemy, jakie emocje ludzie czują?
Baza wiedzy, która jest pomocą dla naszego projektu, obejmuje ponad 30000 znaczeń słów, dla których 20000 unikatowych respondentów przypisuje oceny dotyczące wydźwięku oraz emocji. Mówimy tu o “znaczeniach”, a nie “słowach”, bo wyrazy są wieloznaczne, na przykład “ciemny” znaczy co innego w “ciemny błękit” lub “ciemny lud” i tylko w tym drugim przypadku niesie emocje. Każde znaczenie docelowo otrzyma 50 ocen od różnych osób. Dzięki temu wiemy, jakie odczucia wywołują określone znaczenia w tekście. Jednak emocja tekstu nie jest prostą sumą emocji przypisanych do znaczeń występujących w tym tekście…
Co jeszcze sprawia, że narzędzia do analizy emocji w tekście działają?
Z pomocą przychodzą nam dwie rzeczy. Pierwszą z nich jest nasza gigantyczna baza opinii z przyporządkowanym wydźwiękiem, które pochodzą z różnych dziedzin: podróże, medycyna, produkty i wiele innych. Mamy ponad 10 milionów takich tekstów, co stanowi doskonałe źródło informacji o ogólnym odczuciu twórcy tekstu. Jednak aby stwierdzić, jakie emocje dany tekst wywołuje u czytelnika, prowadzimy także własne badania, analogiczne od badań prowadzonych na pojedynczych znaczeniach. Przedmiotem tych badań są tym razem teksty. Osoby ankietowane przypisują im emocje podstawowe, dokładnie tak samo jak znaczeniom słów. Drugi filar naszego narzędzia to kombinacja wielu metod uczenia maszynowego. Eksperci od przetwarzania języka naturalnego dostarczają nam narzędzi do analizy tekstu na poziomie składniowym oraz semantycznym, dodatkowo tworzą reguły analizy znaczeń w kontekście jak: negacja, przypuszczenie, osłabienie lub wzmocnienie wydźwięku itp. Jest to dodatkowa pomoc dla metod automatycznych, na przykład głębokich sieci neuronowych, za pomocą których odbywa się właściwe wnioskowanie na temat emocji w tekście.
Do czego może się według ciebie przydać automatyczna analiz emocji?
Docelowo widzę wiele zastosowań dla naszych narzędzi. Pierwszy obszar obejmuje rynek reklam wyświetlanych w kontekście artykułów internetowych i dopasowywanie ich do emocji, jakie tekst publikacji wzbudza u czytelników. Przykładowo w smutnym tekście mogłaby pojawić się reklama towarzystwa ubezpieczeniowego, a w radosnym – reklama wycieczki. Kolejnym obszarem jest monitoring marki, czyli analizowanie jak klienci firm piszą w Internecie o danej firmie, jej produktach, jakie emocje im przy tym towarzyszą. Kolejne interesujące obszary to sortowanie skarg mailowych od klientów względem emocji w nich zawartych, detekcja konfliktów rodzących się w korespondencji pracowników, wykrywanie kryzysów w mediach społecznościowych, a nawet możliwość diagnozowania chorób psychicznych – potencjał jest naprawdę ogromny.
Co jeszcze planujesz zrobić w Sentimenti?
Póki co, jest gotowy prototyp z prostą analizą tekstu na poziomie znaczeń oraz z analizą wydźwięku z wykorzystaniem naszych wielkich zasobów opinii. Obecnie we Wrocławskim zespole Sentimenti zarządzam budową mechanizmu uczenia maszynowego, w którym możliwe będzie zagregowanie zarówno informacji z bazy wiedzy dotyczącej znaczeń, jak i informacji pochodzących z potoku przetwarzania języka naturalnego. Wciąż spływają nam nowe dane o odczuciach osób czytających teksty, stanowiące nasz zbiór uczący. Im więcej danych, tym lepsza jakość narzędzia.