Zaznacz stronę
Mapowanie WordNetu na konektom ludzkiego mózgu w przetwarzaniu emocji i rozpoznawaniu podobieństwa semantycznego

Mapowanie WordNetu na konektom ludzkiego mózgu w przetwarzaniu emocji i rozpoznawaniu podobieństwa semantycznego

Miejsce publikacji:

Information Processing & Management, 2021

Tytuł:

Mapowanie WordNetu na konektom ludzkiego mózgu w przetwarzaniu emocji i rozpoznawaniu podobieństwa semantycznego

Autorzy:

Jan Kocoń, Marek Maziarz

Abstrakt:

W tym artykule rozszerzamy strukturę WordNetu o relacje łączące synsety z regionami mózgu Desikana. W oparciu o pliki leksykograficzne i domeny WordNetu mapowanie przebiega od kategorii semantycznych synsetów do funkcji behawioralnych i poznawczych, a następnie bezpośrednio do płatów mózgu. Macierz połączeń ludzkiego mózgu (HBC) została wykorzystana do uchwycenia prawdopodobieństwa przejścia pomiędzy regionami mózgu. Nową strukturę ocenialiśmy w kilku zadaniach związanych z podobieństwem semantycznym i przetwarzaniem emocji, wykorzystując rozszerzony mózgowo Princeton WordNet (207k LUs) i polski WordNet (285k LUs, 30k anotowanych walencją, pobudzeniem i 8 podstawowymi emocjami). Nowa reprezentacja wektorowa HBC okazała się znacząco lepsza od proponowanych rozwiązań bazowych. Link: https://www.sciencedirect.com/science/article/pii/S0306457321000388

Link: ScienceDirect

Cytowanie BibTeX:

@article{kocon2021mapping,
title={Mapping WordNet onto human brain connectome in emotion processing and semantic similarity recognition},
author={Koco{\’n}, Jan and Maziarz, Marek},
journal={Information Processing \& Management},
volume={58},
number={3},
pages={102530},
year={2021},
publisher={Elsevier}
}

10ta GWC: Propagacja emocji, pobudzenia i polaryzacji w WordNecie przy użyciu Heterogeneous Structured Synset Embeddings

10ta GWC: Propagacja emocji, pobudzenia i polaryzacji w WordNecie przy użyciu Heterogeneous Structured Synset Embeddings

Miejsce publikacji:

Proceedings of the 10th Global Wordnet Conference

Tytuł

Propagacja emocji, pobudzenia i polaryzacji w WordNecie przy użyciu Heterogeneous Structured Synset Embeddings

Autorzy:

Jan Kocoń, Arkadiusz Janz

Abstrakt:

W artykule przedstawiamy nowatorską metodę propagacji emocji w WordNecie, opartą na dużym zbiorze emotywnym. Wprowadzamy leksykon emotywny na poziomie znaczeniowym, anotowany za pomocą polaryzacji, pobudzenia i emocji. Dane zostały zanotowane w ramach dużego badania z udziałem ponad 20 000 uczestników. Metadanymi opisano łącznie 30 000 jednostek leksykalnych w polskim WordNecie, każda jednostka otrzymała około 50 adnotacji dotyczących polaryzacji, pobudzenia i 8 podstawowych emocji, oznaczonych na wielopoziomowej skali. Przedstawiamy wstępne podejście do propagacji metadanych emocjonalnych do nieznakowanych jednostek leksykalnych w oparciu o rozkład ręcznych adnotacji z wykorzystaniem regresji logistycznej oraz opis mieszanych embeddingów synsetowych w oparciu o nasz system Heterogeneous Structured Synset Embeddings.

Link: ACL Anthology

Cytowanie BibTeX:

@inproceedings{kocon-janz-2019-propagation,
title = “Propagation of emotions, arousal and polarity in {W}ord{N}et using Heterogeneous Structured Synset Embeddings”,
author = “Koco{\’n}, Jan and
Janz, Arkadiusz”,
booktitle = “Proceedings of the 10th Global Wordnet Conference”,
month = jul,
year = “2019”,
address = “Wroclaw, Poland”,
publisher = “Global Wordnet Association”,
url = “https://www.aclweb.org/anthology/2019.gwc-1.43”,
pages = “336–341”,
abstract = “In this paper we present a novel method for emotive propagation in a wordnet based on a large emotive seed. We introduce a sense-level emotive lexicon annotated with polarity, arousal and emotions. The data were annotated as a part of a large study involving over 20,000 participants. A total of 30,000 lexical units in Polish WordNet were described with metadata, each unit received about 50 annotations concerning polarity, arousal and 8 basic emotions, marked on a multilevel scale. We present a preliminary approach to propagating emotive metadata to unlabeled lexical units based on the distribution of manual annotations using logistic regression and description of mixed synset embeddings based on our Heterogeneous Structured Synset Embeddings.”,
}

Co robią narzędzia Sentimenti? Opowiada dr Jan Kocoń

Co robią narzędzia Sentimenti? Opowiada dr Jan Kocoń

Dr Jan Kocoń jest inżynierem języka naturalnego – to on odpowiada za uczenie maszynowe zamknięte w SentiToolu, naszym narzędziu do analizy emocji w tekście. Koordynuje prace zespołu językoznawczego, integruje poszczególne elementy narzędzia, ściśle współpracuje z zespołem informatycznym.

Kiedy masz komuś pierwszy raz opowiedzieć o Sentimenti i naszych narzędziach, co mówisz najpierw?

Sentimenti jest projektem, w którym zajmujemy się analizą emocji w tekście. W odróżnieniu od rozwiązań konkurencji, w których rozpoznaje się wyłącznie wydźwięk tekstu (pozytywny, neutralny, negatywny), nasze narzędzia są w stanie zrozumieć tekst, przypisać wyrazom w tekście konkretne znaczenia oraz emocje, jakie ludzie odczuwają w związku z tymi znaczeniami. Emocje te stanowią z kolei bazę wiedzy dla mechanizmu uczenia maszynowego, który dokonuje automatycznego rozpoznawania emocji na poziomie zdań oraz całego tekstu.

Co to znaczy, że analizujemy emocje w tekście?

W badaniach prowadzonych w projekcie zaadaptowaliśmy model Plutchika, obejmujący osiem emocji podstawowych: radość, smutek, zaufanie, wstręt, oczekiwanie, strach, zaskoczenie oraz złość. Jesteśmy w stanie oszacować, w jakim stopniu te emocje są wyrażone w tekście.

Skąd wiemy, jakie emocje ludzie czują?

Baza wiedzy, która jest pomocą dla naszego projektu, obejmuje ponad 30000 znaczeń słów, dla których 20000 unikatowych respondentów przypisuje oceny dotyczące wydźwięku oraz emocji. Mówimy tu o “znaczeniach”, a nie “słowach”, bo wyrazy są wieloznaczne, na przykład “ciemny” znaczy co innego w “ciemny błękit” lub “ciemny lud” i tylko w tym drugim przypadku niesie emocje. Każde znaczenie docelowo otrzyma 50 ocen od różnych osób. Dzięki temu wiemy, jakie odczucia wywołują określone znaczenia w tekście. Jednak emocja tekstu nie jest prostą sumą emocji przypisanych do znaczeń występujących w tym tekście…

Co jeszcze sprawia, że narzędzia do analizy emocji w tekście działają?

Z pomocą przychodzą nam dwie rzeczy. Pierwszą z nich jest nasza gigantyczna baza opinii z przyporządkowanym wydźwiękiem, które pochodzą z różnych dziedzin: podróże, medycyna, produkty i wiele innych. Mamy ponad 10 milionów takich tekstów, co stanowi doskonałe źródło informacji o ogólnym odczuciu twórcy tekstu. Jednak aby stwierdzić, jakie emocje dany tekst wywołuje u czytelnika, prowadzimy także własne badania, analogiczne od badań prowadzonych na pojedynczych znaczeniach. Przedmiotem tych badań są tym razem teksty. Osoby ankietowane przypisują im emocje podstawowe, dokładnie tak samo jak znaczeniom słów. Drugi filar naszego narzędzia to kombinacja wielu metod uczenia maszynowego. Eksperci od przetwarzania języka naturalnego dostarczają nam narzędzi do analizy tekstu na poziomie składniowym oraz semantycznym, dodatkowo tworzą reguły analizy znaczeń w kontekście jak: negacja, przypuszczenie, osłabienie lub wzmocnienie wydźwięku itp. Jest to dodatkowa pomoc dla metod automatycznych, na przykład głębokich sieci neuronowych, za pomocą których odbywa się właściwe wnioskowanie na temat emocji w tekście.

Do czego może się według ciebie przydać automatyczna analiz emocji?

Docelowo widzę wiele zastosowań dla naszych narzędzi. Pierwszy obszar obejmuje rynek reklam wyświetlanych w kontekście artykułów internetowych i dopasowywanie ich do emocji, jakie tekst publikacji wzbudza u czytelników. Przykładowo w smutnym tekście mogłaby pojawić się reklama towarzystwa ubezpieczeniowego, a w radosnym – reklama wycieczki. Kolejnym obszarem jest monitoring marki, czyli analizowanie jak klienci firm piszą w Internecie o danej firmie, jej produktach, jakie emocje im przy tym towarzyszą. Kolejne interesujące obszary to sortowanie skarg mailowych od klientów względem emocji w nich zawartych, detekcja konfliktów rodzących się w korespondencji pracowników, wykrywanie kryzysów w mediach społecznościowych, a nawet możliwość diagnozowania chorób psychicznych – potencjał jest naprawdę ogromny.

Co jeszcze planujesz zrobić w Sentimenti?

Póki co, jest gotowy prototyp z prostą analizą tekstu na poziomie znaczeń oraz z analizą wydźwięku z wykorzystaniem naszych wielkich zasobów opinii. Obecnie we Wrocławskim zespole Sentimenti zarządzam budową mechanizmu uczenia maszynowego, w którym możliwe będzie zagregowanie zarówno informacji z bazy wiedzy dotyczącej znaczeń, jak i informacji pochodzących z potoku przetwarzania języka naturalnego. Wciąż spływają nam nowe dane o odczuciach osób czytających teksty, stanowiące nasz zbiór uczący. Im więcej danych, tym lepsza jakość narzędzia.