Propagacja emocji, pobudzenia i polaryzacji w WordNecie przy użyciu Heterogeneous Structured Synset Embeddings

Miejsce publikacji:

  • Proceedings of the 10th Global Wordnet Conference

 

Tytuł

Propagacja emocji, pobudzenia i polaryzacji w WordNecie przy użyciu Heterogeneous Structured Synset Embeddings

 

Autorzy:

Jan Kocoń, Arkadiusz Janz

 

Abstrakt:

W artykule przedstawiamy nowatorską metodę propagacji emocji w WordNecie, opartą na dużym zbiorze emotywnym. Wprowadzamy leksykon emotywny na poziomie znaczeniowym, anotowany za pomocą polaryzacji, pobudzenia i emocji. Dane zostały zanotowane w ramach dużego badania z udziałem ponad 20 000 uczestników. Metadanymi opisano łącznie 30 000 jednostek leksykalnych w polskim WordNecie, każda jednostka otrzymała około 50 adnotacji dotyczących polaryzacji, pobudzenia i 8 podstawowych emocji, oznaczonych na wielopoziomowej skali. Przedstawiamy wstępne podejście do propagacji metadanych emocjonalnych do nieznakowanych jednostek leksykalnych w oparciu o rozkład ręcznych adnotacji z wykorzystaniem regresji logistycznej oraz opis mieszanych embeddingów synsetowych w oparciu o nasz system Heterogeneous Structured Synset Embeddings.

 

Link:

ACL Anthology

 

Cytowanie BibTeX:

@inproceedings{kocon-janz-2019-propagation,
title = “Propagation of emotions, arousal and polarity in {W}ord{N}et using Heterogeneous Structured Synset Embeddings”,
author = “Koco{\’n}, Jan and
Janz, Arkadiusz”,
booktitle = “Proceedings of the 10th Global Wordnet Conference”,
month = jul,
year = “2019”,
address = “Wroclaw, Poland”,
publisher = “Global Wordnet Association”,
url = “https://www.aclweb.org/anthology/2019.gwc-1.43”,
pages = “336–341”,
abstract = “In this paper we present a novel method for emotive propagation in a wordnet based on a large emotive seed. We introduce a sense-level emotive lexicon annotated with polarity, arousal and emotions. The data were annotated as a part of a large study involving over 20,000 participants. A total of 30,000 lexical units in Polish WordNet were described with metadata, each unit received about 50 annotations concerning polarity, arousal and 8 basic emotions, marked on a multilevel scale. We present a preliminary approach to propagating emotive metadata to unlabeled lexical units based on the distribution of manual annotations using logistic regression and description of mixed synset embeddings based on our Heterogeneous Structured Synset Embeddings.”,
}

 

Pełna treść:

2019.gwc-1.43

 

« »