Miejsce publikacji:
Conference: 2021 IEEE International Conference on Data Mining (ICDM) At: Auckland, New Zealand
Tytuł:
Learning Personal Human Biases and Representations for Subjective Tasks in Natural Language Processing
Autorzy:
Jan Kocoń, Piotr Miłkowski, Damian Grimling, Marcin Gruza, Kamil Kanclerz, Przemysław Kazienko, Julita Bielaniewicz
Abstrakt:
Wiele zadań w przetwarzaniu języka naturalnego, takich jak klasyfikacja tekstów obraźliwych, toksycznych lub emocjonalnych, jest z natury subiektywnych. Ludzie mają tendencję do postrzegania treści tekstowych na swój własny, indywidualny sposób. Istniejące metody powszechnie opierają się na uzgodnionych wartościach wyjściowych, takich samych dla wszystkich konsumentów. Tutaj proponujemy spersonalizowane rozwiązania dla subiektywnych zadań. Nasze cztery nowe modele głębokiego uczenia uwzględniają nie tylko treść, ale także specyfikę danego człowieka. Modele reprezentują różne podejścia do uczenia się reprezentacji i przetwarzania danych o czytelnikach tekstu. Eksperymenty przeprowadzono na czterech zbiorach danych: Teksty dyskusyjne Wikipedii oznaczone jako atak, agresja i toksyczność, a także opinie opatrzone adnotacjami z dziesięcioma numerycznymi kategoriami emocjonalnymi. Dane emocjonalne były traktowane jako regresja wielowymiarowa (multitask), natomiast dane z Wikipedii jako niezależne klasyfikacje. Wszystkie nasze modele oparte na ludzkich uprzedzeniach i ich reprezentacjach znacząco poprawiają jakość przewidywania w subiektywnych zadaniach ocenianych z perspektywy jednostki.
Link: ResearchGate