Zaznacz stronę
Konferencja ACL 2021: Personal Bias w przewidywaniu emocji wywołanych przez opinie tekstowe

Konferencja ACL 2021: Personal Bias w przewidywaniu emocji wywołanych przez opinie tekstowe

Miejsce publikacji:

  • Conference: Proceedings of the 59th Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing

Tytuł:

Personal Bias w przewidywaniu emocji wywołanych przez opinie tekstowe.

Autorzy:

Jan Kocoń, Piotr Miłkowski, Damian Grimling, Marcin Gruza, Kamil Kanclerz, Przemysław Kazienko

Abstrakt:

W analizie emocji wywołanych przez opinie, komentarze czy artykuły powszechnie wykorzystuje się korpusy anotowane, w których etykiety przypisane do dokumentów są uśrednieniem poglądów wszystkich anotatorów lub reprezentują decyzję większości. Modele wytrenowane na takich danych są skuteczne w identyfikowaniu ogólnych poglądów populacji. Jednak ich przydatność do przewidywania emocji wywoływanych przez treści tekstowe u konkretnej osoby jest ograniczona. W niniejszej pracy przedstawiamy badanie przeprowadzone na zbiorze danych zawierającym 7000 opinii, z których każda została zaanotowana przez około 50 osób na dwóch wymiarach: walencja, pobudzenie, oraz z intensywnością ośmiu emocji z modelu Plutchika. Nasze badanie wykazało, że indywidualne odpowiedzi często znacząco odbiegały od średniej. Dlatego też zaproponowaliśmy nową miarę do oszacowania tego efektu – Personal Emotional Bias (PEB). Opracowaliśmy również nową architekturę transformaty opartej na BERT, aby przewidzieć emocje z indywidualnej perspektywy człowieka. Stwierdziliśmy, że PEB jest głównym czynnikiem poprawiającym jakość spersonalizowanego rozumowania. Zarówno metoda jak i miara mogą podnieść jakość systemów rekomendacji treści oraz spersonalizowanych rozwiązań chroniących użytkowników przed mową nienawiści lub niepożądanymi treściami, które mają wysoce subiektywny charakter.

Link: ResearchGate

Normy emocji dla 6000 polskich znaczeń słów z bezpośrednim odwzorowaniem na polską Słowosieć

Normy emocji dla 6000 polskich znaczeń słów z bezpośrednim odwzorowaniem na polską Słowosieć

Miejsce publikacji:

Behavior Research Methods

Tytuł:

Emotion norms for 6000 Polish word meanings with a direct mapping to the Polish wordnet

Autorzy:

Jan Kocoń, Arkadiusz Janz, Piotr Miłkowski, Monika Riegel, Małgorzata Wierzba, Artur Marchewka, Agnieszka Czoska, Damian Grimling, Barbara Konat, Konrad Juszczyk, Katarzyna Klessa, Maciej Piasecki

Abstrakt:

Leksykony emocji są przydatne w badaniach z różnych dziedzin, ale dostępność takich zasobów dla większości języków pozostaje ograniczona. Podczas gdy istniejące leksykony emocji zazwyczaj zawierają słowa, to konkretne znaczenie słowa (a nie samo słowo) przekazuje emocje. Aby złagodzić ten problem, przedstawiamy zbiór danych Emotion Meanings, nowatorski zbiór 6000 polskich znaczeń słów. Znaczenia słów pochodzą z polskiego wordnetu (plWordNet), dużej sieci semantycznej łączącej słowa za pomocą relacji leksykalnych i konceptualnych. Znaczenia słów były ręcznie oceniane pod kątem walencji i pobudzenia, wraz z różnymi podstawowymi kategoriami emocji (gniew, obrzydzenie, strach, smutek, oczekiwanie, szczęście, zaskoczenie i zaufanie). Adnotacje okazały się wysoce wiarygodne, o czym świadczy podobieństwo danych zebranych w dwóch niezależnych próbach: nienadzorowanej ( n = 21 317) i nadzorowanej ( n = 561). Chociaż stwierdziliśmy, że adnotacje są stosunkowo stabilne dla kobiet, mężczyzn, młodszych i starszych uczestników, dzielimy zarówno dane zbiorcze, jak i indywidualne, aby umożliwić badania emocji na różnych demograficznie specyficznych podgrupach. Znaczenia słów są dodatkowo uzupełnione o odpowiednie metadane, pochodzące z zasobów lingwistycznych typu open-source. Bezpośrednie mapowanie do Princeton WordNet sprawia, że zbiór danych nadaje się do badań nad wieloma językami. W sumie, ten zbiór danych stanowi wszechstronny zasób, który może być wykorzystany w badaniach nad emocjami w psychologii, kognitywistyce, psycholingwistyce, lingwistyce obliczeniowej i przetwarzaniu języka naturalnego.

Link: ResearchGate

Cytowanie BibTeX:

@incollection { ,
title = “Recognition of emotions, valence and arousal in large-scale multi-domain text reviews”,
author = “Kocoń„, Jan and Janz, Arkadiusz and …, … and Juszczyk, Konrad and Klessa, Katarzyna and Piasecki, Maciej”,
editor = “Vetulani, Zygmunt and Paroubek, Patrick”,
booktitle = “Human Language Technologies as a Challenge for Computer Science and Linguistics”,
year = “2019”,
pages = “274-280”,
}

Rozpoznawanie emocji, sentymentu i pobudzenia w dowolnych treściach na dużą skalę

Rozpoznawanie emocji, sentymentu i pobudzenia w dowolnych treściach na dużą skalę

Miejsce publikacji:

  • 9th Language & Technology Conference: Human Language Technologies as a Challenge for Computer Science and Linguistics

 

Tytuł:

Recognition of emotions, valence and arousal in large-scale multi-domain text reviews

 

Autorzy:

Jan Kocoń, Arkadiusz Janz, Piotr Miłkowski, Monika Riegel, Małgorzata Wierzba, Artur Marchewka, Agnieszka Czoska, Damian Grimling, Barbara Konat, Konrad Juszczyk, Katarzyna Klessa, Maciej Piasecki

 

Abstrakt:

W tym artykule prezentujemy nowy, wielodziedzinowy zbiór danych polskich recenzji tekstowych. Dane zostały zaanotowane w ramach dużego badania z udziałem ponad 20 000 uczestników. Łącznie 7000 tekstów zostało opisanych metadanymi, każdy tekst otrzymał około 25 anotacji dotyczących polaryzacji, pobudzenia i ośmiu podstawowych emocji, oznaczonych na wielopoziomowej skali. Przedstawiamy wstępne podejście do etykietowania danych na podstawie rozkładu ręcznych adnotacji oraz do klasyfikacji etykietowanych danych z wykorzystaniem regresji logistycznej i dwukierunkowych rekurencyjnych sieci neuronowych z pamięcią długotrwałą i krótkotrwałą.

 

Link:

ResearchGate

 

Cytowanie BibTeX:

@incollection { ,
title = “Recognition of emotions, valence and arousal in large-scale multi-domain text reviews”,
author = “Kocoń„, Jan and Janz, Arkadiusz and …, … and Juszczyk, Konrad and Klessa, Katarzyna and Piasecki, Maciej”,
editor = “Vetulani, Zygmunt and Paroubek, Patrick”,
booktitle = “Human Language Technologies as a Challenge for Computer Science and Linguistics”,
year = “2019”,
pages = “274-280”,
}

 

Pełna treść:

LTC2019_Recognition_of_emotions__polarity_and_arousal_in_large_scale_multi_domain_text_reviews

 

Sentimenti w konsorcjum projektu CLARIN-PL. Usługi jeszcze bardziej zaawansowane!

Sentimenti w konsorcjum projektu CLARIN-PL. Usługi jeszcze bardziej zaawansowane!

Na zaproszenie partnerów  projektu CLARIN-PL (Common Language Resources & Technology Infrastructure) SENTIMENTI weszło do grupy firm wspierających to przedsięwzięcie. Celem jest stworzenie w kolejnych latach platformy badawczo-rozwojowej wraz z centrum technologicznym zapewniającym bazę sprzętową.

Projekt realizują wyspecjalizowane zespoły złożone z programistów i lingwistów, specjalistów w zakresie przetwarzania języka naturalnego. Do konsorcjum projektowego dołączyły 22 firmy, w tym SENTIMENTI wraz ze swoim zapleczem badawczym.

Odbiorcami rozwiązań będą zarówno firmy, środowiska akademickie, jak i sektor publiczny.

Sentimenti. Uczenie maszynowe, sztuczna inteligencja i jeszcze lepsze usługi i narzędzia

Celem jest oferowanie zaawansowanych usług obliczeniowych ze szczególnym uwzględnieniem zastosowań technologii przetwarzania języka naturalnego. To między innymi modele językowe, techniki analizy semantycznej tekstu, bazy wiedzy i transkrypcja mowy. Dzięki temu będzie możliwe zaoferowanie jeszcze bardziej kompleksowych usługi analizy tekstu na potrzeby prac badawczo-rozwojowych dla nauki oraz biznesu. Wszystko oparte m.in. o uczenie maszynowe i sztuczną inteligencję.

Docelowo CLARIN-PL-Biz będzie oferować usługi wysokiego poziomu, które można podzielić na następujące grupy:

  • gromadzenie i trwałe przechowywanie danych językowych, w tym tzw. big data (tekst, mowa, dane multimodalne oraz powiązane zasoby numeryczno-symboliczne);
  • wydobywanie informacji i wiedzy z wielkich baz danych językowych, generowanie odpowiedzi na pytania na podstawie korpusu tekstów oraz automatyczne rozumowanie w oparciu o dane językowe;
  • semantyczne indeksowanie i przeszukiwanie danych;
  • środowisko informatyczne do tworzenia systemów dialogowych o różnej modalności, w tym generowanie tekstu i mowy, oraz rozpoznawanie mowy.

Partnerami projektu są Uniwersytet Łódzki, Uniwersytet Wrocławski, Polska Akademia Nauk, Politechnika Wrocławska oraz Instytut Slawistyki PAN. Wśród firm wspierającym są również: Intel, IQS, Grupa Polska Press, Lingventa i inne.

dopisz wyrazy którymi można opisać wymienione uczucia

W gronie najlepszych

Projekt podzielony jest na wiele etapów. To przede wszystkim:

  • utworzenie centrum technologicznego zapewniającego bazę sprzętową dla rozwoju technologii eksploracji danych;
  • wyposażenie centrum w zaawansowane technologie językowe (bazy danych, moduły oprogramowania, usługi sieciowe i aplikacje) służące do inteligentnego przetwarzania wielkich heterogenicznych danych w obszarach niewspieranych przez istniejące infrastruktury badawcze ani otwartą technologię;
  • dostarczenie na rynek narzędzi analizy danych językowych (tj. zapisów mowy i tekstu) w postaci prostej, ustrukturalizowanej (np. tekstu z informacjami o jego strukturze wewnętrznej lub związkach z innymi tekstami, zapisu mowy ze metaznacznikami odnoszącymi się do wybranych jej fragmentów) oraz danych anotowanych (np. tekstów lub nagrań mowy opatrzonych hipertekstem lub metadanymi z odniesieniem do innych zasobów);
  • doprowadzenie do zunifikowanej postaci wielu zasobów i narzędzi językowych dla języków europejskich, a więc doprowadzenie do ich interoperacyjności oraz standaryzacja;
  • dostarczenie wszechstronnego i łatwego dostępu do archiwum zasobów i technologii językowych, jak i szeregu aplikacji przeznaczonych do wykorzystania przez użytkownika końcowego.
Realizacja projektu przewidziana jest na lata 2020-2023. Celem jest powiększenie istniejącej już infrastruktury. Chodzi też o usprawnienie narzędzi w celu budowy nowoczesnej platformy badawczo-rozwojowej do przetwarzania języka naturalnego. Dzięki temu możliwa  będzie eksploracja wielkich zbiorów danych oraz analiza tekstu.
rojekt jest finansowany w ramach Programu Operacyjnego Inteligentny Rozwój 2014-2020, Priorytet IV: Zwiększenie potencjału naukowo-badawczego, Działanie 4.2: Rozwój nowoczesnej infrastruktury badawczej sektora nauki, nr POIR.04.02.00-00C002/19, “CLARIN – Wspólne Zasoby Językowe i Infrastruktura Technologiczna”.

Analiza emocji – rozwiązanie innowacyjne i jedyne na rynku

Sentimenti od dawna, dzięki Sztucznej Inteligencji, mierzy natężenie 8 podstawowych emocji zaszytych w tekście. Mierzy również sentyment, a także ogólne pobudzenie emocjonalne analizowanych danych. Nasze szczegółowe raporty pozwalają zrozumieć nastroje rynkowe, ocenić jakość komunikacji, unikać kryzysów i lepiej kontrolować działania biznesowe. Czytamy dane tak, jakby robiła to grupa 22 tys. Polaków!

W oparciu o rozwiązania i narzędzia Sentimenti stworzono również usługę Sentistock, będącą wparciem dla inwestorów i traderów.

Sztuczna inteligencja pomaga wykrywać zagrożenia. Nie tylko wizerunkowe!

Sztuczna inteligencja pomaga wykrywać zagrożenia. Nie tylko wizerunkowe!

Sztuczna inteligencja na stałe zagościła w naszym codziennym życiu. Dzięki niej nie tylko możemy na stałe monitorować sentyment, emocje czy wizerunek marki i produktu. Coraz częściej są to też rozwiązania z zakresu cyberbezpieczeństwa Dzięki nowoczesnym algorytmom rozwiązania oparte o AI wykrywają wszelkie zagrożenia w zaledwie kilka sekund. To o wiele razy szybciej, niż zrobiłby to człowiek.

Sztuczna inteligencja kontra czynnik ludzki

Kto stworzył internet? Ludzie!

A ludzie to istoty emocjonalne… Czynnik ludzki ma swoje zalety i przewagi nad sztuczną inteligencją. Do zalet nie należy jednak szybkość działania. Człowiek w XXI wieku stanowi wprost lukę wykorzystywaną przez wszelkiej maści oszustów i hackerów. Od momentu przejścia gospodarki w znacznej części na pracę zdalną w wyniku epidemii koronawirusa, problemy te widoczne są jeszcze bardziej.

Nawet 70 proc. firm poniosło wymierne straty związane np. z naruszeniami ochrony danych. Wydaje się więc niemal pewne, że pandemia COVID-19 wpłynie na przyspieszenie wdrożenia w prywatnych komputerach nowoczesnych zabezpieczeń, które do tej pory spotykaliśmy tylko w firmach.

ZOBACZ TAKŻE: Sztuczna inteligencja dobra i zła. Zastępuje dziennikarzy, generuje fake newsy

Podobnie jak nasze, oparte o AI, narzędzia do badania emocji, sentymentu i pobudzenia emocjonalnego, sztuczna inteligencja jest zdolna do przetwarzania miliardów rekordów danych. Nie ważne jest ich pochodzenie. SI uczy się rozpoznawania badanego materiału poprzez uczenie maszynowe. Gromadzi informacje i pokazuje wyniki. W przypadku usług oferujących wykrywanie zagrożeń z zakresu cyberbezpieczeństwa odnotowano nawet 60-krotnie szybsze działanie niż gdyby robił to człowiek. Analizy trwają dużo mniej, a efekty są rewelacyjne.

Dane to podstawa. AI to przyszłość rynku technologicznego

Wyniki badań nie biorą się z powietrza – kluczowe są dane. Korzystanie w codziennej pracy (np. w przypadku działów marketingu czy reklamy) niosą szereg korzyści. W obecnych czasach świadczą też po prostu o nowoczesności i dojrzałości przedsiębiorstwa. Kto nie idzie do przodu, ten się cofa. Algorytmy rządzą światem, a dane gromadzone są przez różne jednostki w nieograniczonych ilościach.

Wiemy już, że próbka głosu poddana analizie narzędziami opartymi o AI będzie pozwalała wykryć choroby. Sztuczna inteligencja pomaga też w walce z epidemią koronawirusa (np. analiza powikłań po przebyciu COVID-19). Istnieją też algorytmy, które w kilka sekund potrafią ocenić, czy biznesplan ma szansę powodzenia. Jest też w końcu nasz Sentitool do badania emocji, pobudzenia emocjonalnego i sentymentu w komentarzach i opiniach, e-mailach, reklamie.

Dzięki algorytmom zaszytym w narzędziach Sentimenti można też skutecznie przewidzieć trendy instrumentów finansowych, jak np. kurs Bitcoina. Jedno jest pewne – AI to przyszłość technologicznego rynku i liczyć się będzie ten, kto swoją pracę opiera o takie właśnie rozwiązania. Niezależnie od branży.

http://sentimenti.pl/blog/public-relations-definicja-marketing-epidemia/