utworzone przez Sentimenti Team | wrz 19, 2019 | Polityka i społeczeństwo, SentiBrand
Kiedy w ubiegłym roku akademickim opowiadałam moim studentom i studentkom o Sentimenti, jeden z nich zapytał: „A jakie jest możliwe najbardziej nieetyczne zastosowanie Sentimenti?„. Pytanie to zaskoczyło mnie, ale też skłoniło do myślenia.
Cyberprzemoc i emocje. A co z mową nienawiści?
Zmartwienie studenta jest całkiem zrozumiałe – technologie automatycznej analizy danych zawsze mogą zostać wykorzystane do niecnych celów. Dlatego zastosowanie wielkich zbiorów danych („big data„) przedostało się do opinii publicznej dzięki skandalowi związanemu z firmą Cambridge Analytica i innymi przykładami wątpliwych moralnie działań na danych użytkowników.
W tym artykule chciałabym zaproponować myślenie odwrotne: do jakich pozytywnych działań może zostać wykorzystane Sentimenti? W jaki sposób możemy uczynić świat lepszym dzięki automatycznej analizie emocji? Do tej pory mówiliśmy o Sentimenti w kontekście czterech głównych zastosowań:
-
- Analiza i sugestie w zakresie emotywnego pozycjonowania reklam
- Monitoring, analiza i kategoryzacja wpisów klientów w mediach społecznościowych i na forach
- Monitoring wybranych przez zleceniodawcę aspektów jego działania (marki, kluczowych klientów, odbioru jakości działania zleceniodawcy)
- Sentistock jako wsparcie w procesach inwestycyjnych, zarządczych w przedsiębiorstwach (w korelacji do kursów giełdowych lub do uzyskiwanych parametrów ekonomicznych)
Możliwe jest jednak wiele innych aplikacji Sentimenti, a niektóre z nich mogą uczynić życie ludzi znacznie lepszym. Pisaliśmy już na blogu o tym, jak rozpoznawanie emocji w Sentimenti pomaga wykrywać mowę nienawiści.
Analiza emocji pomaga wykrywać niebezpieczne zjawiska
Nasze badania wpisują się w światowe trendy stosowania rozpoznawania emocji w tekście do wykrywania niebezpiecznych zjawisk w internecie. Podczas ostatniej konferencji “ACL Symposium On Applied Computing” grupa badaczy zaprezentowała w artykule “Overwhelmed by Negative Emotions? Maybe You Are Being Cyber-bullied!” ciekawe wyniki analizy tekstu pokazujące, jak automatyczne wykrywanie emocji może pomóc w rozpoznawaniu cyberprzemocy.
Cyberprzemoc (cyberbullying) autorzy definiują jako agresywny i celowy atak na ofiarę, która nie ma środków obrony. Dlatego atak ten powtarza się w czasie a agresorzy wykorzystują do niego cyfrowe formy kontaktu.
Autorzy przygotowali zbiór tysiąca komentarzy z Instagrama, które ręcznie oznaczyli wartościami emocji, sentymentu oraz występowania cyberprzemocy. To pozwoliło im to zaobserwować, że złość i negatywny sentyment silnie korelują z cyberprzemocą, dlatego badacze zbudowali automatyczny klasyfikator wyłapujący z wiadomości te, które prawdopodobnie są cyberprzemocą.

Złość pojawia się znacząco częściej w postach zawierających cyberprzemoc (Tabela przedrukowana z cytowanego artykułu).
Wyniki badaczy są bardzo wstępne, a trafność klasyfikatora nie jest jeszcze wysoka. Badanie to pokazuje jednak bardzo obiecujący kierunek, dlatego też analiza emocji może uchronić wiele osób przed staniem się ofiarami cyberprzemocy.
Cytowane badanie:
Pinar Arslan, Michele Corazza, Elena Cabrio, Serena Villata. Overwhelmed by Negative Emotions? Maybe You Are Being Cyber-bullied! SAC 2019 – The 34th ACM/SIGAPP Symposium On Applied Computing, Apr 2019, Limassol, Cyprus.
Autorką posta jest Barbara Konat, kierowniczka badawcza Sentimenti.
utworzone przez Sentimenti Team | wrz 12, 2019 | Styl życia
Apple Event za nami. 12 lat i jeden dzień po pierwszej premierze iPhone Apple zaprezentował poprawione wersje telefonów, zegarków i iPadów oraz nowe serwisy gier i telewizji w sieci. Miliard sprzedanych iPhonów i tyleż pobrań aplikacji z App Store czyni ten telefon obiektem pożądania milionów na całym świecie. Sprawdziliśmy, jak na Apple Event, który odbył się 10 września (w godzinach 19:00-21:00 czasu polskiego) zareagowali polskojęzyczni Internauci.
Kto dziś pamięta telefony z klapką czy plastikową klawiaturą i malutkim ekranem? Miały wiele zalet: były tanie, a bateria trzymała tydzień. Dziś oczekiwania są ogromne: smartfon mamy ze sobą prawie non stop, trzaskamy selfie gdzie się da i przewijamy fejsa stojąc w kolejce lub korku. Ale niekoniecznie na iPhonie, bo od kilku lat iPhone ma konkurencję: Samsung, Huawei czy Xiaomi oferują równie zaawansowane modele, czasem tańsze i oparte na androidzie. Czym mógł iPhone zaskoczyć tym razem?
Apple Event. O czym pisano w sieci?
Może zaskoczył aparatem? Trzy obiektywy szpecą, ale w wersji iPhone pro dają możliwości kamery filmowej. Być może jest to ukłon w stronę youtubowych filmowców i internetowych influencerów. Zaprezentowano też nowy tryb zdjęć: SLOFIE, czyli slow motion selfie. Jak widać w wynikach naszej analizy najczęstszych sformułowań (chmura poniżej), nowe słówko jeszcze nie poszło w sieć.

Wobec tego może jaśniejszym ekranem i szybszym procesorem? Chmura słów wskazuje na zainteresowanie jakością baterii, czasem pracy sprzętu, trybem nocnym i samym systemem operacyjnym. Faktycznie, o tych udoskonaleniach polskojęzyczni internauci wspominali często, stwierdzenie na lepszy aparat pojawiało się w ich wypowiedziach rzadziej. Jeśli chodzi o inne funkcje, echem w sieci odbiło się na przykład to, że na razie iPhone nie będzie miał czytnika linii papilarnych, mimo że konkurencyjne marki wprowadziły go już jakiś czas temu.
Polskojęzyczni fani Apple zwrócili także uwagę na wprowadzenie Apple TV+ jako konkurenta NETFLIXa i HBO, ale już nie Apple Arcade – rodzinną platformę gamingową.
O iPhone 11 wiedzieliśmy jeszcze przed premierą najwięcej ze wszystkich dotychczasowych modeli, łącznie z tym, że trzy godziny przed samym Eventem wyciekły informacje o jego cenach. Jedyna naprawdę nowa informacja zaprezentowana na jego temat podczas konferencji dotyczyła funkcji ekranu always on. Jak widać z naszej chmury słów, pisano o niej (włączony ekran), jednak niezbyt często – większą sensacją okazało się wprowadzenie trybu nocnego.
Emocje wokół Apple Event

Najwięcej wzmianek dotyczących konferencji Apple pojawiło się w jej trakcie i bezpośrednio po zakończeniu. W godzinach 19-20 polskiego czasu (wydarzenie odbyło się o 10:00 czasu Cupertino w Kaliforni, USA). Wtedy przeważały te o pozytywnym wydźwięku, jednak około 21 zaczęło się to zmieniać. Co ciekawe, 11 września w nocy i rano pojawiło się niewiele wypowiedzi o wydarzeniu – za to procent negatywnych znacznie wzrósł. Z kolei poziom pobudzenia wzmianek, proporcja tych wyrażających silne emocje nie ulegała większym wahaniom. Nigdy też nie przekroczyła 32%, co świadczy o umiarkowanym entuzjazmie piszących.

Przyjrzyjmy się wynikom godzina po godzinie, skupiając się na różnicy pomiędzy liczbą uprzednio i publikowanych wzmianek. Zauważymy, że o 19 wzrosła nie tylko liczba wypowiedzi w ogóle, ale także udział tych pozytywnych. Jak wspomnieliśmy wcześniej, po 21 widzimy zmianę nastrojów polskich internautów, a w nocy i rano wzrost liczby negatywnych wypowiedzi.
Reakcje w trakcie konferencji
Analizując wzmianki minuta po minucie (słupki ilustrują procent wypowiedzi pozytywnych, negatywnych lub silnie nacechowanych emocjonalnie) możemy dostrzec zmiany wynikające z prezentacji kolejnych urządzeń i usług.

Pierwszy wyraźny wzrost entuzjazmu zauważamy około 19:07. Wówczas Apple Event dopiero się rozkręcało, prezentowano usługę Apple Arcade. O nowym iPadzie zaczęto mówić o 19:20 – notujemy tu przede wszystkim wzrost liczby wzmianek w sieci. Kolejny (19:28) wiąże się z prezentacją Apple Watcha piątej generacji. IPhone 11 został zaprezentowany o 19:49 – znowu notujemy wzrost liczby wzmianek. Około 20:09 zaczęto mówić o IPhonie 11 Pro. Tym razem nie dostrzegamy skoku pozytywnych reakcji, wręcz przeciwnie, około 20.16 pojawia się znaczny wzrost liczby negatywnych. Co więcej, po 20:30 dostrzegamy zmianę ogólnego wydźwięku dyskusji w sieci (patrz linie trendu). Wypowiedzi o negatywnym sentymencie zaczynają stopniowo przeważać nad pozytywnymi. Ten trend utrzymuje się także po zakończeniu konferencji.
Wnioski
Jak widać, zainteresowanie nowymi sprzętami i serwisami Apple w Polsce nie słabnie. Pewnie nie wszystkich jednak stać na zmianę telefonu lub zegarka. Polscy internauci intensywnie komentowali Apple Event, dyskusje w sieci trwały jeszcze kilka godzin. Jednocześnie wydźwięk wzmianek publikowanych w trakcie wydarzenia szybko zmienił się z raczej pozytywnego na negatywny. Wyniki przeprowadzonej przez nas analizy emocji oddają ten trend dużo lepiej niż chmura słów (pokazująca głównie zainteresowanie sprzętem i jego funkcjonalnościami).
Analiza sentymentu i emocji Sentimenti pozwala nam monitorować na bieżąco internetowe dyskusje toczone w języku polskim. Możemy pokazać, jak emocje zmieniają się z minuty na minutę w reakcji na prezentację konkretnego produktu, jego funkcji lub ceny. Z kolei możliwość prześledzenia zmienności i trendów wydźwięku opinii publikowanych w sieci w dłuższej perspektywie czasowej pozwala nam stwierdzić, jak trwałe nastroje wywołały w konsumentach wydarzenie, promocja czy prezentacja produktu.
utworzone przez Sentimenti Team | wrz 5, 2019 | Kategoryzacja komentarzy, Polityka i społeczeństwo, SentiBrand
Z okazji defilady 15 sierpnia Koleje Śląskie zaoferowały swoim pasażerom darmowe bilety. Z powodu ogromnej liczby chętnych pociągi były przepełnione. Spowodowało to lawinowy przyrost negatywnych komentarzy na temat tej firmy, podgrzanie atmosfery dyskusji oraz zaskakujące zmiany w emocjach.
Koleje Śląskie i wpadka wizerunkowa
O tym, jak bardzo lubimy defilady wojskowe, świadczy liczba uczestników obchodów Święta Wojska Polskiego. W tym roku, 15 sierpnia, minęła także 100 rocznica Powstania Śląskiego, dlatego defilada odbyła się w Katowicach.
Pokaz zatytułowany “Wierni Polsce” obejrzało około 200 tysięcy ludzi, ulicami Katowic przeszło 2600 żołnierzy, przejechało 180 pojazdów i przeleciało ponad 60 samolotów. Chętnych do oglądania polskich żołnierzy było więcej, z tego też powodu Koleje Śląskie przygotowały na ten dzień darmowe przejazdy. Niestety miejsc w pociągach było za mało i niektórzy zostali na peronach, rozeszli się do domów, zmuszeni oglądać paradę na ekranie.
W rezultacie to, co miało być przygodą, okazało się dniem straconym na oczekiwaniu na pociąg i stanie w tłumie zdezorientowanych ludzi.
Gdybym wiedziała, że tak zadrwicie z podróżnych, to bym pojechała samochodem
komentowała w sieci jedna ze zdenerwowanych pasażerek. Sytuacja była opisywana na łamach mediów lokalnych i krajowych, a liczba wzmianek o Kolejach Śląskich w internecie wzrosła z dnia 15.08 na 16.08 parokrotnie. I większość z nich to wzmianki negatywne. Przyjrzeliśmy się im, by ustalić, jakie dokładnie emocje tłok na dworcu i zawiedzione oczekiwania wywołały u entuzjastów pokazów militarnych. Oto nasze wyniki.
„Armagedon totalny”
Dane zebraliśmy w procesie monitorowania mediów elektronicznych. Przeanalizowaliśmy dzięki temu to, co działo się na Facebooku, Twitterze, Instagramie, YouTube, Wykopie a także w komentarzach pod publikacjami na portalach internetowych. Pozyskaliśmy w sumie prawie 10 tysięcy wzmianek dotyczących Kolei Śląskich z tego gorącego okresu.
Sytuację na dworcach porównywano do Armagedonu:
Armagedon totalny 3 pociągi przyjechały i do każdego z nich nikogo nie wypuścili bo były przepełnione ale pomimo tego udało mi się dojechać i było super wrażenia ekstra 🙂
Przepełnione pociągi spóźniały się, a zezłoszczeni pasażerowie obrzucali konduktorów wyzwiskami. Ocena sytuacji przez pasażerów była naprawdę niska:
Przepraszam za moje słowa ale dziś Kolej Śląska była do największej bani z możliwych. Zresztą nie pierwszy raz. Było do przewidzenia ze będą tłumy ludzi więc można też było zaplanować wszystko dokładniej. Ale nie… Po co ludzie na peronach mogą stać za przeproszeniem jak,, idioci,, a dzieci płakać że nie dojadę na defiladę. Porażka.
Gorące emocje z poprzednich przykładów widać na poniższym wykresie, który pokazuje, że im więcej wzmianek dotyczących Kolei Śląskich pojawiało się w internecie, tym większe było pobudzenie emocjonalne piszących.

Nietrudno się domyślić, że wypowiedzi te nie były pozytywne – w dniu parady widzimy duży skok udziału negatywnych wypowiedzi w dyskusji o Kolejach Śląskich. Jeszcze kilka dni komentarzy negatywnych było nadspodziewanie dużo, mimo trendu spadkowego.

Natężenie emocji w czasie
Szczegółowa analiza emotywna zebranych tekstów pokazuje zmiany natężenia emocji w czasie. Na poniższym wykresie widać wyraźnie, że istotną część wzmianek stanowią te z emocją złości. Największy wzrost liczby wzmianek zanotowano w godzinach wieczornych 15.08, czyli bezpośrednio po zakończeniu imprezy, kiedy jej uczestnicy wrócili do domów.
Na poniższym wykresie zmian natężenia emocji godzina do godziny łatwo zauważyć trudną sytuację przed paradą – znaczący wzrost złości i smutku przy znacznym spadku radości. To moment problemów z dojazdem na miejsce wydarzenia.

Wzmianki pojawiły się także następnego dnia rano, nadal negatywne, choć w mniejszej ilości. Dyskusja zakończyła się spadkiem wzmianek i wyrównaniem sentymentu około 15:00 16 sierpnia. Koleje Śląskie przeżyły krótki, ale intensywny kryzys medialny jako marka i nazwa instytucji. Średnia emocji ukazuje idealnie wzrost negatywnej dla marki dyskusji w godzinach wieczornych. Rozmowy te – przepełnione złością, smutkiem i wstrętem, trwały jeszcze w kolejnym dniu. Na poniższym wykresie widzimy wyraźnie jak emocje negatywne: złość, smutek, strach i wstręt (górna część wykresu) idą w górę 15 i 16 sierpnia.
W tych samych dniach emocje pozytywne wyrażane wobec Kolei Śląskich spadają (spadek radości i zaufania). Ciekawie zachowuje się emocja zaskoczenia, która jest emocją ambiwalentną – w zależności od kontekstu może być zarówno pozytywna jak i negatywna. W przypadku poniższego wykresu widać, że dołączyła do emocji negatywnych. O ile marka może chcieć zaskakiwać klientów nowymi promocjami, o tyle zdecydowanie nie warto zaskakiwać ich przepełnionym pociągiem.

Kryzys marki?
Podczas kryzysu marki chcą wiedzieć nie tylko jak się o nich pisze, ale także co jest pisane. Dlatego w naszych analizach stosujemy wizualizacje w postaci chmur słów negatywnych i pozytywnych. Pozwalają markom na głębszy wgląd w charakter dyskusji. W przypadku Kolei Śląskich widzimy wskazane przyczyny problemu (tysiąc ludzi, tłum ludzi), wyrażenia oceniające (totalna porażka, zero organizacji) a także twórcze (i często przesadzone) porównania do czasów minionych (czysty PRL, bydlęcy wagon).

Internauci chętnie wyrażają swoje frustracje i nie przebierają w słowach, gdy mają żal. Nasze narzędzia bez trudu pozwalają na wykrywanie wzrostu negatywnych wzmianek. Także na określenie, czy doszło do medialnego kryzysu marki lub osoby, oraz jakie towarzyszyły temu emocje.
utworzone przez Sentimenti Team | sie 29, 2019 | Kategoryzacja komentarzy
Jak mówimy o klimacie i jego zmianach? Oczekiwanie i strach – to częstość wyrażania tych dwóch emocji zmieniła się najbardziej od 2017 roku. Najrzadziej w przebadanych przez nas wypowiedziach pojawia się zaufanie.
W sieci dyskutujemy na różne tematy, w tym o klimacie i jego zmianach. Z roku na rok takich wzmianek pojawia się coraz więcej. Jednocześnie zmieniają się wyrażane w nich emocje.
Klimat. Największa intensywność dyskusji

Od września 2017 do lipca 2019 najwięcej pisano w sieci o klimacie w grudniu 2018 – kiedy trwał Szczyt Klimatyczny w Katowicach. Poruszano wówczas tematy zmiany klimatu i jej znaczenia dla zwykłych ludzi – pokazujemy to w poniższej chmurze słów.

Kolejna intensyfikacja następuje w czerwcu i lipcu 2019, już bez związku z konkretnym wydarzeniem silnie obecnym w mediach, za to przy okazji mówienia o upałach i globalnym ociepleniu. Używano także słów “katastrofa klimatyczna”.

Jeśli przyjrzymy się udziałowi pozytywnych i negatywnych wzmianek w dyskusjach toczących się w kolejnych miesiącach zauważymy, że oprócz października 2018 pozytywne wypowiedzi nigdy nie są częstsze od negatywnych.
Jednym z ważniejszych wskaźników intensywności dyskusji jest proporcja wzmianek o silnym nacechowaniu emocjonalnym (pozytywnym lub negatywnym) w porównaniu do tych bardziej umiarkowanych i neutralnych. W przypadku rozmów o klimacie widzimy, że w grudniu 2018 procent takich wzmianek był najwyższy w analizowanym okresie. To pokrywa się z wnioskami opartymi na liczbie wzmianek. Jednak kolejny okres intensyfikacji, lato 2019, nie wiąże się ze zwiększeniem temperatury dyskusji. Jaki z tego wniosek? Choć temat klimatu, jego zmian i zanieczyszczenia, był często poruszany, nie wywoływał więcej emocji niż w poprzednich miesiącach 2019. Zobaczmy, czy zmianie uległa częstość wyrażania którejś z 8 emocji podstawowych.
Jak zmieniają się nasze emocje?

Emocjami pojawiającymi się najczęściej w wypowiedziach o klimacie są złość i smutek. Do kwietnia 2018 roku dużo wzmianek wyrażano także oczekiwanie, jednak jego udział spadał stopniowo w kolejnych miesiącach. Najrzadziej pojawiają się wzmianki wyrażające zaufanie czy radość. Co ciekawe, wstręt także jest emocją rzadko okazywaną, gdy tematem dyskusji jest klimat.

Dwie emocje, które uległy największym zmianom w ciągu badanego przez nas okresu to strach i oczekiwanie. Obie wykazują wyraźne trendy: strach wzrostowy, a oczekiwanie spadkowy. Poza tym, o ile w 2017 przeważało oczekiwanie, więc wyraziliśmy więcej optymizmu i nadziei na lepsze, w 2019 przeważać zaczyna strach.
Klimat. O co boimy się coraz bardziej?
Kiedy piszemy w sieci o klimacie i jego zmianach, jesteśmy źli i coraz częściej wyrażamy strach. Robimy to przy okazji uskarżania się na falę upałów lub rozmawiania o szczycie klimatycznym. Przeanalizowane przez nas wzmianki bardzo rzadko niosą pozytywne emocje, w oczy rzuca się przede wszystkim brak zaufania, które tym razem pojawiało się w wypowiedziach internautów rzadziej niż zaskoczenie będące zwykle emocją najsłabiej obecną w naszych wynikach.
Polskojęzyczni użytkownicy Internetu piszący o klimacie nie mają wątpliwości, że zachodzące zmiany są straszne. Nie okazują także nadziei na poprawę sytuacji Ziemi – coraz rzadziej oczekują, że w jakiś sposób powstrzymamy katastrofę klimatyczną. Oczywiście, wyniki dotyczą opinii osób, które biorą czynny udział w tej dyskusji.
Analiza emocji pozwala prześledzić, jak zmieniają się nastroje społeczne i temperatura publicznych dyskusji na dowolny temat. Pozwala nam dużo lepiej zrozumieć, co oznacza wzrost lub spadek liczby wzmianek na jakiś temat. Tym razem skupiliśmy się na wzmiankach o klimacie, co pozwoliło nam potwierdzić nasze intuicje o coraz większym pesymizmie tej części społeczeństwa, która zabiera głos w sieciowych rozmowach na ten temat. W podobny sposób możemy podejść do innych ważnych kwestii społecznych, tak jak analizowaliśmy temat Brexitu. Uzupełniona o analizę częstości słów lub słów kluczowych pozwala nam także pokazać, że nawet przy okazji rozmów o serialach bardzo często mówimy o polityce czy społeczeństwie.
utworzone przez Sentimenti Team | sie 22, 2019 | Kategoryzacja komentarzy
Detekcja mowy nienawiści (hate speech) jest bardzo trudnym zadaniem w każdym języku. Analiza emocji Sentimenti może pokazać, jak bardzo wydźwięk emocjonalny cyberbullingu różni się od zwykłych negatywnych wypowiedzi.
Mowa nienawiści według Rady Europy
“wszystkie formy ekspresji, które rozpowszechniają, podżegają, wspierają lub usprawiedliwiają nienawiść rasową, religijną, ksenofobię, antysemityzm lub inne formy nienawiści wynikające z nietolerancji, łącznie z nietolerancją wyrażoną za pomocą agresywnego nacjonalizmu i etnocentryzmu, dyskryminacją i wrogością wobec przedstawicieli mniejszości, imigrantów i osób obcego pochodzenia”.
Jak widać, negatywne emocje jeszcze nie oznaczają mowy nienawiści – wypowiedzi mające jej znamiona są agresywne, nawołują do przemocy lub ją usprawiedliwiają.
To nasze pierwsze podejście do tego tematu, postanowiliśmy więc zacząć od dobrych danych – zbioru wzmianek poklasyfikowanych przez ekspertów. Szczęśliwie dla nas, w tegorocznym wyzwaniu Poleval jedno z zadań dotyczyło właśnie detekcji mowy nienawiści. Objęło ono 10041 wzmianek, w tym 851 (jedyne 8%) uznanych za cyberbulling. W tym wpisie nie zajmiemy się wykrywaniem mowy nienawiści, raczej przyjrzymy różnicom w wydźwięku tak oznaczonych wzmianek na tle innych, mniej ofensywnych.
Przy okazji pokażemy model emocji obejmujący z jednej strony klasycznie rozumiany sentyment, z drugiej miarę pobudzenia emocjonalnego określającą, czy dana wzmianka wyraża silne emocje. Miara ta dookreśla wydźwięk tekstu, dzięki czemu możemy odróżnić, na przykład, silnie negatywnie nacechowane wypowiedzi od negatywnych, ale umiarkowanych w swoim wyrazie.
Cyberbulling? Chodzi o emocje
Zastosowanie analizy emocji powinno dać bardzo dobre wyniki w zadaniu odróżniania mowy nienawiści od innych wypowiedzi, pozytywnych lub negatywnych. W końcu nie każde silne zdenerwowanie jest nawoływaniem do przemocy czy wykluczania. Wspomniana wcześniej miara pobudzenia może okazać się w tym zadaniu bardzo przydatna. Wypowiedzi mające znamiona cyberbullingu to w końcu ekstremalne przypadki słownego manifestowania złości i wstrętu. Pisze o tym między innymi cytowana przez nas wcześniej Maria Jarymowicz.
Analizując mowę nienawiści zastosowaliśmy nasz algorytm BiLSTM do klasyfikacji wzmianek. Wskazuje on, czy dany tekst ma pozytywny lub negatywny sentyment oraz czy natężenie emocji jest w nim silne czy słabe. Traktujemy te trzy zmienne jako spójny model emocji.

Dwa analizowane przez nas zbiory komunikatów – zwykłe wypowiedzi i mowa nienawiści – różnią się istotnie (Chi=17,73; p<0,001) udziałem wzmianek o pozytywnym i negatywnym wydźwięku oraz procentem wzmianek o wysokim pobudzeniu emocjonalnym (wykresy poniżej i powyżej). Mowa nienawiści obejmuje więcej wzmianek silnie emocjonalnych i negatywnych, a mniej pozytywnych. Oznacza to, że negatywna wypowiedź o wysokim pobudzeniu z dużym prawdopodobieństwem może zostać zaklasyfikowana jako cyberbulling.

Wykrywanie mowy nienawiści
Analiza sentymentu pokazała różnice pomiędzy dwoma zbiorami wzmianek: zwykłymi i nienawistnymi. To pierwszy krok w kierunku wykrywania mowy nienawiści. Narzędzie dedykowane do wykrywania cyberbullingu musi brać pod uwagę także to, że czasami ostateczny wydźwięk wypowiedzi jest bardzo zależny od kontekstu – ale także od tego, kto się wypowiada (wskazują na to na przykład Waseem i Hovy). Co gorsza, mowa nienawiści może ukrywać się także pod płaszczykiem obiektywizmu i formalnego języka.
Pomiar emocji lub klasyfikowanie wzmianek pod względem pobudzenia może wspomóc pracę administratorów mediów społecznościowych czy forów. Zwłaszcza jeśli będzie stosowana w towarzystwie innych filtrów, w tym wyłapujących przekleństwa i słowa uważane za obraźliwe oraz historię wypowiedzi danego użytkownika. Taka analiza emocji dostrojona dodatkowo do dziedziny czy konkretnej tematyki może stać się sprawnym narzędziem wykrywania cyberbullingu.
Dodatek: analiza emocji
Wyniki analizy emocji nie są tak jednoznaczne jak analizy sentymentu, ale uzupełniają nasze rozumienie cyberbullingu. Wstręt i złość to emocje pojawiające się w definicjach mowy nienawiści. Z kolei nasze wyniki wskazują także na istotność strachu oraz smutku w detekcji tego zjawiska.
