Instrukcja Sentitool

Celem tego dokumentu jest zaznajomienie u偶ytkownika z narz臋dziem Sentitool dost臋pnym jako aplikacja webowa pod adresem https://sentitool.sentimenti.pl. Serwis pozwala na rozpoznawanie emocji wyra偶anych przez teksty wed艂ug statystycznego u偶ytkownika w 18 dost臋pnych j臋zykach, w szczeg贸lno艣ci: polski, czeski, angielski, francuski, w艂oski, portugalski, hiszpa艅ski, du艅ski, esto艅ski, niemiecki, norweski, rosyjski, szwedzki, du艅ski, fi艅ski, grecki, s艂owe艅ski, turecki. Dost臋p do j臋zyk贸w i innych opisanych w instrukcji opcji zale偶y od poziomu konta u偶ytkownika.

Analizie mog膮 by膰 poddawane d艂u偶sze artyku艂y, jak i kr贸tkie wzmianki, w tym posty z medi贸w spo艂eczno艣ciowych. Istnieje mo偶liwo艣膰 analizy emotywnej dla ka偶dego z akapit贸w analizowanego tekstu osobno.

Podstawow膮 funkcj膮 narz臋dzia jest automatyczne dodawanie do tekst贸w metadanych w postaci 11 warto艣ci:

  1. 8 emocji podstawowych ko艂o emocji plutchika psychologia pomiar emocji nat臋偶enie psychologiaEmocje:
    1. Z艂o艣膰
    2. Strach
    3. Smutek
    4. Wstr臋t
    5. Zaskoczenie
    6. Oczekiwanie
    7. Rado艣膰
    8. Zaufanie
  2. Sentyment:
    1. Sentyment pozytywny
    2. Sentyment negatywny
  3. Pobudzenie

Logowanie do systemu wymaga podania nazwy u偶ytkownika, nazwy organizacji/firmy oraz has艂a.

Do nazwy organizacji/firmy przypisane s膮 dost臋pne metody analizy oraz konta u偶ytkownik贸w maj膮cych do niego dost臋p. Z kolei do danego u偶ytkownika przypisane jest Archiwum, w kt贸rym dost臋pne s膮 wszystkie przeanalizowane przez danego u偶ytkownika pliki.

W ramach najbardziej rozbudowanego konta, dost臋pne s膮 nast臋puj膮ce mechanizmy oceny emotywnej w tek艣cie (szersze opisy w tabeli poni偶ej).

  1. Agregatory - najprostsze modele, agreguj膮ce dane, r贸偶ni膮 si臋 od siebie ilo艣ci膮 danych,
  2. Klasyfikatory - modele zero-jedynkowe, r贸偶ni膮ce si臋 sposobem analizy danych,
  3. Regresory - najbardziej zaawansowane modele.

Inne typy kont mog膮 zawiera膰 mniejsz膮 liczb臋 metod analizy do wyboru lub dawa膰 u偶ytkownikowi dost臋p tylko do jednej metody.

Po zalogowaniu do systemu u偶ytkownik widzi ekran pozwalaj膮cy na wyb贸r metody analiz (lista rozwijana), rodzaju analizowanego pliku oraz rozpocz臋cie analizy.

Widok u偶ytkownika pozwala na wczytanie pliku (panel po lewej) do analizy oraz przegl膮danie archiwum - historii analiz danego u偶ytkownika (panel po prawej).

Okno drag & drop pozwala na wczytanie pliku do analizy. Narz臋dzie przyjmuje pliki XLSX (XLS) zawieraj膮ce przynajmniej jedn膮 kolumn臋 z tekstem (kolejne wzmianki w wierszach) lub pliki TXT zebrane w ZIP (jeden lub wi臋cej TXT, mog膮 znajdowa膰 si臋 w podfolderach).

Po wczytaniu pliku XLSX aktywne staj膮 si臋 okna wyboru serwisu (Serwis), arkusza i kolumny z tekstami do analizy. Wszystkie otwieraj膮 listy jednokrotnego wyboru: metod, arkuszy i kolumn. Dopiero po wskazaniu, jak膮 metod膮 i jakie dane maj膮 zosta膰 przeanalizowane (wskazanie odpowiedniej kolumny) mo偶liwe jest rozpocz臋cie przetwarzania, czyli automatycznej analizy emocji wybran膮 metod膮. Po rozpocz臋ciu analizy plik zostaje przeniesiony do archiwum.

Mo偶liwe jest tak偶e usuni臋cie pliku wczytanego na serwer, dla kt贸rego nie zacz臋艂a si臋 jeszcze analiza - ikona kosza obok zielonej ikony startu.

Pliki na wyj艣ciu zawieraj膮ce wyniki analizy emocji zawsze maj膮 format XLSX, zawieraj膮 kolumny z wynikami (8 emocji, 2 zmienne opisuj膮ce sentyment oraz dodatkowo pobudzenie emocjonalne), 鈥瀌oklejone鈥 do kolumn pliku poddanego analizie (lub umieszczone w pliku stworzonym w trakcie przetwarzania plik贸w TXT). W przypadku analizy TXT ka偶dy wiersz tabeli wynikowej jest dodatkowo oznaczony nazw膮 pliku TXT, kt贸ry zosta艂 przeanalizowany (automatycznie tworzona jest pierwsza kolumna pliku wynikowego).

Wczytanie pliku ZIP przebiega analogicznie jak XLSX opisane powy偶ej, ale zamiast wyboru arkusza i kolumny mo偶liwe jest zaznaczenie opcji 鈥瀉naliza wieloakapitowa鈥. W贸wczas analizowany jest nie tylko ca艂y tekst, ale tak偶e jego poszczeg贸lne akapity zdefiniowane jako fragmenty rozdzielone znakami ko艅ca linii (鈥瀄n鈥, czyli 鈥瀍nter鈥). W wynikowym XLSX ka偶dy akapit zostanie ponumerowany oraz zaklasyfikowany jako 鈥瀙ierwszy鈥, 鈥瀘statni鈥 lub 鈥炁況odkowy鈥 (wszystkie pozosta艂e akapity).

Po wczytaniu na serwer pliku XLSX nale偶y wybra膰 arkusz i kolumn臋 z tekstem do analizy. Plik excelowy musi mie膰 przynajmniej jedn膮 kolumn臋 posiadaj膮c膮 nazw臋 (w pierwszym wierszu pliku zawieraj膮cym jakiekolwiek dane), w kt贸rej jest tekst przeznaczony do analizy. Poza tym arkusz mo偶e zawiera膰 inne kolumny z dowolnymi danymi, w tym z dat膮 czy godzin膮 publikacji wzmianki. Te dane nie zostan膮 utracone ani nadpisane.

Je艣li podczas wybierania kolumny na li艣cie pojawiaj膮 si臋 puste linie lub nazwy, kt贸rych nie by艂o w ogl膮danym przez nas XLSX, oznacza to, 偶e plik nie zosta艂 poprawnie wczytany lub zawiera b艂臋dy. Po wybraniu arkusza i kolumny z danymi oraz klikni臋ciu na zielon膮 ikon臋 startu analizowany plik zostaje przeniesiony na list臋 archiwum, gdzie po przeanalizowaniu mo偶na obejrze膰 wyniki.

Pliki TXT musz膮 zosta膰 zapisane z kodowaniem UTF-8 oraz zebrane w plik ZIP, kt贸ry mo偶e zawiera膰 podfoldery - w贸wczas adres pliku TXT (podfolder lub zagnie偶d偶one podfoldery) zostanie uwzgl臋dniony w jego nazwie wskazanej w wynikowym XLSX.

Po wczytaniu na serwer i zainicjowaniu analizy status wczytanego na serwer pliku zmieni si臋 z INIT w kolumnie 鈥濪ownload鈥 na liczenie kolejnych przetworzonych wzmianek (np. 64/2158). Kiedy przetwarzanie wzmianek si臋 zako艅czy, pojawi si臋 zielona ikona oznaczaj膮ca, 偶e wyniki w XLSX s膮 gotowe do pobrania. W贸wczas mo偶na pobra膰 wynikowy XLSX lub obejrze膰 podsumowanie i wizualizacje.


W widoku archiwum mo偶na 艣ledzi膰 post臋py przetwarzania pliku (kolumna 鈥濿pisy鈥) lub zatrzyma膰 jego analiz臋 (je艣li na przyk艂ad wybra艂o si臋 z艂y arkusz lub z艂膮 kolumn臋 do analizy). Nale偶y w贸wczas nacisn膮膰 偶贸艂t膮 ikon臋 aktywn膮 w jedynie w czasie przetwarzania pliku. Po zako艅czeniu analizy, wyniki mo偶na usun膮膰 z archiwum (czerwona ikona kosza) - w贸wczas nie b臋d膮 wi臋cej dost臋pne do pobrania. Po klikni臋ciu na ikon臋 鈥瀒鈥 przechodzi si臋 z kolei do wizualizacji wynik贸w.

Analizie mo偶na podda膰 tak偶e pojedynczy tekst. Nale偶y go wpisa膰 lub przekopiowa膰 do pola tekstowego w zak艂adce 鈥濸ojedynczy tekst鈥, wybra膰 metod膮 analizy i klikn膮膰 ikon臋 startu. W przypadku pojedynczego tekstu nie mo偶na pobra膰 wynik贸w, ale ich podsumowanie jest dost臋pne w wizualizacjach (ikona 鈥瀒鈥 w archiwum).

Wyniki analizy emocji s膮 umieszczane po kolumnach z oryginalnego pliku XLSX i zapisywane w tym samym formacie, przy czym do nazwy pliku na wej艣ciu dodawana jest nazwa metody analizy. Przyk艂adowy plik wynikowy pokazany jest poni偶ej.

Wyniki maj膮 posta膰 11 kolumn 鈥 8 z wynikami analizy emocji, 2 polaryzacji (pozytywna i negatywna) oraz pobudzenia (emocjonalne nacechowania wzmianki oraz w jakim stopniu). W przypadku klasyfikatora anotacja 1 oznacza obecno艣膰 cechy (danego wyd藕wi臋ku, danej emocji), a 0 jej brak. Agregatory zwracaj膮 warto艣ci liczbowe w zakresie 0-1 (interpretowane jako nat臋偶enie emocji od 0-100%), a regresor od 0 do 100% (jak pokazano powy偶ej).

Zamieszczony powy偶ej zrzut ekranu pokazuje wyniki pomiaru emocji w tekstach umieszczonych w pierwszej widocznej kolumnie (鈥瀡ideoTitle鈥). Kolumna 鈥瀠s艂uga鈥 zawiera informacj臋 o serwisie. Kolumna 鈥瀙rocent s艂贸w emotywnych鈥 dotyczy jedynie agregator贸w i zawiera informacj臋 o tym, ile token贸w sk艂adaj膮cych si臋 na tekst mia艂o w danej bazie dowoln膮 anotacj臋 emotywn膮. Z kolei kolumna 鈥瀟re艣膰鈥 stanowi kopi臋 danych z kolumny analizowanej i jest jedynym miejscem, gdzie w pliku wynikowym zachowuje si臋 informacja o tym, jakie teksty opisuj膮 wyniki analizy emocji.

Wyniki analizy emocji dla wszystkich plik贸w TXT zebranych w jednym ZIP (w podziale na akapity lub nie) zwracane s膮 w pliku XLSX generowanym przez narz臋dzie do analizy. Ma on tak膮 sam膮 struktur臋 jak wyniki dodawane do przetwarzanego pliku XLSX. W przypadku analizy TXT akapit po akapicie聽 w wynikowym XLSX ka偶dy akapit zostanie ponumerowany oraz zaklasyfikowany jako 鈥瀋a艂o艣膰鈥, 鈥瀙ierwszy鈥, 鈥瀘statni鈥 lub 鈥炁況odkowy鈥 (wszystkie pozosta艂e akapity). Nazwa XLSX tworzona jest na bazie nazwy pliku ZIP z dodan膮 nazw膮 serwisu, a nazwa pliku zawiera nazw臋 TXT (jak poni偶ej) poprzedzon膮 nazw膮 folderu i znakiem 鈥/鈥, je艣li ZIP zawiera艂 podfoldery.

W przypadku u偶ycia agregatora (poni偶ej plik statistics.xlsx) wyniki analizy emocji zawieraj膮 informacj臋 o procencie s艂贸w emotywnych (czyli posiadaj膮cych anotacj臋 emotywne oraz wyra偶aj膮ce przynajmniej jedn膮 emocj臋).

W archiwum przechowywane s膮 wszystkie pliki przetworzone dot膮d przez danego u偶ytkownika. Jego struktura zorganizowana jest chronologicznie, z najnowszymi plikami u g贸ry listy.

Jak wida膰, zgromadzone s膮 w nim wszystkie wyniki z dowolnych modeli przetwarzania tekstu. Mo偶na tu pobra膰 XLSX z wynikami analizy (zielona ikona). Plik mo偶na tak偶e usun膮膰 z archiwum, w贸wczas nie b臋dzie mo偶liwe pobranie go po raz kolejny i zniknie z listy archiwum (ikona kosza). Z tej listy mo偶na tak偶e przej艣膰 do podsumowania i wizualizacji wynik贸w z danego pliku (niebieska ikona 鈥i鈥).

Archiwum pozwala 艣ledzi膰 post臋py przetwarzania pliku w艂a艣nie wczytanego na serwer i poddawanego analizie. Analiz臋 pliku mo偶na przerwa膰 i anulowa膰 (偶贸艂ta ikona), w贸wczas nie powstanie 偶aden wynikowy XLSX.

Archiwum pozwala przejrze膰 histori臋 analiz, z uwzgl臋dnieniem dat, u偶ytych metod oraz specyfikacji ustawie艅 analizy dla danego pliku wej艣ciowego.聽

Umo偶liwia tak偶e na filtrowanie plik贸w wed艂ug ich nazwy, nazwy arkusza lub kolumny oraz u偶ytej metody (pole 鈥濬iltruj鈥 nad list膮).

Z widoku archiwum mo偶na przej艣膰 (granatowa ikona 鈥瀒鈥) do podsumowania i wizualizacji wynik贸w z danego pliku.


Podsumowanie zosta艂o podzielone na opis wynik贸w (po lewej), gdzie znajduj膮 si臋 informacje o pliku i serwisie oraz wyniki - 艣rednie w przypadku regresora i agregator贸w, sumy w przypadku klasyfikatora. Dost臋pne s膮 dwa typy wykres贸w. Pierwszy wykres (u g贸ry) zawsze podsumowuje 8 emocji podstawowych, drugi - sentyment i pobudzenie (poni偶ej).

Maksymalny rozmiar pliku przes艂anego do analizy przez aplikacj臋 Sentitool to 20 MB. W przypadku wi臋kszych plik贸w, konieczne jest ich przygotowanie, tzn. podzielenie na mniejsze, przed wys艂aniem do aplikacji.

Sentitool umo偶liwia przetwarzanie jednego pliku na raz przez jednego u偶ytkownika.聽Poszczeg贸lne konta w ramach aplikacji Sentitool maj膮 wbudowane ograniczenia ilo艣ci danych, kt贸re mog膮 zosta膰 przeanalizowane danego dnia. Limit dotyczy wszystkich plik贸w XLSX, ZIP i pojedynczych tekst贸w w sumie.

Limitowane mo偶e by膰 tak偶e liczba wzmianek w danym pliku i tylko taka ilo艣膰 zostanie przeanalizowana, niezale偶nie od rzeczywistej d艂ugo艣ci analizowanych plik贸w.

 

Wiedza dla ciekawszych

  1. Sentimenti w publikacjach naukowych
  2. Jak powsta艂y narz臋dzia pomiaru emocji Sentimenti
  3. 8 emocji podstawowych
  4. Emocje: jak je rozumie膰?
  5. Dlaczego lepiej zbada膰 8 emocji w tek艣cie, zamiast tylko analizowa膰 sentyment?
  6. Sentyment a emocje 鈥 r贸偶nice w interpretacji
  7. Czego nie wiesz o pobudzeniu emocjonalnym
  8. Sentyment a emocje 鈥 r贸偶nice w interpretacji