comments 2

Tko to tamo huška?

Blogpost koji upravo čitate nadovezuje se na tekst Hrvoja Šimičevića u Novostima, stoga ne bi bilo loše da ga pročitate radi lakšeg razumijevanja. Na kraju objave nalaze se tehnički detalji o istraživanju.

Unaprijed se ispričavam zbog nekolicine nabacanih ideja i vizualizacija koje neću (dovoljno) temeljito objasniti. Primarni je cilj dati uvid u širok spektar mogućih analiza ovakvog skupa podataka, a zatim prikazati količinu mržnje na najpopularnijoj društvenoj mreži. Nekih ću se pitanja dotaknuti bez da na njih odgovorim, ali nadam se da će među istraživačima i istraživačicama potaknuti interes za ovakvim (i sličnim) temama.

Vjerojatnosti kažu da ste ovdje prvi put. Ako želite pročitati nekoliko riječi o samom blogu, pročitajte uvodnu objavu.

Omjeri, apsolutni iznosi i kreativnost

Istraživanje u Novostima obuhvaća korištenje pozdrava “Za dom spremni” na javnim Facebook stranicama. Analizirane stranice su: Velimir Bujanec, Direktno.hr, Dnevno.hr, Željko Glasnović, HČSP, HSP-AS, Kamenjar, Most nezavisnih lista, Narod.hr, Priznajem! Hrvat sam, Projekt Velebit, Sloboda.hr, Urbana desnica, Vecernji.hr i Vigilare. Započnimo s nekoliko činjenica o tom pozdravu i drugim čestim pojavama.

Top lista nadrealista

Javne Facebook stranice s najvećim udjelom poruka komentatora koje sadržavaju starohrvatski pozdrav1 su HČSP s 5,14% i Velimir Bujanec s 2,93%. Facebook stranica Željka Glasnovića je s 2,43% uzela treće mjesto stranici Projekt Velebit, koja zaostaje za samo 0,01%.

Šest stranica s najvećim omjerom poruka koje sadržavaju neki oblik pozdrava “ZDS”
:/

Ukupno je 24.814 Facebook korisnika barem jednom lajkalo komentar koji sadržava poklič iz opere2. Zajedno su takve komentare nagradili s 77.990 lajkova. 

:/

Stranica Priznajem! Hrvat sam sadrži 285 poruka u kojima komentatori smatraju da je Srbima mjesto na vrbama. Te su poruke ručno provjerene nakon inicijalnog filtriranja s ciljem odbacivanja onih poruka koje takav govor mržnje osuđuju ili su neutralne. Ostale stranice zajedno imaju oko 360 takvih poruka, ali one nisu ručno provjerene. Određene poruke ukazuju i na nezadovoljstvo komentatora uzrokovano ranijim brisanjem poruka tog sadržaja. Pojavljuju se i poruke koje problematiziraju potencijalni nedostatak vrba pa se uvode breze i grede kao alternativa. Komentar iz srpnja 2014. kaže:

“srbe na VRBEEE–čede na GREDE..to je STAROHRVATSKI ZAVIJET.jebem im dete od 6 mj. U oko.”

:/

Jugočetnici se spominju 502 puta, a Srbokomunisti 526. Omiljena varijanta ipak je klasični Srbočetnik s 1.798 pojavljivanja. Jugounitaristi su spomenuti tek slabih 49 puta – Mamićev odabir nije postao viralan na Facebooku. Komunjara je 28.850, ali tko to još broji?

:/

Skojevci” su prisutni 1.087 puta, “Petokolonaši” 1.554, a “Orjunaši” u ovoj kategoriji vode s 2.982 pojavljivanja. Predsjednica postavlja trendove i pažljivo bira riječi dok komentira nogomet, a saborski zastupnik Glasnović ima svoj đir pa u javnim nastupima više-manje koristi sve uvrede kojih se može sjetiti.

Broj poruka koje spominju Orjunu i orjunaše na mjesečnoj razini. Eksplozija u lipnju 2016. uzrokovana je komentarom predsjednice na prekid koji su uzrokovali navijači nezadovoljni stanjem u nogometnom savezu
:/

U porukama se 9.055 puta spominje Jasenovac, Bleiburg 4.765 puta.

:/

Djeca jugooficira” spomenuta su samo 45 puta. Izraz, izgleda, više nije aktualan ili je prisutan samo na internetskim portalima. Proročanstvo iz komentara koji datira iz rujna 2014. kaže:

“Djeca jugooficira. Jos malo… tik-tak”

:/

Udbaši” se spominju 31.133 puta. Odgovara li broj vašim predviđanjima? Treba naglasiti da je navedeni broj rezultat pretrage samo prema ulazima “udbaš*” i “udbas*” što znači da ne pokriva slučajeve gdje se “Udba” spominje kao organizacija. 

:/

Lustracija” je spomenuta 13.157 puta, a da nekoga treba “lustrirati” razmatra se u 1.719 poruka. Sudeći prema sadržaju poruka, lustracija je lijek za sve – od korumpiranih političara do išijasa. Komentar iz kolovoza 2016. pokazuje da ne misle svi kako nam je potrebna lustracija:

“Netreba nama lustracija nama treba Erdogen .”

:/

Kurva” je prisutna u 11.251, a “Drolja” u dodatnih 1,289 poruka.

:/

Pet ljudi vjeruje da je vokativ od “poglavnik” – poglavniĆe. Ne, nije tipfeler jer u istim porukama neki “Boban viĆe”.


Zašto?

Tko su ti fiktivni likovi i stvarne osobe koje su predmet mržnje? Tko su svi ti ljudi koji ostavljaju komentare natopljene govorom mržnje i zašto uopće komuniciraju na taj način? Sličnu artikulaciju mržnje prema Drugima nalazimo i u SAD-u, Ujedinjenom Kraljevstvu, Francuskoj, Mađarskoj i Poljskoj. Obrazac je poznat – unutarnje nezadovoljstvo prenosi se na fiktivnog neprijatelja, bio to zli migrant ili protunarodni element (koji se spominje slabih 85 puta, ali je zato 2.924 puta nešto antihrvatsko). Kome to ide na ruku?

Skupina koja zasigurno ima koristi od propagiranja ovakvog sadržaja su mediji, budući da je govor mržnje klikan. Širenjem govora mržnje na vlastitoj Facebook stranici pojedini mediji korisnike dovode na svoj portal i klikove na taj način unovče.

Tipičan primjer je portal Dnevno.hr koji svoju Facebook stranicu koristi kao distribucijski kanal za lažne vijesti i govor mržnje koji proizvode na portalu. O sadržaju se u posljednje vrijeme mnogo piše i nije bez razloga portal Dnevno.hr proglašen najgorim kada je riječ o mrzilačkom diskursu.

Tu je i voditelj Velimir Bujanec koji prenosi sadržaje vezane uz svoju emisiju i za kojeg sam pripremio jedan lajna graf3.

Prije toga, pogledajmo na 1:49 kako Velimir pred kamerama moli okupljene na prosvjedu – “nemojte nam štetiti sad, bez obzira” dok viču da su spremni. Korištenje istog pozdrava na Facebooku nagrađuje se lajkovima – tko god upravlja stranicom Velimir Bujanec, ukupno je 248 puta lajkao “ZDS” poruke od 173 različitih korisnika.

Facebook lajkovi administratora stranice Velimira Bujanca na “ZDS” poruke. Ukupni broj njegovih lajkova i broj različitih korisnika koji su od njega dobili lajk za takvu poruku.

 

Zašto s jedne strane ušutkava, a s druge promiče? Možda nema percepciju Facebooka kao javnog mjesta. Možda samo koristi sve preduvjete koji su već tu – mržnjom je jednostavno privući veći broj posjetitelja pa širenje takvog sadržaja i financijski drži vodu budući da se u procesu dobivaju jeftini klikovi. Facebook ne može sve počistiti, naši zakoni se ne provode, oni na vlasti o tome šute, ostalim čitateljima takvih stranica to očito ne smeta dovoljno da bi se s njih udaljili – i Velimir može veselo klikati mišem po plavim palčevima.

Političke stranke također mogu iskorištavati ovakav sadržaj. Njihova alkemija je pretvaranje straha i mržnje u glasove na izborima. Biračice i birači su discipliniraniji ako ih “kontinuirano ugrožavaju urbani jugoslaveni4. U ovoj tužnoj domaćoj izvedbi, možemo samo zaključiti kako je u pitanju red scare za siromašne.

Za bolje razumijevanje metode, stvari treba pogledati u vremenu. Potrošite par minuta na ovu interaktivnu vizualizaciju koja prikazuje udio “ZDS” poruka na pojedini dan za period od početka 2013. do kraja 2016. godine5
Gornja vizualizacija funkcionira kao vremenski filter za donju ako želite detaljnije pogledati neki mjesec ili godinu. Preporučam otvaranje vizualizacije u full-screen modu klikom na strelicu u desnom donjem kutu 6.

Hrvoje se u tekstu Cyber ustaše potrudio objasniti neke od ovih skokova. Slobodno istražite ostale i u komentarima napišite što ste otkrili7.

Često postavljena pitanja (FAQ):

Nije baš tipično koristiti ovu formu, ali iskoristit ću FAQ da unaprijed odgovorim na neka pitanja koja su mi postavljana u razgovoru o ovom projektu te da ubacim još nekoliko (ne nužno povezanih) vizualizacija.

P: Što točno misliš pod “poruka” u kontekstu Facebook podataka?

O: Poruka je komentar ili odgovor na komentar (reply). U slučajevima kada koristim riječ “komentar” mislim isključivo na komentare, bez odgovora.

Logička struktura podataka ona je koju svakodnevno vidimo na Facebooku: post → comment → reply. Prevedeno: Stranica piše objavu → na nju dolaze komentari korisnika → a na njih dolaze odgovori. Upravo ta logička veza omogućava da se npr. promatra povezanost između sadržaja objave i broja komentara ili lajkova na nju.

Dodatno, moguće je promatrati i koji korisnici lajkaju postove i komentare. Osim prema lajkovima, novije postove moguće je analizirati prema “reakcijama” (reactions – love, haha, wow, sad, angry).

P: Koliko je takvih poruka u ovoj bazi?

O: Ukupno 4.527.017 od čega je 3.446.175 komentara, preostalih 1.080.842 poruka su odgovori na komentare. U bazi je još i 166.501 objava s analiziranih stranica.

P: Kako se odvajaju poruke koje kritički govore o “ZDS” od onih drugih?

O: Ne odvajaju se programski. Moguće je napraviti model koji bi to radio s određenom preciznošću, ali ni to ne bi bilo dovoljno dobro. U trenutku upita prema bazi, odnosno tekstualnog filtriranja sadržaja, poruke se smatraju ravnopravnima. Ručnom provjerom (na uzorku od 300 nasumičnih poruka koje sadržavaju “ZDS”) utvrđeno je da čak 94% poruka odobrava korištenje ili izravno koristi taj pozdrav. Utoliko, brojke vezane uz takve poruke treba skalirati faktorom 0,94 da bi slika bila realna.

P: Kako si birao stranice i zašto baš ovaj uzorak?

O: Ručno sam provjeravao inicijalni skup od desetak stranica i uključivao ih ako su sadržavale mnogo hejterskog sadržaja. Zatim sam skidao pojedine stranice iz čiste radoznalosti i pretpostavljene povezanosti s prvima. U trećoj sam fazi stranice počeo skidati iz potpuno nepovezanih razloga tj. za neka druga istraživanja. Tako sam sakupio petnaestak stranica i zaključio da je vrijeme za analizu. 

Od početka istraživanja do danas prikupio sam još nekoliko većih8 i manjih9 Facebook stranica koje ću uključiti u bazu podataka. Prikupljanje velikog broja podataka putem Facebook API-ja nije brz proces.

P: Zašto se sprdaš s ovako ozbiljnom temom?

O: Žao mi je, ali nakon višetjednog bavljenja s preko 4.500.000 poruka napisanih na spomenutim stranicama, humor vidim kao jedini način da ostanem normalan. U procesu je bilo dosta ručnih analiza u sklopu kojih sam morao čitati komentare. Očima. Vlastitim.

Vadio sam nepovezane činjenice zato što želim prikazati analitički potencijal ovakvih baza podataka, a ne zato da bismo se imali čemu smijati za ručkom. Gotovo svaki od pretraživanih pojmova zaslužuje da se svi zajedno zapitamo – “Zašto se to konkretno događa?” i da se ljudi iz struke, studenti društvenih, ali i tehničkih znanosti, počnu baviti govorom mržnje na Internetu, pa tako i na javnim društvenim mrežama.

P: Što mogu zaključiti iz ovoga?

O: Ovo je deskriptivna analiza začinjena nepotrebnim komentarima. Iznesene brojke su stvarne, a prilikom zaključivanja treba razmišljati o kontekstu. Osim u slučaju ciljanog širenja fašizma – za to ne postoji prikladan kontekst.

Distribucije pojavljivanja traženih pojmova po stranicama značajno variraju od pojma do pojma i bez detaljnije analize nije moguće zaključivati o distribucija nekog od navedenih pojmova. Prevedeno na ljudski jezik, to znači da od ukupnog broj poruka koje sadržavaju npr. “Orjunaš” (2.982 poruka), stranica Direktno.hr sudjeluje u tom broju s 628 poruka, dok stranica MOST nezavisnih lista ima samo 23 poruke. Dakle, nije moguće pretpostaviti da sve stranice u jednakom omjeru sudjeluju u nekoj aktivnosti. Ovo je samo jedan od mogućih brzopletih zaključaka koje valja izbjegavati.

Također, bitno je imati na umu da strojna analiza ne razlikuje poruke koje stvarno koriste uvredu od poruka koje su prema uvredi neutralne, ironične ili kritički nastrojene. Za potrebe kritičnih dijelova analize, poput poruke “ZDS” ili poziva na vješanje manjina, stvarni postotci su ručno utvrđeni (što je spomenuto u ovom tekstu). Ostale pojmove (“udbaš”, “drolja” i slično) treba obraditi na isti način, iako je legitimno pretpostaviti da se u većini slučajeva koriste kao uvreda.

P: Govori li analiza nešto o takvom sadržaju na Facebooku općenito?

O: Ne. Analiza obuhvaća manji broj javnih stranica i njihov sadržaj nikako nije reprezentativan za Facebook u Hrvatskoj, niti za bilo što drugo. Za prikupljanje apsolutnog broja pojavljivanja neke riječi ili izraza, nužan je puni pristup čitavoj bazi Facebooka. Tek tada bi bilo moguće spomenutim brojkama pribrojiti sve slučajeve pojavljivanja ovakvog sadržaja na privatnim profilima korisnika, u privatnim grupama, eventima i privatnim stranicama općenito.

  • Validan zaključak je: “Minimalno 10.000 korisnika i korisnica Facebooka na javnim profilima napisalo je ustaški pozdrav.
  • Greška u zaključivanju: “Na Facebooku postoji ukupno 10.000 ljudi koji koriste ustaški pozdrav.

Još jedan validan zaključak je: “Znači, Facebook može sve to izračunati iz vlastite baze i na temelju toga gurati specifičan sadržaj onim korisnicima za koje izračuna da imaju najveću vjerojatnost da ga nekritički prihvate – makar bio lažan”.

Anksioznost je normalna reakcija na ovaj zaključak. Pročitate još ponešto na tu temu.

P: Jesu li korisnici koji pišu “ZDS” nekako povezani?

O: Jesu, ali povezanost se može definirati na mnogo načina. Ovo je primjer povezanosti korisnika u kojem je veza definirana kao lajk na relaciji dvoje korisnika.

Kliknite na sliku za uvećanu verziju. Deblja veza znači da je korisnik A više puta lajkao “ZDS” poruku korisniku B.

P: Koji je sadržaj najčešće poruke na pretraženim stranicama?

O: Bez konkurencije #CRO #OrangeSponsorsYou. Ukupno 119 tisuća samo u mjesecu nogometnog prvenstva. Evo distribucije po stranicama:

Broj “#CRO #OrangeSponsorsYou” poruka prema stranicama u lipnju 2017.

P: Imaš li možda pri ruci wordcloud napravljen iz transkripata rasprava u kojima je sudjelovao Miro Bulj?

O: Imam10.

Wordcloud napravljen iz transkribiranih rasprava u kojima je sudjelovao Miro Bulj na prvih nekoliko sjednica 9. saziva Sabora. Izvor podataka: http://edoc.sabor.hr/

Korištene su samo izjave Mire Bulja, a prije kreiranja wordclouda u R-u izbačene su ove česte riječi:

Planovi

Otvoren sam za nove ideje za pretragu i potrudit ću se da najbolje ideje iz komentara zaista istražim (u kontekstu prezentiranih podataka) te na njih odgovorim ako stignem.

Treba istražiti i koji sadržaj konkretno korisnike potiče na pisanje neciviliziranih poruka. Šteta bi bila ne iskoristiti mogućnosti R-a za kreiranje, primjerice, modela predviđanja broja “kurvi” u komentarima – ovisno o tome koja se političarka spominje u uvodnoj objavi koja se komentira i ovisno o tome na kojoj je Facebook stranici sadržaj objavljen. Moguće je izračunati i vjerojatnost da će se u naslovu članka pojaviti odjevni predmet ako je u njemu ime neke naše političarke. OK, to je definitivno širi problem od Facebooka. 

Moguće je dublje analizirati povezanost Facebook stranica, primjerice preko njihovih zajedničkih komentatora. Klikom na sliku dobit ćete uvećanu verziju tablice povezanosti prema udjelu zajedničkih komentatora.

Povezanost Facebook stranica prema udjelu zajedničkih komentatora. Primjer čitanja na temelju prvog iznosa lijevo gore: “40,2% komentatora koji su barem jednom komentirali nešto na Bujančevoj stranici, komentirali su nešto i na stranici od Direktno.hr”

Žao mi je što se istraživanje vjerojatno neće objaviti u formi istraživačkog rada, ali ću rado pojasniti detalje u komentarima ako bude bilo pitanja. Ovim putem zahvaljujem svim prijateljicama i prijateljima koji su na bilo koji način sudjelovali u projektu.

Tehnički detalji

Pretrage su vršene pomoću SQL-a nad podacima spremljenim u relacijskoj bazi. Uvjeti pretrage moraju pokriti deklinacije i druge oblike traženih pojmova pa treba paziti da ne bude dohvaćen krivi slučaj. Za dohvat podataka korišten je RFacebook paket. Podaci su zatim pohranjeni u relacijsku bazu Azure SQL Database. Analize i vizualizacije rađene su u više alata, prvenstveno Microsoft Power BI, Excel i ranije spomenuti open-souce R.

Čitava baza, zajedno s nekim redundantnim kopijama podskupa podataka i indexima, zauzima nešto manje od 8 GB prostora.

Funkcije za povlačenje podataka dostupne su na Github repozitoriju.

Projekt je rezultat znatiželje, eksperimentiranja s tehnologijama i neprihvaćanja fašizma. Internet je neizmjerno poremećeno mjesto, ali neki njegovi kutovi mjerljivo su odvratniji od drugih.

Izvor podataka: Facebook

Datum pristupanja podacima: siječanj 2017.

  1. Komentatori se često trude prikazati ustaški pozdrav “Za dom spremni” kao nešto što postoji od davnih vremena. Neki čak tvrde da je pozdrav stariji od Kolumbovih putovanja.
  2. Još jedan u nizu pokušaja da se racionalizira korištenje ZDS-a je pozivanje na operu Nikola Šubić Zrinjski iako je potpuno jasno da se tamo pozdrav ne pojavljuje u spornom obliku.
  3. Lajna chart službeno ne postoji, ali ovo je najdulji horizontalni bar chart koji mi je stao u 600 piksela, potrudio sam se za ovo :’)
  4. ™ Žele
  5. S ciljem smanjenja ekstrema (velika odstupanja iz dana u dan), funkcija je uglađena. Napravljen je moving average tako da se za svaki dan prikazuje sedmodnevni prosjek oko promatranog dana. Recimo da analiziramo četvrtak, 15.12.2016.: Za njega se funkcija računa tako da se uzmu svi dani od 12. do 18. prosinca (3 dana prije i 3 dana nakon četvrtka) i prosjek njihovih udjela predstavlja vrijednost našeg četvrtka.
  6. Imam jedan napola dovršen draft na temu korištenja Power BI vizualizacija za kojeg navijam da se dovrši sam od sebe
  7. Nemojte odmah ove najjednostavnije datume tipa 10. travnja i slično :P
  8. Index, Jutranji, HDZ, SDP
  9. U ime obitelji, Projekt Domovina
  10. Osim tehnološki, ovo nema nikakve veze s ostatkom istraživanja

2 Comments

  1. Žarko

    Izvrsna analiza, pismena s predivnim vizualizacijama (i jako zanimljivim italic dijelovima). RSS’d, cekam nove materijale \0/

    @ivan – drugu stranu?

Leave a Reply

Your email address will not be published. Required fields are marked *