@rakieciara dodała fajny zbiór danych do wykrywania hejtu na podstawie moderacji serwisu wykop.pl
https://www.hejto.pl/wpis/polski-zbior-danych-do-wykrywania-hejtu-powstal-przy-wspolpracy-z-wykop-pl

Znalazłem kilka cytatów o partii:
8292,"> uważaj kolego już raz oddziały specjalne [pseudonym] skasowały ten obrazek
{USERNAME}: jebać pis też kasują za to jebać biedę już jest legalne
! debile",1

3548,"Jak myślicie, będzie coś dzisiaj w #tvpis o zabójstwie irańskiego generała? Czy standardowo broszurka wyborcza PiS i udajemy, że świat poza Polską nie istnieje? ( ͡° ͜ʖ ͡°)
#bekazpisu #kurwizja #polityka",1

8540,"Na S8 do Warszawy wjeżdża okolo 30 policyjnych suk. Czyby Pis coś szykował?
#warszawa #jebacpis",1

2763,No j mamy pierwsze blokady dróg . Jebac PiS ( ͡° ͜ʖ ͡°),1

Na szybko przejrzałem, ale jebać + OPA/Ciebie/[nazwisko]/grupę społeczną/policję/kraj jest na liście ale
jebać + inna niż pis partia nie ma w tym zbiorze albo jest w minimalnych ilościach

Znalazłem też w sumie 0 wystąpień dla jebać biedę i tagu jebacbiede

Jak ktoś będzie trenował na tym sieci neuronowe to niemożliwe będzie wypowiadanie się negatywnie o partii bo automoderacja nie pozwoli

#sztucznainteligencja #datascience #programowanie #ai
entropy_ userbar
rakieciara

@entropy_ zastanawiałam się czemu wykop sam nie ogłasza że uczestniczyli w takim projekcie, może ogarnęli ze mogą wyjść ciekawe rzeczy o ich sposobach moderacji. Nadmienię autorom takie polityczne nacechowanie.

entropy_

@rakieciara nr 3548 to już cenzura partyjna. Gdzie tam jest hate speech?

No ogółem jak przejrzałem to rzeczywiście są inwektywy, ale sporo jest takich typu: cymbał! TY też cymbał!

Słynne standardy moderacyjne wykopu xD

GrindFaterAnona

@entropy_ a co to z lista? Tego typu algorytm powinien wylapywac szerszy kontekst niz ograniczac sie do zlepku slow

entropy_

@GrindFaterAnona tyle, że tam jest negatywnie w 99% o Pisie.

Algorytm nauczy się, że negatywne komentarze o pisie to mowa nienawiści i nie będziesz mógł nic napisać złego o partii.

Zobacz przykład 3548. To nie jest mowa nienawiści ale uczysz algorytm banowania takich tekstów, które są partii nieprzychylne.

Szczerze to nie znalazłem za dużo o innych partiach

GrindFaterAnona

@entropy_ i dont care, wykop moze mi possać. Wolalbym porozmawiać o algorytmach pod tagiem #datascience

Zaloguj się aby komentować