@rakieciara dodała fajny zbiór danych do wykrywania hejtu na podstawie moderacji serwisu wykop.pl

https://www.hejto.pl/wpis/polski-zbior-danych-do-wykrywania-hejtu-powstal-przy-wspolpracy-z-wykop-pl


Znalazłem kilka cytatów o partii:

8292,"> uważaj kolego już raz oddziały specjalne [pseudonym] skasowały ten obrazek

{USERNAME}: j⁎⁎ać pis też kasują za to j⁎⁎ać biedę już jest legalne

! debile",1


3548,"Jak myślicie, będzie coś dzisiaj w #tvpis o zabójstwie irańskiego generała? Czy standardowo broszurka wyborcza PiS i udajemy, że świat poza Polską nie istnieje? ( ͡° ͜ʖ ͡°)

#bekazpisu #kurwizja #polityka",1


8540,"Na S8 do Warszawy wjeżdża okolo 30 policyjnych suk. Czyby Pis coś szykował?

#warszawa #jebacpis",1


2763,No j mamy pierwsze blokady dróg . J⁎⁎ac PiS ( ͡° ͜ʖ ͡°),1


Na szybko przejrzałem, ale j⁎⁎ać + OPA/Ciebie/[nazwisko]/grupę społeczną/policję/kraj jest na liście ale

j⁎⁎ać + inna niż pis partia nie ma w tym zbiorze albo jest w minimalnych ilościach


Znalazłem też w sumie 0 wystąpień dla j⁎⁎ać biedę i tagu jebacbiede


Jak ktoś będzie trenował na tym sieci neuronowe to niemożliwe będzie wypowiadanie się negatywnie o partii bo automoderacja nie pozwoli


#sztucznainteligencja #datascience #programowanie #ai

Komentarze (5)

rakieciara

@entropy_ zastanawiałam się czemu wykop sam nie ogłasza że uczestniczyli w takim projekcie, może ogarnęli ze mogą wyjść ciekawe rzeczy o ich sposobach moderacji. Nadmienię autorom takie polityczne nacechowanie.

entropy_

@rakieciara nr 3548 to już cenzura partyjna. Gdzie tam jest hate speech?

No ogółem jak przejrzałem to rzeczywiście są inwektywy, ale sporo jest takich typu: cymbał! TY też cymbał!

Słynne standardy moderacyjne wykopu xD

GrindFaterAnona

@entropy_ a co to z lista? Tego typu algorytm powinien wylapywac szerszy kontekst niz ograniczac sie do zlepku slow

entropy_

@GrindFaterAnona tyle, że tam jest negatywnie w 99% o Pisie.

Algorytm nauczy się, że negatywne komentarze o pisie to mowa nienawiści i nie będziesz mógł nic napisać złego o partii.

Zobacz przykład 3548. To nie jest mowa nienawiści ale uczysz algorytm banowania takich tekstów, które są partii nieprzychylne.

Szczerze to nie znalazłem za dużo o innych partiach

GrindFaterAnona

@entropy_ i dont care, wykop moze mi possać. Wolalbym porozmawiać o algorytmach pod tagiem #datascience

Zaloguj się aby komentować