Polski zbiór danych do wykrywania hejtu powstał przy współpracy z Wykop.pl

Zielczan★2023-08-24T12:41:17+02:00

Bieżąca wersja zestawu danych składa się z 24 000 próbek anonimizowanej treści, 12 000 sztuk dla „szkodliwych” i 12 000 dla klasy „neutralnej”.

A to dopiero pierwsza strona gorących

ocokaman

2023-08-24T15:52:13+02:00

Pewnie znowu wytrenują na lewacką modłę ze nie można obrażać wszystkich poza polskim heteroseksualnym białym mężczyzną, tzw dyskryminacja pozytywna

ZygoteNeverborn 2023-08-24T16:22:39+02:00

Andrzej Prałat

Przypadek? Nie sądzę.

Mikel★2023-08-24T16:51:11+02:00

content banned from a web service Wykop.pl (often called the "Polish Reddit") by professional moderators

[...]

The human moderation dynamics of the platform let us assume that the remaining (not banned) content after this period can be considered non-harmful.

Patrząc na jakość i skuteczność pracy moderacji, śmiem wątpić nad jakością tego zbioru Musieliby zrobić selekcję i wyciąć tagi #blackpill i #patostreamy bo tam co chwila albo hejt albo wyzwiska. Zakładam więc że grupa kontrolna zawiera wcale niewiele mniej hejtu niż sama próbka.

Garbage in -> garbage out

sebie_juki 2023-08-24T16:53:16+02:00

Ciekawe o kim to było, przed anonimizacją?

Pierwsza myśl - [pseudonym]. Ku⁎⁎⁎⁎zcze, które zrobiłoby wszystko za status [pseudonim] w serwisie.

Orzech★2023-08-24T19:35:27+02:00

Wytrenować na tym LLMa i będzie śmiesznie

hellgihad 2023-08-24T21:35:23+02:00

@rakieciara O qrwa, dobry se model znaleźli to tak jakby próbowali nauczyć AI uczciwości od polityka xD

imie-nazwisko

2023-08-24T22:08:27+02:00

@rakieciara 100 razy więcej hejtu jest na forum Gazety Wyborczej - tyle, że tam wyzywają katolików i księży. Wystraczy byle tekst, że ulicami przeszła procesja z okazji bożego ciała. Gdyby te wpisy dotyczyły Murzynów, ich autorzy dostawaliby wyroki.

ujumaki

2023-08-25T03:41:53+02:00

Komentarz usunięty przez moderatora

Opornik★2023-08-25T06:20:03+02:00

rakieciara chyba nie wie jakim rakotwórczym gównem jest wykop, nawet nie chce mi się klikać....

Miedzyzdroje2005 2023-08-25T11:31:48+02:00

@rakieciara a tymczasem Wykop traci coraz więcej użytkowników. Najnowsze dane > https://www.hejto.pl/wpis/sa-nowe-statystyki-odwiedzalnosci-polskich-internetow-mediapanel-w-kategorii-med

Są nowe statystyki odwiedzalności polskich Internetów, Mediapanel w kategorii media społecznościowe. Chcecie - Miedzyzdroje2005 - Hejto.pl

Są nowe statystyki odwiedzalności polskich Internetów, Mediapanel w kategorii media społecznościowe. Chcecie wiedzieć, jak wypadł Wykop? Otóż tak: kwiecień 2023 - 2,63 miliona realnych użytkowników, 8,01% zasięgu maj 'br - brak danych i zmiana metodologii czerwiec 'br - 2,14 miliona

Hejto.pl

NiosePrawde 2023-08-27T22:32:59+02:00

Wieść głosi że Michał Białek z Poznania osobiście tam dodał dziecięcą pornografię.

Popularne artykuły

Popularne dyskusje

Kategorie

Popularne tagi

Komentarze (18)