Firmy AI kłamały – modele zapamiętują całe teksty chronione prawem, a nie tylko uczą się wzorców

Badanie przeprowadzone przez naukowców ze Stanford i Yale University ujawniło, że główne modele AI, takie jak Gemini, Grok i Claude, mogą przywoływać duże fragmenty chronionych prawem autorskim książek dosłownie, gdy zostaną odpowiednio poproszone.


Podczas gdy firmy AI twierdzą, że ich modele uczą się wzorców, a nie zapamiętują tekst, badanie wykazało, że poprzez podanie pierwszego zdania książki i poproszenie AI o kontynuację, modele takie jak Claude i Gemini mogły odtworzyć do 95% książek takich jak Harry Potter i Wielki Gatsby.


Nawet przy domyślnych ustawieniach Gemini i Grok dostarczały obszernych tekstów bez potrzeby stosowania technik "jailbreakingu", które były wymagane w przypadku Claude'a i ChatGPT, aby ominąć początkowe odmowy. To odkrycie podważa obronę branży AI w toczących się procesach sądowych dotyczących naruszenia praw autorskich, sugerując, że modele AI przechowują całe książki w swoich danych, co budzi obawy dotyczące potencjału zapamiętywania innych wrażliwych informacji, takich jak rozmowy i dane prywatne. Badanie potwierdziło również, że modele nie mogą wyodrębniać danych opublikowanych po terminie ich szkolenia, co wskazuje, że wyodrębniona treść rzeczywiście pochodzi z ich danych treningowych.

Źródło: https://arxiv.org/pdf/2601.02671v1

#sztucznainteligencja #ai #ainews

YouTube

Komentarze (8)

@twardy_kal_owiec - zdecydowanie.

Nie wiem czy to co pierdolą CEO Microslopu i NVidii otwiera ludziom oczy czy nie - ale jest to oznaka kompletnego oderwania od rzeczywistości i strachu, że się w końcu społeczeństwo zorientuje, iż przewalili miliardy na chuj wie co.

Do tego Altman od kilku lat popycha takie kocopoły, że aż mnie (użytkownika AI od samego początku) skręca.

Jak ta napompowana bańka zapętlonymi inwestycjami firm samymi w siebie z kółka wzajemnej adoracji pęknie to wszyscy to odczujemy - a chuj wie jak długo ją jeszcze będą pompować (to tego dochodzi możliwość bailoutu bo te firmy są za duże by upaść).

@koszotorobur nie otwiera, bo takie bezmyślne używanie ejaja do generowania głupich obrazków, albo paranoidalnego zadawania ciągle w każdym kontekście pytania "hej grok czy to prawda" stało się nowym trendem, tak samo jak kiedyś trendem był przykładowo fejs i inne sociale. Korzystają na tym tylko ci, co tą bańkę pompują bez opamiętania, czyli firmy, które wzajemnie się finansują w tym pierdolniku, żeby udawać, że żadna nie robi szwindla. Tylko no- kiedyś to w końcu jebnie, tak samo jak to z dotcomem było. To nie tak, że internet wtedy zniknął, sklepy internetowe się zawinęły, czy coś, ale rynek się porządnie oczyścił i jak na ironię to wtedy na szerokie wody wypłynęły spółki takie jak Google, które dziś robią dokładnie to samo co ich poprzednicy tuż przed upadkiem. A jebnąć to musi, bo jeśli odjąć te wirtualne transfery gotówki z korpo do korpo i skupić się tylko na przychodzie od konsumentów... to cała ta szajba nie przynosi żadnego zysku. Ba- nawet nie wychodzą z tym na zero. Altman rok w rok od 10 lat sprzedaje kity inwestorom OpenAI, jedyna różnica jest taka, że w 2015 miał $0, a teraz ma $0 000 000.0 i tak samo rok w rok uprawia korporacyjne żebry do rządu Stanów o grube setki milionów subsydiów, żeby mu tego dziwnego eksperymentu nie zamknęli. Microsoft wciska wszędzie gdzie się da Copilota, jak skończyli z osobnym produktem, to zaczęli to wjebywać do Office'a, bo przecież wiadomo, że ludzie po napisaniu dokumentu na 15 stron chcą, żeby jakiś upośledzony bot im to wszystko przemielił i cholera wie co z tego zrobił. Skończył się Office, to przeszli do Windowsa i jakby mało było tego chujstwa w starcie, to zaczęli to wciskać kurwa do notatnika. Nie mówiąc już o tym, że 30% kodu W11 to halucynacje AI, co widać po doniesieniach. Twitter próbuje udawać, że idzie mu sprzedawanie tego ichniego premium do Groka, zresztą podobnie jak Google ze swoim Gemini. A do tego dochodzą jeszcze jakieś chińskie odszczepy i nagle się okazuje, że nie dość, że mamy grupę produktową, która nigdy nie została w ogóle dopracowana, wyceniona, ani sprawdzona pod kątem zapotrzebowania rynku poza sztucznym kreowaniem hajpu, to pojawił się problem znany ze streamingów wszelkiej maści, gdzie namnożyło się tego tyle, że rynek został praktycznie rozsmarowane do granicy nieużywalności. A mimo to ciągle, po latach ciągłego trenowania tego śmiecia i obiecywania jakichś cudów na kiju dostajemy wyniki, które i tak za każdym razem trzeba weryfikować, więc na cholerę mi takie AI skoro można to samemu zrobić już za pierwszym razem? Jak pytamy o coś względnie nowego, to w ogóle powodzenia w używaniu AI, które będzie halucynować po całości, bo jest zaprogramowane na odpowiadanie i udawanie mądrego, żeby firma-matka nie miała zjebanego wizerunku. Ciągle i ciągle kolejne zasoby są przekierowywane do puchnięcia kolejnego datacentra- były grafiki, były dyski, teraz jest ram, a ptaszki ćwierkają, że procesory będą następne. Jakby tego było mało, to te wszystkie centra AI żrą już teraz tyle prądu co nieduże państwo, a i tak to nie koniec problemów, bo niebezpiecznie szybko zbliża się kolejny- bo się okazało, że te fajne, mądre centra danych wpierdalają pokaźną ilość nie tylko prądu, ale i wody, żeby w ogóle się nie zagotować i nie można tego "tak se" wylać z powrotem do rzeki więc czekam, aż siądą na tym jeszcze wszelkie organizacje ekologiczne, bo ich tam jeszcze brakuje do kompletu i dostaniemy jakiś eko-podatek od używania tego badziewia wliczony w koszt produktu. I wszystko by było fajnie, gdyby nie to, że całe dostępne w -nastu odsłonach AI powstało na kanwie największej kradzieży własności intelektualnej w historii ludzkości. OpenAI dosłownie zapierdoliło kilkadziesiąt terabajtów cyfrowych treści do trenowania tego swojego śmietnika i wszyscy przeszli nad tym do porządku dziennego, bo "oj tam oj tam, ciepły samuś robi ejaja to nic takiego a my będziemy mieć zabawne filmiki z kotkami, a tak poza tym to było kilka lat temu". Szkoda tylko, że drugi ejajowy ściemniacz czyli Google już nie było takie łaskawe i jak dorwali gościa samo udostępnienie mikroskopijnego procenta tego co zajebała firma Altmana dla dobra ludzi, to wyjebali mu sprawę na bodaj 6 milionów i typek po 2 latach sądów nie widząc wyjścia z tej sytuacji popełnił samobójstwo. Równość wobec prawa, czy coś.

Zaloguj się aby komentować