Jeden z paru setek różnych zarzutów dotyczących #ai to, że kradnie kod do #programowanie


To pomyślałem sobie, że sprawdzę, czy może mojego też nie ukradł.


Popytałem kilku najpopularniejszych modeli o moje publicznie projekty (z wyłączonym searchem oczywiście). Ograniczyłem się do tych, które mają ręce i nogi oraz charakterystyczne nazwy, żeby przypadkiem nie wstrzelił się z odpowiedzią.


Tylko jeden z nich wszystkie modele znały. Bez zaskoczenia, bo to moje jedyne repo, które ma ponad 100 gwiazdek na Githubie. Jak się dopytałem o szczegóły to trochę nazmyślały, ale ogólnie było widać, że widziały kod i sporo rzeczy się zgadzało.


Potem jeszcze sprawdziłem lokalne modele. Wziąłem Genmę (zdaje się, że oparta na Gemini od Google). Zacząłem od 27B, bo tylko taki model mogę odpalić na swoim sprzęcie, żeby dał odpowiedź w sensownym czasie. Też znał mój projekt, chociaż od groma rzeczy sobie wymyślił. Np. jako autora podał jakiegoś randoma z Githuba i twierdził, że jest wykorzystywany na jakiejś stronie, która nie istnieje. 12B i niżej raczej kojarzyły nazwę, ale kompletnie odlatywały.


Tak, że ludzie, którzy się martwią, że im jejaje kradną kod todolisty z dwiema gwiazdkami na GH nie mają się czym martwić najwyraźniej. Natomiast wychodzi na to, że ja się przyłożyłem do tego gówna

Komentarze (3)

Opornik

@szatkus-1 dlaczego one tak kłamią skąd to się bierze, nie pierwszy raz o tym słyszę z różnych branż i tematyk

Cinkciarz

@Opornik Nie kłamią, bo nie myślą. To tylko model, który przewiduje jakie słowa należy napisać w odpowiedzi na twoje zapytanie. Dlatego mają taki duży problem, z rzeczami których nigdzie nie przeczytały, a nad którymi trzeba pomyśleć chwilkę.

Catharsis

@szatkus-1 Widzę, że nie jestem jedyny, też pytałem AI o swoje projekty xD. Nie pamiętam już które modele konkretnie ale część z nich zaczęła o jednym wiedzieć po około roku jak go upubliczniłem. Zadawałem po prostu pytanie, że potrzebuje program który robi dokładnie to co mój program i sprawdzałem co poleca. Ale, że ogólnie to jest niszowy temat to większość z nich zanim poleci mój to najpierw poleca jakieś gówno które nie jest wspierane od paru lat albo wymyśla nazwy nieistniejących projektów.

A to czy AI kradnie kod z GH to jest niemal pewne xD. Przecież na czymś musi się trenować a to jest dosłownie największe źródło otwartego kodu w internecie. Zgaduje, że mają jakiś filtr od ilu gwiazdek zaczynają skanować kod danego repo itp. Ale pewnie takie coś jest coraz bardziej problematyczne no bo od jakiegoś czasu do open source pcha się sporo kodu napisanego przez AI a z tego co kojarzę to jak AI się uczy na rzeczach wyplutych przez AI to dzieją się złe rzeczy i jakość modeli spada.

Zaloguj się aby komentować