DeepSeek – firma, która zrewolucjonizowała proces trenowania modeli AI, redukując koszty o ponad 95%, a - entropy_

★GURU

w Hydepark 2025-01-27T14:01:00+01:00

DeepSeek – firma, która zrewolucjonizowała proces trenowania modeli AI, redukując koszty o ponad 95%, a jednocześnie osiągając wyniki porównywalne z najlepszymi modelami, takimi jak GPT-4 czy Claude.

Jak to zrobili? Przez całkowite przemyślenie dotychczasowych założeń i procesów.

Tradycyjne trenowanie modeli AI to koszmar pod względem kosztów. OpenAI czy Anthropic wydają ponad 100 milionów dolarów tylko na moc obliczeniową, wykorzystując ogromne centra danych z tysiącami drogich procesorów graficznych (GPU).

Tymczasem DeepSeek udowodnił, że można to zrobić za jedyne 5 milionów dolarów.

Kluczowe innowacje DeepSeek:

- Efektywne zarządzanie pamięcią:

Tradycyjne modele AI przechowują dane na 32bitach, co wymaga ogromnych zasobów pamięci. DeepSeek zapytał: "Ale dlaczego 32? W zupełności wystarczy 8", pozwoliło to na zmniejszenie wymagań pamięci o 75%.

- System „multi-token”:

Zamiast przetwarzać tekst słowo po słowie jak klasyczne LLM "Wróbel... siedział... na...", DeepSeek analizuje całe frazy na raz. To sprawia, że proces jest dwa razy szybszy przy zachowaniu 90% dokładności.

- System ekspertów (MoE - Mixture of Experts):

Zamiast jednego ogromnego modelu uruchomionego CAŁY CZAS, DeepSeek wprowadził system wyspecjalizowanych modeli. Każdy z nich uruchamiany jest tylko wtedy, gdy jest potrzebny, co drastycznie zmniejsza ilość aktywnych parametrów (671 miliardów ale tylko 37 miliardów aktywnych na raz). Nie jest po pomysł nowy (używany wcześniej między innymi w modelach Mixtral) ale pierwszy raz zastosowany w tej skali

Rezultaty?

- Koszt trenowania spadł z 100 milionów do 5 milionów dolarów.

- Liczba potrzebnych GPU zmniejszyła się z 100 000 do 2 000.

- Koszty API są niższe o 95%.

- Modele mogą być uruchamiane na standardowych GPU dla graczy zamiast drogich GPU serwerowych.

Co ważne, DeepSeek postawił na otwartość. Kod i dokumentacja są publicznie dostępne, co otwiera drzwi dla mniejszych firm i indywidualnych innowatorów.

Dlaczego to ma znaczenie?

Demokratyzacja AI

Dotychczas tylko najwięksi gracze z ogromnymi budżetami mogli trenować zaawansowane modele. Teraz proces ten staje się dostępny dla mniejszych podmiotów.

Zagrożenie dla dużych firm

Nvidia, dominujący dostawca GPU, może odczuć konsekwencje, gdyż ich model biznesowy opiera się na sprzedaży drogich procesorów z ogromną marżą.

Nowa fala innowacji

Mniejsze wymagania sprzętowe i finansowe oznaczają większą konkurencję, co może przyspieszyć rozwój całej branży.

Podsumowując, DeepSeek zadał pytanie: „Co, jeśli zamiast rzucać coraz więcej sprzętu, po prostu zoptymalizujemy proces?”

Odpowiedzią są przełomowe wyniki, spadek kursu NVIDIA na giełdzie i PANIKA w meta i OpenAI

#zajebaneztwittera #llm #sztucznainteligencja #nvidia

Komentarze (76)

koszotorobur 2025-01-27T14:04:13+01:00

@entropy_ - a co mówiłem nie tak dawno o tym, że właśnie wchodzimy w fazę optymalizacjami kosztów AI bo te są zbyt duże by się AI w obecnej formie opłacało ciągnąć?

entropy_★2025-01-27T14:10:01+01:00

@koszotorobur A mówiłeś, ale po prawdzie gdyby nie kińscy naukowcy to nikt by się nie wziął za obniżenie kosztów.

OpenAi i tak dostawał tyle kasy od inwestorów tyle ile chciał i nikomu absolutnie nie zależało na poprawie dopóki kasa płynie. Inwestorzy happy bo lider rynku, Nvidia happy bo zbyt, OpenAi happy bo wszyscy mogą tylko gonić ich ściśle tajną technologię.

entropy_★2025-01-27T14:12:02+01:00

@bojowonastawionaowca a właśnie pytanie techniczne: W Chinach są "uczeni" jak na wschodzie czy "naukowcy" jak na zachodzie? xD

koszotorobur 2025-01-27T14:13:49+01:00

@entropy_ - prędzej czy później fundusze oczekiwałyby zwrotu z inwestycji - nie da się pakować miliardów latami bo ludzie są niecierpliwi i łasi na kasę - ale wygląda na to, że chińczycy ten proces o kilka miesięcy przyśpieszyli.

entropy_★2025-01-27T14:23:34+01:00

@koszotorobur @sawa12721 Ja nie wierzę w to, że Chińczycy tak z dobrego serca ten model wypuścili. Zrobili to (według mnie) żeby zdestabilizować rynek i nie pozwolić USA na dominację na tym polu.

bojowonastawionaowca★2025-01-27T14:30:07+01:00

@entropy_ w Chinach są towarzysze drogi kolego

koszotorobur 2025-01-27T14:32:52+01:00

@entropy_ - w sensie wypuścili go by zepsuć amerykanom jakość?

bojowonastawionaowca★2025-01-27T14:34:23+01:00

@koszotorobur @entropy_ taka delikatna ciekawostka — tego samego dnia, kiedy LLM Deepseeka ujrzał światło dzienne, to jego założyciel, pan Liang Wenfeng udał się na sympozjum premiera Li Qianga dotyczącym raportu z prac rządu i był tam jedynym przedstawicielem firm zajmujących się LLMami

Czy ciekawe czy nie, to już nie mi oceniać

koszotorobur 2025-01-27T14:36:18+01:00

@bojowonastawionaowca - tam nic nie dzieje się bez przyczyny

bojowonastawionaowca★2025-01-27T14:37:57+01:00

@koszotorobur @entropy_ zresztą w ogóle miałem napisać coś więcej o DeepSeek, ale noż czasu nie mam, a tematów mnóstwo xD W każdym razie sporo źródełek się wysypało, mogę Wam coś podrzucić

entropy_★2025-01-27T14:41:31+01:00

@koszotorobur @bojowonastawionaowca według mnie nie tyle psują jakość co nie dopuszczają do objęcia totalnej dominacji.

Bardziej im się opłaca zrobić tornado w szalecie jak pozwolić żeby 90% opłaty za kibel trafało do usa.

Dali recptę wszystkim na takie obniżenie kosztów, że znam ludzi których stać to sfinansować samemu bez udziału nawet pożyczki z banku przy tych kosztach.

W meta i openai teraz to się wszyscy zesrali w gacie bo przy takiej redukcji kosztów orzenia i użytkowania ikt nie będzie ich potrzebował za 2 lata.

maly_ludek_lego 2025-01-27T14:42:13+01:00

@bojowonastawionaowca @bojowonastawionaowca dawaj owca. Poczytam.

entropy_★2025-01-27T14:45:02+01:00

@bojowonastawionaowca zrób jak ja z tym postem. Wruciłem dwa wątki z tt do deepseeka i kazałem podsumować po polsku xD

Poprawiłem kilka zdań bo za bardzo uprościł (polski język się i tak średnio nadaje do technicznej dyskusji na ten temat), dodałem tagi i gotowe xD

bojowonastawionaowca★2025-01-27T14:45:51+01:00

@entropy_ panie, ale to jest kilkanaście artykułów, często za paywallami - AI nie zabierze mi tej przyjemności xD

bojowonastawionaowca★2025-01-27T14:46:02+01:00

@maly_ludek_lego same źródła czy teksty?

koszotorobur 2025-01-27T14:47:35+01:00

@entropy_ - wojna ekonomiczna trwa w najlepsze i wszystkie chwyty dozwolone by nikt nie zdobył za dużej przewagi

maly_ludek_lego 2025-01-27T14:55:55+01:00

@bojowonastawionaowca mogą być same źródła.

bojowonastawionaowca★2025-01-27T14:57:29+01:00

@maly_ludek_lego poszperaj sobie

https://www.geopolitechs.org/p/deepseek-founder-becomes-a-guest

https://www.interconnects.ai/p/deepseek-v3-and-the-actual-cost-of

https://thezvi.substack.com/p/deekseek-v3-the-six-million-dollar

https://www.baiguan.news/p/deepseek-gpt4-llm-china-ai-innovation-chip-embargo-price-war-affordability-llama3-turbo-api-data-efficiency-agi-roadmap-multimodality-mathematics-natural-language-ecosystem-originality-economic-growth-talent-large-models

https://techcrunch.com/2025/01/20/deepseek-claims-its-reasoning-model-beats-openais-o1-on-certain-benchmarks/

https://analyticsindiamag.com/ai-news-updates/deepseek-crushes-openai-o1-with-an-mit-licensed-model-developers-are-losing-it/

https://www.geopolitechs.org/p/deepseek-launches-next-generation

https://docs.google.com/document/d/1x3FM01NDdXvvQTbkaJlPhyfBoBAFpE3E60tMe_ZlUH8/edit?pli=1&tab=t.0#heading=h.ve68kmdgtbo7

https://www.chinatalk.media/p/deepseek-ceo-interview-with-chinas

https://www.chinatalk.media/p/deepseeks-edge

https://www.ft.com/content/c99d86f0-2d17-49d0-8dc6-9662ed34c831

https://www.economist.com/leaders/2025/01/23/chinese-ai-is-catching-up-posing-a-dilemma-for-donald-trump

https://www.ft.com/content/747a7b11-dcba-4aa5-8d25-403f56216d7e

Część za paywallem, ale mam nadzieję, że ogarniesz temat

DeepSeek Founder Becomes a Guest of China’s Premier, on the Same Day of the R1 Model Launch

Around noon on January 20, DeepSeek’s founder, Liang Wenfeng (梁文锋), had the company release the DeepSeek-R1 model, whose performance can match the official version of OpenAI’s o1.

Geopolitechs

maly_ludek_lego 2025-01-27T15:00:58+01:00

@bojowonastawionaowca dzięki wielkie!

Dziwen 2025-01-27T14:14:02+01:00

@entropy_ ciekawy wpis. Z jednej strony fajnie, z innej jakoś tak średnio ufam Chińczykom, nawet w sferach open source.

Czyli obecnie mamy 90% normy z GPT4? Ciekawe jak tu wypada 1o, bo chyba ten odmienny model rozwoju nadal daje OpenAi bardziej "rozumne" Ai, choć kosztem niebotycznie wyższym.

entropy_★2025-01-27T14:21:56+01:00

@Dziwen o1 i R1 od deepseek działają na zasadzie CoT (Chain of Thought), R1 przed udzieleniem odpowiedzi w tagach <think> </think> rozważa różne możliwości i dopiero udziela odpowiedzi na Twoje zapytanie.

O1 robi to samo ale OpenAi chowa przed użytkownikiem tą część odpowiedzi (żeby jak najdłużej zostać liderem na rynku nie pokazują jak ich model pracuje)

sawa12721★2025-01-27T14:14:15+01:00

@entropy_ Łe, jestem rozczarowany-myślałem, że zredukowali koszty o 95% poprzez zwolnienie pracowników, a tu takie zaskoczenie.

the_good_the_bad_the_ugly 2025-01-27T14:26:04+01:00

@sawa12721 tak by było, gdyby rzecz działa się w Polsce. xD optymalizacja kosztów przez oszczędzanie na pracownikach.

RACO 2025-01-27T14:20:42+01:00

Korzystam od tygodnia jakoś. Rewelacji nie widzę albo nie trafiłem na takiego case że pomoglo

Chrabonszcz 2025-01-27T17:15:48+01:00

@RACO jakiej rewelacji spodziewasz się po modelu o 90% sprawności gpt4???

Rewelacja polega na niższych kosztach i open source.

RACO 2025-01-27T17:34:12+01:00

@Chrabonszcz otwartych zapytan i brak cenzury w odpowiedzi. A nie że dostaje odpowiedź w stylu że nie może pomóc w tej sprawie. Ale jak wpisujesz w wyszukiwarkę to samo to odpowiedź na pierwszym miejscu.

FoxtrotLima★2025-01-27T18:34:24+01:00

@RACO a co ma odpowiadać soft hostowany w Chinach? Odpal se lokalnie i będzie gadać.

RACO 2025-01-27T18:56:20+01:00

@FoxtrotLima mówiłem o gpt i to lokalnie.

FoxtrotLima★2025-01-27T19:05:41+01:00

@RACO

Korzystam od tygodnia jakoś. Rewelacji nie widzę albo nie trafiłem na takiego case że pomoglo

ostrynacienkim★2025-01-28T06:41:54+01:00

@FoxtrotLima posiadacz akcji nvidii ?

FoxtrotLima★2025-01-28T06:44:31+01:00

@ostrynacienkim Mylisz mnie z pewnym marynarzem ( ͡° ͜ʖ ͡°)

ostrynacienkim★2025-01-28T06:45:42+01:00

@FoxtrotLima mialme na mysli pana/pania RACO

rakokuc 2025-01-27T14:44:16+01:00

No i fajnie. Im szybciej AI zastąpi nas w pracy, tym szybciej rozwiąże się problem przeludnienia.

Pstronk 2025-01-27T16:50:35+01:00

@rakokuc

A gdzie mamy problem przeludnienia?

rakokuc 2025-01-27T16:55:49+01:00

@Pstronk nie mam pojęcia. Tak naprawdę to chodziło mi o to, że spodziewam się problemów społecznych, w wyniku których wiele osób samodzielnie odłoży łyżkę.

Chrabonszcz 2025-01-27T17:18:00+01:00

@Pstronk w Indiach, Bangladeszu i w innych gówno krajach w Afryce, gdzie żyją w nędzy, zabijają się na lewo prawo i robią po kilkanaście dzieci.

Chociaż nie wiem jak AI w tym pomoże...

Dzban3Waza 2025-01-27T17:20:51+01:00

@rakokuc rozwiniesz myśl proszę

rakokuc 2025-01-27T17:52:04+01:00

@Dzban3Waza praca daje jakiś tam sens życia. Dla jednych to będą tylko pieniądze, a dla innych potrzeba bycia potrzebnym, kreatywnym, dążenie do jakiegoś celu.

Jeśli zdarzyłoby się, że nagle większość zawodów stanie się zbędna i nie pojawi się nic sensownego w zamian, to co zostanie? Dochód podstawowy i marazm. Albo tylko marazm.

LaMo.zord★2025-01-27T19:13:54+01:00

@rakokuc dlaczego od razu marazm? Ja naprzykład lubię pracować XD Jeśli dodatkowo mój byt nie byłby zależny od tego jak konkretnie pracuje to mógłbym się poświęcić pracy którą lubię i/lub hobby. Podejrzewam też, że nie jestem jedyny. Posiedź na L4 tak pół roku-rok to też docenisz pracę noe za pieniądze, a za samą właśnie pracę ¯\_( ͡° ͜ʖ ͡°)_/¯

rakokuc 2025-01-27T19:45:01+01:00

@LaMo.zord o pracy dla (jakkolwiek dziwnie to nie brzmi) przyjemności też wspomniałem. I założyłem, że takiej pracy też nie będzie, bo po cholerę człowiek ma się wpieprzać maszynom, gdzie nawet jak robi za darmo, to trzeba go pilnować. Albo żeby niczego nie zepsuł, albo żeby sobie niczego nie zrobił - bo jednak ktoś będzie dalej za to odpowiadał.

A coś takiego jak dochód podstawowy nie będzie raczej wprowadzone (o ile w ogóle) po to, żeby wszyscy mieli raj i robili co im się podoba, tylko żeby się nie pozabijali. Także zarówno pod względem ekonomicznym jak i "rozrywkowym", brak pracy dla ludzi nie zapowiada się na życie w królestwie chrystusowym.

Może się mylę, może powinienem zacząć łykać Prozac, może pozwolą kiedyś Błaszczykowskiemu na powtórzenie tego pamiętnego karnego? Kto to wie.

Dzban3Waza 2025-01-27T20:17:07+01:00

@rakokuc ok rozumiem dzieki Olisadebe I krzynowek to był duet, fakt

Pstronk 2025-01-27T20:58:01+01:00

@rakokuc @Chrabonszcz

Problem przeludnienia rozwiązuje się sam na naszych oczach. Nawet w Afryce czy Indiach, Bangladeszu współczynnik narodzin spada mocno.

sumrzeczny 2025-01-27T14:59:49+01:00

jakby zmniejszyli do 0 bitów to by zaoszczedzili 100%

Chrabonszcz 2025-01-27T17:18:50+01:00

@sumrzeczny nie przesadzajmy, dajmy im tego 1 bita i zobaczymy co osiągną.

Naczelnyhejterkacapow 2025-01-27T15:51:00+01:00

@rakokuc to tak nie działa 👀

FoxtrotLima★2025-01-27T17:13:37+01:00

@entropy_ sankcje w postaci bana na chipy od nVidii wymusiły większą pomysłowość jak wykorzystać ograniczone zasoby.

pizzalover 2025-01-27T17:28:37+01:00

jak to działa w praktyce? ktoś korzystał i ma porównanie z GPT? obsługuje też jeż polski?

FoxtrotLima★2025-01-27T18:35:04+01:00

@pizzalover tak, działa dobrze, gada po polsku.

pizzalover 2025-01-27T19:15:37+01:00

@FoxtrotLima @FoxtrotLima dzięki przekonałeś żeby spróbować

FoxtrotLima★2025-01-27T19:24:14+01:00

@pizzalover spróbować zawsze warto. Konkurencja jest pożądana.

pizzalover 2025-01-27T19:31:13+01:00

@FoxtrotLima mam obecnie wykupiony GPT jak będzie porównywalny do tego 4o to anuluję subskrypcję :)

FoxtrotLima★2025-01-27T19:36:57+01:00

@pizzalover powodzenia w testach!

bartek555★2025-01-27T19:43:02+01:00

c⁎⁎j im w d⁎⁎e

[*] nvidia

rakokuc 2025-01-27T19:46:30+01:00

@bartek555 pierwsza dobra wiadomość związana z AI, sąsiad stracił trochę na giełdzie i ma gorzej! (° ͜ʖ °)

entropy_★2025-01-27T20:36:20+01:00

@bartek555 Ty lepiej nie patrz co tam się teraz dzieje xD

bartek555★2025-01-27T21:25:45+01:00

@entropy_ pacze ciagle

pluszowy_zergling 2025-01-27T22:24:22+01:00

@bartek555 szczerze, za chwilę amerykańskie korpo skopiują ten pomysł i to by było tyle ze spadków na giełdzie Zresztą, pewno dzisiejszego dnia pierdylion teamów w googlu i nvidi dostało tego taska do machnięcia asapem.

bartek555★2025-01-27T22:27:55+01:00

@pluszowy_zergling no beka ogolnie bo pojutrze nvidia wypuszcza nowa serie kart, wiec ladny headshot dostali xD

pluszowy_zergling 2025-01-27T22:41:58+01:00

@bartek555 a to się zaktualizuje drajwery

Iknifeburncat 2025-01-27T22:58:25+01:00

@bartek555 IMO to jest tylko chwilowy drop spekulantów. Na ten moment NVIDIA i tak ma praktycznie monopol na produkcję hardware, przecież deepseek był dosłownie na tym wytrenowany. Ja to bym się teraz zaladowal, ale to nie jest porada finansowa ( ͡° ͜ʖ ͡°)

bartek555★2025-01-27T23:00:29+01:00

@Iknifeburncat jak dla mnie to teraz big dogi sie wkupuja w nvidie po jaja, a za 2 dni +200% i heja banana

Iknifeburncat 2025-01-27T23:55:57+01:00

@bartek555 tak łatwo tego drugiego rogala nie odrobisz ( ͡° ͜ʖ ͡°)

Tak zupełnie poważnie to naprawdę nie widzę podstaw do tego, żeby NVIDIA nie miała zaraz odbić, więc popatrzę jeszcze dzień dwa i chyba sam wejdę.

bartek555★2025-01-28T00:12:44+01:00

@Iknifeburncat 30 stycznia bedzie ten dzien jutro pewnie tez troche odbije, bo posprzataja kupe i wezma sie do roboty

pluszowy_zergling 2025-02-01T16:15:25+01:00

@bartek555 Noo i proszę państwa już frunie, a jeszcze pofrunie, Ja generalnie nie zamierzam łapać spadających noży, ale Amerykanie nie zamierzają dać się Chińczykom zrobić w taki sposób.

Co do "premiery" Nvidii to wyszło dość słabo, "Gaming Jesus" to ślicznie podsumował:

https://www.youtube.com/watch?v=wMd2WHKnceI

A co do tego, czy warto się przejmować serią 5000 to bardzo fajne filmy ma Pan Lipton:

ŁoBoże ŁoJezu 5080:

https://www.youtube.com/watch?v=nZn74CHG0mo

Czy 5090 wgl ma sens:

https://www.youtube.com/watch?v=4taX2n0f2tY

5080 po O/C, szału ni ma:

https://www.youtube.com/watch?v=tJR3yYOe0D8

Z mojej strony póki mój złom z gtx970 się nie rozleci gram nadal w Baldury, gdy regeneruję po biegach ^_^

https://pl.wikiquote.org/wiki/Baldur%27s_Gate#Minsc

"Przekroczyliście wszelkie granice! Zakosztujcie, jak smakuje sprawiedliwość chomika!"

bartek555★2025-02-01T16:37:31+01:00

@pluszowy_zergling to the moon!

kitty95 2025-01-27T22:13:20+01:00

O Tajwan zapytajcie.

pluszowy_zergling 2025-01-27T22:20:34+01:00

@entropy_ Czy to przypadkiem nie jest chiński produkt ?

Half_NEET_Half_Amazing 2025-01-27T22:28:47+01:00

dlatego na giełdzie tak urwało

enkamayo 2025-01-27T22:49:20+01:00

Due to large-scale malicious attacks on DeepSeek's services, registration may be busy. Please wait and try again. Registered users can log in normally. Thank you for your understanding and support

Ciekawe kto ich tak atakuje :D

Albo to ściema, bo im serwery siadły.

Iknifeburncat 2025-01-27T22:59:08+01:00

@enkamayo siadły serwery. Zobacz ile jest teraz pobrań w Stanach na wersje mobilne. Pół globu się tym bawi.

Iknifeburncat 2025-01-27T23:00:51+01:00

Tylko pamiętajcie, żeby zapytać co sie działo na Placu Tiananmen w '89, na pewno Wam powie.

frondeus 2025-01-28T09:11:02+01:00

@Iknifeburncat łatwo obejść cenzurę. Wystarczy zapytać co się działo pięć dni przed 9 czerwca 89, w kraju który jest sąsiadem zarówno Rosji jak i Indii

frondeus 2025-01-28T00:29:48+01:00

Tylko taka uwaga - to jest "open source" ale bez "open zbiór danych na których uczyliśmy sieć". A to samo w sobie też może być swojego rodzaju sekretnym sosem

frondeus 2025-01-28T09:09:25+01:00

I ciekawostka z dziś - https://huggingface.co/blog/open-r1 już powstają bardziej "open" klony

Open-R1: a fully open reproduction of DeepSeek-R1

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

Huggingface

kodyak 2025-01-28T09:35:40+01:00

@entropy_ nigdy nie jest tak że ma się cudowne dziecko. O wadach tu nic nie ma. Natomiast tak. Będzie dochodzić do optymalizacji kosztów.

Nie ma żadnej paniki. Bez przesady. Większość spółek na gieldzie jest przeszacownych i to mocno. Szczególnie aktualnie nvidia

Shivaa★2025-01-28T10:49:41+01:00

Ciekawa alternatywa, rozmawia sensownie, pisze kody, ma dostęp do info do 2023 ale może przeszukać net w poszukiwaniu info

Tylko trochę muli i nie zapamiętuje informacji

Będę na pewno dalej testować

Zaloguj się aby komentować

Popularne artykuły

Popularne dyskusje

Kategorie

Popularne tagi

Komentarze (76)