Zdjęcie w tle

entropy_

GURU
  • 1648wpisów
  • 14400komentarzy
entropy_ userbar

DeepSeek – firma, która zrewolucjonizowała proces trenowania modeli AI, redukując koszty o ponad 95%, a jednocześnie osiągając wyniki porównywalne z najlepszymi modelami, takimi jak GPT-4 czy Claude.


Jak to zrobili? Przez całkowite przemyślenie dotychczasowych założeń i procesów.

Tradycyjne trenowanie modeli AI to koszmar pod względem kosztów. OpenAI czy Anthropic wydają ponad 100 milionów dolarów tylko na moc obliczeniową, wykorzystując ogromne centra danych z tysiącami drogich procesorów graficznych (GPU).

Tymczasem DeepSeek udowodnił, że można to zrobić za jedyne 5 milionów dolarów.


Kluczowe innowacje DeepSeek:

- Efektywne zarządzanie pamięcią:

   Tradycyjne modele AI przechowują dane na 32bitach, co wymaga ogromnych zasobów pamięci. DeepSeek zapytał: "Ale dlaczego 32? W zupełności wystarczy 8", pozwoliło to na zmniejszenie wymagań pamięci o 75%.

- System „multi-token”:

   Zamiast przetwarzać tekst słowo po słowie jak klasyczne LLM "Wróbel... siedział... na...", DeepSeek analizuje całe frazy na raz. To sprawia, że proces jest dwa razy szybszy przy zachowaniu 90% dokładności.

- System ekspertów (MoE - Mixture of Experts):

   Zamiast jednego ogromnego modelu uruchomionego CAŁY CZAS, DeepSeek wprowadził system wyspecjalizowanych modeli. Każdy z nich uruchamiany jest tylko wtedy, gdy jest potrzebny, co drastycznie zmniejsza ilość aktywnych parametrów (671 miliardów ale tylko 37 miliardów aktywnych na raz). Nie jest po pomysł nowy (używany wcześniej między innymi w modelach Mixtral) ale pierwszy raz zastosowany w tej skali


Rezultaty?

- Koszt trenowania spadł z 100 milionów do 5 milionów dolarów.

- Liczba potrzebnych GPU zmniejszyła się z 100 000 do 2 000.

- Koszty API są niższe o 95%.

- Modele mogą być uruchamiane na standardowych GPU dla graczy zamiast drogich GPU serwerowych.


Co ważne, DeepSeek postawił na otwartość. Kod i dokumentacja są publicznie dostępne, co otwiera drzwi dla mniejszych firm i indywidualnych innowatorów.


Dlaczego to ma znaczenie?

Demokratyzacja AI

   Dotychczas tylko najwięksi gracze z ogromnymi budżetami mogli trenować zaawansowane modele. Teraz proces ten staje się dostępny dla mniejszych podmiotów.


Zagrożenie dla dużych firm

Nvidia, dominujący dostawca GPU, może odczuć konsekwencje, gdyż ich model biznesowy opiera się na sprzedaży drogich procesorów z ogromną marżą.


Nowa fala innowacji

Mniejsze wymagania sprzętowe i finansowe oznaczają większą konkurencję, co może przyspieszyć rozwój całej branży.


Podsumowując, DeepSeek zadał pytanie: „Co, jeśli zamiast rzucać coraz więcej sprzętu, po prostu zoptymalizujemy proces?”

Odpowiedzią są przełomowe wyniki, spadek kursu NVIDIA na giełdzie i PANIKA w meta i OpenAI


#zajebaneztwittera #llm #sztucznainteligencja #nvidia

44b21698-808a-47e7-b141-99d03d3fc2f6
entropy_ userbar

@entropy_ nigdy nie jest tak że ma się cudowne dziecko. O wadach tu nic nie ma. Natomiast tak. Będzie dochodzić do optymalizacji kosztów.


Nie ma żadnej paniki. Bez przesady. Większość spółek na gieldzie jest przeszacownych i to mocno. Szczególnie aktualnie nvidia

Ciekawa alternatywa, rozmawia sensownie, pisze kody, ma dostęp do info do 2023 ale może przeszukać net w poszukiwaniu info

Tylko trochę muli i nie zapamiętuje informacji

Będę na pewno dalej testować

Zaloguj się aby komentować

Zaloguj się aby komentować

Zaloguj się aby komentować

Zaloguj się aby komentować

Koniec internetu:

Gość na youtube hipotetyzuje możliwość zagłuszania rosyjskich hipersonicznych rakiet kh47 oraz 3m22, używając wiązki radarowej o złej polaryzacji.


Z tego co rozumiem: rosyjski styl budowania anten (wada konstrukcyjna) w powiązaniu z materiałem obudowy powoduje dużą czułość w wiązkach bocznych anteny na zagłuszanie z polaryzacją odwrotną do używanej przez rakietę.

Hipoteza mówi, że w ten sposób nie oszukujesz autopilota tylko serwo sterujące talerzem które kieruje rakietę na echo z wiązki bocznej.


https://youtu.be/WLpvEoMNEls część 2

https://youtu.be/1o7XRYCFYyM część 1


#elektronika #militaria #rakiety

entropy_ userbar

Zaloguj się aby komentować

Zaloguj się aby komentować

@entropy_ nawet miałem kupić PSP, czytałem o "przeróbkach" itd. Ale, nic z tego nie wyszło, może sobie kupię na 40 urodziny i nie będzie już cieszyć jak dawniej. Szkoda, że było się biednym jak było się młodszym.

@entropy_ zawsze chciałem mieć psp jako gówniak, jezu ile ja się filmików o niej naoglądałem. Teraz mam 28 lat, nadal tej konsolki nigdy nie miałem. Wierzę, że uda mi się do 30 r.ż. ogarnąć swoje cztery kąty, zbudować pierwszego kompa, i kupić jakiegoś steamdecka...

Zaloguj się aby komentować

Zaloguj się aby komentować

Zaloguj się aby komentować

Zróbcie noty moderacyjne do tego:

Rys 1: Conor McGregor wchodzi na inaugurację Trumpa

Rys 2 i 3: Morawiecki tylko przypadkiem przechodzi przez losowe miejsce i pyta o drogę.

Absolutnie wykluczamy możliwość, że chciał wejść na inaugurację bo to są różne miejsca!!!! XDDD


Film z McGregorem: https://x.com/m_rebeliant/status/1881362815132541003

Film z Morawieckim: https://www.youtube.com/watch?v=Ecj53vnEPio


#polityka #spin

5de3dca8-5ca9-430f-b835-9ce034453306
582160a0-d562-450c-9ffe-7bc22168c31f
f755a078-5149-448d-a6bc-a72b1429b0a0
ca2429d5-b927-49bf-ba43-112311cb35a6
entropy_ userbar

Zaloguj się aby komentować

Dowód, że e^(iπ)= -1

Wygenerowany w 100% przez AI. Jedyne co ręcznie zrobiłem to wrzuciłem na streamable i napisałem ten post xDDDD


Prompt:

NEW ANIMATION: Using MANIM visualize proof that e^ipi=-1

Wygenerowany kod ruszył od strzała xDDD


https://streamable.com/fd2m5g


#matematyka #ai #chatgpt #sztucznainteligencja

entropy_ userbar

Zaloguj się aby komentować

Babe! Wstawaj! Chińczycy zdropowali na huggingfejsie nowy model który jest porównywalny z GPT4o/Sonetem3.5!


https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Qwen-32B


Całkiem szybki w tokenach na sekundę, umie policzyć 'R' w strawberry, nie umie policzyć strawberry w 'R' i BARDZO ciężko go zmusić do odpowiedzi na temat niektórych placów w chinach, w szczególności jeżeli nazwa placu zaczyna się na T xDDDD

--> TUTAJ <--- Można się pobawić, trzeba deepthink włączyć

#chatgpt #gpt4 #llm #nowosci

5230dd77-d411-4a87-bb9c-912883a38f6c
ac65506d-8e1f-4124-acd1-3183356b6c6d
83d37bf9-b43c-40e7-ab5d-28d4c03903ac
98adea4b-8e94-4044-9cb7-140afc0fe24d
3ca64888-7a6c-4c1e-91d1-3a222c43d912
entropy_ userbar

@entropy_ daje radę z pytaniem o to ile końców ma dwa i pół kija. Jak do tej pory wszystkie modele się na tym wywalały. Poprawnie też liczy ilość liter "c" w słowie "Chewbacca". Z tym też inne modele miały problem.

Zaloguj się aby komentować

Zaloguj się aby komentować

Nie chce mi się filmu przerzucać, przepraszam.

Sobota wieczór w Głogowie, naćpany kierowca próbuje rozjechać przechodniów.


"Policja prowadzi czynności mające na celu wyjaśnienie okoliczności zdarzenia oraz zmierza do zatrzymania sprawcy. na chwile obecną mamy ustalonych świadków oraz zabezpieczone nagrania, które zostaną poddane szczegółowej analizie"


Zgaduję, że dzisiaj sobie poszedł rano po wodę na kaca do żabki, bo szczerze wątpię żeby policja dała radę go znaleźć


@maximilianan @100mph @Gamtaro2

Pytaliście tutaj co za problem dla policji znaleźć osobę

https://www.hejto.pl/wpis/rysiu-a-kto-5-lat-temu-rzadzil-policja-polityka?commentId=5997b1a9-a371-471c-969c-6236bd0ba4fa


Źródło:

https://x.com/bandyci_drogowi/status/1881040279131881720


#bandycidrogowi #carmagedon #glogow

c8f8557e-033b-4bf7-a9b9-5b1c9f840653
809266a1-b2ad-42ac-b809-f9ce1528051b
3fb84c8c-71ac-4264-bc08-cdd518bb00f6
entropy_ userbar

@entropy_ 2025. Ludzie odkrywają że przy ograniczonych zasobach jedne sprawy działają szybciej, drugie wolniej. Mamy dziesiątki tysięcy wakatów w Policji, a dzięki ich wyczynom z ostatniej dekady nikt tam nie chce już przychodzić.


Są świadkowie, nagrania, mogę się założyć że do piątku go przymkną.

Zaloguj się aby komentować

@pierdonauta_kosmolony To dla niego raczej dobrze bo jakby tam był magnetron czy czym tam teraz robią fale radarowe to uruchamianie mogłoby go usmażyć od środka a tak to chyba może próbować


A przy okazji: mam takie same śrubokręty więc jakby ktoś miał głowicę od rakiety to mu mogę rozebrać


Z kosztami produkcji to trochę gościa poniosło, surowce, nawet srebro i złoto ruscy mieli tanie, pracę ludzką też.

Samej elektroniki, pomijając specjalizowane elementy typu gyro czy akcelerometr itp jest mniej więcej tyle co w ruskim kolorowym telewizorze a one nie kosztowały całej wioski, co najwyżej całą wioskę mogły spalić (bardzo przyciągały kurz a potem go zapalały).


Ciekawe że część elektroniki mieli na całkiem cywilnych podzespołach, rezystory z tolerancjami 10% a takie duże tranzystory w metalowych obudowach to gdzieś mam kilka w gratach, pewnie inny model ale to niekoniecznie są militarne wersji, do cywilnych gratów też takie odważniki wsadzali.


Gx

Zaloguj się aby komentować

Zaloguj się aby komentować

Zaloguj się aby komentować

Zaloguj się aby komentować

Absolutnie nie bronię tego co odjebał, ale apropos oznakowań to można zrobić ankietę ile znacie przejazdów kolejowych ze stopem gdzie tory są już tylko na jezdni, a wokół las. Ja w mojej okolicy mam takie dwa, gdzie TRZEBA się zatrzymać bo jest stop i były przypadki że pały sprzedawały mandaty jak ktoś przejechał.

@entropy_ myślałem, że w poślizg wpadł i nie zdążył wyhamować się na filmie od tyłu widać, że naciska hamulec dosłownie 0.1 sec przed uderzeniem w pociąg xD pewnie na telefonie klikał

Zaloguj się aby komentować