Moje wczorajsze video o DeepSeek AI (to na którym model sam się ocenzurował po udzieleniu "niewygodnej" odpowiedzi) viraluje. Ale poprawność polityczna tej apki nie powinna Wam przysłaniać tego, że modele od DeepSeek mają wiele zalet i dosłownie wywróciły stolik na arenie AI. Dlatego, dla pełności obrazu, łapcie pigułę wiedzy na temat DeepSeeka, o którą nikt nie prosił:
DeepSeek namieszał przede wszystkim z 2 powodów:
Niższe koszty szkolenia i działania zostały osiągnięte poprzez kilka sprytnych optymalizacji:
Dzięki tym ulepszeniom, w zasadzie każdy może sobie na własnym laptopie pohostować lokalnie profesjonalny model, który aktualnie w testach przebija (!) lub dorównuje obecnym (byłym?) liderom. A koszt korzystania z API DeepSeek to pół dolara za milion tokenów na wejściu, czyli 30 (!) razy taniej niż u OpenAI.
I dlatego NVIDIA poleciała w dół. Czy NVIDIA przez to permanentnie straci? Odpowiem przewrotnie: moim zdaniem może nawet zyskać. Bo tańsze AI oznacza więcej osób bawiących się w AI, a więc i większe potrzeby na może nie tak drogi, ale wciąż, sprzęt od NVIDII.
I na koniec - nie ma pewności, czy ekipa DeepSeeka faktycznie na trening swojego modelu wydała tylko 5M dolarów (vs 100M jakie wydaje OpenAI i reszta). To może być ściema, mogą celowo umniejszać koszty i zakres pracy, żeby wjechać na jeszcze czerwieńszym smoku. Ale mimo to Chińczycy i tak udowodnili, że da się robić AI sprawniej i taniej. Zdecydowanie taniej. A na dodatek wrzucili wszystko jako Open Source. I to jest właśnie ten "disruption". I ja się z tego bardzo cieszę. I nie mogę się doczekać, co teraz z kodem modeli DeepSeeka zrobi społeczność. I jak szybko te optymalizacje ukradnie do siebie gang OpenAI/Antropic/Google. Bo na tym rynku każdy kradnie od każdego.
https://x.com/niebezpiecznik/status/1884217427841462351
#ai #deepseek #chatgpt