Pytanko do ludzi co maja home-laby IT. Na czym sobie hostujecie lokalne LLMy? Chodzi mi o sprzet. Rozgladam sie za jakims mini pc i wychodzi mi na to ze te applowe beda naj bo maja ten trik z pamiecia i daje to rade (u kumpla sprawdzalem i bangla pieknie). Natomiast mini pc nie wezme w plecak tak jak bym wzial sojebanego macbooka pro. No i sie wacham jak wahadlo. Jak zyc jak setupowac.


#it #ejaj #howto #it

Komentarze (19)

Mordko jest taki gościu co na Facebooku hostuje LLMy na embeded devices. Po pracy poszukam linka to wrzucę 🙂

@ostrynacienkim - czyli powinieneś wiedzieć, że uruchomić się da na prawie wszystkiem

A jak szybko to będzie działać to już tylko zależy od zasobności Twojego portfela

@ostrynacienkim mam u siebie 5080 (16gb), 48gb ram i fedore.

Nie miałem zbyt wiele czasu się tym bawić, więc mam tylko LM studio.

Quen3.6 35B wyciąga mi jakieś 25tok/s

Gemma4 31B to max 10/s

Próbowałem też malutkie żeby dodać do autouzupelniania w VS Code, raz działa a raz nie, ogólnie średnio.

Pewnie jakbym spędził więcej czasu to inaczej bym sobie ten setup zorganizował, ale mam mało więc tylko tyle mi się udało w jeden sobotni poranek.

@rith @rith mam podobnie 16 gb ramu na karcie i tam pcham model(e). Tylko ja to taktuje jako zabawe bardziej i nie mysle zeby zastapic frontier modele loklnymi. Alw chcialbym miec cos rzedu 80-100 tokenow /s

Generalnie ciężko pobić value for money Mac’ów Ultra/Mini szczególnie biorąc pod uwagę wartość rezydualną tego sprzętu - tak wydasz parę kafli ale za każdym razem odzyskasz więcej niż z jakiegoś mini PC x86.

@Donald_Tusk no sklaniam sie coraz bardziej na jakies m5 pro czy max. Pytalem o to czy ktos ma i jesli tak to na czym a nie teoretyzowanie o to czym mozna i za ile bo to wiem (praktyka > teoria z dupy z neta). A samego maka mam w robocie no i kuzwa to jest to

Zaloguj się aby komentować