Zdjęcie w tle

ostrynacienkim

Gruba ryba
  • 376wpisów
  • 2838komentarzy

Pytanko do ludzi co maja home-laby IT. Na czym sobie hostujecie lokalne LLMy? Chodzi mi o sprzet. Rozgladam sie za jakims mini pc i wychodzi mi na to ze te applowe beda naj bo maja ten trik z pamiecia i daje to rade (u kumpla sprawdzalem i bangla pieknie). Natomiast mini pc nie wezme w plecak tak jak bym wzial sojebanego macbooka pro. No i sie wacham jak wahadlo. Jak zyc jak setupowac.


#it #ejaj #howto #it

@ostrynacienkim mam u siebie 5080 (16gb), 48gb ram i fedore.

Nie miałem zbyt wiele czasu się tym bawić, więc mam tylko LM studio.

Quen3.6 35B wyciąga mi jakieś 25tok/s

Gemma4 31B to max 10/s

Próbowałem też malutkie żeby dodać do autouzupelniania w VS Code, raz działa a raz nie, ogólnie średnio.

Pewnie jakbym spędził więcej czasu to inaczej bym sobie ten setup zorganizował, ale mam mało więc tylko tyle mi się udało w jeden sobotni poranek.

Generalnie ciężko pobić value for money Mac’ów Ultra/Mini szczególnie biorąc pod uwagę wartość rezydualną tego sprzętu - tak wydasz parę kafli ale za każdym razem odzyskasz więcej niż z jakiegoś mini PC x86.

Zaloguj się aby komentować

Zaloguj się aby komentować

Zaloguj się aby komentować

Zaloguj się aby komentować

Zaloguj się aby komentować

Zaloguj się aby komentować

Zaloguj się aby komentować

@ostrynacienkim imho sowy trochę jak jeże - człowiek nie jest im zagrożeniem więc mniej się boją w porównaniu do innych dzikich zwierząt.

Kiedyś u mnie na wsi pisklę (podlotek) sowy spadło, bez problemu dało się z powrotem na gałąź posadzić, tylko grubą rękawice musiałem włożyć, bo niby małe ale pazury miało że ho ho

Sowy są supermysliwymi, w porównaniu do innych ptaków drapieżnych maja o wiele większą skuteczność ataków. Mają wyśmienity wzrok oraz słuch. Budowa skrzydeł i piór zapewnia im bezszelestny lot. Naprawdę niesamowite ptaki!

Zaloguj się aby komentować

Zaloguj się aby komentować

Zaloguj się aby komentować

Czekam z niecierpliwością, szkoda tylko że start sezonu przegapię przez urlop :D

Obejrzałem całość na streamie wczoraj, miałem wcześniej wątpliwości czy dowiozą 1.0 do końca roku ale teraz jest to już pewne, zostaje tylko kampania do dokończenia a reszta klas to już później w sezonach będzie.

@Kamry czytalem sobie dzis rozne komentarze - maja juz calosc kampani praktycznie gotowa bedzie na 1.0, dobrze ze zmienili podstawe i fundamenty czy na plus sie okaze. Placzki co chaily 1.0 w lepszej grafice zygaja ze gowniamy update bo za akzdym jebanym razem zapominaja ze to miala byc inna gra i inna bedzie ;D

@ostrynacienkim
Szczerze to nawet 1 komentarza nie widziałem odnośnie grafiki xD czytając reddita/komentarze na yt to jednak 90% komentarzy jest pozytywne, trochę zawiedzionych ludzi że nie ma nowej klasy/mieczy no ale dostajemy tyle contentu zamiast tego że nie ma co narzekać, mi na pewno kolejne 100-200 godzin pyknie przy 0.5 i na pewno te challenge nowe zrobie. Nie mam pojęcia czym zagram ale to się zobaczy po patchnotes

@ostrynacienkim O widzisz, tą lige sobie odpuściłem ale może w końcu sobie zrobię Monka na kolejnej. To już chyba z trzeci rework Breacha xD

Zaloguj się aby komentować

Zaloguj się aby komentować

Zaloguj się aby komentować

Zaloguj się aby komentować

Zaloguj się aby komentować

Nie ma to jak uzywac ej aj do podsumowania wideło o oszczędnościach w pracy z ej aj XD:


(nie probowalem ale wrzucam moze komus sie przyda)


Optymalizacja pracy z Claude Code, aby uniknąć przekraczania limitów użycia:


Głównym problemem jest tzw. "Context Compound" – każda nowa wiadomość przesyła ponownie całą historię rozmowy, co szybko zużywa tokeny i może prowadzić do spadku precyzji modelu ("Context Rot").

Kluczowe strategie optymalizacji:

  1. Zarządzanie narzędziami MCP (Model Context Protocol):

    • Leniwe ładowanie (Lazy Loading): Włączenie zmiennej środowiskowej ENABLE_TOOL_SEARCH sprawia, że Claude ładuje definicje narzędzi tylko wtedy, gdy są potrzebne, zamiast ładować wszystko na starcie (co może oszczędzić 20-100 tys. tokenów).

    • Zamiana MCP na CLI: Wiele narzędzi (np. Supabase, Sentry, Jira, Vercel) lepiej obsługiwać przez interfejs wiersza poleceń (CLI). Wywołania CLI zużywają znacznie mniej tokenów niż ich odpowiedniki MCP.

  2. Optymalizacja "Umiejętności" (Skills) i Promptu Systemowego:

    • Audyt umiejętności: Usuwanie przestarzałych lub dublujących się skryptów/umiejętności zainstalowanych w Claude Code.

    • Odchudzanie CLAUDE.md : Przenoszenie szczegółowych instrukcji z głównego pliku promptu systemowego do osobnych plików referencyjnych w folderze dokumentacji. Claude będzie po nie sięgał tylko w razie potrzeby.

  3. Zmiany w ustawieniach konfiguracyjnych (settings.json):

    • Wcześniejsze autokompaktowanie: Zmiana progu auto_compact_percentage_override (np. z domyślnych 83% na 50-75%), aby model streszczał kontekst zanim zacznie tracić na dokładności.

    • Zwiększenie limitu wyjścia Bash: Ustawienie wyższego limitu BASH_MAX_OUTPUT_LENGTH zapobiega ucinaniu wyników komend, co eliminuje kosztowne (w tokenach) ponowne próby ich uruchamiania przez model.

    • Reguły odmowy dostępu (Deny Rules): Podobnie jak w .gitignore, warto zdefiniować foldery, których Claude nie powinien czytać (np. node_modules, dist, cache), aby niepotrzebnie nie zapychały kontekstu.

Wprowadzenie tych zmian pozwala na zmniejszenie początkowego zużycia kontekstu o kilkadziesiąt procent, co przekłada się na dłuższą i bardziej efektywną pracę bez uderzania w limity.


#ai #it

Zaloguj się aby komentować