Ultracode mode i Opus 4.8

farsinuce@feddit.dk · 14 days ago

Ultracode mode i Opus 4.8

drkt · 14 days ago

Jeg har ikke rørt indstillinger. Jeg brugte ollama pull qwen3:14b men jeg ved ikke hvor den hiver modeller fra eller hvordan de er quantized. Eller om de overhovedet er quantized, går det nu op for mig, og faktisk bare er en 14b model…

Jeg har 16G VRAM og 48G RAM men lad os sige ~30G brugbart RAM Hvad vil du sige jeg skal bruge? Jeg har det fint med at lortet bliver offloaded og er langsomt. Hvad software stack bruger du?

farsinuce@feddit.dk · edit-2 14 days ago

går det nu op for mig, og faktisk bare er en 14b model…

Yatzi. Gå efter deres nyere MoE (Mixture of Experts) model - altså f.eks. “Qwen3.6-35B-A3B-GGUF”, som er på 35B paramentere, hvoraf kun 3B aktiveres.

Jeg kunne ikke få Gemma eller Qwen til at forstå “List the contents of the current working directory”.

Hmm… ja, du skal sikre dig, at de har den nødvendige adgang til dit drev. Kan ikke huske, hvad det hedder, men det er et tool, som man kan give visse modeller i visser miljøer, som jeg forstår det.

Jeg har det fint med at lortet bliver offloaded og er langsomt.

Tjah, hvis jeg var dig, ville jeg nok stadig prøve at få en GGUF model til at fungere, som ikke er meget større, end at dit grafikkort kan trække hovedparten af arbejdet.

Hvad software stack bruger du?

Jeg har 16GB VRAM og 32GB gammel-langsom-RAM (DDRv4 tror jeg endda). Rodder for lidt med lokal LLM. Bruger mest VS Code med Claude Code. Men når jeg endelig prøver at få en lokal model til at arte sig, så er det med super-lette løsninger, som f.eks. Jan.ai, hvor det bare er til ren instruktionstekst. En overgang brugte vi lokal billedgenerering til på arbejde vha. ComfyUI, men nu bruger vi bare replicate som platform til proprietære online-modeller - ingen stats- eller virksomhedshemmeligheder dér.

drkt · edit-2 14 days ago

~~Er ‘Vision’ noget jeg kan spare væk? Jeg skal kun bruge text input.~~

Ja, åbenbart.

Ultracode mode i Opus 4.8

Ultracode mode i Opus 4.8

Introducing dynamic workflows | Claude