I Anthropic’s nylancerede Claude Opus 4.8 model, kan man sætte dens thinking level til Hyper Ultra Kodyl Max (eller noget i den stil). Så kører den agenter i et workflow og vender tilbage med et mærkbart bedre resultat, end 4.7 kunne levere. Prøvede den i mit kodeprojekt (aikemi.eu) - jeg er både imponeret og brændt tør for tokens. 😶 Hvad er jeres erfaringer med 4.7 vs 4.8?

  • farsinuce@feddit.dkOP
    link
    fedilink
    arrow-up
    2
    ·
    edit-2
    13 days ago

    90 EUR om måneden. Men er ikke løbet tør for hele måneden. Du har flere “vinduer” - et, der nulstilles hver femte time, og et andet ugentligt.

    Mit token vindue nulstiller igen her til middag.

    Så jeg kan ikke sige, hvad denne session har kostet. Men altså hvis jeg nu brugte alle tokens hver femte time (maksimalt udnyttede mit abonnement - uden pauser og søvn), så har jeg vel skullet betale €90 / (730 timer i en måned/5 timers vindue) ≈ €0.62, hvis man kan stille det op sådan forsimplet.

    Med 4.7 kunne jeg typisk jonglere 3 agenter, der arbejdede på hver deres del af kodebasen, og lige netop holde mig inden for mit loft hver femte time.

    Men den her ultracode mode i 4.8 er en anden liga. Som jeg ser det, skal den ikke bruges hele tiden som standard.

    • SorteKanin@feddit.dkM
      link
      fedilink
      arrow-up
      3
      ·
      13 days ago

      Har du prøvet andre end Claude? Jeg ville faktisk gerne til at prøve noget AI kodning men har det lidt skidt med at skulle betale for sådan et abonnement til et amerikansk tech-firma. Men min opfattelse (mavefornemmelse) er at lokale modeller ikke er gode nok og at der ikke findes europæiske alternativer der faktisk kan konkurrere på kvalitet.

      • Baizey@feddit.dk
        link
        fedilink
        arrow-up
        3
        ·
        13 days ago

        For europæisk kan du evt prøve Mistral, ellers ville kinesisk deepseek v4 nok være en god billig en for bare at prøve det. Har selv codex/openai privat og GitHub copilot på arbejdet

        Lokale modeller er faktisk blevet gode, men vi snakker stadig at man skal have dedikeret highend gear for rigtig at bruge det (noget der let kan koste 100k kroner). Hvis du har en enkel god gpu (4090, 5090 eller Mac med meget integrated ram) kan du rimlig hurtigt prøve en af de mindre open source modeller som qwen 3.6 (27b eller 35b 3b expert) og se om den er god nok for dig, ollama (for at køre modellen) + pi.dev (som din “claude code”) er nok hurtigst i opsætning

        • farsinuce@feddit.dkOP
          link
          fedilink
          arrow-up
          2
          ·
          12 days ago

          Kan du huske, om Claude Code har åbnet op for, at man kan bruge andre modeller end deres egne?

          Brugte cline i VS code, før jeg skiftede til Claude Code (også en Vs code extension).

      • farsinuce@feddit.dkOP
        link
        fedilink
        arrow-up
        2
        ·
        edit-2
        12 days ago

        Korrekt antaget. Se https://artificialanalysis.ai/leaderboards/models for benchmark sammenligning. Husk at tage benchmarks med et gran salt.

        Ja, jeg har prøvet andre end Claude. Har prøvet Gemini 3.x i VS Code, og brugte GPT 5.x i en tidlig version af Codex. Mistral er kommet langt med deres “Vibe” platform. Diverse kinesiske modeller er ikke langt bagefter, som Baizey skriver.

        Lang historie kort: Efter min opfattelse, giver Claude Code de bedste resultater.

        Hvis du vil opleve, hvor langt LLM-assisteret programmering er kommet, så skal du prøve en flagskibsmodel (med thinking level på max). Hvis du kan nøjes med noget, som er halvt så godt (cirka 1 år bagud), så prøv én af de open source +100B parametre modeller over API - f.eks. Mistral Medium 3.5 (tror jeg, den nyeste hedder?).

        Hvis du vil prøve local LLM kodning (så er vi vel ca. 2 år bagud ift flagskibene), så prøv én af de nyeste Mixture of Experts modeller med færre aktive parametre, der kan køre på ~16 GB VRAM. Men du bliver nok skuffet, hvis du forventer større, sammenhængende kode.

        • SorteKanin@feddit.dkM
          link
          fedilink
          arrow-up
          2
          ·
          9 days ago

          Nå, nu bed jeg i det sure æble og fik mig en pro subscription hos Anthropic.

          Du virker til at have brugt det i længere tid - hvor finder du tips og råd til at bruge Claude effektivt? Lige nu tænker jeg mest på hvordan jeg gør det nemmere at lave code review på det Claude har skrevet og så måske ideer til hvordan jeg udnytter tokens når jeg ikke sidder ved computeren - altså man betaler jo for dem og de nulstiller hver 5. time eller hvordan det er, så man kan da lige så godt bruge dem til noget?

          • farsinuce@feddit.dkOP
            link
            fedilink
            arrow-up
            2
            ·
            edit-2
            8 days ago
            spoiler


            Spøg til side.

            hvor finder du tips og råd til at bruge Claude effektivt?

            Søger ikke rigtigt efter det. Jeg prøver mig mest bare frem. Holder dog øje med deres blog(s). Der er af og til nogle guldkorn.

            Skills er vidst smart at kunne bruge - men jeg har ikke selv arbejdet med det endnu.

            Lige nu tænker jeg mest på hvordan jeg gør det nemmere at lave code review på det Claude har skrevet

            Den nemmeste måde at lave code review på en plan eller en implementation, som Claude har lavet er: ultracode. Bump thinking level helt op, og se dine tokens forsvinde x5 gange hurtigere. Efter min erfaring, har det kunnet betale sig - slutresultaterne er bedre, og jeg slipper for at skulle dele min prompt op i flere sessioner og markdown planer og ekstra revisioner osv.

            og så måske ideer til hvordan jeg udnytter tokens når jeg ikke sidder ved computeren - altså man betaler jo for dem og de nulstiller hver 5. time

            Ah. Ja. Så må du prøve at eksperimentere med deres nye Dispatch. Det er sådan en slags OpenClaw/Hermes lite efterligning. Ved ikke, om det stadig kræver Claude Cowork (og ikke Claude Code). Ellers kan du bare have noget fjernskrivebord kørende fra telefonen, og nogle prompts klar til at sætte den i gang, hvis du har forberedt noget, den skal arbejde på i en 15-20 minutters tid i ultracode.

            Note 1: Jeg bruger selv Claude VS Code extension, men burde egentligt bare få skiftet IDE’et ud med dedikeret Claude Code.

            Note 2: Jeg ved for resten ikke, om nogle af de funktioner, jeg har nævnt, er gated bag en Max subscription (90 EUR/md).

            • SorteKanin@feddit.dkM
              link
              fedilink
              arrow-up
              2
              ·
              8 days ago

              Jeg tænkte mere code review udført af mig selv, på det Claude har skrevet. Jeg gad godt have sådan et setup ligesom med en GitHub PR hvor jeg kan markere noget kode og skrive en kommentar til det. Helst samle alle kommentarer i et review på den måde, præcis som en GitHub PR, bare lokalt og med mig som reviewer på Claudes kode. Men måske findes det ikke endnu eller der er måske en simplere løsning. Jeg ved ikke hvad din erfaring er men jeg har ikke tænkt mig bare at lade Claude kode uden at jeg gennemgår hver en linje.

              Jeg bruger også VS code udvidelsen. Synes bare VS Codes diff viewer er god til at læse ændringer.