Claude Sonnet 5, beter voor gebruik met autonome AI-agents

Op 30 juni 2026 lanceerde Anthropic Claude Sonnet 5, het meest agentische Sonnet-model tot nu toe. De benchmarkgrafieken laten stevige sprongen zien op coderen, redeneren en tool use, met prestaties die de vlaggenschip Opus 4.8 dicht benaderen tegen een fractie van de kosten. Maar het echte verhaal zit niet in de scores. Het zit in de 145 pagina’s tellende system card die naast het model werd gepubliceerd, en die verraadt waar de volgende ingenieursuitdaging ligt: agents betrouwbaar laten opereren wanneer niemand meekijkt.

Wat Sonnet 5 anders maakt dan zijn voorgangers

Sonnet 5 is gebouwd als een drop-in upgrade voor Sonnet 4.6, maar met drie gedragsveranderingen die de agentische focus verraden. Adaptive thinking staat standaard aan, handmatige extended thinking geeft nu een 400-fout terug, en niet-standaard sampling parameters worden geweigerd. Er zit ook een nieuwe tokenizer in die tekst efficiënter verwerkt.

Bij lancering hanteert Anthropic een introductietarief van 2 dollar per miljoen input-tokens en 10 dollar per miljoen output-tokens tot en met 31 augustus 2026. Daarna gaat het naar 3 en 15 dollar. Met prompt caching kunnen kosten tot 90 procent zakken, met batch processing tot 50 procent. Voor teams die agents op schaal draaien is dat een belangrijk element.

Gebruikers geven aan dat het gedrag kwalitatief anders aanvoelt dan bij Sonnet 4.6. Een tester vroeg het model een bug te onderzoeken. Ongevraagd schreef Sonnet 5 eerst een test die de bug reproduceerde, implementeerde vervolgens de fix, en stashte de wijziging om te controleren dat de bug terugkwam zonder de aanpassing.

Waarom de system card belangrijker is dan de scores

De benchmarks van Sonnet 5 zien er sterk uit, maar top-modellen liggen steeds dichter bij mekaar voor standaard evaluaties. Het echte onderscheid ligt elders. De system card besteedt relatief weinig ruimte aan benchmarkwinst en des te meer aan hoe agents het web verkennen, tools gebruiken, plannen over langlopende taken, prompt injection weerstaan en herstellen wanneer iets misgaat.

Dat laatste, herstel, is het interessantste. Een langlopende agent kan op talloze manieren onderbroken worden. Een tool call die een time-out geeft. Een browsersessie die context verliest na een redirect. Een API die tijdelijk niet reageert. Elke onderbreking dwingt de agent te begrijpen wat er veranderd is, voortgang te bewaren, en te beslissen hoe verder te gaan. Of te erkennen dat verdergaan niet kan.

Nieuwe evaluaties voor nieuwe risico’s

Anthropic introduceert in de Sonnet 5 system card evaluaties die in eerdere generaties LLM’s nauwelijks bestonden. Er is aparte aandacht voor kwaadwillig gebruik van coding agents, computer use agents en browser agents. Er zijn tests voor beïnvloedingsoperaties. En er is een live bug bounty-programma dat adaptieve aanvallers loslaat op coding, computer use en browser use omgevingen.

Twee evaluaties springen eruit: SHADE-Arena en LinuxArena. Beide testen of een agent probeert stiekem te handelen, dus verborgen doelen na te streven terwijl hij naar buiten toe de instructies lijkt te volgen. Sonnet 5 scoort daar bijna nul op. Belangrijker dan de score is dat Anthropic deze tests überhaupt uitvoert. Dat signaleert hoe serieus het bedrijf de kloof neemt tussen een model dat het goed doet in een chatvenster en een model dat betrouwbaar blijft wanneer het langdurig zelfstandig mag opereren.

Op prompt injection loopt het testwerk over drie verschillende agentische oppervlakken: coderingsomgevingen, computer use en browser navigatie. De resultaten tonen verbetering ten opzichte van Sonnet 4.6, maar de opzet van de evaluatie is minstens zo veelzeggend. Anthropic controleert grondig of een agent die het web bezoekt zich laat kapen door instructies verstopt in een pagina.

Infrastructuurpatronen voor agents die blijven werken

De eigen evaluatie-infrastructuur van Anthropic geeft een kijk op hoe productieomgevingen voor agents eruit gaan zien. In de system card staan features zoals tool result clearing, waarbij verouderde tool-outputs worden verwijderd naarmate een agent context opbouwt. En memory tools, die informatie laten voortbestaan buiten het actieve contextvenster.

Dit lost concrete problemen op die ontstaan wanneer agents lang doorwerken. State moet meegaan over meerdere stappen. Externe tools moeten gesynchroniseerd blijven. Fouten moeten gedetecteerd worden voordat een agent doorgaat met verouderde of onvolledige informatie. Dit is het loodgieterswerk dat engineeringteams zelf zullen moeten bouwen en onderhouden naarmate agents meer langlopend werken en minder door mensen worden gecontroleerd.

Waar het model minder geschikt voor is

Anthropic traint Sonnet 5 niet gericht op cybersecurity-taken. Het model kan routinematige, ongevaarlijke cybertaken uitvoeren, maar op evaluaties die potentieel gevaarlijke vaardigheden testen, zoals het ontwikkelen van software-exploits, scoort het aanzienlijk lager dan Opus 4.8 en Mythos 5. In een test die vroeg om exploits te ontwikkelen voor kwetsbaarheden in Firefox slaagde Sonnet 5 nooit in een volledig werkende exploit. Het is gelanceerd met cyber safeguards standaard aan. Die detecteren en blokkeren gevaarlijk cybergebruik in real time. Voor werk dat om minder strikte guardrails vraagt beveelt Anthropic Opus 4.8 aan.