Claude Fable 5 zet de lat hoger voor autonome AI met scherpere veiligheidsgrenzen

Anthropic heeft Claude Fable 5 uitgebracht en daarmee voor het eerst een model uit de zogenoemde Mythos-klasse toegankelijk gemaakt voor het brede publiek. Het model presteert volgens de gepubliceerde benchmarks beter dan alle eerder vrijgegeven Claude-versies en is vooral beter voor lange, complexe taken die uren of dagen zelfstandig werk vragen. Tegelijk is Claude Mythos 5 beschikbaar, technisch hetzelfde model maar met minder beperkingen voor mensen die met cybersecurity bezig zijn. Het verschil zit niet in de capaciteiten, maar in de guardrails.

Wat Claude Fable 5 anders maakt

De rode draad door alle prestatiecijfers is consistent: hoe langer en complexer een taak, hoe groter de voorsprong van Fable 5 op eerdere modellen.

In tests van Stripe verwerkte het model een codebase-wijde migratie in een Ruby-project van vijftig miljoen regels in één dag. Een team van menselijke ontwikkelaars zou daar volgens dezelfde inschatting ruim twee maanden over doen. Op Cognition’s FrontierCode-evaluatie, die niet alleen kijkt naar of code werkt maar ook naar productiekwaliteit, scoort Fable 5 het hoogst van alle geteste frontier-modellen.

Kenniswerk en redeneren

Op Hebbia’s Finance Benchmark voor senior-niveau redeneren behaalt Fable 5 de hoogste score van elk getest model. De winst zit vooral in documentgebaseerd redeneren, het interpreteren van grafieken en tabellen, en probleemoplossing in meerdere stappen.

Visie en lange context

Fable 5 is volgens de tests state-of-the-art voor visuele taken. Het haalt nauwkeurige getallen uit gedetailleerde wetenschappelijke grafieken en kan de broncode van een webapp reconstrueren op basis van screenshots alleen. Vorige Claude-modellen lukte het niet om Pokémon FireRed uit te spelen, Fable 5 voltooide het spel.

Voor lange taken houdt het model focus over miljoenen tokens. Bij het deck-buildingspel Slay the Spire verbeterde toegang tot persistente bestandsgebaseerde geheugenfuncties de prestaties drie keer zoveel als bij Opus 4.8, en bereikte Fable 5 de eindfase drie keer vaker.

Wetenschappelijke doorbraken via Mythos 5

Eiwitontwerp-experts van Anthropic versnelden delen van het geneesmiddelontwerpproces ongeveer tien keer. In één studie matchte of overtrof Mythos 5 ervaren menselijke operators bij het ontwerpen van eiwitten, zonder menselijke tussenkomst. Negen van veertien onderzochte eiwittargets leverden sterke kandidaten op voor verder onderzoek naar nieuwe medicijnen.

Nog opmerkelijker: in blinde vergelijkingen verkozen wetenschappers de moleculair-biologische hypotheses van Mythos boven die van Opus-klasse modellen in ongeveer tachtig procent van de gevallen. Eén hypothese over een nieuw mechanisme voor een E. coli-eiwit werd onafhankelijk bevestigd door een lab dat aan hetzelfde vraagstuk werkte. In genomica voerde het model bijna een week zelfstandig onderzoek uit, bouwde een eigen machine learning-model op data van miljoenen cellen uit 138 diersoorten, en versloeg daarmee een recent in Science gepubliceerd model, terwijl het honderd keer kleiner was.

Hoe de veiligheidslaag werkt

De naam Fable verwijst naar het Latijnse fabula, verwant aan het Griekse mythos. Dezelfde betekenis dus, ander pakket. Het verschil tussen Fable 5 en Mythos 5 zit volledig in de veiligheidsfilters eromheen.

Mythos-klasse modellen halen volgens Anthropic een drempel waarop ze serieuze risico’s opleveren. De cybersecurity-capaciteiten kunnen mensen met slechte bedoelingen helpen bij aanvallen op kritieke infrastructuur. De biologische redeneerkracht kan zowel gebruikt worden voor geneesmiddelontwikkeling als voor het maken biologische wapens. Daarom werkt Fable 5 met een nieuwe set classifiers. Dit zijn aparte AI-systemen die verdachte verzoeken detecteren.

Wanneer de classifiers een vraag herkennen rond cybersecurity, biologie en chemie, of pogingen tot distillatie van het model, wordt het antwoord automatisch overgenomen door Claude Opus 4.8. Gebruikers krijgen daar melding van. Dat is geen volledige weigering van de opdracht, maar wel een stap terug naar een model met minder mogelijkheden. De filters zijn bewust voorzichtig afgesteld. Ongeveer vijf procent van de sessies activeert een fallback, soms ook bij onschuldige vragen. Anthropic geeft toe dat dit frustrerend kan zijn en werkt aan het terugdringen van valse positieven.

Bestand tegen jailbreaks

De classifiers werden uitgebreid getest tegen pogingen om ze te omzeilen. Een externe bug bounty leverde in meer dan duizend uur testen geen enkele universele jailbreak op. Eén externe partner vond dat Fable 5 op cybersecurity-verzoeken het meest robuuste model was van alle geteste varianten, en weigerde nul schadelijke single-turn verzoeken rond aanvalsplanning of exploitontwikkeling, ook wanneer dertig verschillende publiek bekende jailbreak-technieken werden gebruikt.

Wat het kost

Fable 5 en Mythos 5 kosten beide 10 dollar per miljoen input-tokens en 50 dollar per miljoen output-tokens. Dat is minder dan de helft van wat Mythos Preview kostte, maar nog steeds ongeveer twee keer Opus 4.8 en drie keer Sonnet 4.6 per token.

Die vergelijking per token kan misleiden. Wat telt is de kostprijs per voltooide taak, en daar wisselen de verhoudingen sterk. Voor een snelle code-review op een kleine pull request betaal je met Fable 5 al snel acht keer meer dan met Sonnet 4.6 voor een marginaal beter resultaat. Maar voor het bouwen van een volledige feature in één run kan Fable 5 effectief goedkoper uitvallen, omdat het model afmaakt wat anders nog uren menselijk nawerk vereist.

Drie gewoontes maken het verschil tussen voorspelbare en uit de hand gelopen kosten:

Gebruik Sonnet 4.6 als standaard en schakel bewust op naar Fable voor zware taken
Stel max_tokens expliciet in per verzoek
Activeer prompt caching op lange sessies, wat de inputkosten met ongeveer negentig procent kan verlagen op herhaalde context

Beschikbaarheid en uitrol

Fable 5 is direct beschikbaar via de Claude API. Voor abonnementen hanteert Anthropic een gefaseerde uitrol. Tot en met 22 juni is het model inbegrepen in Pro-, Max-, Team- en seat-based Enterprise-plannen zonder extra kosten. Vanaf 23 juni verschuift het naar een credit-systeem, met als doel het later weer standaard op te nemen wanneer de capaciteit dat toelaat.

Mythos 5 blijft beperkt tot partners van Project Glasswing en binnenkort een kleine groep biomedische onderzoekers via een trusted access-programma. De groep van ongeveer 150 organisaties die toegang had tot Mythos Preview kan vandaag upgraden naar Mythos 5. Volgens cijfers van Anthropic hebben deze gebruikers tot nu toe meer dan tienduizend kritieke beveiligingsfouten in hun systemen ontdekt met behulp van Mythos.

Een rempedaal voor de versnelling

Het bijzondere aan deze release is niet de capaciteit, hoe indrukwekkend ook. Het is dat Anthropic voor het eerst expliciet erkent dat een model gevaarlijk genoeg is om twee verschillende versies te rechtvaardigen: één voor het brede publiek met filters, één voor vertrouwde partijen zonder. Mede-oprichter Jack Clark vatte het onlangs samen met de opmerking dat de AI-sector een gaspedaal heeft maar geen rem. Met Fable 5 probeert Anthropic die rem zelf in te bouwen, niet door capaciteit weg te houden, maar door een tweede model voor het eerste te zetten. Of die aanpak houdbaar blijft naarmate de capaciteiten verder groeien, is een vraag die de komende modelgeneraties moeten beantwoorden.