Return on tokens

Wie vandaag een AI-toepassing bouwt, krijgt vroeg of laat dezelfde vraag van de directie: wat levert dit nu eigenlijk op? Het antwoord verstopt zich vaak achter technische rapportages over tokenverbruik, modelkeuzes en input-outputratio’s. Voor een engineer is dat relevant. Voor een CFO is het ruis. Daarom wint een nieuw begrip terrein: return on tokens, kortweg ROT. Stop met tellen wat je verbruikt en begin met meten wat je oplevert per eenheid AI-inzet.

Wat return on tokens precies betekent

Return on tokens draait om de verhouding tussen wat een AI-systeem aan rekenwerk verbruikt en welke zakelijke waarde het daarmee genereert. Een token is de kleinste eenheid waarmee taalmodellen rekenen en waarop leveranciers afrekenen. Het probleem is dat tokens en bedrijfswaarde twee verschillende talen spreken. LLM-providers factureren per token, maar jouw organisatie verdient geld per opgeloste klantvraag, per gegenereerd rapport of per geautomatiseerd proces.

De eenheid waarin je betaalt komt niet overeen met de eenheid waarin je waarde creëert. Een melding dat een nieuwe versie van een applicatie twintig procent minder tokens verbruikt klinkt goed, maar zegt niets over of de klant sneller geholpen werd, of het proces betrouwbaarder is geworden, of dat de besparing opweegt tegen de engineeruren die erin gingen zitten. Return on tokens dwingt je om die brug te slaan tussen het technische en het strategische.

Waarom tokens tellen niet meer volstaat

Tokenverbruik verbergt de complexiteit van de onderliggende taak. Een toepassing die dure tokens gebruikt kan hoogwaardige resultaten leveren. Een toepassing die spotgoedkoop draait kan continu actief zijn zonder enige meetbare impact. Door alleen naar tokens te kijken vergelijk je appels met peren en verlies je elk zicht op werkelijke ROI.

Uit een Deloitte-onderzoek van 2025 onder 1854 executives blijkt dat 85 procent van de organisaties hun AI-investeringen het afgelopen jaar verhoogde en dat 91 procent dat opnieuw van plan is. Tegelijk rapporteert de meerderheid dat een typische AI-use case pas binnen twee tot vier jaar een acceptabele ROI oplevert. Voor reguliere technologie-investeringen wordt normaal gesproken zeven tot twaalf maanden gehanteerd. Slechts zes procent ziet zijn AI-investering binnen een jaar terugverdiend. Die kloof tussen investering en zichtbaar rendement maakt duidelijk waarom een nieuwe meetmethode broodnodig is.

Van technische input naar zakelijke output

De kern van return on tokens is een verschuiving in rapportage. Niet langer kijken naar technische inputs, maar naar zakelijke outputs. Drie metrics komen daarbij steeds terug.

Kost per beantwoorde vraag: de totale kosten, inclusief API-calls, voor- en nabewerking en infrastructuur, om één gebruikersvraag te beantwoorden. Hiermee onderbouw je investeringen in interne kennistools tegenover klassieke oplossingen.
Kost per opgelost ticket: de totale kosten van een AI-agent die een supportticket van begin tot eind afhandelt. Dit geeft een direct vergelijk met de operationele kosten van een menselijke medewerker.
Kost per gegenereerd rapport: de kosten om één complex document, zoals een kwartaalsamenvatting, te schrijven en finaliseren. Hiermee bepaal je of een duurder model rendabel is voor synthesetaken.

Een concreet voorbeeld maakt het verschil zichtbaar. Stel dat je kost per opgelost ticket via een AI-agent vijftig cent bedraagt en dat een menselijke medewerker er vijf euro voor nodig heeft. Dan lever je tienmaal rendement op die specifieke taak. Een vergelijking tussen twee verschillende modellen op dezelfde metric vertelt je veel meer dan een vergelijking van tokenprijzen ooit zou kunnen.

Waarom ROI bij AI zo moeilijk te vatten is

Return on tokens lost niet alles op. Deloitte identificeert vijf redenen waarom AI-rendement zo lastig meetbaar blijft. Veel voordelen zijn immaterieel: betere klantbeleving, hogere medewerkertevredenheid, sterkere leveranciersrelaties. Daarnaast lijden veel organisaties onder versnipperde systemen en datasilo’s waardoor een nul- en eindmeting nauwelijks mogelijk is. Proof of concepts draaien vaak op dummydata en sneuvelen zodra er echte data in komt.

De technologie evolueert ook sneller dan de meetmethodes. Wat vandaag baseline is, kan over zes maanden achterhaald zijn. Daarbij komt dat AI zelden in isolatie wordt uitgerold. Het loopt vrijwel altijd parallel met bredere transformaties, reorganisaties of dataprojecten, waardoor de bijdrage van AI moeilijk te isoleren valt. Eén geïnterviewde executive vatte het samen: alleen een ruwe schatting was mogelijk omdat de winst uit AI niet los te koppelen viel van operationele verbeteringen elders.

Wat de koplopers anders doen

Slechts één op vijf organisaties kwalificeert in het Deloitte-onderzoek als AI ROI-leider. Deze groep onderscheidt zich op een aantal punten die direct relevant zijn voor wie return on tokens serieus wil nemen.

Ze behandelen AI niet als efficiëntietool maar als kans om het businessmodel te herdenken. Vijftig procent definieert zijn belangrijkste AI-wins in termen van omzetgroei. Ze investeren ook fors meer: 95 procent besteedt meer dan tien procent van het IT-budget aan AI. Ze hanteren bovendien gedifferentieerde meetkaders. 86 procent gebruikt expliciet andere frameworks of tijdshorizonten voor generatieve AI tegenover agentic AI. Generatieve AI wordt afgerekend op productiviteit en efficiëntie. Agentic AI op kostenbesparing, procesherontwerp en risicobeheersing op langere termijn.

Veertig procent van de leiders maakt AI-training verplicht. Ze beschouwen AI-geletterdheid als basiscompetentie, niet als optionele bijscholing. En 62 procent verankert AI expliciet in de bedrijfsstrategie, vaak met de CEO als de voortrekker.

Verschillende technologieën, verschillende tijdshorizonten

Return on tokens werkt anders voor generatieve dan voor agentic AI. Bij generatieve AI rapporteert vijftien procent al meetbare ROI en verwacht 38 procent rendement binnen een jaar. Het gaat dan vooral om productiviteitswinst: snellere contentcreatie, hogere outputkwaliteit, minder routinetaken.

Bij agentic AI is de dynamiek anders. Slechts tien procent ziet vandaag significant rendement. De rest verwacht het binnen één tot vijf jaar. Die langere doorlooptijd komt door de inherente autonomie van agents en de noodzaak om naadloos te integreren met data, tools en bedrijfsprocessen. Succesvolle organisaties gebruiken generatieve AI om snel momentum te bouwen en leggen tegelijk de fundamenten voor de bredere transformatie die agentic AI vraagt: datakwaliteit, governance, change management.

De volgende stap voor wie waarde wil aantonen

Return on tokens is geen vervanging van klassieke ROI-berekeningen maar een aanvulling die ontbrak. Het geeft architecten en CIO’s de vocabulaire om strategische waarde uit te leggen aan de boardroom. Het laat FinOps-teams toe om uitgaven te optimaliseren op basis van bewezen uitkomsten. En het geeft directies de zekerheid om door te investeren in technologie waarvan het rendement zich vaak pas na jaren toont.

Return on tokens is een gespreksopener, geen einddoel. Wie zijn kost per opgelost ticket kent, weet niet alles. Leiden die opgeloste tickets ook tot klanten die blijven, processen die schalen en medewerkers die hun tijd aan waardevoller werk besteden. Tokens zijn meetbaar. Vertrouwen, snelheid en wendbaarheid niet. De volwassen organisatie meet beide en weet wanneer welke meer belang heeft.