Jalapeño de eerste eigen AI-chip van OpenAI en Broadcom

OpenAI heeft samen met Broadcom zijn eerste eigen AI-chip onthuld. De chip heet Jalapeño en is geen aangepaste GPU, maar een accelerator die vanaf de tekentafel is ontworpen voor inference van grote taalmodellen. Daarmee zet OpenAI een stap die het bedrijf positioneert als meer dan alleen een softwarebouwer. Het neemt nu ook de controle over de hardware waarop zijn modellen draaien.

De aankondiging is om meerdere redenen opmerkelijk. Niet alleen omdat OpenAI hiermee de stap zet naar volledige controle over de eigen stack, maar ook omdat de ontwikkelingstijd ongekend kort was en de implicaties voor de markt fors zijn. Nvidia, dat tot nu toe vrijwel ongenaakbaar leek in AI-hardware, krijgt er een concurrent bij.

Wat Jalapeño anders maakt

Jalapeño wordt door OpenAI omschreven als een Intelligence Processor. Geen brede GPU dus, maar een gespecialiseerde accelerator die is geoptimaliseerd voor één specifieke taak: het uitvoeren van LLM-inference. Dat is het proces waarbij een getraind model antwoorden genereert op vragen van gebruikers.

De architectuur is ontworpen op basis van wat OpenAI dagelijks leert uit het draaien van ChatGPT, Codex en de API. De chip vermindert de hoeveelheid datatransport, balanceert rekenkracht, geheugen en netwerkcapaciteit, en haalt daarmee een benutting die dicht bij de theoretische piek van de hardware komt. Vroege tests laten zien dat de prestaties per watt aanzienlijk hoger liggen dan bij de huidige state of the art chips. Een gedetailleerd technisch rapport volgt later.

Broadcom-CEO Hock Tan stelt dat de chip in praktijk net zo goed presteert als de Blackwell-GPU’s van Nvidia en de TPU’s van Google. Concrete cijfers zijn nog niet gedeeld, dus die uitspraak verdient nuance. Blackwell dankt zijn dominantie aan brede inzetbaarheid en het diepgewortelde CUDA-platform. Jalapeño levert puur winst op voor één specifiek soort werk en is dus minder flexibel als de onderliggende AI-architectuur in de toekomst radicaal verandert.

Van ontwerp tot productie in negen maanden

Misschien wel het meest verbluffende detail van deze aankondiging is de snelheid van de ontwikkeling. Van eerste ontwerp tot een productieklare chip duurde het slechts negen maanden. Volgens OpenAI is dit de snelste ASIC-ontwikkelcyclus die ooit is gerealiseerd in high-performance halfgeleiders.

Die snelheid was mogelijk door drie factoren:

Diepe samenwerking tussen de engineeringteams van OpenAI en Broadcom
Broadcoms expertise in silicon-implementatie en netwerktechnologie
Het gebruik van OpenAI’s eigen AI-modellen om delen van het ontwerp- en optimalisatieproces te versnellen

Dat laatste punt is fascinerend. Dezelfde modellen die elke dag aan miljoenen gebruikers diensten leveren, hielpen mee aan het ontwerp van de chips die toekomstige modellen zullen draaien. E

De rol van Broadcom en Celestica

OpenAI investeert niet in eigen chipfabrieken. In plaats daarvan kiest het bedrijf voor de hyperscaler-route, dezelfde aanpak die Google gebruikt bij de ontwikkeling van zijn TPU’s. Het werk wordt verdeeld over drie partijen.

OpenAI ontwerpt de accelerator en bepaalt de architectuur op basis van diep inzicht in hoe LLM’s werken. Broadcom levert het cruciale silicon en de netwerktechnologie, waaronder Tomahawk-netwerk-silicon dat duizenden chips efficiënt met elkaar laat communiceren. Celestica fungeert als ODM en integreert de chips in server racks die klaar zijn voor inzet in Microsoft Azure-datacenters.

Deze taakverdeling laat zien hoe OpenAI zijn full-stack ambitie invult zonder zelf miljarden in fabrieken te steken. Het bedrijf bouwt aan een platform dat van model tot rack volledig op eigen specificaties draait, terwijl gespecialiseerde partners de fysieke kant invullen.

Gigawatt-schaal vanaf 2026

Hock Tan bevestigt dat de samenwerking veel verder reikt dan één chip. Het gaat om een meerjarig technologisch traject. Vanaf 2026 willen OpenAI, Broadcom, Microsoft en andere partners datacenters uitrollen op gigawatt-schaal.

Inference is waar AI mensen bereikt. Elke verbetering in kosten, snelheid en betrouwbaarheid vertaalt zich direct in een snellere reactie van ChatGPT. Voor OpenAI is dit dus geen technisch project op zichzelf, maar de motor onder de groei van het hele productaanbod.

Waarom Nvidia hier rekening mee moet houden

Nvidia zit niet zonder reden in een dominante positie. De combinatie van krachtige GPU’s en het CUDA-software-ecosysteem heeft het bedrijf decennia voorsprong opgeleverd. Toch verandert er iets fundamenteels. OpenAI is een van Nvidia’s grootste klanten en dat blijft voorlopig zo, maar met Jalapeño bouwt OpenAI aan een toekomst waarin het minder afhankelijk is van externe chipleveranciers.

Die strategie volgt een patroon dat we eerder zagen bij Google met de TPU’s en bij Amazon met Trainium en Inferentia. Hyperscalers en grote AI-spelers willen hun eigen silicon, omdat de kosten van extern inkopen op deze schaal niet meer houdbaar zijn en omdat eigen ontwerp specifieke optimalisaties mogelijk maakt die generieke GPU’s niet kunnen leveren.

Voor Nvidia betekent dit dat een groeiend deel van de inference-markt buiten zijn bereik kan vallen. Training blijft voorlopig terrein waar Blackwell domineert, maar inference is volumetisch veel groter en gevoeliger voor kostenoptimalisatie.

De financiële context

Begin juni diende OpenAI een vertrouwelijk S-1-document in bij de SEC, wat wijst op een naderende beursgang. Met een eigen hardwareplatform laat het bedrijf zien dat het zijn afhankelijkheid van derden actief vermindert en dat het opereert als een verticaal geïntegreerde techgigant.

De verwachte marktwaarde bij een beursgang loopt op naar duizend miljard dollar. Voor zo’n waardering moet OpenAI laten zien dat het meer is dan een softwarebedrijf met één succesvol product. De stap naar eigen chips past in die positionering.

Wat dit betekent voor de bredere AI-markt

Jalapeño is geen geïsoleerd project, maar het begin van wat OpenAI een meerjarig platform noemt. De chip is specifiek ontworpen voor LLM-inference, maar dan wel breed genoeg om met verschillende soorten modellen te werken, niet alleen die van OpenAI zelf.

Voor ontwikkelaars en bedrijven die op OpenAI’s API draaien, betekent dit op termijn lagere kosten en snellere reacties. Voor de chipindustrie verschuift de machtsbalans verder richting een model waarin de grootste AI-bedrijven hun eigen silicon ontwerpen en alleen nog de fysieke productie uitbesteden.