Z.ai, toonaangevende Chinese AI
Chinese AI is de afgelopen jaren pijlsnel geëvolueerd. Z.ai, het geesteskind van de toonaangevende start-up Zhipu AI, wordt stilaan een begrip, niet enkel in China maar ook ver daarbuiten. Met de lancering van hun nieuwste model, GLM 4.5, positioneren ze zich als frontrunner binnen het snelgroeiende landschap van generatieve AI. In deze blogpost onderzoeken we waar de roots liggen van Zhipu, wat GLM 4.5 zo uniek maakt, en waarom dit model de concurrentie het nakijken geeft.
Wat is Z.ai?
Z.ai is het platform en AI-ecosysteem van Zhipu AI dat als missie heeft om generatieve artificiële intelligentie in de praktijk te brengen. Het platform biedt toegang tot de gloednieuwe GLM 4.5-modellen en een scala aan slimme toepassingen: van geavanceerde chatbots tot tools voor presentaties, webontwikkeling en agentic AI die zelfstandig problemen kan aanpakken.
Met Z.ai heb je niet gewoon een klassieke chatbot in handen. Het is een veelzijdig AI-platform waar creativiteit, productiviteit en intelligentie samenkomen. Je gebruikt het voor brainstormsessies, het bouwen van websites, het maken van presentaties en complexe softwareontwikkeling.
Tsinghua University en het ontstaan van Zhipu AI
Het verhaal van Zhipu AI, de drijvende kracht achter Z.ai, begint in 2019 op de campus van Tsinghua University in Beijing. Onder leiding van professoren Tang Jie en Li Juanzi groeide Zhipu uit tot China’s grootste AI-start-up qua medewerkers (800+) en zette het de Chinese standaard in AI-innovatie. De wetenschappelijke basis van het bedrijf ligt bij de Knowledge Engineering Group (KEG) van Tsinghua: een broeihaard van AI-talent en technologie, niet alleen voor Zhipu, maar ook voor andere Chinese AI-unicorns zoals DeepLang en Moonshot AI.
Naast het bouwen van technologie, heeft Zhipu AI ook zware impact gehad op het Chinese AI-ecosysteem door mentoring, samenwerking met researchinstellingen zoals de Beijing Academy of Artificial Intelligence (BAAI), en het stimuleren van een dynamische start-up cultuur die parallel loopt aan Silicon Valley.
Het bedrijf mikt niet enkel op lokale relevantie: CEO Zhang Peng droomt van een wereldwijde doorbraak. In juli 2024 lanceerde Zhipu zelfs een text-to-video generator, een directe uitdager voor OpenAI’s innovatieve Sora-tool. Daarmee toont Zhipu aan dat het Chinese AI niet louter imiteert, maar ook zelf innoveert en op sommige vlakken zelfs trendsetter is.
De missie van Zhipu AI: meer dan imitatie
Waar veel Chinese bedrijven zich richten op het snel inhalen van Westerse leiders, bewandelt Zhipu bewust een eigen pad richting Artificial General Intelligence (AGI) — AI die niet alleen menselijke taken overneemt, maar zelfs zal kunnen uitleggen, zichzelf beoordelen en verbeteren. “Het draait om kwalitatieve verandering op basis van kwantitatieve sprongen,” aldus CEO Zhang Peng. De ambitie is om AI te bouwen die zich autonoom ontwikkelt en zelf denkt, geïnspireerd op maar ook onderscheidend van giganten zoals OpenAI en Google DeepMind.
Het kernwoord? Onafhankelijkheid: eigen research, eigen data, eigen infrastructuur — met als doel Chinese AI klaarstomen voor het mondiale podium. Internationalisering is een cruciale strategie. Met investeerders als het Saudische Prosperity7 mikt Zhipu AI op meer dan enkel de thuismarkt.
GLM is echt tweetalig
Het GLM-verhaal startte in 2021 met een paper over “General Language Model Pretraining with Autoregressive Blank Infilling”. In tegenstelling tot de bekendere BERT- en GPT-modellen, die vooral op Engels geënt waren, focust GLM zich op een universele, tweetalige aanpak (Chinees en Engels). Het model is speciaal ontworpen om de bijzonderheden van het Chinese schrift en taalgebruik te doorgronden. Dit is een onmiskenbare troef, gezien standaard LLM’s moeite hebben met het ontcijferen van woordgrenzen en context in de Chinese taal.
GLM kijkt met twee blikken naar tekst: voorwaarts en achterwaarts. Hierdoor begrijpt het de context veel beter. Dat is nodig want Chinees vereist meer semantisch inzicht dan Engels.
Wat maakt GLM 4.5 zo uniek?
GLM 4.5, beschikbaar via Z.ai, is geen ‘one trick pony’. Het model probeert niet enkel de beste te zijn in code schrijven:
- 355 miljard parameters (32 miljard actief) voor de standaard GLM-4.5, 106 miljard (12 miljard actief) voor de Air-variant. Dat is vergelijkbaar met de grootste LLM’s op de markt.
- MoE-architectuur (Mixture of Experts): In plaats van een breed model, kiest GLM 4.5 voor een diepere opbouw met minder parallelle experts, maar meer lagen. Dit zorgt voor sterkere denkkracht en stabielere prestaties op lange taken.
- Dubbelfunctie: “Thinking mode” schakelt diep redeneervermogen en toolgebruik in, “non-thinking mode” zorgt voor snelle, directe antwoorden. Zo combineert GLM 4.5 het beste van twee werelden.
Bij benchmarks op agentic taken, redeneren en programmeren scoort GLM 4.5 consequent top 3 wereldwijd.
Beoordeling op Chinese benchmarks
In de SuperCLUE-ranglijst van november 2024 — de gouden standaard voor het meten van intelligentie op Chinese taken — staat Zhipu’s GLM als hoogste Chinese model genoteerd, met alleen OpenAI en Anthropic ervoor. Dat toont aan dat het niet louter een nationaal project is, maar een serieuze internationale uitdager.
GLM 4.5 blinkt uit bij:
- Agent taken (TAU-bench, BFCL-v3, BrowseComp): Door diepe integratie van tool-usage en native function calls haalt het model hoge scores. Zo verslaat het onder andere Claude-4-Opus op web browsing en behaalt het een tool-gebruikssucces van liefst 90,6% — beter dan eender welk Chinees LLM, en zelfs beter dan grote namen zoals Kimi-K2 of Qwen3.
- Redeneer-benchmarks (MMLU, GPQA, BBH…): De diepte van het model, in combinatie met geoptimaliseerde attentionmechanismen, geeft het een streepje voor bij logische taken en lange redeneringen.
- Coding (SWE-bench, Terminal-Bench): Full-stack webapps bouwen, databases ontwerpen, frontend en backend uitwerken of zelfs mini-games maken, GLM 4.5 kan het allemaal. Verificatiebenchmarks bevestigen dat het model boven Qwen3 en DeepSeek staat.
Architectuur en training
De structuur van GLM 4.5 steekt ingenieus in elkaar:
- Dieper in plaats van breder: Waar concurrenten als DeepSeek-V3 en Kimi-K2 de breedte opzoeken (meer experts tegelijk), kiest GLM 4.5 voor meer lagen. Dat maakt het model compacter, maar met een sterkere denkkracht. Dit is een bewuste keuze die voor extra stabiliteit zorgt voor lange en complexe interacties.
- Geavanceerde attention: Grouped query attention, partial RoPE (rotary positional encoding), en 2,5 keer meer attention (96) heads dan vergelijkbare modellen zorgen voor uitzonderlijk prestatieniveau bij redeneren.
- Optimisatie en speculatief decoderen: Gebruik van de Muon optimizer en een Multi-Token Prediction (MTP) laag bieden snellere batchverwerking en efficiënte inference.
- Tweeledige pre-training: Eerst een universele dataset van 15 biljoen tokens, daarna 7 biljoen tokens gefocust op redeneren en code. Daarna extra post-training met domeinspecifieke instructiedata.
Post-training & praktische agentic bekwaamheid
Reinforcement Learning (RL) is onmisbaar voor hedendaagse LLM’s maar vaak traag en inefficiënt op schaal. Dankzij slime heeft Zhipu het trainingsproces flexibel en schaalbaar gemaakt. Ze zetten RL gericht in op reasoning en agentic taken: van het oplossen van complexe mathematische vraagstukken over het bouwen van agenten die zelfstandig zoeken, tools combineren, of code evalueren.
Het RL-curriculum is opgebouwd uit een fase voor reasoning en gespecialiseerde fases voor QA en software engineering. Door extra ‘expert distillation’ worden de geleerde skills gebundeld, zodat het model breed inzetbaar blijft.
Toepassingen: van chat tot volwaardige agent
GLM 4.5 schittert niet alleen op papier, maar vooral in de praktijk:
- ChatGLM: Conversational AI, klaar voor integratie in klantendienst, kennismanagement en educatieve omgevingen, met tweetaligheid als troef.
- AutoGLM: Smartphone-assistent die afspraken vastlegt, bestellingen plaatst en agendabeheer slim automatiseert via natuurlijke taal.
- Ying: Tekst-naar-video-tool die van een eenvoudige prompt een videofragment maakt.
- Agentic coding: Creëer volledige webapps of werk bestaande code bij.
- Slides & posters: Dankzij slimme integratie met web search, HTML en design zorgt GLM 4.5 voor verzorgde presentaties met actuele info en aantrekkelijke visuals.
Op het Z.ai-platform komen deze functionaliteiten samen: één AI-hub waar je als gebruiker rechtstreeks kunt interageren met verschillende typen agenten, presentatietools en codegeneratie.
Open source, API’s en lokale inzet
Zhipu AI vindt een slimme balans tussen openheid en bescherming van intellectueel eigendom:
- Bepaalde modellen (zoals GLM-4-9B en GLM-4V-9B, maar voortaan ook GLM 4.5) zijn open-source – gewichten en code kunnen worden gebruikt via HuggingFace of ModelScope.
- API’s op Z.ai zijn OpenAI-compatibel en makkelijk te integreren met bestaande toepassingen.
- Hardware partnerships met Huawei en Qualcomm versnellen mobiele en edge-AI-implementatie (denk aan AI in smartphones of in voertuigen, met behoud van data binnen de landsgrenzen om te voldoen aan Chinese regelgeving).
Deze aanpak trekt nu ook buitenlandse investeerders aan; steeds meer internationale partijen zoeken immers een alternatief voor het Silicon Valley-monopolie. Zhipu AI slaat een brug tussen Chinese innovatie en wereldwijde open source-community’s.
Prijsstrategie
De concurrentie in de Chinese LLM-markt wordt met de dag feller. Om marktaandeel te veroveren, kiest Zhipu AI voor scherpe prijzen, mede dankzij efficiëntere technologie. De GLM 4-serie werd in juni 2024 liefst twee keer goedkoper gemaakt. Dit is niet enkel competitiedrang, maar vooral het resultaat van doorgedreven innovatie. Het model werkt al met 8 GPU’s.
De toekomst van Z.ai en GLM 4.5
Met de lancering van GLM 4.5 doet Z.ai méér dan een update aankondigen. Het is een krachtig statement dat Chinese LLM’s niet enkel concurreren, maar ook innoveren en leiden. Met een stevige academische basis, hypermoderne technologie, uitgebalanceerde open source-strategie en aandacht voor de noden van vandaag (presentaties, coding, agentic workflows) positioneert Zhipu AI zich resoluut in de mondiale AI-top.