Nvidia onthult Nemotron 3: open AI-modellen voor multi-agent-systemen
Nvidia heeft de Nemotron 3-modelreeks gelanceerd: een nieuwe familie open modellen, bibliotheken en datasets speciaal ontworpen om multi-agent-AI-systemen op te schalen. Met innovatieve architecturen, hoge efficiëntie, transparantie en een contextvenster tot 1 miljoen tokens wil Nvidia ontwikkelaars helpen gespecialiseerde, samenwerkende AI-agenten te bouwen voor complexe workflows.
Een nieuwe stap richting agentgebaseerde AI-ontwikkeling
Nvidia introduceert dus de Nemotron 3-lijn, bestaande uit open modellen, datasets en tools die zijn afgestemd op de groeiende behoefte aan agentic AI. Maar in tegenstelling tot traditionele enkele grote taalmodellen focust Nemotron 3 op multi-agent-workloads, waar verschillende gespecialiseerde modellen (zoals retrievers, planners en tool-executors) gelijktijdig communiceren, plannen en acties uitvoeren. De openheid van de modellen inclusief gewichten, trainingsdata en trainingsrecepten moet transparantie en aanpasbaarheid stimuleren.
Drie modelgroottes voor uiteenlopende toepassingen
De Nemotron 3-familie omvat drie varianten, elk gericht op verschillende eisen qua schaal, prestatie en taakcomplexiteit:
Nemotron 3 Nano: een compacte open modelvariant (~30 miljard parameters) met zeer efficiënte inferentie, bedoeld voor lightweight taken zoals debugging, samenvatting en eenvoudige agent-taken.
Nemotron 3 Super: middelgrote variant (~100 miljard parameters) geoptimaliseerd voor multi-agent-communicatie en schaalbare workflows.
Nemotron 3 Ultra: de grootste uitvoering (~500 miljard parameters) bedoeld voor diepgaande, complexe redeneringstaken en grootschalige agent-ecosystemen.
De Nano-variant is direct beschikbaar, terwijl de Super- en Ultra-modellen later in eerste helft van 2026 worden uitgebracht.
Innovatieve architectuur en lange context
Nemotron 3 introduceert meerdere technologische vernieuwingen:
Hybrid Mamba-Transformer Mixture-of-Experts (MoE): een hybride architectuur die Mamba-lagen voor efficiënte langeafstand-invoer combineert met transformer-lagen voor nauwkeurigheid, plus MoE-routing om rekenkosten te verlagen.
1 miljoen token contextvenster: ondersteunt redenering over extreem lange documenten of workflows zonder contextfragmentatie, cruciaal voor multi-agent-systemen die langdurige taken automatiseren.
Multi-environment reinforcement learning (RL): training over meerdere omgevingen met open RL-bibliotheken zoals NeMo Gym verbetert agentgedrag over meervoudige stappen en real-world workflows.
Open data, tools en ontwikkelaars-ecosysteem
Naast de modellen zelf publiceert Nvidia ook:
Open datasets voor pre-training, post-training en reinforcement learning
Gedetailleerde trainingsrecepten en pipeline-configuraties op GitHub
“Cookbooks” voor snelle integratie met bestaande inferentie-engines en ontwikkeltools.
Deze open aanpak maakt het mogelijk om modellen volledig te inspecteren, aanpassen en opnieuw te trainen voor specifieke domeinen of toepassingen, iets wat grote gesloten modellen vaak beperken.
Strategische betekenis voor AI-landschap
Met Nemotron 3 zet Nvidia zichzelf nadrukkelijk neer als niet alleen hardware-leverancier, maar ook modelmaker voor de volgende generatie AI-systemen. Door open modellen in te zetten voor agent-architecturen, een trend die steeds belangrijker wordt in AI-ontwikkeling, beantwoordt Nvidia zowel de vraag naar transparantie als de noodzaak om multi-agent-workloads efficiënt en schaalbaar te beheren.
Analisten zien in Nemotron 3 een strategische beweging om te concurreren met andere open-model-ecosystemen wereldwijd en tegelijk de afhankelijkheid van externe, gesloten AI-systemen te verminderen.

