AI-modellen domineren CFA-examens: zes topsystemen behalen nu alle drie niveaus met recordresultaten
Een recente studie toont aan dat zes geavanceerde AI-modellen nu succesvol alle drie de niveaus van de Chartered Financial Analyst- (CFA-) examens doorlopen, een van de meest veeleisende professionele kwalificaties in de financiële sector. Google’s Gemini 3.0 Pro behaalde een recordscore van 97,6% op Level I, terwijl GPT-5 uitblinkt op Level II en Gemini 3.0 Pro de hoogste score realiseert op de open-antwoordsectie van Level III. Hoewel deze prestaties de enorme vooruitgang van AI onderstrepen, merken onderzoekers op dat succesvol examen afleggen niet automatisch betekent dat AI klaar is voor alle taken van een financiële analist.
De onderzoekers (verbonden aan de instellingen Columbia University, Rensselaer Polytechnic Institute en de University of North Carolina) toonden aan dat de nieuwste generatie AI-“reasoning models” nu met succes in alle drie niveaus van de CFA-examens slagen, en dit met indrukwekkende scores.
De Chartered Financial Analyst-certificering geldt als een van de zwaarste kwalificaties in de financiële wereld.
Het traject bestaat uit drie niveaus:
Level I test basiskennis via multiple-choicevragen,
Level II meet toepassing en analyse met casusvragen,
Level III combineert meerdere formattypen, inclusief open antwoorden die diepgaande synthese vereisen.
In het onderzoek werden zes vooraanstaande AI-modellen getest op een totaal van 980 CFA-vragen. Dit inclusief mock-examens (gebaseerd op officiële oefenmateriaal en externe datasets) om consistente vergelijkbaarheid te garanderen. Alle zes slaagden volgens de normen voor elk van de drie niveaus.
Topprestaties per model en onderdeel
Gemini 3.0 Pro van Google behaalde een recordscore van 97,6% op Level I, waarmee het de hoogste score ooit voor een AI-model op dit onderdeel neerzette.
GPT-5 leidde de resultaten op Level II met 94,3%, waarmee het uitzonderlijke toepassing- en analysecapaciteiten liet zien.
Op Level III, het moeilijkste niveau, domineerde Gemini 3.0 Pro de open-antwoordsectie met een score van 92,0%, terwijl Gemini 2.5 Pro de hoogste multiple-choice uitkomst had.
Andere modellen die slaagden waren Gemini 2.5 Pro, Grok 4, Claude Opus 4.1 en DeepSeek-V3.1, met alle scores ruim boven de drempels die doorgaans als slaagcriteria voor de CFA-examens worden gehanteerd.
Deze resultaten markeren een snelle evolutie in AI-vaardigheden. Twee jaar geleden faalden eerdere generaties zoals GPT-3.5 nog grotendeels voor de meeste niveaus, en GPT-4 behaalde alleen Level I. De huidige generatie laat daarentegen bijna foutloze prestaties tot stand komen, wat aangeeft dat AI de gecodificeerde kennis en analytische vraagstukken van deze examens inmiddels grotendeels beheerst.
Beperkingen blijven bestaan
Ondanks de indrukwekkende resultaten wijzen de onderzoekers op belangrijke nuances:
Ethiekvragen bleken de modellen nog steeds lastig, met relatief hogere foutpercentages.
Er is een mogelijkheid dat sommige oefenvragen, of varianten ervan, in de trainingsdata zijn gelekt, wat de gemeten prestaties zou kunnen beïnvloeden.
Het succesvol afleggen van een examen is niet gelijk aan het effectief uitvoeren van dagelijkse taken van een financieel analist, zoals klantinteractie, marktinzichten en besluitvorming in onzekere omstandigheden.
Conclusie
De studie plaatst een nieuwe benchmark voor wat AI-systemen momenteel kunnen bereiken in gespecialiseerde, complexe domeinen zoals financieel redeneren en professionele examens. Terwijl deze prestaties de potentie van AI voor ondersteuning binnen de financiële sector aantonen, blijft menselijke expertise onmisbaar voor contextuele oordelen, ethische overwegingen en interpersoonlijke vaardigheden.

