Anthropic bereidt ‘Mythos 1’ voor: AI-beveiliging schuift richting offensieve code-audits
Anthropic lijkt zijn meest controversiële AI-model tot nu toe stilaan klaar te maken voor bredere inzet binnen Claude Code en Claude Security. “Mythos”, een model dat tot nu toe achter gesloten deuren draaide vanwege zijn uitzonderlijke cybercapaciteiten, duikt nu op in preview-versies en interne code. Dat wijst op een belangrijke verschuiving: AI-agents die niet alleen software schrijven, maar ook zelfstandig kwetsbaarheden opsporen, exploits bouwen en systemen beveiligen.
Een model dat jarenlang verborgen bleef
Anthropic staat op het punt een nieuwe fase in AI-ontwikkeling te openen. Volgens recente lekken en interne verwijzingen werkt het bedrijf aan een publieke introductie van “Mythos 1”, een extreem geavanceerd model dat tot nu toe exclusief werd gebruikt voor defensieve cybersecurityprojecten. Het model verscheen kortstondig als `claude-mythos-1-preview` in interne builds van Claude Code en Claude Security, waarna de verwijzingen opnieuw verdwenen. Toch lijkt de richting duidelijk: Mythos komt dichter bij een bredere release.
Dat is opvallend, want Anthropic hield het model maandenlang bewust afgeschermd. Het bedrijf omschreef Mythos eerder als te krachtig en potentieel te risicovol voor publieke toegang. In plaats daarvan werd het model ingezet binnen Project Glasswing, een gecontroleerd programma waarin onder meer AWS, Google, Apple en Microsoft Mythos gebruiken om kwetsbaarheden in software en cloudinfrastructuur op te sporen.
Mythos zoekt actief naar kwetsbaarheden
Volgens Anthropic kan Mythos zelfstandig zero-day kwetsbaarheden vinden in grote besturingssystemen en browsers. In sommige gevallen zou het model zelfs automatisch werkende exploits hebben gebouwd zonder menselijke tussenkomst. Onderzoekers meldden onder meer dat Mythos bugs ontdekte die jarenlang onopgemerkt bleven in OpenBSD, Firefox en andere kritieke software.
De recente signalen wijzen erop dat Anthropic deze technologie nu dichter bij ontwikkelaars wil brengen. Interne code verwijst expliciet naar toegang tot Mythos binnen Claude Code en Claude Security, terwijl ook gewerkt wordt aan een nieuwe beveiligingsdashboard voor Enterprise-klanten. Dat dashboard zou kwetsbaarheden visualiseren, historische analyses tonen en geavanceerde triagefunctionaliteit bevatten.
Van coding assistant naar beveiligingsagent
De stap is belangrijk omdat AI-codingtools vandaag nog vooral worden gezien als productiviteitshulpmiddelen. Ze schrijven code sneller, automatiseren repetitieve taken en genereren documentatie. Maar Mythos suggereert een volgende evolutie: AI-systemen die actief meedenken over veiligheid, kwetsbaarheden detecteren vóór productie en automatisch beveiligingslagen voorstellen of implementeren.
Voor bedrijven is dat potentieel een enorme verschuiving. Eén van de grootste bezwaren tegen AI-automatisering blijft immers de vrees dat AI nieuwe beveiligingsrisico’s introduceert. Zeker wanneer AI-agents toegang krijgen tot productieomgevingen of bedrijfsprocessen, ontstaat de vraag wie verantwoordelijk is wanneer iets fout loopt. Een model zoals Mythos draait die discussie mogelijk om: AI wordt dan niet langer gezien als een risico, maar als een actieve verdediging tegen kwetsbaarheden.
De AI-wapenwedloop versnelt verder
Tegelijk groeit ook de bezorgdheid rond de snelheid waarmee deze modellen evolueren. Anthropic lanceerde Claude Opus 4.7 nog maar recent, terwijl geruchten nu al spreken over partner-tests voor Opus 4.8. De ontwikkelingscyclus van frontier-modellen versnelt zichtbaar, en bedrijven die AI integreren krijgen steeds minder tijd om zich aan te passen aan nieuwe mogelijkheden.
Toch blijft voorzichtigheid nodig. Verschillende onderzoekers waarschuwen dat systemen zoals Mythos niet alleen defensief inzetbaar zijn. Dezelfde technologie die kwetsbaarheden kan patchen, kan ze ook misbruiken. Daarom blijft toegang voorlopig sterk beperkt en focust Anthropic nadrukkelijk op gecontroleerde samenwerkingen en verantwoord disclosurebeleid.

