Les origines secrètes d’un modèle ultra-puissant
Lors des phases initiales d’entraînement en laboratoire, les chercheurs ont découvert avec stupeur que l’outil Claude Mythos avait développé de manière totalement autonome des compétences de piratage informatique inédites. Capable de détecter instantanément des vulnérabilités complexes de type zero-day et de concevoir des chaînes d’exploitation logicielle fonctionnelles, le programme affichait un taux de réussite phénoménal de 72,4 % lors des premiers tests internes. Face à un tel potentiel de militarisation numérique, la direction d’Anthropic avait initialement déclaré ce modèle beaucoup trop dangereux pour être rendu public, préférant le conserver sous clé.
Cette découverte a provoqué une panique immédiate au sein des agences gouvernementales à Washington, poussant les autorités américaines à accélérer les discussions sur la réglementation de l’intelligence artificielle. C’est dans ce climat de tension extrême qu’Anthropic a finalement validé la transition vers un déploiement commercial encadré.
Le bouclier défensif du projet Glasswing
Pour minimiser les risques d’une exploitation malveillante, la firme a d’abord partagé l’accès à Claude Mythos en circuit fermé avec un consortium restreint composé de géants de la Tech comme Microsoft, Apple et Google. Dotés d’une enveloppe de 100 millions de dollars en crédits de calcul, ces partenaires de confiance ont exploité la puissance de Claude Mythos pour auditer leurs propres systèmes et analyser des milliers de dépôts de code open-source. Les résultats de cette phase expérimentale se sont révélés stupéfiants, menant à la découverte et au correctif de plus de 23 000 failles de sécurité critiques à travers le monde.
« Un problème général avec les modèles d’IA est qu’ils tirent parfois des conclusions hâtives, affirmant avec assurance avoir progressé dans leurs travaux malgré le peu de preuves », a souligné le créateur de Claude pour expliquer sa quête absolue de fiabilité.
Cette stratégie de divulgation coordonnée a permis de fortifier les fondations d’Internet avant la sortie officielle du logiciel. Les dirigeants estiment qu’il est impossible de dissimuler indéfiniment de telles avancées mathématiques, et que la seule manière de contrer une IA offensive reste l’utilisation préventive d’une IA défensive.

Une doctrine de défense imposée au vieux continent
Cette course contre la montre illustre le glissement inévitable de la Tech vers une doctrine de guerre froide numérique. En précipitant ce lancement pour devancer la concurrence chinoise ou russe, les laboratoires américains imposent de fait leur propre tempo sécuritaire aux entreprises européennes. Pour le tissu industriel et le secteur des médias en France, déjà bousculés par les régulations de l’IA Act, ce choix pose un dilemme crucial. Face à des outils capables d’automatiser aussi bien la parade que l’offensive informatique, la souveraineté ne dépendra plus seulement de la protection des données, mais de notre vitesse d’adoption de ces sentinelles algorithmiques.
Des barrières de confinement pour le grand public
La variante grand public qui sera déployée dans les prochaines semaines ne sera pas le modèle brut utilisé par les équipes de piratage éthique. Anthropic a lourdement modifié Claude Mythos en intégrant des barrières de sécurité déterministes externes, alignées sur les recommandations strictes du NCSC britannique. Le système s’exécutera exclusivement au sein de conteneurs isolés, sans aucun accès direct aux réseaux d’infrastructure vivants, tandis qu’un logiciel de surveillance externe bloquera sur-le-champ la moindre tentative de génération de syntaxe malveillante.
De plus, l’entraînement par IA Constitutionnelle interdit structurellement la production de scripts d’attaque exploitables. L’autonomie décisionnelle de Claude Mythos a également été bridée afin de garantir qu’aucune action complexe ne puisse être menée sans une validation humaine explicite à chaque étape de l’analyse de code.
Modalités d’accès et tarification de l’API
En raison de la charge informatique monumentale requise par cette architecture, l’accès à Claude Mythos sera proposé à un tarif premium de 25 dollars par million de tokens en entrée et 125 dollars par million de tokens en sortie. Le service sera distribué sous la forme d’un point de terminaison sécurisé et restreint via la plateforme Amazon Bedrock.
Cette commercialisation accélérée découle également d’un incident interne majeur : une fuite accidentelle de code source sur un répertoire public et l’apparition brève d’un bouton Claude Mythos sur l’interface utilisateur avaient forcé la main de l’entreprise le mois dernier. En officialisant ce lancement, Anthropic espère garder l’initiative technologique et imposer ses standards de sécurité à l’ensemble du marché.


