Qu'est-ce qui change ?
Anthropic lance Claude Opus 4.6 avec une fonctionnalité inédite pour les équipes techniques : Agent Teams. Plusieurs agents autonomes travaillent en parallèle, coordonnés par un agent "lead", comme une équipe DevOps qui se répartit les tâches.
- Agent Teams : Architecture multi-agents (dans Claude Code). Un lead délègue à des agents spécialisés qui travaillent en parallèle
- 1M tokens context : Mode beta (vs 200K standard). Permet de passer un monorepo entier ou 50+ fichiers de config
- 128K output tokens : Double du précédent (64K). Génération d'IaC complète en une passe sans "truncation"
- Adaptive Thinking : Le modèle décide lui-même quand activer le raisonnement étendu (
budget_tokensest déprécié sur Opus 4.6) - Compaction API (beta) : Résumé automatique du contexte côté serveur = conversations quasi-infinies
Sur les benchmarks publiés par Anthropic, Opus 4.6 affiche des résultats dominants. GPT-5.2 est distancé de +144 Elo sur GDPval-AA (knowledge work) et prend la première place sur Terminal-Bench 2.0 (agentic coding). Sur BrowseComp (retrieval hard-to-find), il atteint N°1 industrie.
| capacité | opus 4.5 | opus 4.6 | amélioration |
|---|---|---|---|
| Context window | 200K standard | 200K (1M beta) | +400% en beta |
| Output max | 64K tokens | 128K tokens | x2 |
| Agent Teams | Non | Oui (Claude Code) | Nouveau |
| Compaction API | Non | Beta | Nouveau |
| MRCR v2 (1M needle)* | 18.5% (Sonnet 4.5) | 76% | x4 |
* Comparaison avec Sonnet 4.5 (pas de donnée Opus 4.5 publiée pour ce benchmark)
Quel impact pour les équipes DevOps et Platform Engineering ?
Agent Teams transforme ce que vous pouvez automatiser en AIOps. Imaginez ce workflow pour votre prochaine migration Kubernetes :
- Agent 1 (Infrastructure) : Génère les manifests Terraform pour le nouveau cluster EKS
- Agent 2 (Configuration) : Adapte les Helm charts et ConfigMaps pour le nouveau contexte
- Agent 3 (Migration) : Rédige le runbook de migration avec les scripts de validation
- Lead Agent : Coordonne les trois agents, gère les dépendances (l'agent 2 attend que l'agent 1 ait terminé), et compile le tout en une stratégie cohérente
Le 128K output élimine les problèmes de "truncation" pour la génération d'Infrastructure as Code. Vous pouvez maintenant demander la génération complète d'une stack AWS (VPC, subnets, security groups, ECS, RDS, monitoring) en une seule requête sans risque de "truncation". Plus besoin de re-générer par morceaux.
La Compaction API résout le problème des sessions de debugging longues. Vous travaillez sur un incident complexe pendant 2 heures, accumulant des logs, des traces, et des hypothèses. L'API résume automatiquement le contexte pour garder toute l'histoire sans exploser le token budget.
Notre analyse
Bien que les Agent Teams soient actuellement limités à Claude Code (pas encore dans l'API standard), c'est un aperçu concret de ce qui arrive en orchestration DevOps assistée par IA. Le pattern multi-agents est conceptuellement reproductible avec l'API classique : vous pouvez créer votre propre orchestrateur qui spawn plusieurs threads Claude avec des rôles distincts.
Selon nous, le vrai différenciateur à long terme sera la Compaction API. C'est une solution côté serveur qui permet de maintenir des conversations techniques quasi-infinies sans devoir manuellement purger le contexte. Pour les équipes qui font du pair-programming avec l'IA sur des systèmes complexes, c'est ce qui différencie vraiment Opus 4.6.
Attention : OpenAI a répondu le même jour avec GPT-5.3-Codex. La guerre des modèles agentiques est lancée, et les équipes techniques sont les grands gagnants. Les prix standard restent identiques ($5/$25 per million tokens input/output), bien que le contexte étendu à 1M tokens soit facturé à un tarif premium.