Le paysage de l'intelligence artificielle vient de connaître un basculement historique. Si l'année 2025 avait déjà amorcé le déclin d'OpenAI, le mois de février 2026 confirme une nouvelle hiérarchie mondiale où Anthropic s'impose désormais comme le nouveau maître du jeu. Alors que les modèles de la firme dirigée par Sam Altman dominaient sans partage jusqu'en novembre 2024, ils ont entamé une chute vertigineuse à partir de juillet 2025, laissant d'abord le champ libre à Google avant que l'outsider Anthropic ne vienne bousculer l'ordre établi.
| Rang | Modèle d'IA (Février 2026) | Éditeur |
|---|---|---|
| 1 | Claude Opus 4.6 thinking | Anthropic |
| 2 | Claude Opus 4.6 | Anthropic |
| 3 | Gemini 3 Pro | |
| 4 | Grok 4.1 thinking | xAI |
| 5 | Gemini 3 Flash | |
| 6 | Dola Seed 2.0 Pro | Dola |
| 7 | Claude Opus 4.5 thinking | Anthropic |
| 8 | Claude Opus 4.5 | Anthropic |
| 9 | Grok 4.1 | xAI |
| 10 | Gemini 3 Flash thinking |
Un séisme dans la hiérarchie des modèles de langage
Le classement de la LMArena pour ce mois de février 2026 révèle une surprise de taille : l'hégémonie totale d'Anthropic. Les nouveaux modèles Claude Opus 4.6 et leur déclinaison thinking, lancés en début de mois, ont réussi l'exploit de détrôner Gemini 3 Pro. Ces outils se distinguent par une aisance inédite dans les tâches généralistes, qu'il s'agisse de traiter des requêtes particulièrement longues, de respecter des instructions complexes ou de faire preuve d'une créativité littéraire supérieure. Pour le deuxième mois consécutif, OpenAI brille par son absence dans le top 10 mondial, une situation impensable il y a encore deux ans. Parallèlement, le modèle chinois Ernie de Baidu quitte également le haut du tableau, confirmant la domination actuelle des entreprises américaines sur ce segment stratégique.
Spécialisation et performances : qui domine quoi ?
Au-delà du classement général, l'analyse par catégorie permet de nuancer les forces en présence. Dans le domaine de la génération de texte, Claude Opus 4.6 règne sans partage, suivi de près par Gemini 3 Pro. Le secteur du développement web voit également Anthropic écraser la concurrence avec ses versions Opus 4.6 et Opus 4.5, bien qu'OpenAI parvienne à sauver l'honneur en plaçant GPT-5.2 high à la quatrième place. Google conserve toutefois un avantage technologique majeur sur la vision et l'analyse d'images grâce à Gemini 3, talonné par la société californienne Dola et son modèle Seed 2.0. La recherche web reste également la chasse gardée du géant de Mountain View avec Gemini 3 Flash Grounding, tandis qu'OpenAI maintient une courte avance uniquement sur le segment de la génération et de la retouche d'images.
L'arbitrage par le score Elo : le système LMArena
Pour établir cette hiérarchie, la LMArena s'appuie sur une méthodologie rigoureuse basée sur l'évaluation humaine collective. Le principe repose sur des duels anonymes : deux modèles sont confrontés au même prompt sans que l'utilisateur ne connaisse leur identité. Ce dernier vote pour la réponse la plus pertinente, ce qui permet d'ajuster dynamiquement un score Elo pour chaque participant. Ce système de classement, emprunté au monde des échecs, valorise les victoires contre des adversaires prestigieux et sanctionne lourdement les échecs face à des modèles moins bien classés. C'est cette approche impartiale qui permet aujourd'hui de constater avec précision le recul des anciens leaders face à l'agilité des nouveaux entrants comme Anthropic ou Grok.



