Amazon retire son classement IA : quand le culte de l’adoption tourne au gaspillage

Un classement supprimé, un aveu plus large

Selon le Financial Times, Amazon a supprimé un classement interne qui suivait l’usage des outils d’intelligence artificielle par ses employés, après avoir constaté que certains cherchaient surtout à améliorer leur score plutôt qu’à produire un travail réellement utile. Le média rapporte que Dave Treadwell, haut dirigeant d’Amazon, a dit aux employés de ne pas utiliser l’IA simplement pour utiliser l’IA, dans un contexte où la consommation de calcul et de jetons devient coûteuse.

Amazon n’a pas publié, à ce stade, de communiqué public détaillant la fermeture de ce leaderboard. La prudence est donc nécessaire : l’information opérationnelle vient principalement du Financial Times, reprise ensuite par des médias spécialisés comme Tom’s Hardware et TechRadar. En revanche, le contexte général est mieux établi. The Information avait déjà rapporté qu’Amazon suivait l’usage des outils IA au moyen d’un système interne appelé Clarity. Et Amazon elle-même, par la voix d’Andy Jassy, pousse publiquement ses salariés à expérimenter avec l’IA et à devenir plus familiers avec ces outils.

Ce qui rend l’épisode intéressant n’est pas seulement l’existence d’un tableau de classement. C’est le retournement implicite : une entreprise qui martèle depuis des mois que l’IA doit transformer tous les métiers reconnaît que mesurer l’usage brut peut produire exactement l’inverse de l’objectif recherché.

La mécanique du mauvais indicateur

L’affaire illustre une vieille règle du management et de l’économie : lorsqu’un indicateur devient une cible, il cesse souvent d’être un bon indicateur. Dans le cas d’Amazon, l’indicateur semble avoir été l’usage mesurable de l’IA : fréquence, volume de jetons, adoption hebdomadaire ou visibilité par équipe. Or un volume de jetons consommés ne dit pas si un document est meilleur, si un déploiement logiciel est plus sûr, si un client est mieux servi ou si une décision a été prise plus rapidement.

Le Financial Times décrit un phénomène que certains employés et observateurs appellent le 'tokenmaxxing' : multiplier les requêtes ou automatiser des tâches de faible valeur pour apparaître comme un grand utilisateur d’IA. Dans un environnement de travail compétitif comme Amazon, où les mécanismes de performance sont historiquement très structurés, un simple signal d’usage peut rapidement être interprété comme un signal de conformité culturelle. Même si l’entreprise affirme que ces statistiques ne sont pas censées déterminer les évaluations individuelles, le fait que des gestionnaires puissent les voir suffit à créer une pression.

C’est là que le problème dépasse Amazon. Depuis 2023, beaucoup d’organisations veulent prouver à leurs investisseurs, conseils d’administration et employés qu’elles ne ratent pas le virage de l’IA générative. Le moyen le plus simple est de montrer une courbe d’adoption : combien d’employés utilisent l’outil, combien de requêtes sont envoyées, combien de projets pilotes sont lancés. Le moyen le plus difficile est de démontrer une valeur nette : temps économisé, erreurs réduites, revenus supplémentaires, coûts évités, satisfaction accrue.

Amazon pousse l’IA, mais veut maintenant la discipliner

Le paradoxe est frappant parce qu’Amazon est l’un des plus grands bénéficiaires de la ruée vers l’IA. Dans sa lettre 2025 aux actionnaires, Andy Jassy décrit l’IA comme un multiplicateur qui doit transformer les expériences clients et les méthodes de travail. Il indique aussi que les investissements en capital liés à l’IA ont contribué à la forte baisse du flux de trésorerie disponible en 2025, un rappel que cette révolution n’est pas gratuite.

Dans un message interne rendu public par Amazon en juin 2025, Jassy affirme que l’entreprise compte plus de 1 000 services et applications d’IA générative en cours ou déjà construits. Il encourage les employés à se former, expérimenter et utiliser l’IA lorsque possible. Il ajoute toutefois que l’adoption extensive de l’IA devrait réduire les effectifs corporatifs dans les années suivantes, à mesure que certains gains d’efficacité se concrétisent.

La suppression du leaderboard s’inscrit donc dans une tension centrale : Amazon veut accélérer l’usage de l’IA, mais elle ne peut pas se permettre que l’usage devienne une fin en soi. Chaque requête inutile consomme du calcul, des crédits internes, du temps de supervision et parfois de l’attention managériale. À grande échelle, le théâtre de l’adoption devient une ligne de coûts.

Les blogues AWS montrent l’autre visage du récit

Les sources primaires d’AWS publiées récemment montrent ce qu’Amazon veut mettre de l’avant : des cas d’usage précis, techniques, optimisés. Dans un billet sur SageMaker AI, AWS explique comment Azercell a entraîné des modèles en azéri avec un débit d’entraînement annoncé 23 % plus élevé et une consommation de mémoire GPU de pointe réduite de 58 %. Dans un autre billet, AWS décrit un portail personnalisé intégrant SageMaker AI MLflow Apps pour faciliter le suivi d’expériences de machine learning. Un troisième billet présente l’automatisation du triage d’alertes anti-blanchiment avec Amazon Quick et Snowflake Cortex AI, avec des tests internes réduisant une enquête de 30 à 90 minutes à moins de 5 minutes.

Ces sources sont utiles, mais elles doivent être lues pour ce qu’elles sont : des contenus d’entreprise, conçus pour promouvoir AWS et ses services. Elles ne constituent pas une validation indépendante. Elles montrent néanmoins la différence entre une adoption défendable et une adoption artificielle. Dans les exemples AWS, l’IA est reliée à un processus, une architecture, une métrique d’efficacité et un cas métier. Dans le leaderboard interne dénoncé par le Financial Times, le risque était inverse : partir de la métrique d’usage, puis chercher après coup une justification.

Un problème déjà visible dans les études sur l’IA au travail

Les recherches disponibles invitent à nuancer le discours triomphal. Le NBER a documenté des gains réels dans un centre de soutien client : une assistance générative a augmenté la productivité moyenne d’environ 14 %, surtout chez les employés moins expérimentés. Mais d’autres travaux du NBER sur le marché danois montrent des effets encore faibles sur les heures travaillées et les revenus, malgré une adoption visible.

McKinsey, dans son état mondial de l’IA 2025, constate une diffusion très large de l’IA dans les organisations, mais aussi des difficultés persistantes à passer des pilotes à un impact économique mesurable. Gartner avait de son côté prédit qu’au moins 30 % des projets d’IA générative seraient abandonnés après preuve de concept d’ici la fin de 2025, en raison de coûts croissants, de données médiocres, de contrôles insuffisants ou d’une valeur d’affaires floue.

Le phénomène du 'workslop', documenté par BetterUp Labs avec le Stanford Social Media Lab et popularisé par Harvard Business Review, ajoute une autre couche : l’IA peut produire du travail qui a l’air professionnel, mais qui transfère en réalité la charge de correction aux collègues. Autrement dit, l’IA peut augmenter l’activité visible tout en dégradant la productivité collective.

Ce que l’épisode annonce pour les entreprises

La prochaine phase de l’IA en entreprise ne devrait pas être celle des classements d’usage, mais celle de la gouvernance de la valeur. Les bons indicateurs ne compteront pas seulement les requêtes, mais le coût par tâche réussie, le taux de révision humaine, le temps réellement économisé, la qualité du résultat, les incidents évités et l’impact sur les clients.

Pour les directions, la leçon est simple : si l’on récompense l’usage, on obtient de l’usage. Si l’on récompense les résultats, l’IA devient un outil parmi d’autres pour atteindre ces résultats. Amazon semble avoir compris, peut-être plus vite que d’autres, qu’un tableau de classement peut transformer un programme d’innovation en concours de consommation.

Ce geste ne signifie pas qu’Amazon ralentit sa stratégie IA. Au contraire, l’entreprise continue de vendre, construire et intégrer l’IA à grande échelle. Mais il marque un ajustement important : l’adoption forcée a ses limites, surtout lorsque les coûts d’inférence, d’infrastructure et de supervision deviennent visibles. Dans un secteur encore dominé par les démonstrations spectaculaires et les promesses de productivité, la phrase attribuée à Dave Treadwell sonne comme un rare moment de pragmatisme : l’IA n’a de valeur que lorsqu’elle sert le travail, pas lorsqu’elle sert à prouver qu’on l’utilise.