Amazon Bedrock AgentCore passe à l’offensive : l’IA agentique d’entreprise devient une plateforme

Amazon transforme AgentCore en usine à agents IA

Amazon Web Services vient de donner un signal clair au marché : l’IA agentique n’est plus seulement un terrain d’expérimentation, mais une couche d’infrastructure que les entreprises devront industrialiser. Le 21 mai 2026, AWS a publié une salve de guides techniques autour d’Amazon Bedrock AgentCore, couvrant trois axes très concrets : contourner les limites de fenêtre de contexte avec des modèles récursifs, déployer des agents de business intelligence en production, et automatiser des processus métier comme le recrutement ou la modification de tableaux de bord par langage naturel.

Il faut replacer cette offensive dans son calendrier. AgentCore avait été présenté par AWS en avant-première en juillet 2025, puis déclaré généralement disponible le 13 octobre 2025. Depuis, le service s’est enrichi de composants d’identité, de mémoire, d’observabilité, de passerelles d’outils, d’un interpréteur de code, d’un navigateur managé et de contrôles de politique. Selon la documentation AWS, la disponibilité générale couvrait initialement neuf régions, avec une expansion progressive en 2026.

La nouveauté n’est donc pas un simple lancement isolé. C’est plutôt une maturation accélérée : AWS veut démontrer que Bedrock AgentCore peut héberger des agents en conditions réelles, avec isolation de session, mémoire persistante, accès gouverné aux outils, traces d’exécution et intégration à plusieurs modèles ou frameworks.

La fenêtre de contexte n’est plus le seul horizon

Le guide le plus intéressant publié par AWS porte sur les Recursive Language Models, ou RLM. L’idée est simple à formuler, mais lourde de conséquences : au lieu de tenter de faire entrer un corpus gigantesque dans la fenêtre de contexte d’un modèle, on traite ce corpus comme un environnement externe que l’agent explore par code.

Dans l’architecture décrite par AWS, un agent racine construit avec le SDK Strands pilote un environnement Python sandboxé dans Amazon Bedrock AgentCore Code Interpreter. Le document complet est chargé comme variable dans cet environnement, puis l’agent écrit du code pour chercher, découper, comparer et déléguer des sous-tâches à des appels de sous-modèles. Les résultats intermédiaires restent dans la mémoire de travail de l’interpréteur, plutôt que de saturer la fenêtre de contexte du modèle principal.

Ce mécanisme s’appuie sur un article de recherche publié sur arXiv par Alex L. Zhang, Tim Kraska et Omar Khattab. Les auteurs y présentent les RLM comme une stratégie d’inférence permettant de traiter des entrées jusqu’à deux ordres de grandeur au-delà des fenêtres de contexte classiques. Il faut toutefois rester prudent : il s’agit d’un article scientifique récent, non d’une validation industrielle universelle. AWS l’utilise ici comme brique méthodologique dans son propre environnement cloud.

Le message commercial est limpide : AWS ne veut pas seulement vendre des modèles avec de plus grandes fenêtres de contexte. Il veut vendre une architecture où le contexte devient un système d’exploitation externe, persistant et observable. Pour les secteurs comme la finance, le juridique, la conformité ou l’analyse documentaire, c’est potentiellement plus important que l’ajout de quelques centaines de milliers de jetons à une fenêtre de prompt.

OPLOG : un cas d’usage BI très orienté production

Le deuxième guide publié par AWS met en scène OPLOG, une entreprise de logistique et d’exécution de commandes opérant notamment en Turquie, au Royaume-Uni et en Allemagne. Selon AWS, OPLOG a construit trois agents de business intelligence avec le SDK Strands, les a déployés sur Amazon Bedrock AgentCore, puis les a intégrés à Anthropic Claude Sonnet et à Amazon Bedrock Knowledge Bases pour du RAG.

Les chiffres avancés par AWS sont spectaculaires : réduction de 35 % des cycles de vente, amélioration de 91 % de la complétude des données CRM et réduction de 98 % du temps de recherche manuel. Ces chiffres doivent être lus pour ce qu’ils sont : des résultats communiqués dans un billet de fournisseur cloud et non une étude indépendante auditée. Mais ils montrent le type de récit que veut imposer AWS : l’agent IA n’est pas un chatbot, c’est une chaîne d’automatisation capable de relier CRM, entrepôts de données, communications internes et moteurs de recherche documentaire.

L’enjeu est particulièrement fort pour la BI. Les tableaux de bord traditionnels répondent bien aux questions déjà modélisées. Les agents, eux, promettent de surveiller les données, détecter les anomalies, enrichir le CRM, rechercher des prospects et préparer des synthèses sans attendre qu’un analyste assemble manuellement les rapports. Cette promesse est séduisante, mais elle déplace aussi le risque : erreurs d’interprétation, mauvais accès aux systèmes internes, hallucinations sur des données opérationnelles ou actions déclenchées avec trop d’autonomie.

RH, dashboards et langage naturel : AWS vise les métiers

AWS ne limite pas AgentCore aux développeurs. Le billet sur l’assistant de recrutement décrit une architecture de référence avec Amazon Bedrock, Amazon Nova Pro, Lambda, API Gateway, DynamoDB, S3, Cognito et Bedrock Guardrails. L’objectif est d’analyser des CV, produire des scores de compatibilité, générer des questions d’entrevue et assister les recruteurs. AWS précise que cette architecture est destinée à l’apprentissage et n’est pas une solution prête pour la production, une nuance importante dans un domaine aussi sensible que l’emploi.

Dans les ressources humaines, l’IA peut réduire la charge administrative, mais elle expose aussi les organisations à des risques de biais, de discrimination indirecte et d’explicabilité insuffisante. Le fait qu’AWS mette en avant l’anonymisation des données personnelles, la détection d’attaques par prompt et les filtres liés aux biais montre que le fournisseur sait que l’automatisation RH ne peut pas être présentée comme une simple optimisation technique.

Le guide sur l’automatisation de dashboards pousse la logique encore plus loin. AWS y décrit une architecture multi-agents où un agent trouve les tableaux de bord et les métadonnées, un autre modifie les visualisations, et un orchestrateur interprète les demandes en langage naturel. Une requête comme « ajoute le nom de famille au tableau de bord de test » peut être classée, validée, exécutée et historisée. L’intégration avec Amazon Quick Sight, Amazon Nova, AgentCore Memory et AgentCore Observability illustre la stratégie d’AWS : transformer les interfaces métier en surfaces conversationnelles contrôlées.

Strands, l’arme discrète d’AWS

Le SDK Strands est central dans cette offensive. Présenté par AWS comme un SDK open source pour construire des agents en quelques lignes de code, Strands adopte une approche dite model-driven : le modèle choisit ses étapes, appelle des outils et gère une partie du raisonnement, tandis que le développeur définit surtout le prompt, les outils et les contraintes.

Cette orientation rapproche AWS des frameworks comme LangGraph, CrewAI ou LlamaIndex, mais avec un avantage évident : Strands est pensé pour se brancher naturellement à Bedrock, AgentCore, OpenTelemetry et aux services AWS. L’ouverture est réelle sur le papier, puisque Strands peut fonctionner avec plusieurs fournisseurs de modèles. Mais le biais stratégique est tout aussi clair : plus une entreprise adopte Strands, AgentCore Memory, AgentCore Gateway et AgentCore Observability, plus elle ancre ses workflows agentiques dans l’écosystème AWS.

La bataille avec Microsoft, NVIDIA et Dell

La poussée d’Amazon intervient dans un marché déjà très disputé. Microsoft positionne Foundry Agent Service comme une plateforme managée pour construire, déployer et superviser des agents, avec identité Microsoft Entra, RBAC, observabilité, outils intégrés, MCP et publication vers Teams ou Microsoft 365 Copilot. C’est une proposition très forte pour les organisations déjà standardisées sur Azure et Microsoft 365.

En face, NVIDIA et Dell poussent une logique différente : rapprocher les agents des données internes, parfois sur site. Dell AI Factory with NVIDIA met en avant des architectures validées, des GPU, NVIDIA AI Enterprise, NIM, NeMo et des blueprints agentiques. NVIDIA, de son côté, a présenté en mars 2026 son Agent Toolkit comme une pile ouverte pour agents d’entreprise, soutenue par plusieurs grands éditeurs logiciels. La promesse est moins « tout managé dans le cloud » que « contrôlez vos agents, vos modèles et vos données dans votre propre infrastructure accélérée ».

Amazon se situe entre les deux mondes. AgentCore reste profondément cloud, mais AWS insiste sur VPC, PrivateLink, IAM, CloudFormation, isolation, politiques et gouvernance. C’est une manière de répondre à l’argument souveraineté et sécurité sans céder le terrain de l’infrastructure managée.

Le vrai test : gouvernance, sécurité et coûts

La prochaine phase ne se jouera pas uniquement sur la qualité des modèles. Elle se jouera sur la capacité à prouver qu’un agent peut agir sans devenir incontrôlable. Les référentiels comme l’OWASP Top 10 for LLM Applications rappellent que les risques de prompt injection, d’agence excessive, de fuite de données et de mauvais usage des outils sont structurels dans les systèmes agentiques.

AWS a compris ce point : AgentCore Policy, Identity, Observability et Evaluations ne sont pas des options cosmétiques. Ce sont les briques qui décideront si les directions TI acceptent de connecter des agents à des CRM, ERP, entrepôts de données et systèmes transactionnels. La mémoire longue, les appels récursifs et les outils autonomes sont puissants, mais ils rendent aussi les erreurs plus persistantes et plus difficiles à diagnostiquer.

À court terme, AgentCore devrait accélérer les prototypes enterprise. À moyen terme, il pourrait devenir pour AWS ce que Kubernetes est devenu pour les applications cloud natives : une couche de standardisation opérationnelle. Mais le marché n’est pas gagné. Microsoft dispose de l’avantage bureautique et collaboratif. NVIDIA et Dell séduisent les entreprises qui veulent garder leurs charges sensibles sur site. AWS mise sur l’intégration, la rapidité de déploiement et la profondeur de Bedrock.

Le signal à retenir est clair : l’agent IA d’entreprise n’est plus vendu comme une démonstration futuriste. Il devient une pile complète, avec runtime, mémoire, identité, politiques, observabilité et cas d’usage métier. Et dans cette bataille, Amazon vient de montrer qu’il veut être non seulement fournisseur de modèles, mais fournisseur du système nerveux des agents IA.