Quand l’IA agentique perce l’anonymat : le nouveau risque privacy des textes « anonymisés »

Un signal d’alerte venu d’arXiv

Un préprint publié sur arXiv le 29 mai 2026 remet en cause une hypothèse centrale de l’anonymisation textuelle : l’idée qu’effacer les noms, les adresses et quelques identifiants directs suffit à rendre un récit exploitable sans risque majeur. L’article, signé par Ziwen Li, Jianing Wen et Tianshi Li, s’intitule « LLM Anonymization Against Agentic Re-Identificatio ». Sa thèse est simple, mais lourde de conséquences : les grands modèles de langage agentiques, lorsqu’ils disposent d’un accès à la recherche web, transforment des indices faibles en pistes vérifiables de ré-identification.

Il faut insister d’emblée sur la nature de la source : il s’agit d’un préprint arXiv, donc d’un résultat scientifique public, mais non encore validé par les pairs. Les auteurs proposent aussi leur propre méthode de défense, AURA, ce qui introduit un biais classique de publication : l’évaluation sert à démontrer l’intérêt d’un cadre conçu par les mêmes chercheurs. Cela n’invalide pas les résultats, mais impose de les lire comme un signal de recherche, pas comme une norme établie.

Le cœur du problème : les détails utiles sont aussi les détails dangereux

L’anonymisation de textes est plus complexe que celle de tableaux structurés. Dans un jeu de données tabulaire, on peut généraliser une date de naissance, supprimer un code postal ou agrandir une catégorie d’âge. Dans un entretien, un témoignage médical ou une note journalistique, les informations sensibles sont souvent disséminées dans le style, la chronologie, les anecdotes et les relations sociales.

Un texte peut ne contenir aucun nom propre et rester très identifiant. Une personne peut évoquer « une petite clinique francophone en région minière », « un accident survenu l’hiver où l’école locale a fermé », « un passage dans une association rare » ou « un métier exercé dans une niche très visible ». Pris isolément, ces fragments semblent faibles. Croisés avec des moteurs de recherche, des archives de presse, LinkedIn, des pages institutionnelles ou des publications locales, ils deviennent des quasi-identifiants.

C’est précisément ce que change le LLM agentique. Là où un humain devait formuler manuellement des requêtes, trier les résultats, noter les contradictions et reformuler ses hypothèses, un agent peut découper la tâche : extraire les indices, lancer des recherches, comparer plusieurs candidats, estimer la plausibilité et produire une conclusion argumentée. La barrière opérationnelle baisse fortement.

AURA : masquer, reconstruire, tester

Face à ce nouveau modèle de menace, le préprint introduit AURA, pour « Anonymization with Utility-Retention Adaptation ». L’idée n’est pas seulement de caviarder les mots sensibles, mais de séparer deux opérations : localiser les éléments qui exposent la personne, puis reconstruire un texte qui conserve l’utilité analytique sans garder les mêmes points d’accroche.

Cette distinction est importante. Dans la recherche qualitative, la santé, les sciences sociales ou le journalisme, supprimer tous les détails contextuels revient souvent à détruire la valeur du document. Un entretien anonymisé mais vidé de ses circonstances ne permet plus d’étudier les trajectoires, les discriminations, les obstacles administratifs ou les dynamiques locales. L’enjeu n’est donc pas « confidentialité contre utilité », mais arbitrage mesuré entre deux exigences contradictoires.

AURA tente de sélectionner des versions candidates d’un texte en les soumettant à deux formes de contrôle : une vérification de résistance à la ré-identification par agents de recherche web, et une évaluation de la conservation de l’utilité contextuelle. C’est une évolution notable par rapport à des approches qui testent surtout l’absence d’identifiants explicites ou la capacité d’un modèle sans web à inférer des attributs privés.

Un historique d’échecs annoncés

Le risque de ré-identification n’est pas nouveau. Les travaux d’Arvind Narayanan et Vitaly Shmatikov sur la désanonymisation de grands ensembles de données, notamment dans le contexte du Netflix Prize, ont montré dès les années 2000 que des données apparemment anonymes pouvaient redevenir personnelles lorsqu’elles étaient croisées avec des sources externes. Plus récemment, des recherches sur les profils pseudonymes en ligne ont montré que les LLM peuvent extraire des indices de localisation, de profession ou d’intérêts à partir de fragments de conversation.

Ce qui change aujourd’hui n’est pas seulement la puissance statistique des modèles. C’est leur capacité à agir dans un environnement informationnel ouvert. Selon un autre préprint arXiv, « Large-scale online deanonymization with LLMs », des agents dotés d’un accès Internet peuvent ré-identifier des utilisateurs pseudonymes ou des participants à des entretiens avec une efficacité qui se rapproche de celle d’un enquêteur humain, mais à une échelle et à un coût beaucoup plus faibles. Un autre travail, « Agentic LLMs as Powerful Deanonymizers », insiste sur le fait que ces attaques peuvent être menées avec des outils ordinaires et des consignes en langage naturel.

Autrement dit, la « sécurité par obscurité pratique » s’effrite. Ce qui était théoriquement possible mais coûteux devient reproductible, automatisable et potentiellement industrialisable.

RGPD : le test des « moyens raisonnablement susceptibles » se durcit

Le RGPD n’exige pas une impossibilité métaphysique de ré-identification. Son considérant 26 demande d’évaluer les moyens raisonnablement susceptibles d’être utilisés, en tenant compte des coûts, du temps nécessaire, de la technologie disponible et de son évolution. Cette formulation devient centrale à l’ère des agents IA.

Si un LLM relié au web réduit le coût et le temps de ré-identification, alors le périmètre de ce qui est « raisonnablement susceptible » s’élargit. Des organisations qui considéraient un corpus comme anonymisé pourraient devoir le requalifier en données personnelles, ou au minimum revoir leur analyse d’impact. La CNIL rappelle déjà que la pseudonymisation conserve souvent le caractère personnel des données, notamment parce que des données tierces peuvent permettre de retrouver l’identité. L’autorité française insiste aussi sur la nécessité d’une veille régulière, car les techniques d’anonymisation et de ré-identification évoluent.

L’ICO britannique va dans le même sens avec son test de l’« intrus motivé ». Sa documentation mentionne explicitement les services en ligne, les moteurs de recherche, les archives de presse et les outils d’IA générative parmi les moyens à considérer. Le NIST, de son côté, recommande des standards mesurables, des études de ré-identification et une gouvernance de type comité de divulgation, plutôt qu’un simple masquage cosmétique.

Santé : les champs libres deviennent le point faible

Les données de santé illustrent le danger. Les dossiers médicaux comportent souvent des champs libres : notes de consultation, antécédents, récits de symptômes, contexte familial, détails géographiques, événements rares. Les règles américaines HIPAA prévoient deux voies de dé-identification : l’expertise statistique ou la méthode dite « Safe Harbor », fondée sur la suppression d’identifiants listés. Mais le département américain de la Santé reconnaît que le risque n’est jamais nul et que les textes libres compliquent l’identification systématique des éléments sensibles.

Dans un monde avec agents web, le risque ne porte pas seulement sur le nom du patient. Il peut porter sur l’unicité d’un parcours : maladie rare, collecte de fonds locale, participation à un essai clinique, accident médiatisé, emploi dans un établissement précis. Pour les hôpitaux, assureurs, chercheurs et fournisseurs d’IA médicale, la conclusion est claire : anonymiser des textes cliniques ne peut plus se limiter à une liste d’entités nommées à supprimer.

Journalisme : protéger une source ne veut plus dire seulement changer son nom

La même logique menace la protection des sources journalistiques. Les rédactions savent déjà qu’un détail de lieu, de fonction ou de calendrier peut trahir une source. Le Committee to Protect Journalists recommande des évaluations de risque, la séparation des appareils, l’usage de pseudonymes dans les contacts et la prudence face aux traces numériques. Mais les LLM agentiques ajoutent une couche : même un article soigneusement rédigé peut fournir assez de micro-indices pour qu’un adversaire formule des recherches ciblées.

Cela concerne particulièrement les enquêtes sur les administrations, les entreprises, les hôpitaux, les écoles ou les communautés restreintes. Dire « une cadre intermédiaire ayant participé au comité d’audit en 2023 » peut suffire si les procès-verbaux, communiqués ou biographies publiques permettent de réduire le champ des candidats. Le risque n’est pas seulement technique ; il est éditorial. Les rédactions devront intégrer des tests adversariaux avant publication pour les témoignages sensibles.

Vers une nouvelle hygiène de l’anonymisation

La principale leçon du préprint n’est pas que l’anonymisation est impossible. C’est qu’elle doit devenir dynamique, adversariale et contextualisée. Les organisations devront tester leurs textes contre des agents outillés, documenter les hypothèses de menace, réévaluer les corpus lorsque de nouvelles données publiques apparaissent et accepter que l’utilité analytique a un coût privacy.

On peut anticiper trois évolutions. Premièrement, les audits de ré-identification par IA deviendront un passage obligé pour les corpus textuels sensibles. Deuxièmement, les méthodes d’anonymisation devront reconstruire le contexte plutôt que simplement supprimer des mots. Troisièmement, les cadres juridiques et les pratiques de conformité devront traiter les moteurs de recherche, les réseaux sociaux et les agents LLM comme une même surface d’attaque.

AURA propose une piste, mais pas une solution définitive. Son intérêt est de déplacer la discussion : l’attaquant moderne n’est plus un lecteur isolé, mais un système capable de raisonner, chercher et recouper. Pour les responsables de données, les chercheurs, les hôpitaux et les journalistes, c’est un changement de paradigme. Le texte anonymisé n’est plus seulement un document expurgé ; c’est une hypothèse de sécurité à tester contre le web entier.