Les puces IA ont besoin de climatiseurs millimétriques

Le nouveau mur thermique de l’IA

La course aux puces d’intelligence artificielle ne se joue plus seulement en nanomètres, en HBM ou en capacité CoWoS. Elle se joue aussi en millimètres, dans l’espace minuscule qui sépare le silicium brûlant du système chargé d’évacuer sa chaleur. À mesure que les accélérateurs IA concentrent davantage de transistors, de mémoire empilée et d’interconnexions rapides, le refroidissement cesse d’être un accessoire d’infrastructure pour devenir une contrainte de conception au même titre que l’alimentation électrique ou le packaging avancé.

Le signal le plus récent vient de ScienceNet, qui rapporte les travaux de l’équipe du professeur Li Bing, de l’Université de Shenzhen, et de la société Ruimeng Semiconductor. Selon ce média scientifique chinois, l’équipe a développé un microsystème actif de refroidissement piézoélectrique présenté comme une sorte de climatiseur millimétrique pour puces IA. Le dispositif utiliserait une céramique piézoélectrique de 0,1 millimètre d’épaisseur capable de vibrer des dizaines de milliers de fois par seconde afin de déplacer activement la chaleur, avec une épaisseur totale de micro-pompe inférieure à 2 millimètres.

ScienceNet indique aussi que le projet aurait franchi une étape industrielle : une ligne de production de refroidissement liquide à micro-pompe pour terminaux 3C, construite avec des partenaires industriels, viserait une capacité proche du million d’unités par mois, tandis que Ruimeng Semiconductor aurait levé plus de 210 millions de yuans depuis sa création. Il faut toutefois lire cette source pour ce qu’elle est : un article institutionnel, très proche de l’écosystème universitaire et industriel chinois, qui valorise la trajectoire d’un laboratoire et d’une entreprise. Il donne des détails utiles sur la stratégie de transfert technologique, mais ne remplace pas une validation indépendante de la performance, de la fiabilité et du coût en production.

De la plaque froide au refroidissement dans la puce

Jusqu’ici, la majorité des serveurs IA refroidis par liquide reposent sur une architecture relativement classique : une plaque froide est appliquée contre le processeur ou le GPU, un fluide circule dans cette plaque, puis la chaleur est transférée vers une unité de distribution de liquide, ou CDU. Cette approche est déjà un changement majeur pour les centres de données conçus autour de l’air, mais elle conserve un problème fondamental : la chaleur doit traverser plusieurs couches, interfaces thermiques, substrats, couvercles et matériaux d’assemblage avant d’atteindre le fluide.

Les nouvelles approches cherchent donc à rapprocher le liquide de la source de chaleur. Les micro-canaux, gravés dans le silicium ou intégrés au package, transforment la puce ou son environnement immédiat en échangeur thermique. Le principe est simple à expliquer, mais difficile à industrialiser : faire passer un fluide dans des canaux de quelques dizaines à quelques centaines de micromètres, au plus près des points chauds, sans fuite, sans obstruction, sans corrosion, sans vibration excessive et sans compromettre le rendement de fabrication des semi-conducteurs.

Cette idée n’est pas nouvelle. La DARPA a structuré dès les années 2010 le programme ICECool autour du refroidissement intra-puce et inter-puce, en poussant l’idée que la gestion thermique devait être intégrée dès les premières étapes de conception électronique. Mais l’explosion de l’IA générative lui donne aujourd’hui une urgence commerciale. Les racks IA dépassent désormais les seuils où l’air devient insuffisant. Uptime Institute observe que le refroidissement liquide s’impose surtout au-delà de 50 kW par rack, tandis que les architectures d’entraînement IA poussent les opérateurs vers des densités que les salles informatiques traditionnelles n’avaient pas anticipées.

Ce que disent les laboratoires

La recherche académique montre que les marges physiques sont considérables. Dans Nature, l’équipe de Remco van Erp et Elison Matioli a montré en 2020 qu’un dispositif co-conçu entre électronique et microfluidique pouvait extraire plus de 1,7 kW par centimètre carré avec seulement 0,57 W par centimètre carré de puissance de pompage. L’intérêt n’était pas seulement la performance brute : l’étude montrait qu’en intégrant les canaux directement dans le substrat, on pouvait supprimer une partie du chemin thermique et réduire les besoins en dissipateurs volumineux.

En 2025, Nature Electronics a publié une autre avancée importante : des micro-canaux à collecteur et micro-jets, réalisés à l’arrière d’un substrat de silicium par des procédés MEMS, capables de dissiper jusqu’à 3 000 W par centimètre carré avec de l’eau en simple phase et une puissance de pompage annoncée à 0,9 W par centimètre carré. Ce type de résultat reste expérimental, mais il fixe un horizon : la limitation thermique n’est pas une fatalité physique, elle est de plus en plus une question d’intégration, de rendement industriel et de compatibilité avec les chaînes de fabrication.

Une autre voie, présentée en 2026 dans Communications Engineering, consiste à déplacer les micro-canaux non pas dans la puce elle-même, mais dans le package. Cette approche direct-to-package vise à contourner une partie de la complexité du refroidissement direct-to-chip, tout en supprimant certaines interfaces thermiques. L’étude rapporte une dissipation jusqu’à environ 625 W par centimètre carré avec seulement quelques millilitres de fluide, mais elle souligne aussi les défis de fiabilité, de stabilité mécanique et d’isolation électrique.

Les hyperscalers entrent dans la microfluidique

Le passage du laboratoire au centre de données commence à se dessiner. Microsoft a annoncé en 2025 avoir développé un système de refroidissement microfluidique dans lequel des canaux sont gravés directement au dos du silicium. Le groupe affirme que cette approche peut retirer la chaleur jusqu’à trois fois mieux que des plaques froides conventionnelles et réduire jusqu’à 65 % la hausse maximale de température du silicium dans certains scénarios. Microsoft travaille notamment avec la start-up suisse Corintis, qui utilise des outils de conception inspirés de l’IA pour orienter les flux vers les points chauds.

TSMC explore de son côté l’intégration du refroidissement liquide à ses plateformes de packaging avancé. Des travaux associés à CoWoS et au concept de micro-refroidisseur intégré au silicium montrent la possibilité de dissiper plusieurs kilowatts dans des packages de très grande taille. C’est un point crucial : les accélérateurs IA modernes ne sont plus des puces isolées, mais des modules hétérogènes combinant GPU, puces d’E/S, interposeurs et piles HBM. Le problème thermique devient donc tridimensionnel.

Dans ce contexte, le refroidissement de la mémoire est aussi stratégique. Les piles HBM sont indispensables aux performances des modèles IA, mais elles introduisent leurs propres contraintes thermiques. Si la mémoire surchauffe, la bande passante baisse, le système ralentit et le GPU le plus cher du rack attend ses données. C’est pourquoi l’industrie regarde désormais le refroidissement comme une propriété du package complet, et non plus seulement du processeur principal.

Une nouvelle chaîne d’approvisionnement critique

La conséquence industrielle est majeure : la chaîne d’approvisionnement IA ne s’arrête plus aux GPU. Elle inclut les plaques froides, les pompes, les micro-usinages, les joints, les capteurs, les fluides diélectriques, les CDUs, les collecteurs, les raccords rapides, les tests de fuite et les logiciels de contrôle thermique. TrendForce estime que le refroidissement liquide dans les centres de données IA est passé d’une phase pilote à un déploiement à grande échelle, avec une pénétration qui devait dépasser 30 % en 2025. Le cabinet cite notamment Cooler Master, AVC, Boyd et Auras parmi les fournisseurs de plaques froides, et Vertiv ou Boyd dans les CDUs en ligne.

Cela crée un nouveau goulot d’étranglement. Un hyperscaler peut sécuriser des GPU, mais se retrouver limité par la disponibilité des composants thermiques, la capacité d’intégration en rack ou l’adaptation du bâtiment. Les centres de données existants n’ont pas toujours les planchers, l’alimentation électrique, les boucles d’eau ou la maintenance nécessaires pour accueillir ces architectures. Le rapport 2024 du Lawrence Berkeley National Laboratory pour le département américain de l’Énergie rappelle que la demande électrique des centres de données américains pourrait encore fortement croître d’ici 2028, principalement sous l’effet de l’IA et de l’accélération GPU. Le refroidissement efficace devient donc aussi un enjeu énergétique et hydrique.

Les risques : fuite, coût et verrouillage industriel

Le rêve d’une puce refroidie au millimètre près cache des contraintes sévères. Plus le liquide se rapproche du silicium, plus les conséquences d’une fuite ou d’une contamination deviennent graves. Les micro-canaux peuvent s’encrasser. Les joints doivent tenir sous cycles thermiques. Les matériaux doivent rester compatibles avec les fluides, les pressions et les procédés d’assemblage. La maintenance d’un rack IA liquide est déjà plus complexe que celle d’un rack à air ; celle d’un package microfluidique le sera encore davantage.

Il y a aussi un risque de verrouillage. Si le refroidissement devient co-conçu avec la puce, le package et le serveur, les clients dépendront plus fortement d’un petit nombre d’écosystèmes intégrés. Le fournisseur de GPU, le fondeur, l’intégrateur serveur et le fabricant de solution thermique devront travailler ensemble très tôt. Cela pourrait renforcer les acteurs déjà dominants, mais aussi ouvrir une fenêtre à des spécialistes comme Corintis, Frore Systems ou des fabricants asiatiques de composants thermiques.

Ce que cela annonce

À court terme, les data centers IA vont généraliser le direct-to-chip par plaques froides. À moyen terme, les accélérateurs les plus denses intégreront des microstructures de refroidissement dans le package, puis dans certaines parties du silicium. À plus long terme, l’architecture des puces sera probablement pensée avec la carte thermique dès le départ : les unités de calcul, la mémoire, l’alimentation et les canaux de fluide seront optimisés ensemble.

La technologie décrite par ScienceNet s’inscrit dans cette tendance, mais plutôt du côté des terminaux et de la miniaturisation active : smartphones IA, tablettes, robots, modules optiques ou systèmes embarqués. Pour les serveurs, les mêmes principes physiques s’appliquent, mais l’échelle, les débits et les contraintes de fiabilité sont autrement plus lourds.

Le message est clair : dans l’IA, la prochaine pénurie ne sera pas seulement celle des GPU. Elle pourrait concerner la capacité à les refroidir. Les gagnants de la prochaine génération d’infrastructure ne seront pas uniquement ceux qui gravent les meilleurs transistors, mais ceux qui sauront évacuer chaque watt au bon endroit, au bon coût, et pendant des années.