Les vendeurs de pelles

Pendant un temps, l'histoire était d'une simplicité satisfaisante. L'intelligence artificielle avait besoin de GPU. Nvidia avait les GPU. Donc Nvidia possédait l'avenir.

Comme récit de marché, il avait le mérite d'être facile à comprendre — et, pour les investisseurs, hautement rentable. Il n'était pas exactement faux. Mais il était incomplet, comme le sont beaucoup de récits à succès : il prenait la contrainte la plus visible pour la seule qui existât.

Les derniers résultats d'AMD, d'Intel et de SanDisk suggèrent que l'économie de l'IA s'élargit au-delà de son premier goulot d'étranglement. Les GPU restent centraux. Mais l'infrastructure nécessaire pour faire fonctionner l'intelligence artificielle à grande échelle commence à tirer sur le reste de la pile matérielle : processeurs, mémoire, stockage, réseaux, centres de données, énergie et chaînes d'approvisionnement.

Le boom ne consiste plus seulement à rendre les modèles plus intelligents. Il consiste à rendre disponible assez de capacité physique pour qu'on puisse les utiliser.

De l'entraînement à l'usage

La première phase de la course à l'IA fut dominée par l'entraînement. C'était un monde de grands modèles, de clusters de GPU géants et de dépenses d'investissement spectaculaires. Dans ce monde, l'obsession pour Nvidia était rationnelle. L'entreprise occupait le point le plus étroit de l'entonnoir.

Mais l'économie de l'IA change à mesure que les modèles quittent les laboratoires pour devenir des produits.

L'entraînement est épisodique. L'inférence est continue. Un modèle peut être entraîné en une rafale concentrée de calcul, mais une fois déployé, il doit répondre à des millions — et bientôt des milliards — de requêtes. Chaque demande déclenche une chaîne d'activité : récupération de données, accès mémoire, lectures de stockage, réseau, orchestration, classement, appels d'outils et, de plus en plus, des workflows agentiques qui se déroulent en plusieurs étapes.

Résultat : l'IA ressemble de moins en moins à une fonctionnalité logicielle et de plus en plus à un système industriel. Ses contraintes sont physiques. Ses intrants sont intensifs en capital. Ses goulots d'étranglement se déplacent.

C'est pourquoi les chiffres récents venus des segments les moins glamour de l'industrie des semi-conducteurs comptent. La forte croissance d'AMD dans les centres de données, le trimestre meilleur qu'attendu d'Intel et l'envolée des revenus de SanDisk dans le stockage d'entreprise ne sont pas de simples notes de bas de page du récit Nvidia. Ils attestent que le déploiement de l'IA devient plus diffus.

Le retour de la puce sans prestige

Le CPU n'était pas censé être la partie excitante de l'IA. Pendant l'essentiel de la dernière décennie, les processeurs généralistes semblaient matures, nécessaires et ennuyeux. Le prestige appartenait aux accélérateurs.

L'IA agentique complique ce tableau. Les agents ne se contentent pas de répondre à des questions. Ils planifient, se ramifient, recherchent de l'information, appellent des outils, exécutent des workflows, maintiennent un contexte et prennent des décisions séquentielles. Une grande partie de ce travail exige non seulement de l'accélération, mais de la coordination.

Cela redonne au CPU une pertinence nouvelle. Non que la puce elle-même ait soudain changé — c'est la charge de travail qui a changé. Un système qui doit gérer la logique, l'état et l'orchestration à grande échelle ne peut pas vivre des seuls GPU.

Cela ne fait pas d'Intel ou d'AMD « le nouveau Nvidia ». Ce serait une autre simplification abusive. Mais cela suggère que la vieille distinction entre l'accélérateur stratégique et le reste banalisé du serveur devient de plus en plus difficile à tenir.

La mémoire retrouve un pouvoir de prix

Le stockage et la mémoire racontent une histoire plus tranchée encore.

SanDisk, longtemps associé aux clés USB et au stockage grand public, se retrouve exposé à l'un des besoins les plus pressants de l'économie de l'IA : garder d'immenses quantités de données suffisamment proches pour être utiles. L'inférence à grande échelle est avide non seulement de calcul, mais d'un accès à l'information à faible latence.

C'est un développement inconfortable pour quiconque a l'habitude de voir la NAND comme un marché de commodité impitoyable. La mémoire a toujours eu le don de séduire les investisseurs en haut de cycle. Les pénuries créent un pouvoir de prix. Le pouvoir de prix attire la capacité. La capacité crée la surproduction. La surproduction détruit les marges. Le cycle est assez ancien pour mériter l'humilité.

Et pourtant, quelque chose semble bel et bien changer. Les hyperscalers n'achètent plus le stockage comme ils achetaient jadis du matériel de bureau. Ils sécurisent de l'infrastructure. La distinction compte : les intrants stratégiques se contractent autrement, se tarifent autrement et se discutent à des niveaux plus élevés de l'organisation.

Il serait prématuré de déclarer la mort du cycle de la mémoire. Il serait tout aussi imprudent de supposer que la demande d'IA le laisse intact.

L'économie physique de l'intelligence

La conclusion la plus importante n'est pas que les investisseurs devraient remplacer une valeur fétiche par une autre. C'est que l'intelligence artificielle, malgré son image éthérée, devient une affaire très matérielle.

Elle dépend de puces fabriquées à Taïwan, de mémoire fournie par la Corée du Sud et le Japon, de capacités de packaging avancé, de réseaux électriques, de systèmes de refroidissement, de permis de centres de données, de transformateurs, de logistique et de contrôles à l'exportation. Aucune de ces contraintes ne se résout par une meilleure interface utilisateur.

C'est la partie du récit de l'IA que beaucoup de stratégies d'entreprise sous-estiment encore. Elles traitent la capacité d'IA comme quelque chose qui s'achètera à la demande, comme un logiciel d'entreprise. Mais les entreprises qui dépensent le plus agressivement se comportent tout autrement.

Meta, Microsoft, Google et Amazon n'achètent pas simplement de l'optionnalité. Ils sécurisent une capacité industrielle rare.

Voilà qui devrait inquiéter les conseils d'administration. L'infrastructure cloud partagée est peut-être commode, mais une infrastructure partagée signifie aussi des contraintes partagées. Dans un monde où la demande excède l'offre, les clients les plus attractifs seront servis en premier, la meilleure performance se paiera au prix fort, et la flexibilité stratégique appartiendra à ceux qui auront planifié tôt.

La démocratisation de l'IA est peut-être vraie au niveau de l'interface. Elle l'est beaucoup moins au niveau du centre de données.

Le retour de la géographie

Cette nouvelle pile industrielle comporte aussi une gêne géopolitique. Les entreprises qui conçoivent les systèmes d'IA sont peut-être américaines. Celles qui les déploient sont peut-être mondiales. Mais une grande partie du socle physique se trouve en Asie de l'Est.

TSMC reste central dans la fabrication de puces avancées. Samsung et SK Hynix dominent des pans cruciaux du marché de la mémoire. Kioxia demeure important dans l'approvisionnement en NAND. Les contrôles américains à l'exportation, la demande chinoise, le risque taïwanais, la capacité coréenne et la politique industrielle japonaise habitent désormais ce que beaucoup de dirigeants appellent encore leur « stratégie IA ».

Ce n'est pas un détail d'achats. C'est un risque de souveraineté.

La question du conseil d'administration n'est plus seulement de savoir si l'entreprise a accès aux meilleurs modèles. C'est de savoir si elle comprend la fragilité de l'infrastructure dont ces modèles dépendent.

Les marchands de pioches et de pelles

La vieille analogie de la ruée vers l'or est imparfaite, mais utile. Les prospecteurs prenaient le prestige et le risque. Les marchands de pioches, de pelles, de toile de jean et de provisions gagnaient souvent l'argent le plus régulier.

L'IA a ses prospecteurs : constructeurs de modèles, éditeurs d'applications, plateformes logicielles, consultants et équipes de transformation. Mais les vendeurs de pelles deviennent difficiles à ignorer. Ce sont les concepteurs de puces, les fonderies, les fournisseurs de mémoire, les entreprises de réseaux, les opérateurs de centres de données et les producteurs d'énergie qui font passer l'intelligence artificielle de la démo au déploiement.

Tous ne gagneront pas également. La position d'AMD n'est pas celle d'Intel. Les défis d'Intel ne sont pas ceux de SanDisk. La vigueur récente de SanDisk n'efface pas la cyclicité de la mémoire. Une thèse générale ne remplace pas une analyse entreprise par entreprise.

Reste que la direction du mouvement est claire. Dans l'IA, la rareté descend le long de la pile.

La question que les conseils devraient poser

La plupart des organisations ont désormais une stratégie IA. Certaines en ont plusieurs. Rares sont celles qui manquent de slides.

La question la plus utile est de savoir si ces stratégies sont exécutables sous contraintes réelles. L'entreprise sait-elle de combien de calcul elle aura besoin ? A-t-elle vérifié si ce calcul est réservé, partagé ou simplement présumé ? Comprend-elle son exposition à la mémoire, à la latence, aux mouvements de données, aux prix et à la disponibilité du cloud ? A-t-elle envisagé ce qui se passe si l'infrastructure devient plus chère, plus politisée ou moins accessible ?

Vue depuis la fenêtre de prompt, l'IA peut sembler impalpable. En dessous s'étend une chaîne dense de silicium, d'énergie, de capital et de géographie.

La première phase du boom a récompensé ceux qui ont repéré la course aux modèles. La suivante récompensera peut-être ceux qui comprennent les goulots d'étranglement.

Dans la ruée vers l'or de l'intelligence artificielle, les pelles ne sont plus une métaphore. Elles sont la stratégie.