En bref. La bataille NVIDIA vs AMD ne se joue plus seulement sur la carte graphique la plus rapide. Avec les AI factories, les deux groupes vendent désormais une infrastructure complète : GPU, CPU, réseau, logiciels, racks, énergie et partenaires capables de déployer des centres de calcul à l'échelle industrielle.
Une AI factory n'est pas un simple datacenter
Le terme AI factory est devenu central parce qu'il décrit un changement de logique. Un datacenter classique héberge des applications ; une usine IA produit des modèles, des tokens, des recommandations, des images, du code, des simulations et des agents. Elle doit donc optimiser une chaîne complète : alimentation électrique, refroidissement, serveurs, interconnexion, stockage, orchestration logicielle et disponibilité.
Dans cette lecture, NVIDIA et AMD ne vendent plus seulement du silicium. Ils vendent une façon de construire la capacité IA. Pour les hyperscalers, les grands groupes industriels et les acteurs cloud, le choix ne consiste pas seulement à comparer des performances théoriques. Il faut regarder le coût par token, la vitesse de déploiement, la densité par rack, la maturité logicielle et le risque de dépendance.
NVIDIA transforme son avance en plateforme intégrée
NVIDIA part avec l'avantage le plus visible : l'entreprise contrôle une grande partie de la pile. Ses résultats du premier trimestre fiscal 2027 donnent le contexte. Le groupe publie 81,6 milliards de dollars de chiffre d'affaires, dont 75,2 milliards pour le Data Center. Dans le détail, NVIDIA sépare 60,4 milliards de dollars de revenus compute et 14,8 milliards de dollars de revenus networking. Ce dernier point est essentiel : l'usine IA est aussi une affaire de réseau.
La génération Vera Rubin renforce cette stratégie. NVIDIA présente une plateforme qui réunit GPU Rubin, CPU Vera, NVLink, BlueField, Spectrum-X Ethernet et designs de racks. L'objectif n'est pas uniquement d'augmenter la puissance brute, mais de réduire les goulets d'étranglement entre les puces et d'améliorer le rendement d'une usine entière. Quand NVIDIA parle d'agentic AI factories, le message est clair : les agents IA réclament une infrastructure qui sert des milliards d'inférences avec une latence et un coût maîtrisés.
AMD pousse l'alternative ouverte et hyperscale
AMD arrive avec une proposition différente. Le groupe ne peut pas simplement copier l'intégration NVIDIA ; il doit convaincre que son architecture est suffisamment performante, plus ouverte, plus flexible et attractive pour les grands clients qui veulent éviter un verrouillage excessif. Ses résultats du premier trimestre 2026 montrent déjà une accélération : 10,253 milliards de dollars de chiffre d'affaires, dont 5,8 milliards pour le Data Center, en hausse de 57 % sur un an.
La stratégie AMD repose sur plusieurs briques : Instinct côté GPU, EPYC côté CPU, ROCm côté logiciel, Pensando côté réseau et Helios côté rack-scale. Avec MI350 puis MI450, AMD veut prouver que l'IA à grande échelle peut se construire sur une pile plus ouverte. Les accords avec Meta et OpenAI donnent du poids à ce récit : dans les deux cas, AMD parle de déploiements pouvant atteindre 6 gigawatts d'infrastructure IA, avec une première vague autour de MI450 à partir de la seconde moitié de 2026.
Le vrai duel se joue dans le rack
Comparer NVIDIA et AMD seulement sur un GPU masque l'essentiel. Une AI factory se juge à l'échelle du rack, puis du bâtiment. NVIDIA met en avant Vera Rubin NVL72, NVLink, BlueField, Spectrum-X et un écosystème de partenaires industriels capable d'assembler des systèmes complets. AMD répond avec Helios, MI400, EPYC Venice, interconnexion ouverte et intégration ROCm. Dans les deux cas, le produit final est moins une puce qu'une unité de production IA.
Ce changement favorise les fournisseurs capables de livrer une feuille de route crédible. Les clients achètent des générations successives, pas une annonce isolée. Ils veulent savoir si le logiciel tiendra, si les systèmes seront disponibles, si les fournisseurs pourront garantir l'approvisionnement, et si le rendement énergétique reste acceptable. À cette échelle, une amélioration de quelques points sur la consommation, le réseau ou l'utilisation des GPU peut peser très lourd.
| Critère | NVIDIA | AMD | Ce que cela change |
|---|---|---|---|
| Positionnement | Plateforme intégrée, très contrôlée, pensée autour de CUDA, NVLink, Spectrum et des racks complets. | Alternative ouverte, centrée sur Instinct, EPYC, ROCm, Pensando et les designs rack-scale Helios. | Le choix oppose sécurité d'écosystème et volonté de diversification. |
| Accélérateurs | Blackwell puis Vera Rubin pour l'entraînement, l'inférence et les agents IA à grande échelle. | MI350, MI450 puis MI400 pour renforcer l'inférence, les grands modèles et les déploiements hyperscale. | Les performances doivent être jugées en usage réel, pas seulement dans les fiches. |
| Réseau | Spectrum-X, NVLink, BlueField et Ethernet photonics pour réduire les contraintes d'interconnexion. | Pensando Pollara, Vulcano et architecture ouverte pour connecter GPU, CPU et stockage. | Le réseau devient un différenciateur aussi important que le GPU. |
| Logiciel | CUDA, bibliothèques NVIDIA, pile IA très mature et forte adoption développeurs. | ROCm progresse, mais doit encore convaincre sur la simplicité, la compatibilité et l'outillage. | Le coût total dépend fortement du temps d'intégration logiciel. |
| Clients | Position dominante chez cloud providers, laboratoires IA et industriels déjà équipés. | Accords structurants annoncés avec Meta et OpenAI, plus une logique de second fournisseur stratégique. | Les grands clients cherchent de la capacité, mais aussi un pouvoir de négociation. |
Pourquoi les hyperscalers veulent plusieurs fournisseurs
Pour Meta, OpenAI, Microsoft, Oracle, Google ou Amazon, l'IA n'est plus un projet expérimental. C'est une capacité industrielle. Aucun acteur ne veut dépendre d'une seule route d'approvisionnement si la demande continue d'augmenter. Même lorsqu'un fournisseur domine, les grands acheteurs cherchent souvent un second écosystème crédible pour sécuriser les volumes, négocier les prix, accélérer certains déploiements et réduire les risques de pénurie.
C'est là que la proposition AMD devient intéressante. Si ROCm et les racks Helios tiennent les promesses à grande échelle, AMD peut devenir moins un remplaçant direct de NVIDIA qu'un contrepoids stratégique. Le marché n'a pas forcément besoin que tous les workloads basculent. Il suffit que certaines charges d'inférence, certains modèles et certains clusters soient économiquement meilleurs sur AMD pour changer les arbitrages d'achat.
Le logiciel reste l'avantage défensif de NVIDIA
L'avance NVIDIA ne vient pas seulement de ses GPU. Elle vient de CUDA, des bibliothèques optimisées, des outils d'orchestration, des habitudes des développeurs, de la documentation et de l'écosystème de partenaires. Cette inertie est puissante. Une entreprise peut aimer l'idée d'une pile plus ouverte et décider malgré tout de rester chez NVIDIA si la migration logicielle coûte trop cher ou ralentit la production.
AMD le sait. C'est pourquoi ROCm 7, les optimisations pour l'inférence et les partenariats de long terme comptent autant que les annonces matériel. Dans une AI factory, le GPU inutilisé est du capital immobilisé. Le vainqueur n'est donc pas seulement celui qui promet le plus de FLOPS, mais celui qui transforme le plus vite l'électricité, les racks et les modèles en service fiable.
Les limites à garder en tête
Les chiffres cités viennent majoritairement des entreprises concernées. Ils sont utiles pour comprendre les feuilles de route, mais ils doivent être lus comme des annonces industrielles et financières, pas comme une mesure indépendante de performance. Les gains de tokens, d'efficacité énergétique ou de coût par génération dépendent des workloads, des logiciels, de la disponibilité des systèmes, des prix négociés et de l'exploitation réelle.
Autre limite : la contrainte énergétique. Une usine IA ne se décide pas seulement avec une commande de GPU. Elle demande des mégawatts, des autorisations, du refroidissement, des sites adaptés, de la fibre, du personnel et une chaîne logistique capable de suivre. Les questions d'export, de souveraineté, de pénurie de composants et de concentration du marché peuvent aussi modifier le calendrier.
Ce qu'il faut suivre maintenant
Pour NVIDIA, le point clé sera la capacité à transformer l'avance Blackwell en cycle Vera Rubin sans créer de friction chez les clients. Il faudra suivre la disponibilité des racks, les gains réels sur l'inférence agentique, la demande réseau et la capacité à maintenir une marge élevée malgré l'industrialisation massive.
Pour AMD, il faudra suivre les premiers déploiements MI450, l'adoption de ROCm, les preuves chez Meta et OpenAI, les performances de Helios et la capacité à obtenir des volumes récurrents au-delà des annonces. Si AMD réussit, le marché des AI factories deviendra moins monolithique. Si l'intégration logicielle patine, NVIDIA gardera un avantage difficile à attaquer.
Le duel NVIDIA vs AMD raconte donc une transition plus large : l'IA devient une industrie lourde. Les marques technologiques qui compteront ne seront pas seulement celles qui fabriquent les meilleures puces, mais celles qui savent organiser une production continue d'intelligence artificielle, depuis la prise électrique jusqu'au modèle en service.
FAQ
Qu'est-ce qu'une AI factory ?
Une AI factory est une infrastructure conçue pour produire de l'IA à grande échelle : entraînement, inférence, agents, tokens et services IA. Elle combine GPU, CPU, réseau, stockage, logiciels, énergie et refroidissement.
Pourquoi NVIDIA domine-t-il encore ce marché ?
NVIDIA dispose d'une avance matérielle, réseau et logicielle très forte. CUDA, NVLink, BlueField, Spectrum-X et ses designs de racks créent une plateforme complète déjà largement adoptée.
Quel est l'intérêt d'AMD pour les grands clients IA ?
AMD peut servir d'alternative stratégique avec Instinct, EPYC, ROCm et Helios. Les grands clients cherchent plus de capacité, de concurrence fournisseur et parfois une pile plus ouverte.
MI450 peut-il remplacer NVIDIA chez Meta ou OpenAI ?
Pas nécessairement. L'enjeu est d'abord de compléter et diversifier la capacité IA. Si les performances, la disponibilité et l'intégration logicielle sont au rendez-vous, AMD peut prendre une place importante sur certains workloads.
Le réseau est-il vraiment aussi important que le GPU ?
Oui. À très grande échelle, les GPU doivent échanger des données rapidement et efficacement. L'interconnexion, l'Ethernet spécialisé, les DPU et les switches peuvent déterminer le rendement réel de l'usine IA.





