Le Règne Contesté de NVIDIA
NVIDIA règne sur le marché des puces IA depuis le début de la révolution deep learning. En 2026, l'entreprise de Jensen Huang contrôle encore plus de 80% du marché des GPU pour datacenters. Mais cette domination, longtemps incontestée, fait face à des attaques coordonnées de tous les fronts.
La situation actuelle rappelle celle d'Intel dans les années 2000 : une position de monopole apparent qui masque des fissures structurelles. Les clients — hyperscalers, entreprises IA, gouvernements — cherchent désespérément des alternatives. Non par insatisfaction technique, mais par nécessité stratégique : dépendre d'un seul fournisseur est devenu un risque inacceptable.
Les Challengers Établis
AMD a fait un retour remarquable avec la série MI300. Ses puces offrent des performances comparables aux H100 de NVIDIA pour certaines charges de travail, à un prix inférieur. Microsoft et Meta ont publiquement adopté AMD pour une partie de leur infrastructure, légitimant l'alternative. Le logiciel ROCm, longtemps le talon d'Achille d'AMD, s'est considérablement amélioré.
Intel peine davantage. Gaudi 3, sa puce dédiée à l'IA, existe mais n'a pas trouvé son marché. L'entreprise mise sur une stratégie de foundry, fabriquant les puces des autres plutôt que les siennes. Un aveu d'échec relatif sur le front de la conception.
Google avec ses TPU v5 reste une force majeure, mais ces puces ne sont accessibles que via Google Cloud. C'est à la fois une force — intégration parfaite avec l'écosystème — et une limite — pas d'achat direct possible pour les entreprises souhaitant leur propre infrastructure.
La Vague des Startups
Le véritable danger pour NVIDIA vient peut-être des startups spécialisées :
Cerebras propose des wafer-scale chips, des puces géantes couvrant un wafer entier. Pour l'entraînement de très grands modèles, l'approche offre des avantages uniques en termes de bande passante mémoire.
Groq mise sur l'inférence ultra-rapide. Ses Language Processing Units (LPU) affichent des latences records, idéales pour les applications temps réel. La démonstration publique de 2024 a fait sensation.
SambaNova cible les entreprises avec une approche full-stack, combinant hardware et software dans une offre intégrée.
Graphcore (racheté par SoftBank) continue de développer ses IPU, avec un focus particulier sur les architectures innovantes comme les transformers sparse.
Le Facteur Géopolitique
La guerre des puces est aussi une guerre géopolitique. Les restrictions américaines sur les exportations vers la Chine ont créé un marché parallèle, où des acteurs locaux comme Huawei (avec ses puces Ascend) tentent de combler le vide.
Taiwan, où TSMC fabrique la quasi-totalité des puces avancées, reste le point de tension majeur. Une perturbation de la production taiwanaise paralyserait l'industrie mondiale. Cette dépendance pousse les États-Unis et l'Europe à investir massivement dans des capacités de production locales, mais les résultats ne seront pas visibles avant la fin de la décennie.
Les Tendances Techniques
Plusieurs innovations techniques redéfinissent le marché :
Le packaging avancé : l'intégration de multiples puces dans un seul package (chiplets) permet de contourner les limites de la loi de Moore. NVIDIA l'utilise dans Blackwell, AMD dans MI300.
La mémoire haute bande passante (HBM) : le goulot d'étranglement n'est plus le calcul mais la mémoire. HBM3e et bientôt HBM4 deviennent différenciateurs critiques.
L'inférence optimisée : après la course à l'entraînement, l'industrie se focalise sur l'inférence efficace. Les architectures spécialisées pour ce cas d'usage gagnent en importance.
La quantization : faire tourner des modèles en précision réduite (FP8, INT4) sans perte significative de qualité permet d'utiliser des puces moins puissantes.
Les Enjeux pour les Entreprises
Pour les entreprises utilisatrices d'IA, ce marché en ébullition est une opportunité. Les prix baissent sous l'effet de la concurrence. Les options se multiplient. Le pouvoir de négociation face à NVIDIA augmente.
Mais la complexité augmente aussi. Choisir la bonne architecture pour chaque charge de travail demande une expertise croissante. Le risque de lock-in logiciel (CUDA chez NVIDIA) reste un facteur de décision majeur. L'optimisation multi-plateforme devient une compétence recherchée.
Conclusion
NVIDIA reste le roi incontesté, mais la couronne vacille. D'ici 2028, le marché sera probablement plus équilibré, avec 2-3 alternatives viables pour chaque cas d'usage. La compétition bénéficiera à tous : prix plus bas, innovation accélérée, moins de dépendance à un acteur unique. Pour les acheteurs de puces IA, c'est le meilleur moment depuis une décennie.
