Test de la GeForce RTX 5090 : Blackwell et son neural rendering sont-ils révolutionnaires ?

Spécifications

Avant d'aborder les spécifications des différentes cartes lancées, un mot rapide sur les GPU et procédés de fabrication associés. Commençons par Intel qui se contentait de 2 GPU jusqu'à peu : l'ACM-G10 pour les solutions moyen de gamme et performance (ARC A770/750 et théoriquement A5xx que nous n'avons jamais vues) et l'ACM-G11 pour l'entrée de gamme (ARC A3xx). Intel est un fondeur, mais plutôt que de faire appel à ses propres capacités de production, il sous-traite la gravure de ces 2 puces à TSMC via son procédé de fabrication N6, une optimisation du nœud 7 nm. Clairement dépassé en termes de densité ou de performance par le 5 nm (et maintenant 3 nm) du géant taïwanais des semiconducteurs, ce procédé de fabrication à l'avantage d'être bien moins cher. ACM-G10 est une puce plutôt conséquente, avec un peu plus de 400 mm² de surface et pas moins de 21,7 milliards de transistors. Son petit frère se contente de 157 mm² pour 7 milliards de transistors. À cela s'ajoute à présent BMG-G11, utilisant cette fois le même node que la concurrence, à savoir le N5 de TSMC et que l'on retrouve sur la B580 et maintenant B570. De quoi caser 19,6 milliards de transistors sur 272 mm². La densité progresse, mais reste bien moindre que celle de la concurrence, et ce même si les méthodes de comptages peuvent différer. Elle résulte probablement d'un design moins optimisé et de davantage d'interfaces moins denses.

NVIDIA utilise de son côté le 4N de TSMC, une déclinaison "personnalisée" du très performant 5 nm, sur l'intégralité de sa série RTX 40, mais aussi 50. Pas moins de 8 GPU différents ont été conçus, allant de GB202 intégrant plus de 92 milliards de transistors sur une superficie de 750 mm² et animant la RTX 5090, au petit AD107 se contentant de 159 mm² pour presque 19 milliards et affecté cette fois à la RTX 4060. Entre ces 2 extrêmes se trouvent les puces AD 102 (RTX 4090), AD103 RTX (RTX 4070 Ti SUPER / RTX 4080 / RTX 4080 SUPER), GB203 (RTX 5080 / 5070 Ti), AD104 (RTX 4070 Ti / RTX 4070 / RTX 4070 SUPER), GB205 (RTX 5070) et AD106 (RTX 4060 Ti) par ordre décroissant de superficie et complexité. Ces 8 références monopolisent le haut du classement en matière de densité de transistors par mm², multipliant pratiquement par trois cette valeur en comparaison du précédent N8 de Samsung utilisé par la génération Ampere (RTX 30). Il existe donc une différence très conséquente entre ces 2 nœuds de gravure, et ce contrairement à ce que laisseraient penser leurs nomenclatures commerciales respectives. Le N8 est en fait une optimisation du node 10nm, NVIDIA "enjambant" donc le 7 nm pour passer directement au 5 nm, soit un saut de 2 générations. On notera tout de même que la génération Blackwell est légèrement moins dense qu'Ada Lovelace, du fait de différences de design.

AMD a, lui, opté pour un "en même temps" au moyen de chiplets, en attendant sa nouvelle génération prévue pour mars 2025. Le N5 de TSMC est donc dévolu aux GCD, alors que les MCD doivent de leur côté se contenter du N6, tout comme Navi 33. Ce dernier, purement monolithique, mesure 204 mm² pour 13,3 milliards de transistors et se charge d'animer les RX 7600 et RX 7600 XT. À l'autre bout de la gamme, les 6 MCD plus le GCD d'un Navi 31 complet occupent une superficie totale de presque 530 mm², pour 57,7 milliards de transistors. La densité est donc légèrement moindre que sur les puces intégralement en 4N du caméléon, mais finalement pas si éloignée malgré le mix des nœuds de gravure. Cela tendrait à corroborer l'assertion d'AMD quant aux faibles gains (en densité au moins) à attendre d'une gravure plus fine pour certains éléments constitutifs d'un GPU. Les RX 7900 XTX / 7900 XT et 7900 GRE emploient un tel GPU. Enfin, Navi 32 des RX 7700 XT et 7800 XT couple un GCD de 200 mm² gravé en 5 nm, à 4 MCD gravés en 6 nm par TSMC. La partie logique étant fortement réduite sur ce nouveau GCD, la densité va finalement se positionner entre celle de Navi 33 et Navi 31.

GPU	Process	Nombre de transistors	Superficie die	Densité (Millions de transistors par mm²)
AD102	4N TSMC	76,3 milliards	608,5 mm²	125,4
GB202	4N TSMC	92,2 milliards	750 mm²	122,9
AD106	4N TSMC	22,9 milliards	187,8 mm²	121,9
AD104	4N TSMC	35,8 milliards	294,5 mm²	121,6
AD103	4N TSMC	45,9 milliards	378,6 mm²	121,2
GB203	4N TSMC	45,6 milliards	378 mm²	120,6
AD107	4N TSMC	18,9 milliards	158,7 mm²	119,1
GB205	4N TSMC	31,1 milliards	263 mm²	118,3
Navi 31	N5 + N6 TSMC	57,7 milliards	529,5 mm²	109
Navi 32	N5 + N6 TSMC	28,1 milliards	350 mm²	80,3
BMG-G21	N5 TSMC	19,6 milliards	272 mm²	72,1
GA100	7N TSMC	54.2 milliards	826 mm²	65,6
Navi 33	N6 TSMC	13,3 milliards	204 mm²	65,2
ACM-G10	N6 TSMC	21,7 milliards	406 mm²	53,4
Navi 21	N7P TSMC	26,8 milliards	520 mm²	51,6
Navi 22	N7P TSMC	17,2 milliards	335 mm²	51,3
Navi 24	N6 TSMC	5,4 milliards	107 mm²	50,5
Navi 23	N7P TSMC	11,1 milliards	237 mm²	46,8
ACM-G11	N6 TSMC	7,2 milliards	157 mm²	45,9
GA102	8N Samsung	28,3 milliards	628,4 mm²	45
GA104	8N Samsung	17,4 milliards	392 mm²	44,4
GA106	8N Samsung	12 milliards	276 mm²	43,5
Navi 10	N7P TSMC	10,3 milliards	251 mm²	41
Vega 20	N7FF TSMC	13.2 milliards	331 mm²	39,9
Vega 10	14LPP GF	12.5 milliards	495 mm²	25,3
TU104	12FFC TSMC	13,6 milliards	545 mm²	25
TU102	12FFC TSMC	18,6 milliards	754 mm²	24,7
TU106	12FFC TSMC	10,8 milliards	445 mm²	24,3

Détaillons à présent les caractéristiques des cartes employant ces GPU en comparaison d’un certain nombre de cartes des segments haut de Enthusiast et haut de gamme des générations actuelles et précédentes.

Cartes	GPU	Fréq. Boost GPU (MHz)	Fréq. Mémoire (MHz)	SP / CC	ALU FP32	ROP	VRAM (Go)	Bus mem. (bits)	Calcul SP (Tflops)	Bande Passante mémoire (Go/s)	TGP (W)
RX 5700	Navi 10	1 725	1 750	2 304	2 304	64	8	256	7,9	448	180
RX 5700 XT	Navi 10	1 905	1 750	2 560	2 560	64	8	256	9,8	448	225
RX 6700 XT	Navi 22	2 424	1 988	2 560	2 560	64	12	192	12,4	382	230
RX 6750 XT	Navi 22	2 495	2 238	2 560	2 560	64	12	192	12,8	430	250
RX 6800	Navi 21	1815	1 988	3 840	3 840	96	16	256	13,9	509	250
RX 6800 XT	Navi 21	2015	1 988	4 608	4 608	128	16	256	18,6	509	300
RX 6900 XT	Navi 21	2015	1 988	5 120	5 120	128	16	256	20,6	509	300
RX 6950 XT	Navi 21	2100	2238	5 120	5 120	128	16	256	21,5	573	335
RX 7700 XT	Navi 32	2 544	2 238	3 456	6 912	96	12	192	35,2	430	245
RX 7800 XT	Navi 32	2 430	2 425	3 840	7 680	96	16	256	37,3	621	263
RX 7900 GRE	Navi 31	2 245	2 238	5 120	10 240	192	16	256	46,0	573	260
RX 7900 XT	Navi 31	2 400	2 487	5 376	10 752	192	20	320	51,6	796	315
RX 7900 XTX	Navi 31	2 500	2 487	6 144	12 288	192	24	384	61,4	955	355
Arc A750	ACM-G10	2 400	2 000	3 584	3 584	112	8	256	17,2	512	225
Arc A770	ACM-G10	2400	2000 / 2188	4 096	4 096	128	8 / 16	256	19,7	512 / 560	225
Arc B570	BMG-G11	2 750	2 375	2 304	2 304	80	10	160	12,7	380	150
Arc B580	BMG-G11	2 850	2 375	2 560	2 560	80	12	192	14,6	456	190
RTX 2070	TU106	1 620	175	2 304	2 304	64	8	256	7,5	448	175
RTX 2070 SUPER	TU104	1 770	1 750	2 560	2 560	64	8	256	9,1	448	215
RTX 2080	TU104	1 710	1 750	2 944	2 944	64	8	256	10,1	448	215
RTX 2080 SUPER	TU104	1 815	1 938	3 072	3 072	64	8	256	11,2	496	250
RTX 2080 Ti	TU102	1 545	1 750	4 352	4 352	88	11	352	13,5	616	250
RTX 3070	GA104	1 725	1 750	2 944	5 888	96	8	256	20,3	448	220
RTX 3070 Ti	GA104	1 770	1 188	3 077	6 144	96	8	256	21,7	608	290
RTX 3080	GA102	1 710	1 188	4352	8 704	96	10	320	29,8	760	320
RTX 3080 Ti	GA102	1 710	1 188	4 480	8 960	96	12	384	30,6	912	350
RTX 3090	GA102	1 695	1 219	5 248	10 496	112	24	384	35,6	936	350
RTX 4070	AD104	2 475	1 313	2 944	5 888	64	12	192	29,1	504	200
RTX 4070 SUPER	AD104	2 475	1 313	3 584	7 168	80	12	192	35,5	504	220
RTX 4070 Ti	AD104	2 610	1 313	3 840	7 680	80	12	192	40,1	504	285
RTX 4070 Ti SUPER	AD103	2 610	1 313	4 224	8 448	96	16	256	44,1	672	285
RTX 4080 SUPER	AD104	2 550	1 438	5 120	10 240	112	16	256	52,2	736	320
RTX 4090	AD102	2 520	1 313	8 192	16 384	176	24	384	82,6	1 008	450
RTX 5070	GB205	2 512	1 750	6 144	6 144	80	12	192	30,9	672	250
RTX 5070 Ti	GB203	2 452	1 750	8 960	8 960	96	16	256	43,9	896	300
RTX RTX 5080	GB203	2 617	1 875	10 752	10 752	112	16	256	56,3	960	360
RTX 5090	GB202	2 407	1 750	21 760	21 760	176	32	512	104,8	1 792	575

Rappelons qu'il est très difficile d'inférer les performances pratiques d'une carte graphique sur la seule base des valeurs brutes annoncées. Plusieurs raisons à cela, dont les fréquences réellement appliquées (qui diffèrent plus ou moins largement de celles officielles), mais aussi les subtilités architecturales quant aux conditions d'exécution de certaines unités ou l'impact par exemple des larges caches sur la bande passante mémoire effective. Toujours est-il que la GeForce RTX 5090 devance de presque 27 % en puissance de calcul et 78 % en bande passante mémoire le précédent vaisseau amiral des verts. Il ne faut pas oublier non plus que le cache L2 progresse d'un tiers, ce qui va mécaniquement lui donner un avantage encore plus important lors de certains scénarios. Mettons donc à l'épreuve les valeurs théoriques en exécutant quelques tests synthétiques de bas niveau.

Tests synthétiques

Nous utilisons la suite de tests Geeks 3D pour estimer les performances synthétiques de la nouvelle venue, lors de l’exécution de certaines tâches particulières. Ainsi, PixMark Julia FP32 permet de mesurer la puissance de calcul brute en simple précision (FP32) et le fillrate qui en découle. Il dépend donc à la fois des unités de calcul et des ROP. Le test GiMark, s’attache de son côté à évaluer les performances de nos cartes au niveau de la géométrie (génération de primitives 3D). Enfin, TessMark permet de son côté de mesurer les capacités en tessellation des différentes cartes. Ces tests relativement brefs et spécifiques (n’utilisant donc qu’une partie des ressources totales des GPU) permettent aux modèles limités par leur température et/ou puissance électrique maximale autorisée, de conserver des fréquences plus élevées que lors d’une session de jeu par exemple.

Tests synthétiques - RTX 5090 FE

1Images par seconde - Le plus élevé est le meilleur Titre Couleur PixMark Julia FP32 GiMark TessMark \nTitre Court PixMark GiMark TessMark \nSous-titre 0.7.0 - OpenGL 3.0 - 2160P 0.7.0 - OpenGL 3.3 - 2160P 0.7.0 - OpenGL 4.0 - 2160P - X64 \nRadeon RX 6900 XT MBA #ED1C24 1600 321 487 \nRadeon RX 7900 XT MBA #ED1C24 1745 343 473 \nRadeon RX 7900 XTX MBA #ED1C24 2027 379 533 \nGeForce RTX 3090 FE #76B900 1788 305 662 \nGeForce RTX 4080 SUPER FE #76B900 2252 250 948 \nGeForce RTX 4090 FE #76B900 3142 395 1206 \n**GeForce RTX 5090 FE** #76B900 3594 442 1407

En matière de puissance de calcul brute, nous ne retrouvons dans notre test "que" 14 % d'avance pour la RTX 5090 sur la 4090, soit la moitié de ce que l'on pouvait espérer. Toutefois, les ROP n'évoluant pas entre les deux références, une limitation côté fillrate peut en découler. Qui plus est, rien ne dit que nous ne soyons pas non plus limités par le CPU lors de ce test basique. En matière de géométrie, l'écart est encore moindre, puisque se limitant à 12 %. Finissons par la tessellation, qui montre cette fois un écart de 17 % entre les vaisseaux amiraux des deux générations. Des écarts somme toute modestes, mais gardez toutefois à l'esprit que ces tests utilisent des scènes avec des charges très spécifiques, ne correspondant pas vraiment à l'usage typique d'un rendu 3D complet. Qui plus est, ils s'appuient sur OpenGL, une API commençant à sérieusement dater.

Passons à présent à des tests synthétiques issus de 3DMark, en s’attachant à vérifier les capacités des cartes graphiques pour diverses fonctionnalités. DXR, au nom explicite, sollicite de manière intensive les capacités d’accélération du Ray Tracing par le GPU, au travers de l’API de Microsoft. La nouvelle venue se montre 20 % moins rapide que sa devancière dans ce domaine. Il n'y a aucune raison logique à cela, nous penchons donc pour un bug à ce niveau, à voir avec de futures mises à jour. Mesh Shader évalue la capacité de traitement de ces derniers par les GPU modernes. Le test permet de comparer les performances avec et sans Mesh Shaders actifs, mais cette représentation ne permet pas une comparaison pertinente entre cartes. Nous affichons donc les performances de chaque référence avec Mesh Shaders actifs. La RTX 5090 laisse cette fois sa devancière sur le carreau avec une avance de 40 %.

Tests fonctionnalités - RTX 5090 FE

2 Titre Couleur 3DMark: DXR 3DMark: Mesh Shader 3DMark: PCIe Bandwidth 3DMark: Sampler Feedback 3DMark: Variable Rate Shading \nTitre Court DXR Mesh Shader PCIe Bandwidth Sampler Feedback Variable Rate Shader \nSous-titre 1.0 - DXR - 1440P 1.0 - DX12U - 2160P 1.0 - DX12 - 2160P 1.0 - DX12U - 2160P 1.1 - DX12 - 2160P \nAxe x Images par seconde - Le plus élevé est le meilleur Images par seconde - Le plus élevé est le meilleur Go/s - Le plus élevé est le meilleur Images par seconde - Le plus élevé est le meilleur Images par seconde - Le plus élevé est le meilleur \nRadeon RX 6900 XT MBA #ED1C24 37.3 578.8 27.6 486.2 236.3 \nRadeon RX 7900 XT MBA #ED1C24 50.1 591.8 28.6 658.4 282.9 \nRadeon RX 7900 XTX MBA #ED1C24 56.9 624.4 28.6 762.2 336.2 \nGeForce RTX 3090 FE #76B900 57.9 665.7 26.9 749.6 253.1 \nGeForce RTX 4080 SUPER FE #76B900 89.5 907.3 26.9 928.6 380.7 \nGeForce RTX 4090 FE #76B900 136.8 1043.7 26.9 1303.8 559.5 \n**GeForce RTX 5090 FE** #76B900 109.8 1461.6 117.9 1841.3 692.7

Le test PCIe renvoie lui aussi un résultat incompréhensible, à moins qu'AMD et Nvidia aient intégré la Gen 6 sans nous en avertir... Plus sérieusement il s'agit ici aussi d'un bug à corriger, nous mettrons donc à jour les résultats une fois le logiciel mis à jour. Le test Sampler Feedback mesure de son côté l’impact de cette fonctionnalité introduite (comme la plupart des autres) par les cartes Turing. Cette fois, c'est à nouveau un gain d'une quarantaine de pourcents pour la nouvelle venue sur la RTX 4090. Enfin, le test VRS, abréviation de Variable Rate Shading, permet de mesurer le gain apporté par cette fonctionnalité lorsqu’elle est activée. Là aussi, il s'agit d'une comparaison entre 2 passes, nous préférons donc reporter ici aussi le score atteint par chaque carte une fois la fonctionnalité activée, permettant ainsi une comparaison brute entre elles. La RTX 5090 dispose ici d'un avantage de 24 % sur le précédent vaisseau amiral des verts.

Chris Gaming

·

23 Janvier 2025 - 15:02

C'est parti pour un peu de lecture, merci d'avance pour votre test !!

Voir plus
- Eric B.
  
  ·
  
  23 Janvier 2025 - 21:35
  
  🙏
  
  Voir plus
Thomas N.

·

23 Janvier 2025 - 15:06

Merci pour le test les copains ! 💯

Voir plus
- Eric B.
  
  ·
  
  23 Janvier 2025 - 21:35
  
  🙏
  
  Voir plus
1

123

·

23 Janvier 2025 - 15:17

Merci beaucoup pour le test, très complet!

Alors certes elle a de la patate et est à l'aise en upscale + FG, mais voilà la conso (et la température des puces mémoire, aouch)!

Voir plus
- Eric B.
  
  ·
  
  23 Janvier 2025 - 21:36
  
  🙏
  
  Voir plus
J

Joebob

·

23 Janvier 2025 - 15:25

Merci Hardware & Co pour cet article de qualité (et les petites touches de cultures).

Bonne journée.

Voir plus
Eric B.

·

23 Janvier 2025 - 15:27
Quelques points à signaler vu l'ampleur du dossier et le temps imparti pour le réaliser :
- Il y a probablement encore beaucoup de fautes qui vont être corrigées au cour des jours à venir (vous pouvez utiliser le bouton signaler pour nous avertir si vous en voyez et que vous le souhaitez)
- La partie architecturale a été en grande partie rédigée par Nicolas faute de temps de mon côté (c'est ça la force d'une vraie équipe)
- La partie DLSS 4 / visuelle va être enrichie
- La partie verdict va également être affinée car elle aussi "rushée"
Merci pour votre compréhension

Voir plus
- L
  
  laurent
  
  ·
  
  23 Janvier 2025 - 15:42
  Quelques points à signaler vu l'ampleur du dossier et le temps imparti pour le réaliser :
  
  Il y a probablement encore beaucoup de fautes qui vont être corrigées au cour des jours à venir (vous pouvez utiliser le bouton signaler pour nous avertir si vous en voyez)
  
  La partie architecturale a été en grande partie rédigée par Nicolas faute de temps de mon côté (c'est ça la force d'une vraie équipe)
  
  La partie DLSS 4 / visuelle va être enrichie
  
  La partie verdict va également être affinée car elle aussi "rushée"
  
  Merci pour votre compréhension
  Cool le test merci
  
  rajouter une passe en UHD RT mais sans DLSS? Parce que le DLSS ca fonctionne mais on le sait depuis les premières RTX!
  
  Voir plus
  - Eric B.
    
    ·
    
    23 Janvier 2025 - 15:46
    
    30 heures de boulot mini, désolé je peux pas. Il fallait que je case quelque part l'apport du DLSS 4. Sur 4 def/réglages, il y en a 3 sans DLSS/FSR et c'est en UHD RT qu'il fait plus sens.
    
    Voir plus
    - L
      
      laurent
      
      ·
      
      23 Janvier 2025 - 16:05
      
      30 heures de boulot mini, désolé je peux pas. Il fallait que je case quelque part l'apport du DLSS 4. Sur 4 def/réglages, il y en a 3 sans DLSS/FSR et c'est en UHD RT qu'il fait plus sens.
      
      Ouai je comprend , après je n'ai clairement pas la même vision sur le dlss!
      
      Voir plus
      - Eric B.
        
        ·
        
        23 Janvier 2025 - 16:08
        
        Avec le DLSS 4 il y a match ! C'est justement tout l'intérêt de cette nouvelle version utilisant Transformer
        
        Voir plus
      - L
        
        laurent
        
        ·
        
        23 Janvier 2025 - 16:28
        
        Avec le DLSS 4 il y a match ! C'est justement tout l'intérêt de cette nouvelle version utilisant Transformer
        
        Toute mes excuses j'avais sauté la page dlss 4, il y a l'info que je souhaitais, mea culpa!
        
        Voir plus
      - Eric B.
        
        ·
        
        23 Janvier 2025 - 21:18
        
        Toute mes excuses j'avais sauté la page dlss 4, il y a l'info que je souhaitais, mea culpa!
        
        Il n'y a pas de mal, c'est vrai que j'ai ajouté les tests en UHD RT natif dans la page DLSS 4, mais ça se limite à la seule 5090 et les 4 jeux testés, tant mieux si tu as trouvé ton bonheur.
        
        Voir plus
- Ping
  
  ·
  
  23 Janvier 2025 - 18:41
  
  Pour un test partiellement "rushé" 🙃 c'est juste incroyable le travail réalisé 🤩
  
  Merci 🤸‍♂️
  
  Voir plus

Test de la GeForce RTX 5090 : Blackwell et son neural rendering sont-ils révolutionnaires ?

Spécifications

Tests synthétiques

Tests synthétiques - RTX 5090 FE

Tests fonctionnalités - RTX 5090 FE

118 commentaires

Laissez votre commentaire

Lire aussi...

Test GeForce RTX 5060 Ti 8G Custom : PNY RTX 5060 Ti EPIC-X RGB OC

Une centaine de GeForce RTX 5090 profitant du soleil dans une rue en Chine ? MSI s'explique

The Oversight Bureau : trailer officiel et démo disponible pour le jeu avec IA NVIDIA ACE, à commander avec votre voix

Test de la GeForce RTX 5090 : Blackwell et son neural rendering sont-ils révolutionnaires ?

Spécifications

Tests synthétiques

Tests synthétiques - RTX 5090 FE

Tests fonctionnalités - RTX 5090 FE

118 commentaires

Laissez votre commentaire

Lire aussi...

Test GeForce RTX 5060 Ti 8G Custom : PNY RTX 5060 Ti EPIC-X RGB OC

Une centaine de GeForce RTX 5090 profitant du soleil dans une rue en Chine ? MSI s'explique

The Oversight Bureau : trailer officiel et démo disponible pour le jeu avec IA NVIDIA ACE, à commander avec votre voix

Test de la GeForce RTX 5090 : Blackwell et son neural rendering sont-ils révolutionnaires ?

Test GeForce RTX 5060 Ti 8G Custom : PNY RTX 5060 Ti EPIC-X RGB OC

Une centaine de GeForce RTX 5090 profitant du soleil dans une rue en Chine ? MSI s'explique

The Oversight Bureau : trailer officiel et démo disponible pour le jeu avec IA NVIDIA ACE, à commander avec votre voix