Nvidia RTX 5090

Spécifications

Avant d'aborder les spécifications des différentes cartes lancées, un mot rapide sur les GPU et procédés de fabrication associés. Commençons par Intel qui se contentait de 2 GPU jusqu'à peu : l'ACM-G10 pour les solutions moyen de gamme et performance (ARC A770/750 et théoriquement A5xx que nous n'avons jamais vues) et l'ACM-G11 pour l'entrée de gamme (ARC A3xx). Intel est un fondeur, mais plutôt que de faire appel à ses propres capacités de production, il sous-traite la gravure de ces 2 puces à TSMC via son procédé de fabrication N6, une optimisation du nœud 7 nm. Clairement dépassé en termes de densité ou de performance par le 5 nm (et maintenant 3 nm) du géant taïwanais des semiconducteurs, ce procédé de fabrication à l'avantage d'être bien moins cher. ACM-G10 est une puce plutôt conséquente, avec un peu plus de 400 mm² de surface et pas moins de 21,7 milliards de transistors. Son petit frère se contente de 157 mm² pour 7 milliards de transistors. À cela s'ajoute à présent BMG-G11, utilisant cette fois le même node qu'AMD et Nvida, à savoir le 5 nm de TSMC et que l'on retrouve sur la B580 et maintenant B570. De quoi caser 19,6 milliards de transistors sur 272 mm². La densité progresse, mais reste bien moindre que celle de la concurrence, et ce même si les méthodes de comptages peuvent différer. Elle résulte probablement d'un design moins optimisé et de davantage d'interfaces moins denses.  

NVIDIA utilise de son côté le 4N de TSMC, une déclinaison "personnalisée" du très performant 5 nm, sur l'intégralité de sa série RTX 40, mais aussi 50. Pas moins de 8 GPU différents ont été conçus, allant de GB202 intégrant plus de 92 milliards de transistors sur une superficie de 750 mm² et animant la RTX 5090, au petit AD107 se contentant de 159 mm² pour presque 19 milliards et affecté cette fois à la RTX 4060. Entre ces 2 extrêmes se trouvent les puces AD 102 (RTX 4090),  AD103 (RTX 4070 Ti SUPER / RTX 4080 / RTX 4080 SUPER), GB203 (RTX 5080 / 5070 Ti), AD104 (RTX 4070 Ti / RTX 4070 / RTX 4070 SUPER), GB205 (RTX 5070) et AD106 (RTX 4060 Ti) par ordre décroissant de superficie et complexité. Ces 8 références monopolisent le haut du classement en matière de densité de transistors par mm², multipliant pratiquement par trois cette valeur en comparaison du précédent N8 de Samsung utilisé par la génération Ampere (RTX 30). Il existe donc une différence très conséquente entre ces 2 nœuds de gravure, et ce contrairement à ce que laisseraient penser leurs nomenclatures commerciales respectives. Le N8 est en fait une optimisation du node 10nm, NVIDIA "enjambant" donc le 7 nm pour passer directement au 5 nm, soit un saut de 2 générations. On notera tout de même que la génération Blackwell est légèrement moins dense qu'Ada Lovelace, du fait de différences de conception.

AMD a, lui, opté pour un "en même temps" au moyen de chiplets, en attendant sa nouvelle génération prévue pour mars 2025. Le N5 de TSMC est donc dévolu aux GCD, alors que les MCD doivent de leur côté se contenter du N6, tout comme Navi 33. Ce dernier, purement monolithique, mesure 204 mm² pour 13,3 milliards de transistors et se charge d'animer les RX 7600 et RX 7600 XT. À l'autre bout de la gamme, les 6 MCD plus le GCD d'un Navi 31 complet occupent une superficie totale de presque 530 mm², pour 57,7 milliards de transistors. La densité est donc légèrement moindre que sur les puces intégralement en 4N du caméléon, mais finalement pas si éloignée malgré le mix des nœuds de gravure. Cela tendrait à corroborer l'assertion d'AMD quant aux faibles gains (en densité au moins) à attendre d'une gravure plus fine pour certains éléments constitutifs d'un GPU. Les RX 7900 XTX / 7900 XT et 7900 GRE emploient un tel GPU. Enfin, Navi 32 des RX 7700 XT et 7800 XT couple un GCD de 200 mm² gravé en 5 nm, à 4 MCD gravés en 6 nm par TSMC. La partie logique étant fortement réduite sur ce nouveau GCD, la densité va finalement se positionner entre celle de Navi 33 et Navi 31.

GPU
Process
Nombre de transistors Superficie die Densité (Millions de transistors par mm²)
AD102 4N TSMC 76,3 milliards 608,5 mm² 125,4
GB202 4N TSMC 92,2 milliards 750 mm² 122,9
AD106 4N TSMC 22,9 milliards 187,8 mm² 121,9
AD104 4N TSMC 35,8 milliards 294,5 mm² 121,6
AD103 4N TSMC 45,9 milliards 378,6 mm² 121,2
GB203 4N TSMC 45,6 milliards 378 mm² 120,6
AD107 4N TSMC 18,9 milliards 158,7 mm² 119,1
GB205 4N TSMC 31,1 milliards 263 mm² 118,3
Navi 31 N5 + N6 TSMC 57,7 milliards 529,5 mm² 109
Navi 32 N5 + N6 TSMC 28,1 milliards 350 mm² 80,3
BMG-G21 N5 TSMC 19,6 milliards 272 mm² 72,1
GA100 7N TSMC 54.2 milliards 826 mm² 65,6
Navi 33 N6 TSMC 13,3 milliards 204 mm² 65,2
ACM-G10 N6 TSMC 21,7 milliards 406 mm² 53,4
Navi 21 N7P TSMC 26,8 milliards 520 mm² 51,6
Navi 22 N7P TSMC 17,2 milliards 335 mm² 51,3
Navi 24 N6 TSMC 5,4 milliards 107 mm² 50,5
Navi 23 N7P TSMC 11,1 milliards 237 mm² 46,8
ACM-G11 N6 TSMC 7,2 milliards 157 mm² 45,9
GA102 8N Samsung 28,3 milliards 628,4 mm² 45
GA104 8N Samsung 17,4 milliards 392 mm² 44,4
GA106 8N Samsung 12 milliards 276 mm² 43,5
Navi 10 N7P TSMC 10,3 milliards 251 mm² 41
Vega 20 N7FF TSMC 13.2 milliards 331 mm² 39,9
Vega 10 14LPP GF 12.5 milliards 495 mm² 25,3
TU104 12FFC TSMC 13,6 milliards 545 mm² 25
TU102 12FFC TSMC 18,6 milliards 754 mm² 24,7
TU106 12FFC TSMC 10,8 milliards 445 mm² 24,3

Détaillons à présent les caractéristiques des cartes employant ces GPU en comparaison d’un certain nombre de cartes des segments Enthusiast et haut de gamme des générations actuelles et précédentes.

Cartes GPU Fréq. Boost GPU (MHz) Fréq. Mémoire (MHz)

SP
/
CC

ALU FP32 ROP VRAM (Go) Bus mem. (bits) Calcul SP (Tflops) Bande Passante mémoire (Go/s) TGP (W)
RX 5700 Navi 10 1 725 1 750 2 304 2 304 64 8 256 7,9 448 180
RX 5700 XT Navi 10 1 905 1 750 2 560 2 560 64 8 256 9,8 448 225
RX 6700 XT Navi 22 2 424 1 988 2 560 2 560 64 12 192 12,4 382 230
RX 6750 XT Navi 22 2 495 2 238 2 560 2 560 64 12 192 12,8 430 250
RX 6800 Navi 21 1815 1 988 3 840 3 840 96 16 256 13,9 509 250
RX 6800 XT Navi 21 2015 1 988 4 608 4 608 128 16 256 18,6 509 300

RX 6900 XT

Navi 21 2015 1 988 5 120 5 120 128 16 256 20,6 509 300
RX 6950 XT Navi 21 2100 2238 5 120 5 120 128 16 256 21,5 573 335
RX 7700 XT Navi 32 2 544 2 238 3 456 6 912 96 12 192 35,2 430 245
RX 7800 XT Navi 32 2 430 2 425 3 840 7 680 96 16 256 37,3 621 263
RX 7900 GRE Navi 31 2 245 2 238 5 120 10 240 192 16 256 46,0 573 260
RX 7900 XT Navi 31 2 400 2 487 5 376 10 752 192 20 320 51,6 796 315
RX 7900 XTX Navi 31 2 500 2 487 6 144 12 288 192 24 384 61,4 955 355
Arc A750 ACM-G10 2 400 2 000 3 584 3 584 112 8 256 17,2 512 225
Arc A770 ACM-G10 2400 2000 / 2188 4 096 4 096 128 8 / 16 256 19,7 512 / 560 225
Arc B570 BMG-G11 2 750 2 375 2 304 2 304 80 10 160 12,7 380 150
Arc B580 BMG-G11 2 850 2 375 2 560 2 560 80 12 192 14,6 456 190
RTX 2070 TU106 1 620 175 2 304 2 304 64 8 256 7,5 448 175
RTX 2070 SUPER TU104 1 770 1 750 2 560 2 560 64 8 256 9,1 448 215
RTX 2080 TU104 1 710 1 750 2 944 2 944 64 8 256 10,1 448 215
RTX 2080 SUPER TU104 1 815 1 938 3 072 3 072 64 8 256 11,2 496 250
RTX 2080 Ti TU102 1 545 1 750 4 352 4 352 88 11 352 13,5 616 250
RTX 3070 GA104 1 725 1 750 2 944 5 888 96 8 256 20,3 448 220
RTX 3070 Ti GA104 1 770 1 188 3 077 6 144 96 8 256 21,7 608 290
RTX 3080 GA102 1 710 1 188 4352 8 704 96 10 320 29,8 760 320
RTX 3080 Ti GA102 1 710 1 188 4 480 8 960 96 12 384 30,6 912 350
RTX 3090 GA102 1 695 1 219 5 248 10 496 112 24 384 35,6 936 350
RTX 4070 AD104 2 475 1 313 2 944 5 888 64 12 192 29,1 504 200
RTX 4070 SUPER AD104 2 475 1 313 3 584 7 168 80 12 192 35,5 504 220
RTX 4070 Ti AD104 2 610 1 313 3 840 7 680 80 12 192 40,1 504 285
RTX 4070Ti SUPER AD103 2 610 1 313 4 224 8 448 96 16 256 44,1 672 285
RTX 4080 SUPER AD104 2 550 1 438 5 120 10 240 112 16 256 52,2 736 320
RTX 4090 AD102 2 520 1 313 8 192 16 384 176 24 384 82,6 1 008 450
RTX 5070 GB205 2 512 1 750 5 888 5 888 80 12 192 30,9 672 250
RTX 5070 Ti GB203 2 452 1 750 8 960 8 960 96 16 256 43,9 896 300
RTX 5080 GB203 2 617 1 875 10 752 10 752 112 16 256 56,3 960 360
RTX 5090 GB202 2 407 1 750 21 760 21 760 176 32 512 104,8 1 792 575

Rappelons qu'il est très difficile d'inférer les performances pratiques d'une carte graphique sur la seule base des valeurs brutes annoncées. Plusieurs raisons à cela, dont les fréquences réellement appliquées (qui diffèrent plus ou moins largement de celles officielles), mais aussi les subtilités architecturales quant aux conditions d'exécution de certaines unités ou l'impact par exemple des larges caches sur la bande passante mémoire effective. Toujours est-il que si la GeForce RTX 5070 Ti devance la RTX 4070 Ti de 9,5 % en puissance de calcul, ce n'est pas le cas face à la déclinaison SUPER qui officiellement se retrouve devant pour 0,5 %. Elle se rattrape du côté de la bande passante mémoire via sa GDDR7 avec des avantages respectifs de 78 et 33 % sur ces dernières. Le cache L2 est de taille identique et le fillrate ne progresse que du différentiel de fréquences réellement appliqué entre nos exemplaires. Mettons donc à l'épreuve les valeurs théoriques en exécutant quelques tests synthétiques de bas niveau.

Tests synthétiques

Nous utilisons la suite de tests Geeks 3D pour estimer les performances synthétiques de la nouvelle venue, lors de l’exécution de certaines tâches particulières. Ainsi, PixMark Julia FP32 permet de mesurer la puissance de calcul brute en simple précision (FP32) via le fillrate qui en découle. Il dépend donc à la fois des unités de calcul et des ROPs. Le test GiMark, s’attache de son côté à évaluer les performances de nos cartes au niveau de la géométrie (génération de primitives 3D). Enfin, TessMark permet de son côté de mesurer les capacités en tessellation des différentes cartes. Ces tests relativement brefs et spécifiques (n’utilisant donc qu’une partie des ressources totales des GPU) permettent aux modèles limités par leur température et/ou puissance électrique maximale autorisée, de conserver des fréquences plus élevées que lors d’une session de jeu par exemple.

Tests synthétiques - RTX 5070 Ti

1Images par seconde - Le plus élevé est le meilleur Titre Couleur PixMark Julia FP32 GiMark TessMark \nTitre Court PixMark GiMark TessMark \nSous-titre 0.7.0 - OpenGL 3.0 - 2160P 0.7.0 - OpenGL 3.3 - 2160P 0.7.0 - OpenGL 4.0 - 2160P - X64 \nRadeon RX 6800 MBA #ED1C24 1200 193 348 \nRadeon RX 6900 XT MBA #ED1C24 1600 321 487 \nGigabyte RX 7800 XT Gaming OC #ED1C24 1513 181 333 \nGigabyte RX 7900 GRE Gaming OC #ED1C24 1734 258 410 \nRadeon RX 7900 XT MBA #ED1C24 1745 343 473 \nRadeon RX 7900 XTX MBA #ED1C24 2027 379 533 \nGeForce RTX 3080 FE #76B900 1521 258 565 \nGeForce RTX 3090 FE #76B900 1788 305 662 \nAsus ROG Strix RTX 4070 Ti SUPER Gaming #76B900 2014 233 803 \nGeForce RTX 4080 SUPER FE #76B900 2252 250 948 \nGeForce RTX 4090 FE #76B900 3142 395 1206 \n**MSI RTX 5070 Ti Ventus 3x** #76B900 1989 315 830 \nGeForce RTX 5080 FE #76B900 2279 360 964 \nGeForce RTX 5090 FE #76B900 3594 442 1407

En matière de puissance de calcul brute, nous retrouvons la RTX 5070 Ti en retrait de 1 % par rapport à la RTX 4070 Ti SUPER, comme attendu au vu des spécifications respectives. Côté géométrie, l'écart est cette fois de 35 % en faveur de la nouvelle venue, mais il ne s'agit ici que d'un bug apparu sur les cartes à base d'AD103 suite à une évolution des pilotes et jamais corrigé depuis par Nvidia. Finissons par la tessellation, et cette fois la 5070 Ti devance de 3 % son ainée en version SUPER. Gardez toutefois à l'esprit que ces tests utilisent des scènes avec des charges très spécifiques, ne correspondant pas vraiment à l'usage typique d'un rendu 3D complet. Qui plus est, ils s'appuient sur OpenGL, une API commençant à sérieusement dater.

Passons à présent à des tests synthétiques issus de 3DMark, en s’attachant à vérifier les capacités des cartes graphiques pour diverses fonctionnalités. DXR, au nom explicite, sollicite de manière intensive les capacités d’accélération du Ray Tracing par le GPU, au travers de l’API de Microsoft. Comme attendu, Nvidia a corrigé le bug touchant la série 50 pour ce test, avec des RTX 5080 et 5090 tenant cette fois leur rang. La RTX 4070 Ti n'est pas en reste, 11 % devant la 4070 Ti SUPER. Mesh Shader évalue la capacité de traitement de ces derniers par les GPU modernes. Le test permet de comparer les performances avec et sans Mesh Shaders actifs, mais cette représentation ne permet pas une comparaison pertinente entre cartes. Nous affichons donc les performances de chaque référence avec Mesh Shaders actifs. L'écart est ici aussi de 11 % entre les deux xx70 Ti.

Tests fonctionnalités - RTX 5070 Ti

2 Titre Couleur 3DMark: DXR 3DMark: Mesh Shader 3DMark: PCIe Bandwidth 3DMark: Sampler Feedback 3DMark: Variable Rate Shading \nTitre Court DXR Mesh Shader PCIe Bandwidth Sampler Feedback Variable Rate Shader \nSous-titre 1.0 - DXR - 1440P 1.0 - DX12U - 2160P 1.0 - DX12 - 2160P 1.0 - DX12U - 2160P 1.1 - DX12 - 2160P \nAxe x Images par seconde - Le plus élevé est le meilleur Images par seconde - Le plus élevé est le meilleur Go/s - Le plus élevé est le meilleur Images par seconde - Le plus élevé est le meilleur Images par seconde - Le plus élevé est le meilleur \nRadeon RX 6800 MBA #ED1C24 27.2 450.8 27.9 410.3 177.9 \nRadeon RX 6900 XT MBA #ED1C24 37.3 578.8 27.6 486.2 236.3 \nGigabyte RX 7800 XT Gaming OC #ED1C24 36.7 426.8 27.8 520.8 230.1 \nGigabyte RX 7900 GRE Gaming OC #ED1C24 44.0 476.7 27.8 514.6 267.9 \nRadeon RX 7900 XT MBA #ED1C24 50.1 591.8 28.6 658.4 282.9 \nRadeon RX 7900 XTX MBA #ED1C24 56.9 624.4 28.6 762.2 336.2 \nGeForce RTX 3080 FE #76B900 47.5 593.4 26.9 632.7 218.2 \nGeForce RTX 3090 FE #76B900 57.9 665.7 26.9 749.6 253.1 \nAsus ROG Strix RTX 4070 Ti SUPER Gaming #76B900 74.1 725.7 26.9 801.8 316.5 \nGeForce RTX 4080 SUPER FE #76B900 89.5 907.3 26.9 928.6 380.7 \nGeForce RTX 4090 FE #76B900 136.8 1043.7 26.9 1303.8 559.5 \n**MSI RTX 5070 Ti Ventus 3x** #76B900 82.0 807.9 65.0 948.6 337.7 \nGeForce RTX 5080 FE #76B900 99.7 911.6 65.2 1114.8 397.6 \nGeForce RTX 5090 FE #76B900 183.0 1461.6 117.9 1841.3 692.7

Le test PCIe renvoie un résultat toujours surévalué, il faudra probablement attendre une mise à jour du test par UL pour des résultats fiables en PCIe Gen 5. Le test Sampler Feedback mesure de son côté l’impact de cette fonctionnalité introduite (comme la plupart des autres) par les cartes Turing. Cette fois, c'est un gain de 18 % pour la nouvelle venue, probablement bien aidée par sa bande passante mémoire ici, à l'instar de ses grandes sœurs. Enfin, le test VRS, abréviation de Variable Rate Shading, permet de mesurer le gain apporté par cette fonctionnalité lorsqu’elle est activée. Là aussi, il s'agit d'une comparaison entre 2 passes, nous préférons donc reporter ici aussi le score atteint par chaque carte une fois la fonctionnalité activée, permettant ainsi une comparaison brute entre elles. La RTX 5070 Ti dispose ici d'un avantage de 7 % sur la 4070 Ti SUPER.

Eric


  • Merci par avance pour cet excellent test à n'en pas douter comme à votre habitude, je le lirais ce soir à la maison j'ai juste lu la conclusion : 

    "qui plus est AMD est sur le point d'annoncer sa nouvelle gamme RDNA 4. Nous ne sommes pas à l'abri d'une bonne surprise, évitez donc la précipitation et regretter son empressement dans quelques jours"

    Serait-ce un indice sur une gen AMD plutôt réussie ? 😁

  • Très bon test comme toujours 

    La carte est un peu plus perf que ce que j'aurais cru la bande passante en plus lui fait du bien apparemment 

    Par contre cher et surtout indisponible pour le moment 

    Quand les prix et la disponibilité seront revenu à la normale je vois pas l'intérêt de prendre une 5080 les 2 cartes étant bien trop proche 

  • Merci pour le boulot !

    Ils auraient pu la renommer 4070 ti super vu le peu de gain. Reste la MFG mais si c'est pour monter les options graphique (rt à fond typiquement) pour redégrader l'image derrière via l'interpolation IA je vois pas trop l'intérêt. Autant jouer en medium ou high en natif ou juste avec le dlss en qualité et éviter l'impression d'être dans une vidéo youtube (en mf4 ça donne cette impression en mouvement, celle d'une vidéo un peu trop compressée, c'est d'ailleurs peut être l'intérêt de la techno : sur les tests vidéos c'est dur de voir la différence avec du natif)

  • Une nouvelle fois merci pour ce super test. Je l'ai un peu trop vite parcouru en attendant d'être à la maison pour m'y replonger plus sérieusement.

    Je l'attendais avec impatience cette 5070 Ti surtout avec ses 16 Go me permettant d'être plus à l'aise avec l'UHD. Je vais suivre ces bons conseils et attendre que la situation se décante et peut-être même attendre les futures Super.

  • Merci pour ce test complet !

    La déception sur le bruit O.o et la conso/perf par rapport à la gen précédente :(

    Sur le bruit, le modèle est particulièrement mal foutu ou bien c'est commun à toutes les 5070ti ?

    • Il y a pas dd modèle fe juste que cette version est mal conçu elle ne dissipe pas assez d'autres modèles fint mieux 

    • Depuis que j'ai découvert les casques qui annulent activement le bruit, je ne me soucis plus du bruit des cartes graphiques, on n'entend plus rien grâce à cette technologie, tu devrais peut-être essayer !

      • oui ça serait une super solution (mon ainé fils du haut de sa vingtaine fait ça avec une tour qui fait un bruit des boeing au décollage) mais pas moyen pour moi, je suis vieux et j'ai du poil dans les oreilles et elles chauffent :)

        Bref, le bruit est un des trucs que je regarde le plus en hardware, et au boulot également (avec un threadripper 3990x et une cuda qui ronronnent plus doux qu'une drosophile à pleine puissance)

  • Super test, bon ben la RTX 5070Ti n'est ni mieux ni moins bien que la RTX 5080, elle est moins chere et moins performante (L'ecart de perfs en path tracing dans Cyberpunk 2077 est quand meme important)

    C'est de la bonne came ces cartes graphiques, on peut critiquer nVIDIA pour le peu de VRAM, mais pour du jeu video c'est suffisant

  • La RTX aurait dû avoir au moins 10% de perf en plus afin de justifier l'écart de prix avec cette 5070TI. Nvidia va d'ici 1 an dégêner une rtx 5080 Ti, 5070 Super et 5070 Ti Super. Il y aura même la place d'une RTX 5080 Ti Super avec le gap qu'il y a sur la RTX 5090.   

16 commentaires

Laissez votre commentaire

En réponse à Some User