Spécifications
Avant d'aborder les spécifications des différentes cartes lancées, un mot rapide sur les GPU et procédés de fabrication associés. Commençons par Intel qui se contentait de 2 GPU jusqu'à peu : l'ACM-G10 pour les solutions moyen de gamme et performance (ARC A770/750 et théoriquement A5xx que nous n'avons jamais vues) et l'ACM-G11 pour l'entrée de gamme (ARC A3xx). Intel est un fondeur, mais plutôt que de faire appel à ses propres capacités de production, il sous-traite la gravure de ces 2 puces à TSMC via son procédé de fabrication N6, une optimisation du nœud 7 nm. Clairement dépassé en termes de densité ou de performance par le 5 nm (et maintenant 3 nm) du géant taïwanais des semiconducteurs, ce procédé de fabrication à l'avantage d'être bien moins cher. ACM-G10 est une puce plutôt conséquente, avec un peu plus de 400 mm² de surface et pas moins de 21,7 milliards de transistors. Son petit frère se contente de 157 mm² pour 7 milliards de transistors. À cela s'ajoute à présent BMG-G11, utilisant cette fois le même node qu'AMD et Nvida, à savoir le 5 nm de TSMC et que l'on retrouve sur la B580 et maintenant B570. De quoi caser 19,6 milliards de transistors sur 272 mm². La densité progresse, mais reste bien moindre que celle de la concurrence, et ce même si les méthodes de comptages peuvent différer. Elle résulte probablement d'un design moins optimisé et de davantage d'interfaces moins denses.
NVIDIA utilise de son côté le 4N de TSMC, une déclinaison "personnalisée" du très performant 5 nm, sur l'intégralité de sa série RTX 40, mais aussi 50. Pas moins de 8 GPU différents ont été conçus, allant de GB202 intégrant plus de 92 milliards de transistors sur une superficie de 750 mm² et animant la RTX 5090, au petit AD107 se contentant de 159 mm² pour presque 19 milliards et affecté cette fois à la RTX 4060. Entre ces 2 extrêmes se trouvent les puces AD 102 (RTX 4090), AD103 RTX (RTX 4070 Ti SUPER / RTX 4080 / RTX 4080 SUPER), GB203 (RTX 5080 / 5070 Ti), AD104 (RTX 4070 Ti / RTX 4070 / RTX 4070 SUPER), GB205 (RTX 5070) et AD106 (RTX 4060 Ti) par ordre décroissant de superficie et complexité. Ces 8 références monopolisent le haut du classement en matière de densité de transistors par mm², multipliant pratiquement par trois cette valeur en comparaison du précédent N8 de Samsung utilisé par la génération Ampere (RTX 30). Il existe donc une différence très conséquente entre ces 2 nœuds de gravure, et ce contrairement à ce que laisseraient penser leurs nomenclatures commerciales respectives. Le N8 est en fait une optimisation du node 10nm, NVIDIA "enjambant" donc le 7 nm pour passer directement au 5 nm, soit un saut de 2 générations. On notera tout de même que la génération Blackwell est légèrement moins dense qu'Ada Lovelace, du fait de différences de conception.
AMD a, lui, opté pour un "en même temps" au moyen de chiplets, en attendant sa nouvelle génération prévue pour mars 2025. Le N5 de TSMC est donc dévolu aux GCD, alors que les MCD doivent de leur côté se contenter du N6, tout comme Navi 33. Ce dernier, purement monolithique, mesure 204 mm² pour 13,3 milliards de transistors et se charge d'animer les RX 7600 et RX 7600 XT. À l'autre bout de la gamme, les 6 MCD plus le GCD d'un Navi 31 complet occupent une superficie totale de presque 530 mm², pour 57,7 milliards de transistors. La densité est donc légèrement moindre que sur les puces intégralement en 4N du caméléon, mais finalement pas si éloignée malgré le mix des nœuds de gravure. Cela tendrait à corroborer l'assertion d'AMD quant aux faibles gains (en densité au moins) à attendre d'une gravure plus fine pour certains éléments constitutifs d'un GPU. Les RX 7900 XTX / 7900 XT et 7900 GRE emploient un tel GPU. Enfin, Navi 32 des RX 7700 XT et 7800 XT couple un GCD de 200 mm² gravé en 5 nm, à 4 MCD gravés en 6 nm par TSMC. La partie logique étant fortement réduite sur ce nouveau GCD, la densité va finalement se positionner entre celle de Navi 33 et Navi 31.
GPU |
Process |
Nombre de transistors | Superficie die | Densité (Millions de transistors par mm²) |
---|---|---|---|---|
AD102 | 4N TSMC | 76,3 milliards | 608,5 mm² | 125,4 |
GB202 | 4N TSMC | 92,2 milliards | 750 mm² | 122,9 |
AD106 | 4N TSMC | 22,9 milliards | 187,8 mm² | 121,9 |
AD104 | 4N TSMC | 35,8 milliards | 294,5 mm² | 121,6 |
AD103 | 4N TSMC | 45,9 milliards | 378,6 mm² | 121,2 |
GB203 | 4N TSMC | 45,6 milliards | 378 mm² | 120,6 |
AD107 | 4N TSMC | 18,9 milliards | 158,7 mm² | 119,1 |
GB205 | 4N TSMC | 31,1 milliards | 263 mm² | 118,3 |
Navi 31 | N5 + N6 TSMC | 57,7 milliards | 529,5 mm² | 109 |
Navi 32 | N5 + N6 TSMC | 28,1 milliards | 350 mm² | 80,3 |
BMG-G21 | N5 TSMC | 19,6 milliards | 272 mm² | 72,1 |
GA100 | 7N TSMC | 54.2 milliards | 826 mm² | 65,6 |
Navi 33 | N6 TSMC | 13,3 milliards | 204 mm² | 65,2 |
ACM-G10 | N6 TSMC | 21,7 milliards | 406 mm² | 53,4 |
Navi 21 | N7P TSMC | 26,8 milliards | 520 mm² | 51,6 |
Navi 22 | N7P TSMC | 17,2 milliards | 335 mm² | 51,3 |
Navi 24 | N6 TSMC | 5,4 milliards | 107 mm² | 50,5 |
Navi 23 | N7P TSMC | 11,1 milliards | 237 mm² | 46,8 |
ACM-G11 | N6 TSMC | 7,2 milliards | 157 mm² | 45,9 |
GA102 | 8N Samsung | 28,3 milliards | 628,4 mm² | 45 |
GA104 | 8N Samsung | 17,4 milliards | 392 mm² | 44,4 |
GA106 | 8N Samsung | 12 milliards | 276 mm² | 43,5 |
Navi 10 | N7P TSMC | 10,3 milliards | 251 mm² | 41 |
Vega 20 | N7FF TSMC | 13.2 milliards | 331 mm² | 39,9 |
Vega 10 | 14LPP GF | 12.5 milliards | 495 mm² | 25,3 |
TU104 | 12FFC TSMC | 13,6 milliards | 545 mm² | 25 |
TU102 | 12FFC TSMC | 18,6 milliards | 754 mm² | 24,7 |
TU106 | 12FFC TSMC | 10,8 milliards | 445 mm² | 24,3 |
Détaillons à présent les caractéristiques des cartes employant ces GPU en comparaison d’un certain nombre de cartes des segments haut de Enthusiast et haut de gamme des générations actuelles et précédentes.
Cartes | GPU | Fréq. Boost GPU (MHz) | Fréq. Mémoire (MHz) |
SP |
ALU FP32 | ROP | VRAM (Go) | Bus mem. (bits) | Calcul SP (Tflops) | Bande Passante mémoire (Go/s) | TGP (W) |
---|---|---|---|---|---|---|---|---|---|---|---|
RX 5700 | Navi 10 | 1 725 | 1 750 | 2 304 | 2 304 | 64 | 8 | 256 | 7,9 | 448 | 180 |
RX 5700 XT | Navi 10 | 1 905 | 1 750 | 2 560 | 2 560 | 64 | 8 | 256 | 9,8 | 448 | 225 |
RX 6700 XT | Navi 22 | 2 424 | 1 988 | 2 560 | 2 560 | 64 | 12 | 192 | 12,4 | 382 | 230 |
RX 6750 XT | Navi 22 | 2 495 | 2 238 | 2 560 | 2 560 | 64 | 12 | 192 | 12,8 | 430 | 250 |
RX 6800 | Navi 21 | 1815 | 1 988 | 3 840 | 3 840 | 96 | 16 | 256 | 13,9 | 509 | 250 |
RX 6800 XT | Navi 21 | 2015 | 1 988 | 4 608 | 4 608 | 128 | 16 | 256 | 18,6 | 509 | 300 |
RX 6900 XT |
Navi 21 | 2015 | 1 988 | 5 120 | 5 120 | 128 | 16 | 256 | 20,6 | 509 | 300 |
RX 6950 XT | Navi 21 | 2100 | 2238 | 5 120 | 5 120 | 128 | 16 | 256 | 21,5 | 573 | 335 |
RX 7700 XT | Navi 32 | 2 544 | 2 238 | 3 456 | 6 912 | 96 | 12 | 192 | 35,2 | 430 | 245 |
RX 7800 XT | Navi 32 | 2 430 | 2 425 | 3 840 | 7 680 | 96 | 16 | 256 | 37,3 | 621 | 263 |
RX 7900 GRE | Navi 31 | 2 245 | 2 238 | 5 120 | 10 240 | 192 | 16 | 256 | 46,0 | 573 | 260 |
RX 7900 XT | Navi 31 | 2 400 | 2 487 | 5 376 | 10 752 | 192 | 20 | 320 | 51,6 | 796 | 315 |
RX 7900 XTX | Navi 31 | 2 500 | 2 487 | 6 144 | 12 288 | 192 | 24 | 384 | 61,4 | 955 | 355 |
Arc A750 | ACM-G10 | 2 400 | 2 000 | 3 584 | 3 584 | 112 | 8 | 256 | 17,2 | 512 | 225 |
Arc A770 | ACM-G10 | 2400 | 2000 / 2188 | 4 096 | 4 096 | 128 | 8 / 16 | 256 | 19,7 | 512 / 560 | 225 |
Arc B570 | BMG-G11 | 2 750 | 2 375 | 2 304 | 2 304 | 80 | 10 | 160 | 12,7 | 380 | 150 |
Arc B580 | BMG-G11 | 2 850 | 2 375 | 2 560 | 2 560 | 80 | 12 | 192 | 14,6 | 456 | 190 |
RTX 2070 | TU106 | 1 620 | 175 | 2 304 | 2 304 | 64 | 8 | 256 | 7,5 | 448 | 175 |
RTX 2070 SUPER | TU104 | 1 770 | 1 750 | 2 560 | 2 560 | 64 | 8 | 256 | 9,1 | 448 | 215 |
RTX 2080 | TU104 | 1 710 | 1 750 | 2 944 | 2 944 | 64 | 8 | 256 | 10,1 | 448 | 215 |
RTX 2080 SUPER | TU104 | 1 815 | 1 938 | 3 072 | 3 072 | 64 | 8 | 256 | 11,2 | 496 | 250 |
RTX 2080 Ti | TU102 | 1 545 | 1 750 | 4 352 | 4 352 | 88 | 11 | 352 | 13,5 | 616 | 250 |
RTX 3070 | GA104 | 1 725 | 1 750 | 2 944 | 5 888 | 96 | 8 | 256 | 20,3 | 448 | 220 |
RTX 3070 Ti | GA104 | 1 770 | 1 188 | 3 077 | 6 144 | 96 | 8 | 256 | 21,7 | 608 | 290 |
RTX 3080 | GA102 | 1 710 | 1 188 | 4352 | 8 704 | 96 | 10 | 320 | 29,8 | 760 | 320 |
RTX 3080 Ti | GA102 | 1 710 | 1 188 | 4 480 | 8 960 | 96 | 12 | 384 | 30,6 | 912 | 350 |
RTX 3090 | GA102 | 1 695 | 1 219 | 5 248 | 10 496 | 112 | 24 | 384 | 35,6 | 936 | 350 |
RTX 4070 | AD104 | 2 475 | 1 313 | 2 944 | 5 888 | 64 | 12 | 192 | 29,1 | 504 | 200 |
RTX 4070 SUPER | AD104 | 2 475 | 1 313 | 3 584 | 7 168 | 80 | 12 | 192 | 35,5 | 504 | 220 |
RTX 4070 Ti | AD104 | 2 610 | 1 313 | 3 840 | 7 680 | 80 | 12 | 192 | 40,1 | 504 | 285 |
RTX 4070 Ti SUPER | AD103 | 2 610 | 1 313 | 4 224 | 8 448 | 96 | 16 | 256 | 44,1 | 672 | 285 |
RTX 4080 SUPER | AD104 | 2 550 | 1 438 | 5 120 | 10 240 | 112 | 16 | 256 | 52,2 | 736 | 320 |
RTX 4090 | AD102 | 2 520 | 1 313 | 8 192 | 16 384 | 176 | 24 | 384 | 82,6 | 1 008 | 450 |
RTX 5070 | GB205 | 2 512 | 1 750 | 5 888 | 5 888 | 80 | 12 | 192 | 30,9 | 672 | 250 |
RTX 5070 Ti | GB203 | 2 452 | 1 750 | 8 960 | 8 960 | 96 | 16 | 256 | 43,9 | 896 | 300 |
RTX RTX 5080 | GB203 | 2 617 | 1 875 | 10 752 | 10 752 | 112 | 16 | 256 | 56,3 | 960 | 360 |
RTX 5090 | GB202 | 2 407 | 1 750 | 21 760 | 21 760 | 176 | 32 | 512 | 104,8 | 1 792 | 575 |
Rappelons qu'il est très difficile d'inférer les performances pratiques d'une carte graphique sur la seule base des valeurs brutes annoncées. Plusieurs raisons à cela, dont les fréquences réellement appliquées (qui diffèrent plus ou moins largement de celles officielles), mais aussi les subtilités architecturales quant aux conditions d'exécution de certaines unités ou l'impact par exemple des larges caches sur la bande passante mémoire effective. Toujours est-il que la GeForce RTX 5080 devance de 7,8 % en puissance de calcul et 30 % en bande passante mémoire la RTX 4080 SUPER qui dispose d'un AD103 intégral. Le cache L2 est de taille identique et le fillrate ne progresse que du différentiel de fréquences réellement appliqué entre nos exemplaires. Mettons donc à l'épreuve les valeurs théoriques en exécutant quelques tests synthétiques de bas niveau.
Tests synthétiques
Nous utilisons la suite de tests Geeks 3D pour estimer les performances synthétiques de la nouvelle venue, lors de l’exécution de certaines tâches particulières. Ainsi, PixMark Julia FP32 permet de mesurer la puissance de calcul brute en simple précision (FP32) et le fillrate qui en découle. Il dépend donc à la fois des unités de calcul et des ROP. Le test GiMark, s’attache de son côté à évaluer les performances de nos cartes au niveau de la géométrie (génération de primitives 3D). Enfin, TessMark permet de son côté de mesurer les capacités en tessellation des différentes cartes. Ces tests relativement brefs et spécifiques (n’utilisant donc qu’une partie des ressources totales des GPU) permettent aux modèles limités par leur température et/ou puissance électrique maximale autorisée, de conserver des fréquences plus élevées que lors d’une session de jeu par exemple.
Tests synthétiques - RTX 5080 FE
En matière de puissance de calcul brute, nous ne retrouvons dans notre test "que" 1 % d'avance pour la RTX 5080 sur la 4080 SUPER, autant dire rien. Comme nous l'expliquions plus haut, les ROPs n'évoluant pas entre les deux références, ces cartes sont plus ou moins équivalentes en termes de fillrate, dont le résultat du test dépend fortement. Côté géométrie, l'écart est cette fois de 44 %, mais inutile de se réjouir puisqu'il ne s'agit ici que d'un bug apparu sur AD103 suite à une évolution des pilotes et jamais corrigé depuis par Nvidia (mais qui à part nous se sert encore de tels tests, je vous le demande ?). Finissons par la tessellation, et ce sont cette fois 2 % d'écart entre AD103 et GB203, à nouveau rien ou presque. Gardez toutefois à l'esprit que ces tests utilisent des scènes avec des charges très spécifiques, ne correspondant pas vraiment à l'usage typique d'un rendu 3D complet. Qui plus est, ils s'appuient sur OpenGL, une API commençant à sérieusement dater.
Passons à présent à des tests synthétiques issus de 3DMark, en s’attachant à vérifier les capacités des cartes graphiques pour diverses fonctionnalités. DXR, au nom explicite, sollicite de manière intensive les capacités d’accélération du Ray Tracing par le GPU, au travers de l’API de Microsoft. Sans raison valable, la nouvelle venue se montre bien moins rapide que sa devancière dans ce domaine. Le même phénomène touchait la RTX 5090, un bug à n'en pas douter comme le corrobore le benchmark Port Royal de 3DMark et dédié au RT également, montrant cette fois un avantage des nouvelles-nées. Mesh Shader évalue la capacité de traitement de ces derniers par les GPU modernes. Le test permet de comparer les performances avec et sans Mesh Shaders actifs, mais cette représentation ne permet pas une comparaison pertinente entre cartes. Nous affichons donc les performances de chaque référence avec Mesh Shaders actifs. La RTX 5080 ne parvient pas à se démarquer de sa devancière, une fois encore.
Tests fonctionnalités - RTX 5080 FE
Le test PCIe renvoie un résultat moins incohérent que celui de sa grande soeur, mais toujours surévalué. ll s'agit ici aussi d'un bug à corriger, nous mettrons donc à jour les résultats une fois le logiciel adapté aux nouvelles venues. Le test Sampler Feedback mesure de son côté l’impact de cette fonctionnalité introduite (comme la plupart des autres) par les cartes Turing. Cette fois, c'est un gain de 20 % pour la nouvelle venue, probablement bien aidée par sa bande mémoire ici, à l'instar de sa grande sœur. Enfin, le test VRS, abréviation de Variable Rate Shading, permet de mesurer le gain apporté par cette fonctionnalité lorsqu’elle est activée. Là aussi, il s'agit d'une comparaison entre 2 passes, nous préférons donc reporter ici aussi le score atteint par chaque carte une fois la fonctionnalité activée, permettant ainsi une comparaison brute entre elles. La RTX 5080 dispose ici d'un micro avantage de 4 % sur la 4080 SUPER.
Merci!
Merci pour le test.
Une génération à oublier pour moi, tant les gains ne sont pas significatifs.
Le MFG est quand même intéressant.
très bon test comme toujours
dommage ça stagne un peu
il manque une 5080 ti avec un gb202 castré en bus 384 bits gros écart entre les 2 50
le modèle fe n'a apparemment plus de metal liquid et a délaissé aussi la chambre a vapeur pour des caloduc "simple" du coup bien que la consommation baisse pas mal le bruit s'améliore de très peu et la carte reste un peu audible
je me doute que nvidia a voulu / doit faire des économies mais c'est une carte a quand meme 999 $ j'aurais plus vu une chambre a vapeur simplifié mais chambre a vapeur tout de meme
la version caloduc serait plus allé pour une 5070 ti si elle avait existé
vivement une nouvelle gravure pour plus de nouveauté j'aurais appelé cette gen rtx 45 plus que 50 au vu des maigre améliorations
Je viens d'ajouter le lien vers les pages du démontage de la carte par TPU.
c'est la ou j'ai vu
C'est de la bonne came
Autant la 4080 elle etait un peu juste pour remplacer une 3080, autant une 5080 ca fait du X2 partout, meme au niveau du debit DisplayPort, ca tombe bien, c'est ce que je demande pour un upgrade
Je vais peut etre attendre les modeles 24Go quand meme, pour le futur c'est mieux
Merci pour cet excellent banc d'essai !
Malheureusement, il démontre la totale inutilité de Blackwell, en tout cas à ce niveau de la gamme.
Espérons que les 5070(Ti) ferons nettement mieux que les 4070(Ti) Super, sinon on voit vraiment mal l'intérêt des RTX 5000, et la RTX 5090 aurait tout aussi bien pu être la seule dans la gamme, voire être référencée comme RTX 4090 Titan...
On se répète, mais merci pour le test les copains !
Aucune surprise sur le test d'une objectivité incroyable......
Bon je vais attendre quelques mois pour remplacer ma 3080 ti, merci nividia de proposer une 5080 à un tarif intéressant.
Merci pour le test, très intéressant.
Bon au final à part en 4K et MFG rien de neuf. Un peu déçu ! Et on peu presque affirmer que la 5070 Ti n'ira pas chercher la 4080 Super.
Vivement un test de la 5070, 5060Ti et les AMD à côté pour potentiellement une guerre de prix. Qui sait.
Côté dissipation, le rad de la 5090 sur la 5080 marche plutôt bien !