Test • Les GPU haut de gamme Q3 2023

Spécifications

Avant d'aborder les spécifications des différentes cartes lancées, un mot rapide sur les GPU et procédés de fabrication associés. Commençons par le cas le plus simple, à savoir Intel qui se contente pour l'heure de 2 GPU : l'ACM-G10 pour les solutions moyen / haut de gamme (ARC A770/750 et futures A5xx) et l'ACM-G11 pour l'entrée de gamme (ARC A3xx). Intel est un fondeur, mais plutôt que de faire appel à ses propres capacités de production, il sous-traite la gravure de ces 2 puces à TSMC via son procédé de fabrication N6, une optimisation du nœud 7 nm. Clairement dépassé en termes de densité ou de performance par le 5 nm du géant taïwanais des semiconducteurs, ce procédé de fabrication à l'avantage d'être bien moins cher. ACM-G10 est une puce plutôt conséquente, avec un peu plus de 400 mm² de surface et pas moins de 21,7 milliards de transistors. Son petit frère se contente de 157 mm² et 7 milliards de transistors.

Nvidia de son côté a fait un choix totalement différent, en basculant l'intégralité de sa gamme sur le N4 de TSMC, une déclinaison "personnalisée" du très performant 5 nm. Pas moins de 5 GPU différents ont été conçus, allant d'AD102 intégrant plus de 76 milliards de transistors sur une superficie de 608 mm² et animant la RTX 4090, au petit AD107 se contentant de 159 mm² pour presque 19 milliards et affecté cette fois à la RTX 4060. Entre ces 2 extrêmes, se trouvent les AD103 (RTX 4080), AD104 (RTX 4070 Ti / RTX 4070) et AD106 (RTX 4060 Ti) par ordre décroissant de superficie et complexité. Ces 5 références monopolisent le haut du classement en termes de densité de transistors par mm², multipliant pratiquement par trois cette valeur en comparaison du précédent N8 de Samsung, du fait de la différence conséquente entre ces 2 nœuds de gravure, et ce contrairement à ce que laisserait penser leurs nomenclatures commerciales respectives. Le N8 est en fait une optimisation du Node 10nm, Nvidia "enjambant" donc le 7 nm pour passer directement au 5 nm.

AMD a lui opté pour un "en même temps" que ne renierait pas un homme politique français, ayant été élu à deux reprises à la magistrature suprême. Le N5 de TSMC est donc dévolu au GCD (cf. page précédente), alors que les MCD doivent de leur côté se contenter du N6, tout comme Navi 33. Ce dernier purement monolithique, mesure 204 mm² pour 13,3 milliards de transistors et se charge d'animer la RX 7600. À l'autre bout de la gamme, les 6 MCD plus le GCD d'un Navi 31 complet occupent une superficie totale de presque 530 mm² pour 57,7 milliards de transistors. La densité est donc légèrement moindre que sur les puces intégralement en 4N du caméléon, mais finalement pas si éloignée malgré le mix des nœuds de gravure. Cela tendrait à corroborer l'assertion d'AMD quant aux faibles gains (en densité au moins) à attendre d'une gravure plus fine pour certains éléments constitutifs d'un GPU. A noter que Navi 32 ne devrait plus tarder à pointer le bout de son nez si on en croit les dernières fuites. Il reprendrait un design par chiplet avec des MCD identiques (4 au maximum), couplés à un GCD plus petit que celui de Navi 31 et toujours gravés en 5 nm par TSMC

GPU	Process	Nombre de transistors	Superficie die	Densité (Millions de transistors par mm²)
AD102	4N TSMC	76,3 milliards	608,5 mm²	125,4
AD106	4N TSMC	22,9 milliards	187,8 mm²	121,9
AD104	4N TSMC	35,8 milliards	294,5 mm²	121,6
AD103	4N TSMC	45,9 milliards	378,6 mm²	121,2
AD107	4N TSMC	18,9 milliards	158,7 mm²	119,1
Navi 31	N5 + N6 TSMC	57,7 milliards	529,5 mm²	109
GA100	7N TSMC	54.2 milliards	826 mm²	65,6
Navi 33	N6 TSMC	13,3 milliards	204 mm²	65,2
ACM-G10	N6 TSMC	21,7 milliards	406 mm²	53,4
Navi 21	N7P TSMC	26,8 milliards	520 mm²	51,6
Navi 22	N7P TSMC	17,2 milliards	335 mm²	51,3
Navi 24	N6 TSMC	5,4 milliards	107 mm²	50,5
Navi 23	N7P TSMC	11,1 milliards	237 mm²	46,8
ACM-G11	N6 TSMC	7,2 milliards	157 mm²	45,9
GA102	8N Samsung	28,3 milliards	628,4 mm²	45
GA104	8N Samsung	17,4 milliards	392 mm²	44,4
GA106	8N Samsung	12 milliards	276 mm²	43,5
Navi 10	N7P TSMC	10,3 milliards	251 mm²	41
Vega 20	N7FF TSMC	13.2 milliards	331 mm²	39,9
GP102	16FFC TSMC	12 milliards	471 mm²	25,5
Vega 10	14LPP GF	12.5 milliards	495 mm²	25,3
GP100	16FFC TSMC	15,3 milliards	610 mm²	25,1
TU104	12FFC TSMC	13,6 milliards	545 mm²	25
TU102	12FFC TSMC	18,6 milliards	754 mm²	24,7
TU106	12FFC TSMC	10,8 milliards	445 mm²	24,3

Détaillons à présent les caractéristiques des cartes employant ces GPU en comparaison d’un certain nombre de cartes des segments performance, haut de gamme, et enthusiast, des générations précédentes.

Cartes	GPU	Fréq. Boost GPU (MHz)	Fréq. Mémoire (MHz)	SP / CC	ALU FP32	TMU	ROP	VRAM (Go)	Bus mem. (bits)	Calcul SP (Tflops)	Bande Passante mémoire (Go/s)	TGP (W)
RX Vega⁵⁶	Vega 10	1 471	800	3 584	3 584	224	64	8	2 048	10,5	410	210
RX Vega⁶⁴	Vega 10	1 546	946	4 096	4 096	256	64	8	2 048	12,7	484	295
Radeon VII	Vega 20	1 750	1 000	3 840	3 840	340	64	16	4 096	13,4	1 024	300
RX 5700	Navi 10	1 725	1 750	2 304	2 304	144	64	8	256	7,9	448	180
RX 5700 XT	Navi 10	1 905	1 750	2 560	2 560	160	64	8	256	9,8	448	225
RX 6700	Navi 22	2 174	1 988	2 304	2 304	144	64	10	160	10	318	175
RX 6700 XT	Navi 22	2 424	1 988	2 560	2 560	160	64	12	192	12,4	382	230
RX 6750 XT	Navi 22	2 495	2 238	2 560	2 560	160	64	12	192	12,8	430	250
RX 6800	Navi 21	1 815	1 988	3 840	3 840	240	96	16	256	13,9	509	250
RX 6800 XT	Navi 21	2 015	1 988	4 608	4 608	288	128	16	256	18,6	509	300
RX 6900 XT	Navi 21	2 015	1 988	5 120	5 120	320	128	16	256	20,6	509	300
RX 6950 XT	Navi 21	2 100	2 238	5 120	5 120	320	128	16	256	21,5	573	335
RX 7900 XT	Navi 31	2 400	2 500	5 376	10 752	336	192	20	320	51,6	800	315
RX 7900 XTX	Navi 31	2 500	2 500	6 144	12 288	384	192	24	384	61,4	960	355
ARC A750	ACM-G10	2 400	2 000	3 584	3 584	224	112	8	256	17,2	512	225
ARC A770	ACM-G10	2 400	2 000 / 2 188	4 096	4 096	256	128	8 / 16	256	19,7	512 / 560	225
GTX 1070	GP104	1 683	2 002	1 920	1 920	120	64	8	256	6,5	256	150
GTX 1070 Ti	GP104	1 683	2 002	2 432	2 432	152	64	8	256	8,2	256	180
GTX 1080	GP104	1 733	1 251	2 560	2 560	160	64	8	256	8,9	320	180
GTX 1080 Ti	GP102	1 582	1 376	3 584	3 584	224	88	11	352	11,3	484	250
RTX 2070	TU106	1 620	1 750	2 304	2 304	144	64	8	256	7,5	448	175
RTX 2070 SUPER	TU104	1 770	1 750	2 560	2 560	160	64	8	256	9,1	448	215
RTX 2080	TU104	1 710	1 750	2 944	2 944	184	64	8	256	10,1	448	215
RTX 2080 SUPER	TU104	1 815	1 938	3 072	3 072	192	64	8	256	11,2	496	250
RTX 2080 Ti	TU102	1 545	1 750	4 352	4 352	272	88	11	352	13,5	616	250
RTX 3070	GA104	1 725	1 750	2 944	5 888	184	96	8	256	20,3	448	220
RTX 3070 Ti	GA104	1 770	1 188	3 077	6 144	192	96	8	256	21,7	608	290
RTX 3080	GA102	1 710	1 188	4 352	8 704	272	96	10	320	29,8	760	320
RTX 3080 12 Go	GA102	1 710	1 188	4 480	8 960	280	96	12	384	30,6	912	350
RTX 3080 Ti	GA102	1 665	1 188	5 120	10 240	320	112	12	384	34,1	912	350
RTX 3090	GA102	1 695	1 219	5 248	10 496	328	112	24	384	35,6	936	350
RTX 3090 Ti	GA102	1 860	1 313	5 376	10 752	336	112	24	384	40	1 008	450
RTX 4070	AD104	2 475	1 313	2 944	5 888	184	64	12	192	29,1	504	200
RTX 4070 Ti	AD104	2 610	1 313	3 840	7 680	240	80	12	192	40,1	504	285
RTX 4080	AD103	2 505	1 400	4 864	9 728	304	112	16	256	48,7	717	320
RTX 4090	AD102	2 520	1 313	8 192	16 384	512	176	24	384	82,6	1 008	450

Rappelons qu'il est très difficile d'inférer les performances pratiques d'une carte graphique sur la seule base des valeurs brutes annoncées. Plusieurs raisons à cela, dont les fréquences réellement appliquées (qui diffèrent plus ou moins largement de celles officielles), mais aussi les subtilités que nous avons rappelées dans les pages architecturales, quant aux conditions d'exécution de certaines unités ou l'impact par exemple des larges caches sur la bande passante effective. Ces indispensables précisions apportées, une remarque sur la politique industrielle respective des concepteurs. Si Intel et AMD proposent systématiquement des références utilisant des puces intégrales ( 7900 XTX, A770) en sus de déclinaisons moins onéreuses voyant la désactivation de certains composants, Nvidia a une approche quelque peu différente.

Ainsi, la carte la plus performante des verts, la RTX 4090, utilise un AD102 dont 11 % des unités ont été désactivées, ainsi que 25 % du cache L2. Ce n'est pas une paille, mais cela permet de réduire les coûts en permettant la certification de puces partiellement défectueuses, comme étant aptes pour cette référence. Il en est de même à moindre échelle pour la RTX 4080 (95% d'AD103 complet). On peut supputer que les puces sans défaut sont prioritairement orientées vers le marché professionnel outrageusement dominé par les verts, où les prix de ventes et donc marges bien supérieures qui y sont pratiquées, peuvent s'accommoder d'un coût de production un peu plus élevé. Passons à présent à quelques tests synthétiques pour identifier les différents points forts/faibles des cartes testées.

Tests synthétiques

Nous utilisons la suite de tests Geeks 3D pour estimer les performances synthétiques de la nouvelle venue, lors de l’exécution de certaines tâches particulières. Ainsi, PixMark Julia FP32 permet de mesurer la puissance de calcul brute en simple précision (FP32) et le fillrate qui en découle. Il dépend donc à la fois des unités de calcul et des ROP. Le test GiMark, s’attache de son côté à évaluer les performances de nos cartes au niveau de la géométrie. Enfin, TessMark permet de son côté de mesurer les capacités en tessellation des différentes cartes. Ces tests étant relativement brefs et spécifiques (n’utilisant donc qu’une partie des ressources totales des GPU), ils permettent aux modèles limités par leur température et/ou puissance électrique maximale autorisée, de conserver des fréquences plus élevées que lors d’une session de jeu par exemple.

En matière de puissance brute, la RTX 4090 domine très largement les débats, suivie à bonne distance par les RTX 4080 et RX 7900 XTX. Ce test étant réalisé sous OpenGL, les performances des différentes cartes dépendent également de la qualité des pilotes pour cette API vieillissante. Pour la géométrie, vous noterez le résultat totalement erratique de la RTX 4080 (mais systématiquement reproductible), probablement un bug pilote. Précisons également à ce sujet, que Nvidia bride intentionnellement via les pilotes les performances de ses GeForce dans ce domaine, pour privilégier ses cartes professionnelles dans les logiciels fortement dépendant de la géométrie. Cela conduit à des écarts relativement faibles entre la RTX 4090 et les RX 7900. En tessellation, les cartes vertes profitent par contre d'un niveau de performance bien supérieur à la concurrence, alors que l'ARC A770 est de son côté vraiment à la peine.

Tests synthétiques - GPU Q3 2023

1Images par seconde - Le plus élevé est le meilleur Titre Couleur PixMark Julia FP32 GiMark TessMark \nTitre Court PixMark GiMark TessMark \nSous-titre 0.7.0 - OpenGL 3.0 - QHD 0.7.0 - OpenGL 3.3 - QHD 0.7.0 - OpenGL 4.0 - QHD - X64 \nRadeon RX 6700 XT #ED1C24 891 153 304 \nRadeon RX 6800 #ED1C24 1152 180 336 \nRadeon RX 6800 XT #ED1C24 1338 300 455 \nRadeon RX 6900 XT #ED1C24 1575 311 473 \nRadeon RX 7900 XT #ED1C24 1654 344 514 \nRadeon RX 7900 XTX #ED1C24 1947 359 505 \nARC A770 - 16 Go #0068B5 884 259 209 \nGeForce RTX 3070 #76B900 1116 177 427 \nGeForce RTX 3080 #76B900 1531 258 562 \nGeForce RTX 3090 #76B900 1783 306 651 \nGeForce RTX 4070 #76B900 1470 212 565 \nGeForce RTX 4070 Ti #76B900 1854 327 732 \nGeForce RTX 4080 #76B900 2190 260 916 \nGeForce RTX 4090 #76B900 3206 395 1215

Passons à présent à des tests synthétiques issus de 3DMark, en s’attachant à vérifier les capacités des cartes graphiques sur divers points. DXR, au nom explicite, sollicite de manière intensive les capacités d’accélération du Ray Tracing, GPU au travers de l’API de Microsoft. AMD annonçait "jusqu'à" 80 % de gains (probablement dans les cas les plus favorables), les valeurs mesurées ici entre générations sont moindres à +50% pour RDNA 3 par rapport à RDNA 2. C'est toute de même un beau progrès, la RX 7900 XTX revenant ainsi au niveau de la RTX 3090, qui était la référence de la génération passée (si on exclut la 3090 Ti sortie à la toute fin). Cependant, Ada apporte dans le même temps encore plus de gains à ce niveau en comparaison d'Ampere, si bien qu'un "simple AD104" suffit à devancer Navi 31 (intégral) de 20 % dans ce domaine, alors que GA104 (qui était même plus haut dans la hiérarchie des puces Nvidia en l'absence de GA103 au lancement), n'y parvenait pas vis-à-vis de Navi 21. Intel s'en sort également bien, avec une ARC A770 au niveau d'une 6800 XT, malgré un GPU d'une gamme là aussi moindre, preuve s'il fallait en ajouter une, de la faiblesse des Ray Accelerator sur RDNA 2 (malheureusement base des consoles ce qui limite l'usage du RT que font/feront la plupart des développeurs).

Mesh Shader évalue la capacité de traitement de ces derniers par les GPU modernes. Le test permet de comparer les performances avec et sans Mesh Shaders actifs, mais cette représentation ne permet pas une comparaison pertinente entre cartes. Nous affichons donc les performances de chaque référence avec Mesh Shaders actifs. À nouveau le trio AD102/103/104 domine les débats. Le test PCIe mesure le débit de l’interface éponyme et confirme ici l’usage de 16 lignes PCIe 4.0 pour tous les GPU testés. On notera que les cartes d’AMD disposent systématiquement d’un petit avantage à ce niveau. Le test Sampler Feedback, mesure de son côté l’impact de cette fonctionnalité introduite par les cartes Turing, via le Texture Space Shading. La RX 7900 XTX talonne cette fois la RTX 4080, inutile de préciser celle qui domine les débats. Finissons par le test VRS, abréviation de Variable Rate Shading, permettant de mesurer le gain apporté par cette fonctionnalité lorsqu’elle est activée. Là aussi, le test affichant une comparaison entre 2 passes, nous préférons reporter ici le score atteint par chaque carte une fois la fonctionnalité activée, permettant ainsi une comparaison brute entre elles. Pas de changement de hiérarchie notable par rapport au test précédent.

Tests fonctionnalités - GPU Q3 2023

1Images par seconde - Le plus élevé est le meilleur Titre Couleur 3DMark: DXR 3DMark: Mesh Shader 3DMark: PCIe Bandwidth 3DMark: Sampler Feedback 3DMark: Variable Rate Shading \nTitre Court DXR Mesh Shader PCIe Bandwidth Sampler Feedback Variable Rate Shader \nSous-titre i/s - 2.26.8125 - QHD i/s - 2.26.8125 - UHD Go/s - 2.26.8125 - UHD i/s - 2.26.8125 - UHD i/s - 2.26.8125 - UHD \nRadeon RX 6700 XT #ED1C24 19.7 345.8 26.6 342.5 133.5 \nRadeon RX 6800 #ED1C24 26.8 438.1 26.7 437.1 164.5 \nRadeon RX 6800 XT #ED1C24 33.2 554.6 26.6 486.9 193.7 \nRadeon RX 6900 XT #ED1C24 37.3 576.7 26.7 514.7 225.2 \nRadeon RX 7900 XT #ED1C24 47.9 601.1 26.0 677.0 262.7 \nRadeon RX 7900 XTX #ED1C24 56.3 611.0 25.8 784.2 321.3 \nARC A770 - 16 Go #0068B5 32.5 437.7 22.6 359.7 119.2 \nGeForce RTX 3070 #76B900 32.8 450.7 24.0 457.9 159.6 \nGeForce RTX 3080 #76B900 47.7 588.4 24.0 614.5 214.6 \nGeForce RTX 3090 #76B900 57.1 643.7 24.0 718.5 248.9 \nGeForce RTX 4070 #76B900 51.5 519.5 24.1 560.6 220.1 \nGeForce RTX 4070 Ti #76B900 68.3 710.1 24.0 674.3 287.8 \nGeForce RTX 4080 #76B900 84.7 891.1 24.1 879.6 362.4 \nGeForce RTX 4090 #76B900 136.7 1076.8 24.1 1261.7 551.4

Voilà pour les spécifications des différentes cartes et leurs performances synthétiques, détaillons page suivante le protocole de test.

Campi

·

23 Août 2023 - 13:13

Merci pour ce gros test !

Voir plus
Bob

·

23 Août 2023 - 17:05

Super boulot ! Merci ! Les explications de fonctionnement sont super informatives.

Je pourrai abuser et demander l'ajout de la gamme en dessous : une 3060, une 4060, une 6600 de chez dédé ? ou tout du moins l'une d'elle ? :oS

Sinon ce serait super d'avoir une représentation des résultats en 3D (interactive ?) x: perf synthétique sur les 20 jeux, y: nuisance sonore, z: conso ... bon pi quand les humains auront évolué pour le percevoir, un 4ème axe "prix" ça serait au poil :D car c'est un peu de cette optimisation que chacun prend sa décision d'achat ;) Et ça serait marrant de voir des gros outliers sortant du lot.

Voir plus
- Eric B.
  
  ·
  
  23 Août 2023 - 18:45
  
  Je pourrai abuser et demander l'ajout de la gamme en dessous : une 3060, une 4060, une 6600 de chez dédé ? ou tout du moins l'une d'elle ? :oS
  
  Alors non, désolé et ce pour une raison simple : ces cartes ne sont pas adaptées du tout pour les définitions et réglages sélectionnés pour ce dossier. Même parmi l'échantillon de test, certaines références se retrouvent dans une situation inconfortable parce qu'elle ne sont pas utilisées dans leur plage adaptée (principalement en UHD). Le souci, c'est que cela conduit à une hiérarchie pour ces cartes qui n'est pas pertinente (parce que structurellement (plus de VRAM, de ROP, etc.) la référence A serait moins limitée que la référence B dans ces conditions qui ne font pas partie de leur plage nominale et ce même si cela ne rend pas le réglage jouable pour autant) et qui pourra induire en erreur le lecteur qui se contente de regarder l'indice moyen (et il y en a bcp).
  
  C'est pour ça que je suis contre les plages de références trop larges du fait de ce biais. On pourrait le contourner partiellement en rajoutant le FHD en plus des QHD/UHD, mais d'une part cela va multiplier de manière conséquente la durée des mesures (et le risque qu'une nouvelle version de pilotes ou un patch de jeu sorte obligeant à reprendre toutes les cartes déjà testées), et d'autre part la pertinence retrouvée via cette nouvelle définition pour ces cartes entrainera aussi une absence de pertinence (pour cette même définition) pour certaines autres références qui pour le coup vont être totalement limitées par le CPU et se tourner les pouces rendant la hiérarchie biaisée à nouveau même si pour d'autres raisons. Nous avons toutefois réalisé d'autres dossiers où l'on retrouve des références communes qui permet d'extrapoler quelque peu le positionnement des références demandées.
  
  Sinon ce serait super d'avoir une représentation des résultats en 3D (interactive ?) x: perf synthétique sur les 20 jeux, y: nuisance sonore, z: conso
  
  Nos graphs dynamiques ne permettent pas de folie de ce genre pour le moment, mais probablement un type radar à l'avenir. Par contre les nuisances sonores sont fortement liées à la version choisie : on ne peut pas inférer ce que sera le niveau d'une Asus, Gigabyte, MSI, etc. en se basant sur la prestation à ce niveau de la carte de référence.
  
  un 4ème axe "prix" ça serait au poil
  
  Pour ça il y a nos guides d'achat, ils vont être remis à jour prochainement.
  
  Voir plus
Nicolas D.

·

23 Août 2023 - 23:37

Ça c'est du test de qualité (et de quantité) non de diou ! Merci Riton pour l'investissement !

Voir plus
Shun Wick

·

24 Août 2023 - 08:37

Je me suis régalé en page 2 3 4, c'est tellement bien détaillé !

Merci pour le test Eric, comme d'hab' au top!

Voir plus
- Eric B.
  
  ·
  
  24 Août 2023 - 10:10
  
  Content que ça t'ait plu 😉
  
  Voir plus

Test • Les GPU haut de gamme Q3 2023

Spécifications

Tests synthétiques

Tests synthétiques - GPU Q3 2023

Tests fonctionnalités - GPU Q3 2023

6 commentaires

Laissez votre commentaire

Lire aussi...

Panther Lake analysé, promesse de la consommation de Lunar Lake alliée aux performances d'Arrow Lake

Une centaine de GeForce RTX 5090 profitant du soleil dans une rue en Chine ? MSI s'explique

Radeon 9070 XT : un second cas de connecteur 16 pins brulé...

Test • Les GPU haut de gamme Q3 2023

Spécifications

Tests synthétiques

Tests synthétiques - GPU Q3 2023

Tests fonctionnalités - GPU Q3 2023

6 commentaires

Laissez votre commentaire

Lire aussi...

Panther Lake analysé, promesse de la consommation de Lunar Lake alliée aux performances d'Arrow Lake

Une centaine de GeForce RTX 5090 profitant du soleil dans une rue en Chine ? MSI s'explique

Radeon 9070 XT : un second cas de connecteur 16 pins brulé...

Une centaine de GeForce RTX 5090 profitant du soleil dans une rue en Chine ? MSI s'explique

Radeon 9070 XT : un second cas de connecteur 16 pins brulé...