Gigabyte RTX 5050 Gaming

Spécifications

Avant d'aborder les spécifications des différentes cartes lancées, un mot rapide sur les GPU et procédés de fabrication associés. Commençons par Intel qui se contentait de 2 GPU jusqu'à peu : l'ACM-G10 pour les solutions moyen de gamme et performance (ARC A770/750 et théoriquement A5xx que nous n'avons jamais vues) et l'ACM-G11 pour l'entrée de gamme (ARC A3xx). Intel est un fondeur, mais plutôt que de faire appel à ses propres capacités de production, il sous-traite la gravure de ces 2 puces à TSMC via son procédé de fabrication N6, une optimisation du nœud 7 nm. Clairement dépassé en termes de densité ou de performance par le 5 nm (et maintenant 3 nm) du géant taïwanais des semiconducteurs, ce procédé de fabrication a l'avantage d'être bien moins cher. ACM-G10 est une puce plutôt conséquente, avec un peu plus de 400 mm² de surface et pas moins de 21,7 milliards de transistors. Son petit frère se contente de 157 mm² pour 7 milliards de transistors. À cela s'ajoute à présent BMG-G11, utilisant cette fois le même node qu'AMD et Nvida, à savoir le 5 nm de TSMC et que l'on retrouve sur la B580 et B570. De quoi caser 19,6 milliards de transistors sur 272 mm². La densité progresse, mais reste bien moindre que celle de la concurrence, et ce même si les méthodes de comptages peuvent différer. Elle résulte probablement d'un design moins optimisé et de davantage d'interfaces moins denses.  

NVIDIA utilise de son côté le 4N de TSMC, une déclinaison "personnalisée" du très performant 5 nm, sur l'intégralité de sa série RTX 40, mais aussi 50. Pas moins de 9 GPU différents ont été conçus, allant de GB202 intégrant plus de 92 milliards de transistors sur une superficie de 750 mm² et animant la RTX 5090, au petit GB207 se contentant de 149 mm² pour presque 17 milliards et affecté cette fois à la RTX 5050. Entre ces 2 extrêmes se trouvent les puces AD 102 (RTX 4090),  AD103 (RTX 4070 Ti SUPER / RTX 4080 / RTX 4080 SUPER), GB203 (RTX 5080 / 5070 Ti), AD104 (RTX 4070 Ti / RTX 4070 / RTX 4070 SUPER), GB205 (RTX 5070), AD106 (RTX 4060 Ti), GB206 (RTX 5060 / RTX 5060 Ti) et AD107 (RTX 4060) par ordre décroissant de superficie et complexité. Ces références monopolisent le haut du classement (à l'exception de la première marche) en matière de densité de transistors par mm², multipliant pratiquement par trois cette valeur en comparaison du précédent N8 de Samsung utilisé par la génération Ampere (RTX 30). Il existe donc une différence très conséquente entre ces 2 nœuds de gravure, et ce contrairement à ce que laisseraient penser leurs nomenclatures commerciales respectives. Le N8 est en fait une optimisation du node 10nm, NVIDIA "enjambant" donc le 7 nm pour passer directement au 5 nm, soit un saut de 2 générations. On notera tout de même que la génération Blackwell est légèrement moins dense qu'Ada Lovelace, du fait de différences de conception.

AMD a de son côté opté pour un "en même temps" au moyen de chiplets avant de revenir à une conception monolithique pour sa nouvelle génération (cf. fin de paragraphe). Le N5 de TSMC est donc dévolu aux GCD, alors que les MCD doivent de leur côté se contenter du N6, tout comme Navi 33. Ce dernier, purement monolithique, mesure 204 mm² pour 13,3 milliards de transistors et se charge d'animer les RX 7600 et RX 7600 XT. À l'autre bout de la gamme, les 6 MCD plus le GCD d'un Navi 31 complet occupent une superficie totale de presque 530 mm², pour 57,7 milliards de transistors. La densité est donc légèrement moindre que sur les puces intégralement en 4N du caméléon, mais finalement pas si éloignée malgré le mix des nœuds de gravure. Cela tendrait à corroborer l'assertion d'AMD quant aux faibles gains (en densité au moins) à attendre d'une gravure plus fine pour certains éléments constitutifs d'un GPU. Les RX 7900 XTX / 7900 XT et 7900 GRE emploient un tel GPU. Enfin, Navi 32 des RX 7700 XT et 7800 XT couple un GCD de 200 mm² gravé en 5 nm, à 4 MCD gravés en 6 nm par TSMC. La partie logique étant fortement réduite sur ce nouveau GCD, la densité va finalement se positionner entre celle de Navi 33 et Navi 31. En 2025, AMD a lancé Navi 48 & Navi 44, des puces monolithiques utilisant le procédé N4P de TSMC. La densité augmente drastiquement par rapport à la génération précédente qui devait jongler entre deux procédés. De quoi en faire les puces les plus denses que l'on retrouve à l'heure actuelle sur des cartes graphiques grand public, à savoir les RX 9070 / 9070 XT et RX 9060 XT.

GPU
Process
Nombre de transistors Superficie die Densité (Millions de transistors par mm²)
Navi 48 N4P TSMC 53,9 milliards 357 mm² 151
Navi 44 N4P TSMC 29,7 milliards 199 mm² 149,2
AD102 4N TSMC 76,3 milliards 608,5 mm² 125,4
GB202 4N TSMC 92,2 milliards 750 mm² 122,9
AD106 4N TSMC 22,9 milliards 187,8 mm² 121,9
AD104 4N TSMC 35,8 milliards 294,5 mm² 121,6
AD103 4N TSMC 45,9 milliards 378,6 mm² 121,2
GB206 4N TSMC 21,9 milliards 181 mm² 121
GB203 4N TSMC 45,6 milliards 378 mm² 120,6
AD107 4N TSMC 18,9 milliards 158,7 mm² 119,1
GB205 4N TSMC 31,1 milliards 263 mm² 118,3
GB207 4N TSMC 16,9 milliards 149 mm² 113,4
Navi 31 N5 + N6 TSMC 57,7 milliards 529,5 mm² 109
Navi 32 N5 + N6 TSMC 28,1 milliards 350 mm² 80,3
BMG-G21 N5 TSMC 19,6 milliards 272 mm² 72,1
GA100 7N TSMC 54.2 milliards 826 mm² 65,6
Navi 33 N6 TSMC 13,3 milliards 204 mm² 65,2
ACM-G10 N6 TSMC 21,7 milliards 406 mm² 53,4
Navi 21 N7P TSMC 26,8 milliards 520 mm² 51,6
Navi 22 N7P TSMC 17,2 milliards 335 mm² 51,3
Navi 24 N6 TSMC 5,4 milliards 107 mm² 50,5
Navi 23 N7P TSMC 11,1 milliards 237 mm² 46,8
ACM-G11 N6 TSMC 7,2 milliards 157 mm² 45,9
GA102 8N Samsung 28,3 milliards 628,4 mm² 45
GA104 8N Samsung 17,4 milliards 392 mm² 44,4
GA106 8N Samsung 12 milliards 276 mm² 43,5
Navi 10 N7P TSMC 10,3 milliards 251 mm² 41
Vega 20 N7FF TSMC 13.2 milliards 331 mm² 39,9
Vega 10 14LPP GF 12.5 milliards 495 mm² 25,3
TU104 12FFC TSMC 13,6 milliards 545 mm² 25
TU102 12FFC TSMC 18,6 milliards 754 mm² 24,7
TU106 12FFC TSMC 10,8 milliards 445 mm² 24,3

Détaillons à présent les caractéristiques des cartes employant ces GPU en comparaison d’un certain nombre de cartes des segments performance des générations actuelles et précédentes.

Cartes GPU Fréq. Boost GPU (MHz) Fréq. Mémoire (MHz)

SP
/
CC

ALU FP32 ROP VRAM (Go) Bus mem. (bits) Calcul SP (Tflops) Bande Passante mémoire (Go/s) TGP (W)
RXX 5600 XT Navi 10 1 560 1 500 2 304 2 304 64 6 192 7,2 288 150
RX 5700 Navi 10 1 725 1 750 2 304 2 304 64 8 256 7,9 448 180
RX 5700 XT Navi 10 1 905 1 750 2 560 2 560 64 8 256 9,8 448 225
RX 6500 XT Navi 24 2 610 2238 1 024 1 024 32 4 64 5,3 143 107
RX 6600 XT Navi 23 2 589 1 988 2 048 2 048 64 8 128 10,6 254 160
RX 6650 XT Navi 23 2 635 2 188 2 048 2 048 64 8 128 10,8 280 176
RX 6700 XT Navi 22 2 424 1 988 2 560 2 560 64 12 192 12,4 382 230
RX 6750 XT Navi 22 2 495 2 238 2 560 2 560 64 12 192 12,8 430 250
RX 7600 Navi 33 2 655 2 238 2 048 4 096 64 8 128 21,7 286 165
RX 7600 XT Navi 33 2 755 2 238 2 048 4 096 64 16 128 22,6 286 190
RX 7700 XT Navi 32 2 544 2 238 3 456 6 912 96 12 192 35,2 430 245
RX 7800 XT Navi 32 2 430 2 425 3840 7 680 96 16 256 37,3 621 263
RX 9060 XT Navi 44 3 130 2 505 2 048 4 096 64 8 / 16 128 25,6

321

150 / 160
RX 9070 Navi 48 2 520 2 505 3 584 7 168 128 16 256 36,1 641 220
RX 9070 XT Navi 48 2 970 2 505 4 096 8 192 128 16 256 48,7 641 304
Arc A750 ACM-G10 2 400 2 000 3 584 3 584 112 8 256 17,2 512 225
Arc A770 ACM-G10 2400 2000 / 2188 4 096 4 096 128 8 / 16 256 19,7 512 / 560 225
Arc B570 BMG-G11 2 750 2 375 2 304 2 304 80 10 160 12,7 380 150
Arc B580 BMG-G11 2 850 2 375 2 560 2 560 80 12 192 14,6 456 190
RTX 2060 SUPER TU106 1 650 1 750 2 176 2 176 64 8 256 7,2 448 175
RTX 2070 TU106 1 620 1 750 2 304 2 304 64 8 256 7,5 448 175
RTX 2070 SUPER TU104 1 770 1 750 2 560 2 560 64 8 256 9,1 448 215
RTX 3050 GA106/7 1 777 1 750 1 280 2 560 32 8 128 9,1 224 130
RTX 3060 GA106 1 777 1 875 1 792 3 584 48 12 192 12,7 360 170
RTX 3060 Ti GA104 1 665 1 750 2 432 4 864 80 8 256 16,2 448 200
RTX 3070 GA104 1 725 1 750 2 944 5 888 96 8 256 20,3 448 220
RTX 3070 Ti GA104 1 770 1 188 3 077 6 144 96 8 256 21,7 608 290
RTX 4060 AD107 2 460 2 125 1 536 3 072 48 8 128

15,1

272 115
RTX 4060 Ti AD106 2 535 2 250 2 176 4 352 48 8 / 16 128 22,1 288 160 / 165
RTX 4070 AD104 2 475 1 313 2 944 5 888 64 12 192 29,1 504 200
RTX 4070 SUPER AD104 2 475 1 313 3 584 7 168 80 12 192 35,5 504 220
RTX 4070 Ti AD104 2 610 1 313 3 840 7 680 80 12 192 40,1 504 285
RTX 4070Ti SUPER AD103 2 610 1 313 4 224 8 448 96 16 256 44,1 672 285
RTX 5050 GB207 2 572 2 500 2 560 2 560 32 8 128 13,2 320 130
RTX 5060 GB206 2 500 1 750 3 840 3 840 48 8 128 19,2 478 150
RTX 5060 Ti GB206 2 572 1 750 4 608 4 608 48 8 / 16 128 23,7 438 180
RTX 5070 GB205 2 512 1 750 6 144 6 144 80 12 192 30,9 672 250
RTX 5070 Ti GB203 2 452 1 750 8 960 8 960 96 16 256 43,9 896 300

Rappelons qu'il est très difficile d'inférer les performances pratiques d'une carte graphique sur la seule base des valeurs brutes annoncées. Plusieurs raisons à cela, dont les fréquences réellement appliquées (qui diffèrent plus ou moins largement de celles officielles), mais aussi les subtilités architecturales quant aux conditions d'exécution de certaines unités ou l'impact par exemple des larges caches sur la bande passante mémoire effective. La GeForce RTX 5050 dispose d'une puissance de calcul inférieure de 12,5 % en comparaison de la RTX 4060. C'est pire face à la RTX 5060 (~31%). Côté bande passante mémoire, avantage cette fois à la nouvelle née (+11%) face à la RTX 4060, par contre elle cède à nouveau une trentaine de pourcents (33 exactement) à la 5060 disposant de GDDR7. Mettons donc à l'épreuve ces spécifications techniques en exécutant quelques tests synthétiques de bas niveau.

Tests synthétiques

Nous utilisons la suite de tests Geeks 3D pour estimer les performances synthétiques de la nouvelle venue, lors de l’exécution de certaines tâches particulières. Ainsi, PixMark Julia FP32 permet de mesurer la puissance de calcul brute en simple précision (FP32) via le fillrate qui en découle. Il dépend donc à la fois des unités de calcul et des ROPs. Le test GiMark, s’attache de son côté à évaluer les performances de nos cartes au niveau de la géométrie (génération de primitives 3D). Enfin, TessMark permet de son côté de mesurer les capacités en tesselation des différentes cartes. Ces tests relativement brefs et spécifiques (n’utilisant donc qu’une partie des ressources totales des GPU) permettent aux modèles limités par leur température et/ou puissance électrique maximale autorisée, de conserver des fréquences plus élevées que lors d’une session de jeu par exemple.

Tests synthétiques - RTX 5050

1Images par seconde - Le plus élevé est le meilleur Titre Couleur PixMark Julia FP32 GiMark TessMark \nTitre Court PixMark GiMark TessMark \nSous-titre 0.7.0 - OpenGL 3.0 - 1440P 0.7.0 - OpenGL 3.3 - 1440P 0.7.0 - OpenGL 4.0 - 1440P - X64 \nGigabyte RX 6600 Eagle #ED1C24 1242 189 353 \nGigabyte RX 6600 XT Gaming Pro OC #ED1C24 1633 201 385 \nGigabyte RX 7600 Gaming OC #ED1C24 1996 151 316 \nGigabyte RX 7600 XT Gaming OC #ED1C24 2073 154 321 \nAsus RX 9060 XT Dual 8 Go #ED1C24 2591 264 479 \nGigabyte RX 9060 XT Gaming OC 16 Go #ED1C24 2740 267 498 \nARC A750 LE #0068B5 1792 294 259 \nARC A770 LE #0068B5 2071 328 262 \nASRock B570 Challenger #0068B5 1534 252 301 \nARC B580 LE #0068B5 1751 281 334 \nGigabyte RTX 3050 Eagle #76B900 1063 99 257 \nZotac RTX 3060 Gaming Twin Edge #76B900 1431 133 348 \nAsus RTX 4060 Dual #76B900 1697 203 517 \nGeForce RTX 4060 Ti FE #76B900 2168 247 678 \nMSI RTX 4060 Ti Ventus 3X OC 16 Go #76B900 2135 237 653 \n**Gigabyte RTX 5050 Gaming OC** #76B900 1431 181 456 \nMSI RTX 5060 Shadow 2X OC #76B900 1901 205 635 \nInno 3D RTX 5060 Ti Twin X2 8 Go #76B900 2227 242 694 \nGainward RTX 5060 Ti Python III OC 16 Go #76B900 2208 237 680

En matière de fillrate, la RTX 5050 fait jeu égal avec la RTX 3060, largement devancée donc par la RTX 4060 qui en sus de la puissance de calcul brute, dispose aussi d'un avantage côté ROP (48 vs 32). Côté géométrie, c'est un peu moins déséquilibré, puisque la nouvelle venue ne lâche "que" 12,5% à la RTX 4060, correspondant au différentiel côté TPC contenant les polymorph engines chargés de ces tâches. Étant aussi responsables de la tesselation, l'écart est donc inchangé entre ces deux références pour ce dernier test. Gardez tout de même à l'esprit que ces tests utilisent des scènes avec des charges très spécifiques, ne correspondant pas vraiment à l'usage typique d'un rendu 3D complet. Qui plus est, ils s'appuient sur OpenGL, une API commençant à sérieusement dater.

Passons à présent à des tests synthétiques issus de 3DMark, en s’attachant à vérifier les capacités des cartes graphiques pour diverses fonctionnalités. DXR, au nom explicite, sollicite de manière intensive les capacités d’accélération du Ray Tracing par le GPU, au travers de l’API de Microsoft. RDNA 4 marque un réel tournant à ce niveau si bien que les RX 9060 XT parviennent à talonner la RTX 5060. De son côté, la RTX 5050 s'approche de la RTX 4060. Mesh Shader évalue la capacité de traitement de ces derniers par les GPU modernes. Le test permet de comparer les performances avec et sans Mesh Shaders actifs, mais cette représentation ne permet pas une comparaison pertinente entre cartes. Nous affichons donc les performances de chaque référence avec Mesh Shaders actifs. A nouveau la RTX 5050 talonne la RTX 4060.

Tests fonctionnalités - RTX 5050

2 Titre Couleur 3DMark: DXR 3DMark: Mesh Shader 3DMark: PCIe Bandwidth 3DMark: Sampler Feedback 3DMark: Variable Rate Shading \nTitre Court DXR Mesh Shader PCIe Bandwidth Sampler Feedback Variable Rate Shader \nSous-titre 1.0.0.4 - DXR - 1440P 1.0.1.1 - DX12U - 2160P 1.0.1.25 - DX12 - 2160P 1.0.4.1 - DX12U - 2160P 1.1.6.77 - DX12 - 2160P \nAxe x Images par seconde - Le plus élevé est le meilleur Images par seconde - Le plus élevé est le meilleur Go/s - Le plus élevé est le meilleur Images par seconde - Le plus élevé est le meilleur Images par seconde - Le plus élevé est le meilleur \nGigabyte RX 6600 Eagle #ED1C24 13.3 293.6 14.3 196.0 93.6 \nGigabyte RX 6600 XT Gaming Pro OC #ED1C24 16.3 326.1 14.3 230.5 119.0 \nGigabyte RX 7600 Gaming OC #ED1C24 19.7 272.4 14.4 263.4 128.2 \nGigabyte RX 7600 XT Gaming OC #ED1C24 20.3 273.1 14.3 263.3 132.8 \nAsus RX 9060 XT Dual 8 Go #ED1C24 30.7 344.1 55.2 392.6 168.1 \nGigabyte RX 9060 XT Gaming OC 16 Go #ED1C24 33.9 349.9 55.2 393.2 182.6 \nARC A750 LE #0068B5 28.8 405.6 23.4 347.4 108.8 \nARC A770 LE #0068B5 31.8 438.1 23.4 369.9 118.5 \nASRock B570 Challenger #0068B5 26.4 343.8 14.4 371.9 96.8 \nARC B580 LE #0068B5 30.5 411.6 14.4 427.6 113.2 \nGigabyte RTX 3050 Eagle #76B900 13.9 207.4 13.4 206.4 75.0 \nZotac RTX 3060 Gaming Twin Edge #76B900 18.8 281.8 26.9 293.9 102.3 \nAsus RTX 4060 Dual #76B900 26.7 336.7 13.4 329.0 128.6 \nGeForce RTX 4060 Ti FE #76B900 38.5 441.9 13.4 396.5 171.3 \nMSI RTX 4060 Ti Ventus 3X OC 16 Go #76B900 37.1 431.1 13.4 385.9 164.4 \n**Gigabyte RTX 5050 Gaming OC** #76B900 25.0 331.3 28.9 304.5 117.6 \nMSI RTX 5060 Shadow 2X OC #76B900 35.8 411.6 28.9 424.3 156.2 \nInno 3D RTX 5060 Ti Twin X2 8 Go #76B900 43.0 513.5 28.9 477.0 186.9 \nGainward RTX 5060 Ti Python III OC 16 Go #76B900 42.2 504.0 28.9 471.2 187.0

Le test PCIe confirme les 8 lignes Gen 5.0 sur GB207. Sampler Feedback mesure de son côté l’impact de cette fonctionnalité introduite (comme la plupart des autres) par les cartes Turing. La RTX 5050 doit cette fois lâcher 8 % à la RTX 4060. Enfin, le test VRS, abréviation de Variable Rate Shading, permet de mesurer le gain apporté par cette fonctionnalité lorsqu’elle est activée. Là aussi, il s'agit d'une comparaison entre 2 passes, nous préférons donc reporter ici aussi le score atteint par chaque carte une fois la fonctionnalité activée, permettant ainsi une comparaison brute entre elles. Bis repetita avec cette fois un avantage de 9 % pour la RTX 4060 sur la nouvelle-née. 

Eric


  • Elle est pas exceptionnelle mais en entrée de gamme elle réunit des bons compromis 

    Voir plus

Un commentaire

Laissez votre commentaire

Créez un compte pour personaliser votre avatar, débloquer davantage d'options de mise en forme et être notifié par mail en cas de réponse.
En réponse à Some User