Banniere Intel Arc B580

Spécifications

Avant d'aborder les spécifications des différentes cartes lancées, un mot rapide sur les GPU et procédés de fabrication associés. Commençons par Intel qui se contentait de 2 GPU jusqu'à présent : l'ACM-G10 pour les solutions moyen de gamme et performance (ARC A770/750 et théoriquement A5xx que nous n'avons jamais vues) et l'ACM-G11 pour l'entrée de gamme (ARC A3xx). Intel est un fondeur, mais plutôt que de faire appel à ses propres capacités de production, il sous-traite la gravure de ces 2 puces à TSMC via son procédé de fabrication N6, une optimisation du nœud 7 nm. Clairement dépassé en termes de densité ou de performance par le 5 nm (et maintenant 3 nm) du géant taïwanais des semiconducteurs, ce procédé de fabrication à l'avantage d'être bien moins cher. ACM-G10 est une puce plutôt conséquente, avec un peu plus de 400 mm² de surface et pas moins de 21,7 milliards de transistors. Son petit frère se contente de 157 mm² pour 7 milliards de transistors. À cela s'ajoute à présent BMG-G11, utilisant cette fois le même node que la concurrence, à savoir le N5 de TSMC. De quoi caser 19,6 milliards de transistors sur 272 mm². La densité progresse, mais reste bien moindre que celle de la concurrence, et ce même si les méthodes de comptages peuvent différer. Elle résulte probablement d'un design moins optimisé et de davantage d'interfaces moins denses.  

NVIDIA de son côté fait un choix totalement différent, en basculant l'intégralité de sa gamme sur le 4N de TSMC, une déclinaison "personnalisée" du très performant 5 nm. Pas moins de 5 GPU différents ont été conçus, allant d'AD102 intégrant plus de 76 milliards de transistors sur une superficie de 608 mm² et animant la RTX 4090, au petit AD107 se contentant de 159 mm² pour presque 19 milliards et affecté cette fois à la RTX 4060. Entre ces 2 extrêmes, se trouvent les puces AD103 RTX (RTX 4070 Ti SUPER / RTX 4080 / RTX 4080 SUPER), AD104 (RTX 4070 Ti / RTX 4070 / RTX 4070 SUPER) et AD106 (RTX 4060 Ti) par ordre décroissant de superficie et complexité. Ces 5 références monopolisent le haut du classement en matière de densité de transistors par mm², multipliant pratiquement par trois cette valeur en comparaison du précédent N8 de Samsung utilisé par la génération Ampere (RTX 30). Il existe donc une différence très conséquente entre ces 2 nœuds de gravure, et ce contrairement à ce que laisseraient penser leurs nomenclatures commerciales respectives. Le N8 est en fait une optimisation du node 10nm, NVIDIA "enjambant" donc le 7 nm pour passer directement au 5 nm, soit un saut de 2 générations.

AMD a, lui, opté pour un "en même temps" au moyen de chiplets, une stratégie que ne renierait pas un homme politique français, ayant été élu à deux reprises à la magistrature suprême. Le N5 de TSMC est donc dévolu aux GCD, alors que les MCD doivent de leur côté se contenter du N6, tout comme Navi 33. Ce dernier, purement monolithique, mesure 204 mm² pour 13,3 milliards de transistors et se charge d'animer les RX 7600 et RX 7600 XT. À l'autre bout de la gamme, les 6 MCD plus le GCD d'un Navi 31 complet occupent une superficie totale de presque 530 mm², pour 57,7 milliards de transistors. La densité est donc légèrement moindre que sur les puces intégralement en 4N du caméléon, mais finalement pas si éloignée malgré le mix des nœuds de gravure. Cela tendrait à corroborer l'assertion d'AMD quant aux faibles gains (en densité au moins) à attendre d'une gravure plus fine pour certains éléments constitutifs d'un GPU. Les RX 7900 XTX / 7900 XT et 7900 GRE emploient un tel GPU. Enfin, Navi 32 des RX 7700 XT et 7800 XT couple un GCD de 200 mm² gravé en 5 nm, à 4 MCD gravés en 6 nm par TSMC. La partie logique étant fortement réduite sur ce nouveau GCD, la densité va finalement se positionner entre celle de Navi 33 et Navi 31.

GPU
Process
Nombre de transistors Superficie die Densité (Millions de transistors par mm²)
AD102 4N TSMC 76,3 milliards 608,5 mm² 125,4
AD106 4N TSMC 22,9 milliards 187,8 mm² 121,9
AD104 4N TSMC 35,8 milliards 294,5 mm² 121,6
AD103 4N TSMC 45,9 milliards 378,6 mm² 121,2
AD107 4N TSMC 18,9 milliards 158,7 mm² 119,1
Navi 31 N5 + N6 TSMC 57,7 milliards 529,5 mm² 109
Navi 32 N5 + N6 TSMC 28,1 milliards 350 mm² 80,3
BMG-G21 N5 TSMC 19,6 milliards 272 mm² 72,1
GA100 7N TSMC 54.2 milliards 826 mm² 65,6
Navi 33 N6 TSMC 13,3 milliards 204 mm² 65,2
ACM-G10 N6 TSMC 21,7 milliards 406 mm² 53,4
Navi 21 N7P TSMC 26,8 milliards 520 mm² 51,6
Navi 22 N7P TSMC 17,2 milliards 335 mm² 51,3
Navi 24 N6 TSMC 5,4 milliards 107 mm² 50,5
Navi 23 N7P TSMC 11,1 milliards 237 mm² 46,8
ACM-G11 N6 TSMC 7,2 milliards 157 mm² 45,9
GA102 8N Samsung 28,3 milliards 628,4 mm² 45
GA104 8N Samsung 17,4 milliards 392 mm² 44,4
GA106 8N Samsung 12 milliards 276 mm² 43,5
Navi 10 N7P TSMC 10,3 milliards 251 mm² 41
Vega 20 N7FF TSMC 13.2 milliards 331 mm² 39,9
GP102 16FFC TSMC 12 milliards 471 mm² 25,5
Vega 10 14LPP GF 12.5 milliards 495 mm² 25,3
GP100 16FFC TSMC 15,3 milliards 610 mm² 25,1
TU104 12FFC TSMC 13,6 milliards 545 mm² 25
TU102 12FFC TSMC 18,6 milliards 754 mm² 24,7
TU106 12FFC TSMC 10,8 milliards 445 mm² 24,3

Détaillons à présent les caractéristiques des cartes employant ces GPU en comparaison d’un certain nombre de cartes des segments performance des générations actuelle et précédentes.

Cartes GPU Fréq. Boost GPU (MHz) Fréq. Mémoire (MHz)

SP
/
CC

ALU FP32 ROP VRAM (Go) Bus mem. (bits) Calcul SP (Tflops) Bande Passante mémoire (Go/s) TGP (W)
RX 5700 Navi 10 1 725 1 750 2 304 2 304 64 8 256 7,9 448 180
RX 5700 XT Navi 10 1 905 1 750 2 560 2 560 64 8 256 9,8 448 225
RX 6700 Navi 22 2 174 1 988 2 304 2 304 64 10 160 10 318 175
RX 6700 XT Navi 22 2 424 1 988 2 560 2 560 64 12 192 12,4 382 230
RX 6750 XT Navi 22 2 495 2 238 2 560 2 560 64 12 192 12,8 430 250
RX 7700 XT Navi 32 2 544 2 238 3 456 6 912 96 12 192 35,2 430 245
RX 7800 XT Navi 32 2 430 2 425 3 840 7 680 96 16 256 37,3 621 263
Arc A750 ACM-G10 2 400 2 000 3 584 3 584 112 8 256 17,2 512 225
Arc A770 ACM-G10 2400 2000 / 2188 4 096 4 096 128 8 / 16 256 19,7 512 / 560 225
Arc B570 BMG-G11 2 750 2 375 2 304 2 304 80 10 160 12,7 380 150
Arc B580 BMG-G11 2 850 2 375 2 560 2 560 80 12 192 14,6 456 190
GTX 1070 GP104 1 683 2 002 1 920 1 920 64 8 256 6,5 256 150
GTX 1070 Ti GP104 1 683 2 002 2 432 2 432 64 8 256 8,2 256 180
RTX 2070 TU106 1 620 1 750 2 304 2 304 64 8 256 7,5 448 175
RTX 2070 SUPER TU104 1 770 1 750 2 560 2 560 64 8 256 9,1 448 215
RTX 3070 GA104 1 725 1 750 2 944 5 888 96 8 256 20,3 448 220
RTX 3070 Ti GA104 1 770 1 188 3 077 6 144 96 8 256 21,7 608 290
RTX 4070 AD104 2 475 1 313 2 944 5 888 64 12 192 29,1 504 200
RTX 4070 SUPER AD104 2 475 1 313 3 584 7 168 80 12 192 35,5 504 220

Rappelons qu'il est très difficile d'inférer les performances pratiques d'une carte graphique sur la seule base des valeurs brutes annoncées. Plusieurs raisons à cela, dont les fréquences réellement appliquées (qui diffèrent plus ou moins largement de celles officielles), mais aussi les subtilités architecturales quant aux conditions d'exécution de certaines unités ou l'impact par exemple des larges caches sur la bande passante mémoire effective. Toujours est-il que l'Arc B580 dispose à la fois de moins de puissance de calcul, mais aussi de moins de bande passante mémoire que les A700. Mettons donc à l'épreuve les valeurs théoriques en exécutant quelques tests synthétiques de bas niveau.

Tests synthétiques

Nous utilisons la suite de tests Geeks 3D pour estimer les performances synthétiques de la nouvelle venue, lors de l’exécution de certaines tâches particulières. Ainsi, PixMark Julia FP32 permet de mesurer la puissance de calcul brute en simple précision (FP32) et le fillrate qui en découle. Il dépend donc à la fois des unités de calcul et des ROP. Le test GiMark, s’attache de son côté à évaluer les performances de nos cartes au niveau de la géométrie (génération de primitives 3D). Enfin, TessMark permet de son côté de mesurer les capacités en tessellation des différentes cartes. Ces tests étant relativement brefs et spécifiques (n’utilisant donc qu’une partie des ressources totales des GPU), ils permettent aux modèles limités par leur température et/ou puissance électrique maximale autorisée, de conserver des fréquences plus élevées que lors d’une session de jeu par exemple.

En matière de puissance de calcul brute, l'Arc B580 ne peut rivaliser avec les A700 comme le laissaient penser  ses caractéristiques. Elle arrive toutefois à talonner les RTX 4060 et RX 7600. En matière de géométrie, ce n'est pas mieux face aux A750/770,  mais elle devance cette fois nettement les Radeon et GeForce concurrentes. Finissons par la tessellation, qui montre cette fois des gains colossaux par rapport à Alchemist (+ 86% vs A770), lui permettant de finir relativement proche de la RTX 4060, tout en devançant significativement les Radeon. Gardez également à l'esprit que ces tests utilisent des scènes avec des charges très spécifiques ne correspondant pas vraiment à l'usage typique d'un rendu 3D. Qui plus est, ils s'appuient sur OpenGL, une API commençant à dater.

Tests synthétiques - Intel Arc B580

1Images par seconde - Le plus élevé est le meilleur Titre Couleur PixMark Julia FP32 GiMark TessMark \nTitre Court PixMark GiMark TessMark \nSous-titre 0.7.0 - OpenGL 3.0 - UHD 0.7.0 - OpenGL 3.3 - UHD 0.7.0 - OpenGL 4.0 - UHD - X64 \nGigabyte RX 6600 Eagle #ED1C24 1215 193 370 \nGigabyte RX 7600 Gaming OC #ED1C24 1685 156 337 \nGigabyte RX 7600 XT Gaming OC #ED1C24 1762 159 347 \nGigabyte RX 7700 XT Gaming OC #ED1C24 2077 200 382 \nArc A750 LE #0068B5 1743 287 254 \nArc A770 LE #0068B5 2035 321 257 \n**Arc B580 LE** #0068B5 1619 276 479 \nZotac RTX 3060 Twin Edge #76B900 1381 129 349 \nAsus RTX 4060 Dual #76B900 1656 202 508 \nGeForce RTX 4060 Ti FE #76B900 2121 242 659 \nMSI RTX 4060 Ti Ventus 3X 16G OC #76B900 2093 233 639

Passons à présent à des tests synthétiques issus de 3DMark, en s’attachant à vérifier les capacités des cartes graphiques pour diverses fonctionnalités. DXR, au nom explicite, sollicite de manière intensive les capacités d’accélération du Ray Tracing par le GPU, au travers de l’API de Microsoft. La nouvelle venue doit céder respectivement 24 et 36 % aux A750 et A770 malgré ses unités de nouvelle génération, du fait d'un différentiel important de leurs nombres entre les GPU (28 / 32 vs 20. Mesh Shader évalue la capacité de traitement de ces derniers par les GPU modernes. Le test permet de comparer les performances avec et sans Mesh Shaders actifs, mais cette représentation ne permet pas une comparaison pertinente entre cartes. Nous affichons donc les performances de chaque référence avec Mesh Shaders actifs. La B580 devance tout le monde ici attestant des assertions d'Intel concernant les évolutions architecturales.

Tests fonctionnalités - Intel Arc B580

2 Titre Couleur 3DMark: DXR 3DMark: Mesh Shader 3DMark: PCIe Bandwidth 3DMark: Sampler Feedback 3DMark: Variable Rate Shading \nTitre Court DXR Mesh Shader PCIe Bandwidth Sampler Feedback Variable Rate Shader \nSous-titre 2.30.833.0 - QHD 2.30.833.0 - UHD 2.30.833.0 - UHD 2.30.833.0 - UHD 2.30.833.0 - UHD \nAxe x Images par seconde - Le plus élevé est le meilleur Images par seconde - Le plus élevé est le meilleur Go/s - Le plus élevé est le meilleur Images par seconde - Le plus élevé est le meilleur Images par seconde - Le plus élevé est le meilleur \nGigabyte RX 6600 Eagle #ED1C24 13.9 292.5 14.2 199.4 93.5 \nGigabyte RX 7600 Gaming OC #ED1C24 20.2 266.9 14.3 261.1 127.3 \nGigabyte RX 7600 XT Gaming OC #ED1C24 21.0 268.5 14.3 261.6 132.0 \nGigabyte RX 7700 XT Gaming OC #ED1C24 32.6 371.9 28.2 391.9 193.0 \nArc A750 LE #0068B5 28.7 398.9 23.1 342.7 107.4 \nArc A770 LE #0068B5 31.6 431.6 23.1 363.3 116.9 \n**Arc B580 LE** #0068B5 23.2 439.6 14.4 303.0 111.9 \nZotac RTX 3060 Twin Edge #76B900 18.2 276.1 26.8 289.7 100.6 \nAsus RTX 4060 Dual #76B900 26.1 330.3 13.4 323.9 126.9 \nGeForce RTX 4060 Ti FE #76B900 37.3 429.7 13.4 387.2 168.0 \nMSI RTX 4060 Ti Ventus 3X 16G OC #76B900 36.1 421.9 13.4 377.8 161.7

Le test PCIe confirme l'emploi de 8 lignes Gen 4 sur la nouvelle-née, sans surprise. Le test Sampler Feedback mesure de son côté l’impact de cette fonctionnalité introduite (comme la plupart des autres) par les cartes Turing. Cette fois avantage aux Arc 700, mais la B580 finit plutôt proche de la RTX 4060, tout en devançant la RX 7600. Enfin, le test VRS, abréviation de Variable Rate Shading, permet de mesurer le gain apporté par cette fonctionnalité lorsqu’elle est activée. Là aussi, il s'agit d'une comparaison entre 2 passes, nous préférons donc reporter ici aussi le score atteint par chaque carte une fois la fonctionnalité activée, permettant ainsi une comparaison brute entre elles. La B580 va se positionner pile entre les A750 et A770, devancée toutefois par les RTX 4060 et RX 7600.

Eric


  • tout n'est pas parfait mais son avantage de vram lui donne beaucoup d'intérêt dans cette gamme de prix 

    très bon test comme d'habitude 

    le fonctionnement du mode turbo est spéciale je suis sur que la carte pourrait grapiller des mhz avec un fonctionnement plus comme amd/nvidia

    • Par contre j'ai fini vraiment à l'arrache, donc désolé s'il y a des fautes/typos/coquille, on va corriger une bonne partie de cela dans les heures qui viennent.

    • tout n'est pas parfait mais son avantage de vram lui donne beaucoup d'intérêt dans cette gamme de prix 

      très bon test comme d'habitude 

      le fonctionnement du mode turbo est spéciale je suis sur que la carte pourrait grapiller des mhz avec un fonctionnement plus comme amd/nvidia

      je dis ça pas parce que Eric est un ami, mais ses tests sont une tuerie complète et tellement riches d'enseignements, ils servent de base dans mes connaissances 😊

  • je viens de lire plus en detail l'article si on écoute le descriptif on croit que la b580 a un die complet et le b570 un die castré 

    de se que j'ai compris la b580 a aussi un die castré mais je me trompe peut être 

    • de se que j'ai compris la b580 a aussi un die castré mais je me trompe peut être 

      Intel ne l'a pas précisé, mais si tu regardes bien la représentation du die en page 2, tu distingues facilement les 5 Render Slice (20 Xe Engine) et 6 contrôleurs mémoire, pas un de plus. Donc il semble bien que le die soit complet.  

      • J'avais vu passer que les 5 render slice c'était bizarre et que du coup il y en aurait 6 mais ton explication tient la route 

        Mais du coup le côté faible densité en prend un coup j'ai cru que le die avait réellement un bus 256 bits 

        Ils ont pour moi en tout cas chier dans la colle sur ça 

        Après ont sait que avec les unités xmx prennent beaucoup (trop ?) de place et qu'il faut un plus gros die pour être équivalent à amd/nvdia mais la c'est peu abusé 

        • J'ai aucune certitude, mais c'est ce qui me semble le plus probable. De toute façon lorsque tu poses la question à Intel (ou aux deux autres) la réponse est toujours la même : "nous ne communiquons jamais sur des produits ou fonctionnalités non annoncées" donc il y a toujours un doute.

          • L ia chez intel sert à quoi à par le xess ? Pas grand chose il me semble 

            Il faut des unités ia mais je trouve ça surdimentionné

            Les arcs ne sont même pas décliné en secteur pro il me semble 

        • Ils ont pour moi en tout cas chier dans la colle sur ça 

          Il ne faut pas oublier aussi que la densité est très étroitement liée à la maîtrise / expérience du procédé de gravure... ce qui passe par l'expertises des outils de conception. Avec Intel qui débarque tout juste chez TSMC - qui plus est avec des GPU qui ne sont pas sa spécialité -, face à un NVIDIA et AMD rompu à la tâche car fabless, c'est compliqué. Il est aussi possible que Intel avait des buts plus agressifs en matière de fréquence, et a initialement designé la puce avec des transistors moins denses mais plus susceptibles de monter en cadence.

  • Merci pour le test, c'est encourageant pour intel, mais ça arrive beaucoup trop tard et trop cher chez nous.

25 commentaires

Laissez votre commentaire

En réponse à Some User