Bannière Threadripper 7980X & Gigabyte TRX50 AI TOP

AMD Ryzen Threadripper série 7000

Pour commencer, petit rappel de la gamme Ryzen Threadripper (7000), puisque c'est son nom complet (AMD souhaitant probablement capitaliser sur la notoriété de la marque Ryzen), mais que nous nommerons uniquement Threadripper au sein de se dossier, par souci de simplification. Cette gamme se destine principalement aux professionnels de la création nécessitant beaucoup de puissance de traitement parallèle, mais aussi aux amateurs recherchant ce genre de prestations. Pour concevoir ces processeurs, AMD conserve son approche en chiplets, mixant un die dédié aux entrées/sorties (CIOD) et plusieurs CCD dédiés aux calculs.

Concernant ces derniers, la série 7000 s'appuie comme pour les Ryzen dédiés aux PC de bureau, sur la microarchitecture Zen 4 via des dies gravés en 5 nm par TSMC et comportant chacun 8 coeurs et 32 Mo de cache L3. Le CIOD est quant à lui gravé en 6 nm (toujours par TSMC), mais est autrement plus ambitieux que son pendant utilisés sur les Ryzen 7000. On passe ainsi de 122 mm² à 388 mm². Pourquoi une telle inflation ? Sans être exhaustif, les principales raisons sont le passage de 2 canaux mémoire à 8 et de 24 lignes PCIe Gen 5.0 à 128, de quoi alimenter sérieusement une station de travail, même si des différences significatives existent entre versions. On notera par contre l'absence totale d'IGP dans cet IO die, il sera donc forcément nécessaire de coupler une carte graphique à un tel processeur.

Quid de la gamme ? Elle se décompose entre les versions Pro, clairement dédiées aux stations de travail et les autres (non "Pro" quoi !) plutôt orientées vers les configurations de bureau haut de gamme (HEDT). Tâchons de décortiquer tout cela au travers du tableau suivant : 

Référence Cœurs / Threads  Boost Max Cache L3 Canaux mémoire Lignes PCIe 5.0 TDP (Watts)
Threadripper Pro 7995WX 96 / 192 5,1 GHz 384 Mo 8 128 350
Threadripper Pro 7985WX 64 / 128 5,1 GHz 256 Mo 8 128 350
Threadripper 7980X 64 / 128 5,1 GHz 256 Mo 4 48 350
Threadripper Pro 7975WX 32 / 64 5,3 GHz 128 Mo 8 128 350
Threadripper 7970X 32 / 64 5,3 GHz 128 Mo 4 48 350
Threadripper Pro 7965WX 24 / 48 5,3 GHz 128 Mo 8 128 350
Threadripper 7960X 24 / 48 5,3 GHz 128 Mo 4 48 350
Threadripper Pro 7955WX 16 / 32 5,3 Ghz 64 Mo 8 128 350
Threadripper Pro 7945WX 12 / 24 5,3 GHz 64 Mo 8 128 350

Les séries "Pro" utilisent un CIOD totalement actif, alors que le reste de la gamme utilise des dies bridés (probablement partiellement fonctionnels ce qui permet de les recycler) à 4 canaux mémoires et 48 lignes PCIe Gen 5. Le vaisseau amiral (Threadripper Pro 7995WX) est constitué de pas moins de 12 CCD associés à un CIOD, alors que le 7945WX se contente lui de 2 CCD (dont 2 cœurs ont été de surcroit désactivés). Comme indiqué en débutant ce dossier, nous avons réussi de notre côté à nous faire prêter un Threadripper 7980X que nous allons détailler à présent.

AMD Ryzen Threadripper 7980X

Les Threadripper série 7000 utilisent un socket sTR5. C'est mine de rien le 3ème socket différent (et même quatrième si on compte le sWRX8 disposant du même nombre de broches mais exclusivement dédié aux versions Pro des TR 3000 / 5000) pour ces plateformes HEDT, alors que les versions pour processeurs moins huppés n'en ont connu que deux dans le même temps. Quoi qu'il en soit, le changement était ici nécessaire du fait du passage à la DDR5, alors que les précédents TR utilisaient des modules DDR4. La bonne nouvelle, c'est que cette fois les versions Pro ou non utilisent le même socket, ce qui n'était pas le cas précédemment.

Ok c'est bien beau tout ça, mais alors ce processeur ? Physiquement, il ressemble comme 2 gouttes d'eau aux précédents Threadripper, avec un heat-spreader inchangé (on ne retrouve pas la découpe de celui des Ryzen AM5). La face arrière se compose cette fois de 4 844 points de contacts, alors que les précédents TRX4 / sWRX8 en comptaient 4 094. Compte tenu de la taille et du poids d'un tel processeur, AMD conserve le système de mise en place via glissière, sécurisant totalement cette opération qui peut être très délicate. Le CPU prend donc place dans un berceau en plastique orange qui va faciliter l'opération que nous détaillerons page suivante.

Le Ryzen Threadripper 7980X côté pile et face

Que nous apprend CPU-Z sur ce monstre ? On retrouve naturellement les éléments principaux détaillés dans le tableau précédent, avec une configuration à 64 cœurs dotés de SMT et disposant individuellement de 1 mégaoctet de cache L2. A cela s'ajoute un cache L3 de 32 Mo par CCD, soit 256 Mo en tout ici. Le TDP est de 350 W, et correspond ici au PPT (soit la puissance électrique maximale admissible au niveau du socket). La fréquence en crête atteint 5,65 GHz, soit bien au-delà de l'attendu. Nous n'avons pourtant pas détecté d'overclocking apparent au niveau de la carte mère... Quoi qu'il en soit, une fois le processeur totalement chargé, la limite de puissance rappelle tout le monde à l'ordre et le TR 7980X passe sous les 4 GHz.

Fréquences du Ryzen Threadripper 7980X (Repos, 1 cœur actif, tous cœurs actifs)

HWiNFO64 permet de monitorer un peu plus finement le processeur : on retrouve la fréquence de crête très brève sur un coeur à 5,65 GHz, mais la charge soutenue (ici Arnold) conduit à une fréquence moyenne des coeurs comprises entre 3,98 GHz et 3,37 GHz. D'après les sondes monitorées par HWiNFO, notre TR 7980X atteint bien 350 Watts en charge, nous verrons ce qu'il en est de nos propres mesures en fin de dossier.

Fréquences du Threadripper 7980X via HWiNFO64

Pour en finir avec les fréquences, nous utilisons également une boucle de divisions flottantes au moyen de l'utilitaire stress sous Linux. Au bout de 70 secondes (afin de limiter les variations dues à un potentiel boost trop court), nous échantillonnons 30 mesures de fréquences (du cœur disposant de la fréquence la plus élevée au moment de chaque mesure) espacées de 200 ms entre elles, puis reportons la médiane des maxima obtenus. Nous répétons l'opération complète à chaque changement du nombre de threads sollicités. Notez que ce test est moins intense que certaines charges très lourdes (rendu 3D, etc.), évitant ou atténuant certaines limitations liées à la puissance ou aux températures. D'après nos mesures, le TR 7980X maintient la fréquence de son cœur le plus rapide au-dessus de 5 GHz à concurrence de 7 threads avant de plonger ensuite. S'en suit un plateau courant jusqu'à 38 threads avant le début d'une chute progressive jusqu'à la pleine charge.

Threadripper 7980X : les fréquences

5Nombre de Threads Titre Evolution de la fréquence du 1er cœur \nTitre Court Fréquence GPU \nSous-titre Impact du nombre de threads \nCourbe Threadripper 7980X \nAxe y Fréquence (MHz) \nCouleur #F26522 \n1 5515 \n2 5481 \n3 5467 \n4 5459 \n5 5442 \n6 5431 \n7 5241 \n8 4794 \n9 4793 \n10 4793 \n11 4793 \n12 4793 \n13 4793 \n14 4793 \n15 4793 \n16 4793 \n17 4793 \n18 4793 \n19 4793 \n20 4793 \n21 4793 \n22 4793 \n23 4793 \n24 4793 \n25 4793 \n26 4793 \n27 4793 \n28 4793 \n29 4793 \n30 4793 \n31 4793 \n32 4793 \n33 4793 \n34 4793 \n35 4793 \n36 4793 \n37 4793 \n38 4793 \n39 4767 \n40 4767 \n41 4732 \n42 4718 \n43 4717 \n44 4693 \n45 4671 \n46 4667 \n47 4642 \n48 4592 \n49 4592 \n50 4586 \n51 4568 \n52 4539 \n53 4517 \n54 4517 \n55 4491 \n56 4466 \n57 4442 \n58 4413 \n59 4391 \n60 4343 \n61 4342 \n62 4312 \n63 4292 \n64 4291 \n65 4269 \n66 4264 \n67 4258 \n68 4244 \n69 4241 \n70 4218 \n71 4218 \n72 4216 \n73 4193 \n74 4173 \n75 4171 \n76 4169 \n77 4160 \n78 4143 \n79 4143 \n80 4142 \n81 4118 \n82 4093 \n83 4093 \n84 4093 \n85 4093 \n86 4090 \n87 4088 \n88 4068 \n89 4064 \n90 4040 \n91 4023 \n92 4019 \n93 4004 \n94 3999 \n95 3993 \n96 3990 \n97 3984 \n98 3971 \n99 3968 \n100 3944 \n101 3933 \n102 3918 \n103 3918 \n104 3918 \n105 3916 \n106 3894 \n107 3893 \n108 3869 \n109 3868 \n110 3845 \n111 3844 \n112 3844 \n113 3843 \n114 3820 \n115 3820 \n116 3817 \n117 3807 \n118 3794 \n119 3794 \n120 3778 \n121 3769 \n122 3768 \n123 3767 \n124 3744 \n125 3743 \n126 3741 \n127 3738 \n128 3718

Un dernier mot concernant les latences inter-cœurs. Sur les PC de bureau à un seul CCD (Ryzen 5 & 7), les variations sont limitées, mais progressent significativement dès l'instant où il faut changer de CCD sur les Ryzen 9. Quid d'un Threadripper intégrant cette fois non plus 2 mais 8 CCD. Pour cela, Nicolas a développé un petit script mesurant ces valeurs (ns) et nous les représentons au travers d'une matrice à 2 dimensions via un tableur et une mise en forme conditionnelle avec nuances de couleurs variant du vert (latence la plus faible) au rouge (latence la plus élevée).

Latence entre cœurs

Par essence de notre test (mesure du temps de va-et-vient d’une variable entre deux cœurs), la matrice résultante est symétrique et présente une latence la plus faible (7,6 ns) entre deux cœurs logiques partageant le même cœur physique : pas très étonnant, puisque le L1 est commun. S’en suivent (8 grands carrés verts de 16x16) les latences intra-CCD, où la communication s’effectue par le L3 en environ 20 ns. Enfin, les messages inter-CCD passent par l’Infinity Fabric, et tous les dies ne sont pas égaux à ce niveau — un héritage du routage à 12 dies des processeurs encore mieux pourvus. En effet, en se cassant un peu la tête pour trouver une logique dans tout cela, on observe 4 groupes de 2 CCD — de quoi confirmer l’organisation physique de 4 x 2 dies — : le groupe 4/8, relié le plus rapidement à tous les autres, le 6/2, légèrement plus lent, et les deux duos 7/3 et 1/8, tous deux également peu véloces, autant entre membres du groupe qu’avec les autres CCD.

Ainsi et de manière étrange, les clusters ne semblent pas suivre de règles de routage simple (i.e. d’envoi de message par plus proches voisins), mais un protocole plus complexe. Pourquoi AMD a-t-il opté pour cette solution ? Difficile à dire : peut-être s’agit-il d’un effet de bord lié à la fonction de hash utilisée pour décider de l’emplacement physique de la variable partagée dans notre test ; à moins qu’il ne soit question d’une adaptation partielle de la solution de routage complète étudiée initialement pour les CPU à 12 CCD. Enfin, nous notons que la latence n’est pas non plus homogène entre CCD distincts en fonction du cœur actif : ceux de plus haut identifiant ont en règle générale une latence supérieure, montrant un accès privilégié à l’Infinity Fabric pour les premiers cœurs de chaque die. Maintenant que vous savez tout ou presque sur ce Threadripper 7980X, passons à la description de la plateforme nous ayant permis de le mettre en œuvre.

Eric


  • Il a certes 64 core mais il est pas x4 en perf vs le 7950x sur d'autres tests on voit même que le tdp le limite beaucoup il pas très loin devant le 32 core 

    On sait pourquoi amd ne fait pas du 1/2 chiplet zen pour les faibles charges en nombre de thread et ensuite du zen c ? Je trouve ça pas bête 

    Ils ont fait un 24 core mais bizarrement pas un 48 core 

    J'aurais bien vu un 16 core avec 2 core actif par chiplet et 256 mo de cache 

    Si tu as encore le cpu tu peux tester crysis sans gpu dessus stp ? 😅

  • WOW, quel monstre !! Et ce score sous SF... 🙃  😁

    Bravo Eric pour ce (encore et tjs) super test !

    Vais-je craquer pour 6 fois plus de perfs ? -> Non ! Là c'est vraiment hors de prix. Déjà mon threadripper 1950X c'était 850 € (que le CPU évidemment) et c'était un peu une folie d'amoureux du hardware, mais cette fois c'est trop.

    Trop, mais délicieusement énorme.

    • Oui quand j'ai vu la barre sur StockFish, j'imaginais déjà ta tête en regardant le résultat 😅

  • Super super

    J espérais voir ce genre de test

    Je me demande sous lightroom comment ce comporte le 7970 et 7960

    • Peut-être à l'avenir si on arrive à mette la main sur d'autres Threadrippers.

  • Excellent travail

    Je vais me rabattre sur la petite sœur Z890 AI Top mon valeureux I74790k n'en peut plus les u9 285k ne sont pas ouf mais.... 😏

    Mille merci pour ce test 

9 commentaires

Laissez votre commentaire

En réponse à Some User