Amd Epyc Logo

L'AVX-512 offre un avantage de taille aux CPU AMD d'entrée de gamme sur les serveurs, le tout à un prix sacrément compétitif !

Historiquement, Intel est l’entreprise prenant l’initiative sur les progrès en matière de jeu d’instruction : enclave sécurisée avec SGX, mémoires transactionnelles avec TSX, et vectorisation toujours plus avancée avec l’AVX-512. À l’inverse, nous devons remonter au début des années 2000 et l’amd64 pour trouver du développement de l’ISA effectué par le concurrent AMD. C’est donc sans surprise que les instructions vectorielles ont été initialement déployées dès Skylake dans sa version X (HEDT) et SP (Scalable Platform, pour serveur). Dans la pratique, cet AVX-512 permet de condenser une seule instruction des opérations sur 512 bits de données, au lieu de (minimum) 2 instructions AVX2 ou 4 instructions SSE (et bien plus en x86 natif !). Bref, la chose intéresse fortement les professionnels réalisant du calcul scientifique, du machine learning et de l’émulation, mais cela ne venait pas sans contrepartie.

En effet, les premières implémentations étaient gourmandes et faisaient chuter la fréquence du processeur lors de leur utilisation, ce qui résultait parfois en des performances inférieures aux codes AVX2 précédents. Rajoutez que Skylake possédait en hardware 2 unités AVX2, et que seuls les CPU les plus chers avaient 2 unités AVX-512 : le milieu de gamme n’en avait qu’une… ce qui signifiait que la puissance brute des cœurs demeurait équivalente quelle que soit les instructions employées — une décision architecturale qui est restée jusqu’à Ice Lake. Sur les modèles grand public ultérieurs, l’hétérogénéité des cœurs a forcé l’homogénéisation des instructions : P-Core comme E-Core doivent parler le même langage, et comme les cœurs efficients ne sont pas équipés d’unité AVX-512, la gamme grand public a dit « au revoir » à la fonctionnalité.

Amd Epyc Logo

À contre-courant, AMD a introduit sa première prise en charge de l’AVX-512 sur Zen 4, dans laquelle les instructions étaient traduites par le CPU en AVX 2, autant dire que leur intérêt était limité. En revanche, Zen 5 a apporté des vraies unités AVX-512 sur les cœurs utilisés dans les CPU de bureau et professionnels (ceux portables se contentant d’une implémentation similaire à Zen 4 de ce côté-là), et les derniers tests en provenance de Phoronix montrent une domination sans égale des rouges à ce niveau.

En effet, armé d’un EPYC 4345P (325 $ pour 8 cœurs/16 threads) et d’un EPYC 4585PX (699 $ pour 16 cœurs/32 threads, et le 3D V-Cache de la firme) face à un Xeon 6369P (606 $ pour 8 cœurs/16 threads), le résultat est sans appel : 

Geometric Mean Of All Test Results benchmark with settings of Result Composite, AMD EPYC 4005 Series AVX-512 Performance Benchmarks. EPYC 4585PX was the fastest.

Sur un total de 80 benchmarks Linux mêlant calcul haute performance, IA, édition vidéo et autres logiciels créatifs, les processeurs rouges ressortent vainqueur.... même lorsque que l’AVX 512 est désactivé ! Notez que le 4345P et le 6369P sont équivalents en matière de consommation avec 90 W mesurés, là où le 4585PX et ses 160 W sont dans une tout autre dimension. De quoi démontrer le besoin urgent de renouvellement de Raptor Lake refresh, actuellement seul sur l’entrée de gamme des professionnels en socket LGA 1700 - Arrow Lake étant désespérément absent de la gamme Xeon. Heureusement, Granite Rapids et son Intel 3 sont là pour donner davantage de fil à retordre sur les serveurs plus testicouillus !

Par ici pour le test complet chez Phoronix !

Double Doc

Aucun commentaire

Laissez votre commentaire

En réponse à Some User