Nvidia Grace Hopper Gh200

Alors, compétitive la dernière solution CPU de NVIDIA pour propulser les serveurs et concurrencer EPYC et Xeon sur leur terrain de prédilection ?

Phoronix a réussi à mettre la main - mais à distance seulement - sur le gros module GH200 de NVIDIA, une solution officiellement en production depuis le printemps dernier et qui commence progressivement à entrer en service. Les premiers chiffres indépendants sur les performances avaient commencé à apparaitre en septembre 2023. Comme vous en doutez, ce n’est pas du tout donné comme matériel. Le testeur s’est tourné vers GPTshop.ai, enseigne européenne se servant notamment du GH200 pour un nouveau système desktop. Pour l’anecdote, celui-ci est au format tour comme nous en avons l’habitude, mais son prix démarre à 47 500 €, en sachant que plusieurs configurations sont proposées en jouant par exemple sur le stockage ou encore les adaptateurs.

Avant de continuer, rappelons que le GH200 est un assemblage plaçant côte à côte les 72 cœurs Arm Neoverse-V2 du CPU Grace avec un GPU Hopper H100, en plus de jusqu’à 480 Go de LPDDR5 et 86 Go de HBM3 ou 144 Go de HBM3e.  Le CPU Grace n’étant pas disponible seul, l’idée ici était de tester spécifiquement la partie CPU du GH200 et de l’opposer à plusieurs solutions concurrentes, dont le flagship EPYC 9754 Bergamo d’AMD et Xeon Platinum 8592+ Emerald Rapids d’Intel, au travers de nombreux benchmarks sous Linux pertinents au domaine concerné.

Alors ? Comment se compare le premier CPU de NVIDIA à la concurrence ? Cette dernière doit-elle déjà trembler ?

Benchmarks (plus haut c’est mieux)

NVIDIA Grace Hopper GH200 AMD EPYC 9754 Xeon Platinum 8592+
High Performance Conjugate Gradient 41,69 25,89 35,42
Algebraic Multi-Grid 1.2 1 997 929 111 2 291 049 667 1 839 912 667
LULESH 2.0.3 23 185,18 22 365,75 39 469,91
Xmrig 6.18.1 17 253 29 356,1 40 381,2
John The Ripper 2023.03.14 68 817 204 828 178 108
ACES DGEMM 1.0 17,94 43,68 29,14

GraphicsMagick 1.3.38 Sharpen

1 363 924 749
GraphicsMagick 1.3.38 Enhance 1 761 1 451 1 192
Graph500 3.0 Median 1 239 790 000 1 147 090 000 1 238 670 000
Graph500 3.0 Max 1 315 650 000 1 184 510 000 1 304 200 000
Stress-NG 0.16.04 Matrix 512 758,08 552 067,04 301 894,53
Stress-NG 0.16.04 3D 17 483,02 8 009,21 13 854,38
Benchmarks (plus bas c’est mieux) NVIDIA Grace Hopper GH200 AMD EPYC 9754 Xeon Platinum 8592+
Rodinia 3.1 30,31 25,15 39,89
NVCHem 7.0.2 1 403,5 1 700,8 1 850,8

Xompact3d Incompact3d

(X3D-benchmarking input.i3d)

254,49 493,5 323,53

Xompact3d Incompact3d

(input.i3d 193 Cells Per Direction)

9,81 9,03 10,18
Godot Compilation 4.0 139,1 118,25 111,96
Primesieve 8.0 35,49 21,76 49,06
Helsing 1.0-beta 67,61 48,95 84,95
DuckDB 0.9.1 IMDB 92,08 147,6 96,87
DuckDB 0.9.1 TPC-H Parquet 148,76 177,13 134,73
RawTherapee 46,72

66,13

45,53
Timed Gem 5 Compilation 23.0.1 180,62 208,58 174,18
Performance moyenne 2 175,03 2459,11 2 242,9

Dans l’ensemble, le CPU Grace a tout de même réussi à empocher 15 victoires contre Emerald Rapids et 13 contre Bergamo (et Genoa), occasionnellement même contre des configurations dual-socket. Grace s’est aussi révélé supérieur au vieillissant Altra Max M128-30 d’Ampere. En somme, c'est un très bon bilan. Cependant, quand Grace perd, c’est souvent de beaucoup, ce qui explique que la moyenne place le CPU de NVIDIA assez en retrait par rapport à la concurrence, dont AMD en tête. Selon Phoronix, il y a encore certaines taches qui doivent être optimisées pour les cœurs Arm de Grace, d’où les grosses marges parfois observées lors des défaites. Mais dans ce domaine, l’efficacité énergétique est également d’une très grande importance et un critère de sélection majeur.

Nvidia Grace Hopper Superchip Configurations

Les deux saveurs pour Grace chez NVIDIA.

Malheureusement, du fait de l’accès à distance, Phoronix n’a pas été en mesure d’évaluer la consommation du CPU et le GH200 ne semble pas pour l’instant exposer à la lecture ce type de données sous Linux. Le TDP officiel du GH200 s’étend sur une plage de 450 à 1000 W et la superpuce CPU Grace (où une deuxième puce CPU emplace le GPU GH100) a un TDP de 500 W. La "Grace Superchip" a déjà montré récemment son potentiel d’efficacité lors des premiers benchmarks face à une paire de Xeon Platinum 8160 Sapphire Rapids, qui sont donnés pour 350 W chacun. On peut donc en conclure que cela devrait valoir aussi pour un seul CPU Grace, qui semble donc avoir les moyens d'être un concurrent plus que crédible ! (Source : Phoronix, via Tom's)

Le test de Phoronix

Matt


  • Je serais AMD et Intel, je serrerais les fesses. L'implémentation Neoverse V2 de nVidia semble performante, et globalement Grace semble dans le coup.

  • Impressionnant que NVIDIA parvienne à échanger les coups d'égal à égal avec les 2 autres.

    Comment se compare le premier CPU de NVIDIA à la concurrence ?

    Sur quels critères dites-vous que c'est le premier ? Parce qu'ils ont déjà eu des CPUs dans leurs produits Shield, la Nintendo Switch et quelques automobiles, avec les SoC Tegra.

2 commentaires

Laissez votre commentaire

En réponse à Some User