Phoronix a réussi à mettre la main - mais à distance seulement - sur le gros module GH200 de NVIDIA, une solution officiellement en production depuis le printemps dernier et qui commence progressivement à entrer en service. Les premiers chiffres indépendants sur les performances avaient commencé à apparaitre en septembre 2023. Comme vous en doutez, ce n’est pas du tout donné comme matériel. Le testeur s’est tourné vers GPTshop.ai, enseigne européenne se servant notamment du GH200 pour un nouveau système desktop. Pour l’anecdote, celui-ci est au format tour comme nous en avons l’habitude, mais son prix démarre à 47 500 €, en sachant que plusieurs configurations sont proposées en jouant par exemple sur le stockage ou encore les adaptateurs.
Avant de continuer, rappelons que le GH200 est un assemblage plaçant côte à côte les 72 cœurs Arm Neoverse-V2 du CPU Grace avec un GPU Hopper H100, en plus de jusqu’à 480 Go de LPDDR5 et 86 Go de HBM3 ou 144 Go de HBM3e. Le CPU Grace n’étant pas disponible seul, l’idée ici était de tester spécifiquement la partie CPU du GH200 et de l’opposer à plusieurs solutions concurrentes, dont le flagship EPYC 9754 Bergamo d’AMD et Xeon Platinum 8592+ Emerald Rapids d’Intel, au travers de nombreux benchmarks sous Linux pertinents au domaine concerné.
Alors ? Comment se compare le premier CPU de NVIDIA à la concurrence ? Cette dernière doit-elle déjà trembler ?
Benchmarks (plus haut c’est mieux) |
NVIDIA Grace Hopper GH200 | AMD EPYC 9754 | Xeon Platinum 8592+ |
---|---|---|---|
High Performance Conjugate Gradient | 41,69 | 25,89 | 35,42 |
Algebraic Multi-Grid 1.2 | 1 997 929 111 | 2 291 049 667 | 1 839 912 667 |
LULESH 2.0.3 | 23 185,18 | 22 365,75 | 39 469,91 |
Xmrig 6.18.1 | 17 253 | 29 356,1 | 40 381,2 |
John The Ripper 2023.03.14 | 68 817 | 204 828 | 178 108 |
ACES DGEMM 1.0 | 17,94 | 43,68 | 29,14 |
GraphicsMagick 1.3.38 Sharpen |
1 363 | 924 | 749 |
GraphicsMagick 1.3.38 Enhance | 1 761 | 1 451 | 1 192 |
Graph500 3.0 Median | 1 239 790 000 | 1 147 090 000 | 1 238 670 000 |
Graph500 3.0 Max | 1 315 650 000 | 1 184 510 000 | 1 304 200 000 |
Stress-NG 0.16.04 Matrix | 512 758,08 | 552 067,04 | 301 894,53 |
Stress-NG 0.16.04 3D | 17 483,02 | 8 009,21 | 13 854,38 |
Benchmarks (plus bas c’est mieux) | NVIDIA Grace Hopper GH200 | AMD EPYC 9754 | Xeon Platinum 8592+ |
Rodinia 3.1 | 30,31 | 25,15 | 39,89 |
NVCHem 7.0.2 | 1 403,5 | 1 700,8 | 1 850,8 |
Xompact3d Incompact3d (X3D-benchmarking input.i3d) |
254,49 | 493,5 | 323,53 |
Xompact3d Incompact3d (input.i3d 193 Cells Per Direction) |
9,81 | 9,03 | 10,18 |
Godot Compilation 4.0 | 139,1 | 118,25 | 111,96 |
Primesieve 8.0 | 35,49 | 21,76 | 49,06 |
Helsing 1.0-beta | 67,61 | 48,95 | 84,95 |
DuckDB 0.9.1 IMDB | 92,08 | 147,6 | 96,87 |
DuckDB 0.9.1 TPC-H Parquet | 148,76 | 177,13 | 134,73 |
RawTherapee | 46,72 |
66,13 |
45,53 |
Timed Gem 5 Compilation 23.0.1 | 180,62 | 208,58 | 174,18 |
Performance moyenne | 2 175,03 | 2459,11 | 2 242,9 |
Dans l’ensemble, le CPU Grace a tout de même réussi à empocher 15 victoires contre Emerald Rapids et 13 contre Bergamo (et Genoa), occasionnellement même contre des configurations dual-socket. Grace s’est aussi révélé supérieur au vieillissant Altra Max M128-30 d’Ampere. En somme, c'est un très bon bilan. Cependant, quand Grace perd, c’est souvent de beaucoup, ce qui explique que la moyenne place le CPU de NVIDIA assez en retrait par rapport à la concurrence, dont AMD en tête. Selon Phoronix, il y a encore certaines taches qui doivent être optimisées pour les cœurs Arm de Grace, d’où les grosses marges parfois observées lors des défaites. Mais dans ce domaine, l’efficacité énergétique est également d’une très grande importance et un critère de sélection majeur.
Les deux saveurs pour Grace chez NVIDIA.
Malheureusement, du fait de l’accès à distance, Phoronix n’a pas été en mesure d’évaluer la consommation du CPU et le GH200 ne semble pas pour l’instant exposer à la lecture ce type de données sous Linux. Le TDP officiel du GH200 s’étend sur une plage de 450 à 1000 W et la superpuce CPU Grace (où une deuxième puce CPU emplace le GPU GH100) a un TDP de 500 W. La "Grace Superchip" a déjà montré récemment son potentiel d’efficacité lors des premiers benchmarks face à une paire de Xeon Platinum 8160 Sapphire Rapids, qui sont donnés pour 350 W chacun. On peut donc en conclure que cela devrait valoir aussi pour un seul CPU Grace, qui semble donc avoir les moyens d'être un concurrent plus que crédible ! (Source : Phoronix, via Tom's)
Je serais AMD et Intel, je serrerais les fesses. L'implémentation Neoverse V2 de nVidia semble performante, et globalement Grace semble dans le coup.
Impressionnant que NVIDIA parvienne à échanger les coups d'égal à égal avec les 2 autres.
Sur quels critères dites-vous que c'est le premier ? Parce qu'ils ont déjà eu des CPUs dans leurs produits Shield, la Nintendo Switch et quelques automobiles, avec les SoC Tegra.