Les superordinateurs (participants, rien n’oblige leurs opérateurs à soumettre leurs scores) du monde sont comparés via deux classements. D’un côté, le Top500, qui met à l’honneur la puissance brute de chaque machine, généralement aux frais de l’efficacité énergétique. À ce jeu, ce sont à ce jour les USA qui dominent, avec 5 machines dans le top 10 du Top500 de novembre 2024, dont 4 sur les 4 premières marches du classement. Néanmoins, l’Europe ne s’en tire pas trop mal non plus, avec 4 machines également dans le top 10 (HPC6 en Italie, Alps en Suisse, LUMI en Finlande et Leonardo en Italie). Enfin, on y trouve aussi toujours le Fugaku du Japon. De l’autre côté, nous avons le Green500, consistant à classer les supermachines en fonction de la performance de calcul qu’ils fournissent sur le benchmark HPL par watt d’énergie électrique consommée. Sans trop de surprise, aucun des 10 superordinateurs les plus puissants ne s’y trouve et à ce jeu-là, les USA font pâle-figure, pour une fois !
De toute évidence, la notion d’efficacité énergétique n’est pas approchée de la même manière partout dans ce domaine. Ainsi, seulement deux systèmes américains sont présents parmi les champions de l’efficacité du Green500, et plutôt dans le bas du tableau. Tous les autres se trouvent sur le continent européen ! Les législations généralement assez restrictives sur le Vieux Continent en matière de sobriété énergétique n’y sont certainement pas pour rien. Voici donc à quoi ressemble le top 10 du classement du Green500, fraichement mis à jour :
Classement Green500 (Top500) | Nom | Pays | Efficacité en GFLOPS/watts | Hardware | Entrée dans le Top500 |
---|---|---|---|---|---|
1 (224) | JEDI | Allemagne | 72,73 | NVIDIA Grace 72 cores + NVIDIA GH200 | Juin 2024 |
2 (122) | ROMEO-2025 | France | 70,91 | NVIDIA Grace 72 cores + NVIDIA GH200 | Novembre 2024 |
3 (442) | Adastra 2 | France | 69,10 | AMD EPYC 4e gen 24 cores + AMD Instinct MI300A | Novembre 2024 |
4 (155) | Isambard-AI phase 1 | Royaume-Uni | 68,83 | NVIDIA Grace 72 cores + NVIDIA GH200 | Juin 2024 |
5 (51) | Capella | Allemagne | 68,05 | AMD EPYC 9334 32 cores + NVIDIA H100 | Novembre 2024 |
6 (18) | JETI-JUPITER | Allemagne | 67,96 | NVIDIA Grace 72 cores + NVIDIA GH200 | Novembre 2024 |
7 (69) | Helios GPU | Pologne | 66,95 | NVIDIA Grace 72 cores + NVIDIA GH200 | Juin 2024 |
8 (371) | Henri | USA | 65,40 | Intel Xeon Platinum 8362 32 cores + NVIDIA H100 | Novembre 2024 |
9 (340) | HoreKa-Teal | Allemagne | 62,96 | AMD EPYC 9354 32 cores + NVIDIA H100 | Juin 2024 |
10 (49) | rzAdams | USA | 62,80 | AMD EPYC 4e gen 24 cores + AMD Instinct MI300A | Novembre 2024 |
L’Allemagne et la France en particulier peuvent se vanter d’accueillir certains des superordinateurs les plus efficaces du marché, et nos voisins outre-Rhin peuvent donc même se couronner champions du monde du charbon de l’efficacité ! En jetant un œil sur le matériel, on remarquera que c’est le couple CPU Grace et Superchip Grace Hopper GH200 qui équipe la moitié des machines. Il s’agit visiblement de l’association matérielle la plus efficace à ce jour, mais AMD n’est pas très loin avec son duo EPYC et Instinct - qui truste par ailleurs également le top 10 du classement Top500. Il n’y a qu’Henri aux USA qui fasse figure d’exception ici avec sa plateforme Intel mélangeant Xeon et H100. (Source : top500, Computerbase)
El capitan le nouveau numéro une question me vient
Est ce que avoir 128 go de ram par apu ne le limite pas ?
Pour le jedi il est très efficace mais j'ai relever une chose c'est que jupiter en début d'année qui sera une version plus grande de jedi atteindra 1 exa flops en fp 64 avec 125 armoire la ou el capitan fait 2.75 avec seulement 87 armoire
Même en ia nvidia annonce 93 exa flops el capitan pourrait monter à 175 exaflops ( il sera exploiter pour la simulation atomique donc inutile )
Donc je trouve nvidia certe efficace en watts mais pas en volume
La limitation en RAM dépendra surtout du type d'application. Etant donné que le focus ici est de faire du calcul optimisé sur de l'hyperscalaire (le fait de paralléliser en masse), comme on retrouve fréquemment dans les domaines scientifiques ou le machine learning, alors le plus gros problème est la puissance de calcul. La RAM permet surtout d'avoir une sorte de base locale pour l'APU, à 128 Go par accélérateur on est plutôt confortable.
Pour ce qui est de l'efficacité en volume, c'est pas forcément du meilleur intérêt. OK on gagne de l'espace, mais réduire la taille des infrastructure rajoute parfois d'autres contraintes (refroidissement, maintenance), rendant ce gain pas forcément intéressant. Très souvent, le facteur d'optimisation prioritaire reste la consommation d'énergie, tant la taille de ces infrastructure les rendent impactées par le moindre %.