Alors qu’Intel pousse la MRDIMM comme technologie visant à faire monter le débit mémoire via la densification et la montée en cadence des modules de RAM ; AMD propose déjà avec ses EPYC une solution bête comme chou : multiplier les canaux mémoire, avec pas moins de 12 sur les derniers CPU serveurs de la série EPYC 9005. Architecturalement parlant, cela signifie que le processeur peut piocher en parallèle sur 12 barrettes, alors que nos machines grand public doivent se contenter de 2 canaux (soit 4 barrettes en tout, un canal pouvant être équipé de deux modules afin d’augmenter sa capacité… sans possibilité de lecture/écriture parallèle). Forcément, cela a un coût au niveau du silicium, que les firmes payent volontiers du fait de la barrière mémoire.
L’évolution des cœurs, de la bande passante et le ratio des deux (crédit image : Micron)
Késako ? Tout simplement le fait que la densité en transistors suit plus ou moins la loi de Moore (c’est-à-dire un doublement tous les deux ans), et, par conséquent, que la puissance de calcul des processeurs a suivi grâce à la multiplication du nombre de cœurs. Or, la mémoire n’a pas été aussi rapide pour se développer, si bien que les serveurs ont, finalement, de moins en moins de bande passante par cœur au fur et à mesure que les générations passent. Un paradoxe quand ces mêmes cœurs ont toujours plus de puissance grâce à l’extension des instructions SIMD, AVX-512 en tête. Fort heureusement, les caches et autre prefetcher sont là pour cacher ce manque de débit, sans pour autant être magiques.
Alors, en conditions réelles, est-ce qu’un gros EPYC 9655 à 96 cœurs et 192 triades arrive à tirer profit de 12 canaux de RAM ? Si l’on se doute que la réponse est oui, l’optimisation des logiciels pour réussir à utiliser correctement tout cela est essentiel, c’est pour cela que notre confrère Phoronix a testé la chose, armé d’un Supermicro H13SSL-N et de 12 barrettes RDIMM de 64 Gio DDR5-6000MT/s de chez Micron. Résultat ? Si les tests synthétiques et certaines applications comme le calcul scientifique des NAS Parallel Benchmark ou la compression de fichier se voient grandement accélérées, tel n’est pas le cas de la majorité des bases de données, des réseaux de neurones ou encore de l’encodage vidéo. Ainsi, il est inutile de se ruer sur une machine intégrant 12 canaux si votre utilisation principale est comprise dans ces derniers cas… sinon, vous pouvez aussi lire la prose complète — mais anglaise — de notre collègue pour avoir le détail complet !