Il y a une semaine, Intel nous invitait en Arizona à l’occasion de l’événement Intel Tech Tour US. L’occasion de nous présenter en détail la microarchitecture et l’agencement du SoC Panther Lake, de nous faire un tour (caméras éteintes !) de leur usine (fab 52), mais également de présenter leurs nouveaux Xeon. Une série qui, pour une fois, ne correspond pas à une nouvelle gamme à part entière, mais complémente l’offre des bleus côté serveurs. En effet, si les Xeon 6 en version P-Core sont actuellement disponibles en version 350 W (socket LGA4710, série 6500P/6700P, jusqu’à 86 P-Cores) et en version 500 W (socket LGA7529, série 6900P, jusqu’à 120 P-Cores), ce n’est pas encore le cas des E-Core, pour le moment encore limités au "petit" socket LGA4710, pour 144 E -Core maximum. Avec cette nouvelle mise à jour nommée Xeon 6+, les 288 cœurs promis arrivent sur socket LGA7529 et la série 6900E, pour un total impressionnant de 288 E-Core par socket, 576 Mio de L3, et une interchangeabilité avec les Xeon 6900P. La vache !
Nommée Clearwater Forest, cette nouvelle série apporte deux améliorations : d’une part, la gravure en 18A et ses gains associés — dont un stacking 3D via Foveros Direct 3D sur lequel nous reviendrons, et une mise à jour architecturale. En effet, alors que le précédent Sierra Forest faisait usage de cœurs Crestmont — c’est-à-dire datant de Meteor Lake, alors que la génération grand public était déjà à Skymont dont les gains en performances étaient notable —, Clearwater Forest effectue un saut de génération et offre directement les cœurs Darkmont, dont nous vous faisons la présentation détaillée ici, pour des gains en IPC de 17 % selon la firme.
À gauche, la dernière génération de Xeon P-Core. À droite, la nouvelle génération d’E-Core. Toujours plus de dies !
Comme annoncé précédemment, ces Xeon 6900E apportent pour la seconde fois (le premier essai, Lakefield, ayant été plus que limité) une structure 2,5 D active, c’est-à-dire un empilement de couches dans lequel les deux dies sont munis de transistors et, ainsi, d’unité logiques ; a contrario des tuiles passives comme celles de Lunar Lake et Panther Lake qui ne contiennent que de l’interconnecte. Ces complexes nouvelles puces utilisent au total pas moins de 29 morceaux de silicium, dont 12 tuiles de calcul en 18A, 3 tuiles de "base" contenant entre autres une partie de l’alimentation, les contrôleurs mémoires et le cache L3 (d’où la similarité avec le 3D V-Cache d’AMD) accompagné des agents le gérant, le tout en Intel 3T ; 2 tuiles d’IO en Intel 7 (identiques à celles des Xeon 6 précédents) et 12 tuiles passivent pour les ponts EMIB entre tuiles. Puisque les tuiles de calcul sont situées au-dessus de la tuile de base, et que les ponts EMIB sont, eux, en dessous, Intel commercialise ici un empilement à 3 dies : admirez la prouesse.
Du côté du die de calcul, ce dernier se compose de clusters de 4 E-Core et de 4 Mio de L3, similairement aux assemblages intégrés sur Panther Lake. Pas moins de 6 de ces clusters sont présents pour un total de 24 cœurs/24 Mio de L2, qui viennent s’additionner aux 48 Mio de L3 de la tuile de base. Grâce aux doubles nouvelles technologies du 18A, à savoir PowerVia et RibbonFet, Intel annonce avoir réussi à caser 90 % de cellules (i.e. de transistors utilisés pour le calcul) sur sa tuile, ce qui explique la densité remarquable atteinte par Clearwater Forest.
Avec toute cette densité, Intel annonce pouvoir diviser par 8 le nombre de racks utilisés dans les datacenters cibles par rapport à du matériel data de la 2e génération de l’Intel Scalable Platform, désormais arrivé au bout de son cycle de vie. Cela représente un gain de 3,5 x en performance par watts, et 2,3 x en nombre de vCPU par rack. Bref, autant d’arguments à destination des professionnels, typiquement pour de l’hébergement web apacher, des VPS peu gourmands ou encore des relais pour la 5G. Appétissant ? Encore faut-il savoir le prix, car la concurrence des EPYC, certes moins pourvue avec "seulement" 192 cœurs Zen5c sur la série 9005, devrait toutefois avoir l’avantage de la performance.
Les wafers des tuiles de calcul, en 18A, font clairement apparaître les 6 blocs de 4 E-Core/4 Mio de L2. Mais que c’est beau !

Enfin intel passe a un design qui innove un peu et qui change