Le nouveau fleuron tout-puissant de la génération Hopper à tout pour plaire aux compagnies impliquées dans le domaine de l'intelligence artificielle, avec ses 80 milliards de transistors et un N4 sur-mesure par TSMC pour une puce aux capacités fortement supérieure à l'A100 de l'ancienne génération Ampere. Vu le niveau de performance, il n'est pas difficile d'imaginer que beaucoup d'entreprises cherchent en ce moment à mettre la main dessus. En théorie, pas de problème si vous vous trouvez dans les petits papiers des USA, en revanche, pas de bol pour les autres du mauvais côté du mur. En effet, depuis l'année dernière avec l'implémentation de nouvelles restrictions par les USA, plus personne ne peut vendre à des pays comme la Chine (enfin, surtout la Chine, en fait) des GPU ayant une bande passante supérieure ou égale à 600 Gio/s (une caractéristique cruciale dans le domaine de l'IA), ce qui a donc empêché NVIDIA de continuer à expédier de l'A100 et du H100 vers cette région. Cependant, NVIDIA avait rapidement trouvé la parade en commercialisant une version spéciale de l'A100 possédant une interface NVLink bridée à 400 Gio/s baptisée A800, et qui est pour le coup parfaitement légale.
Vous pensez donc bien que NVIDIA a effectivement adopté la même approche afin de pouvoir continuer à vendre et expédier l'âme de Jensen de la puce Hopper vers la Chine, et vers des acteurs (et gros clients) importants tels qu'Alibaba, Baidu et Tencent, sauf qu'elle s'y appelle H800 ! Sa conformité aux réglementations d'exportation vient du « simple » fait que la bande passante de l'interconnect aurait été bridé d'environ de moitié par rapport à l'original. Cette dernière information n'est pas officielle, NVIDIA n'étant pas entré dans les détails, mais ceci voudrait dire que le NVLink de la H800 moulinerait approximativement à seulement 300 Gio/s. La chute de performance de la H100 à la H800 serait donc potentiellement plus sévère qu'elle ne le fut entre l'A100 et l'A800. En revanche, n'oublions pas que la H100 est significativement plus rapide que l'A100, ce qui explique peut-être pourquoi NVIDIA a opté pour une limitation plus drastique. Notez que l'on ne sait toujours pas si cette bride est uniquement logicielle et serait donc potentiellement réversible, ou implique une modification matérielle de l'interconnect plus difficile, voire impossible à contourner.
Par curiosité, nous aimerions aussi bien savoir ce qu'en pensent les autorités américaines de cette petite « astuce ». Il n'est pas certain qu'elles voient forcément cela d'un très bon œil et il n'est pas à écarter que NVIDIA puisse à l'occasion se faire rappeler à l'ordre. En attendant, le constructeur américain peut donc continuer à vendre sans sourciller ses GPU qui valent de l'or à tous ceux qui en veulent et peuvent se les payer. Potentiellement, NVIDA pourrait même vendre encore plus de puces Hopper qu'en temps normal si l'on suppute que les entreprises chinoises pourraient tout simplement utiliser plus de H800 pour réaliser le même travail (la conception d'un ChatGPT chinois, par exemple ?) qu'un peu moins de H100... On savait déjà que Jensen avait un sens des affaires et du marketing inégalés, mais là, ce serait quand même très fort ! (Source : Tom's)