Usa Doc Sanctions Charte Comprendre 3a090

La dernière mise à jour des sanctions a beaucoup fait parler et causé pas mal de confusion. Le Département du Commerce des USA a essayé de clarifier tout ça...

Vous n’êtes pas seuls, beaucoup, nous inclus, se sont un peu perdus en cherchant à satisfaire la curiosité de savoir et comprendre quels sont exactement les GPU que les pays tels que la Chine vont désormais être dans l’impossibilité (théoriquement) de se procurer. Ça ne s’est pas vraiment arrangé la semaine passée avec l’apparition de nouveaux GPU chez NVIDIA, qui a dans la foulée été accusé parfois de violer et contourner les sanctions. Mais il faut garder à l’esprit que les références H20, L20 et L2 mentionnées ne sont pas officielles et n’ont pas été confirmées par le fabricant, leur existence future reste donc encore à ce jour parfaitement hypothétiquement et ne convainc pas tout le monde.

Justement, de son côté, l’analyste Patrick Moorhead a pris le temps d’un article pour expliquer que NVIDIA n’est pas "stupide", que le constructeur s’efforcera toujours à respecter les règles du jeu et que faire l’inverse ferait plus de mal que de bien à l’entreprise. Certes, ceci ne veut pas dire que NVIDIA ne cherche pas, directement ou indirectement (via les partenaires) à maximiser les ventes des futurs GPU sanctionnés avant l’entrée en vigueur du nouveau règlement (d’ici à quelques jours).

Usa Vs Chine Container

Pour clarifier le nouvel ensemble de règles pour le moins (très) alambiqué, le Departement of Commerce (DoC) a récemment tenu une réunion publique via Teams pour mieux expliquer quels sont les GPU qui peuvent être exportés vers la Chine et ceux qui ne le peuvent plus. Tout d’abord, il faut savoir que les nouvelles règles se basent sur trois nouveaux éléments : le Total Processing Performance (TPP), la densité de performance (Performance Density ou PD) et l’interprétation par le DoC de ce qu’est un produit conçu pour un usage en datacenter.

Le Total Processing Performance correspond grosso modo à la puissance de calcul d’une puce - qu’elle soit orientée mainstream ou pro - déclarée par le fabricant, multipliée par la durée d’une opération (FLOPS ou TOPS) sans "sparsité" (dans le cas de la multiplication de matrices). Un GPU H100 de NVIDIA, avec ses 989 TFLOPS en FP16/BF16 avec "sparsité" obtient un TPP de 7912, ce qui est bien au-delà de la limite de 4800 fixée par le DoC. Et il en va de même pour une RTX 4090, qui tombera dans la même catégorie de GPU soumis à licence à cause de son TPP de 5280 obtenu avec ses 660 TFLOPS en FP8.

La Performance Density est une métrique établie spécifiquement pour les puces haute densité spécialisées ayant un TPP entre 1600 et 4800 dans le but d’éviter le contournement des sanctions par l’achat d’une plus grande quantité de puces moins puissantes et qui pourrait de concert offrir des performances équivalentes aux solutions sanctionnées. La PD est calculée en divisant le TPP par la superficie du die en mm2 (surface incluant donc les caches, mais excluant la mémoire externe). Ainsi, une L4, avec son TPP de 1936 et sa puce AD104 de 294 mm2 à un PD de 6,5. Elle ne peut donc plus être exportée vers la Chine. À l’inverse, une RTX 4070 Ti exploitant le même GPU, mais n’étant pas destinée de base aux datacenters, n’est pas restreinte.

En sus du TPP et du PD, l’interprétation du DoC jouera désormais aussi un rôle très important. En effet, l’autorité appréciera aussi l’orientation et l’usage potentiel d’un produit en fonction de ses caractéristiques physiques et techniques plutôt qu’en se basant uniquement sur la dénomination attribuée par le fabricant dans son catalogue. Il s’agit ici de cibler les cartes n’étant pas nécessairement vendues par un constructeur spécifiquement pour les centres de données, mais pouvant l’être du fait de leur(s) caractéristique(s). Comprenez par là qu’une carte gaming, telle qu’une RTX avec un GPU pourtant non sanctionné, mais proposé dans un format compact avec un refroidissement passif ou un blower peut être catégorisée comme produit pour data center et peut ainsi être soumis à licence d’exportation...

Enfin, voici la charte présentée par le DoC pour appuyer ses explications :

Usa Doc Sanctions Charte Comprendre 3a090

NAC = Notify Advanced Computing / ECCN = Export Control Classification Number

Les produits dans la zone rouge sont soumis à licence pour leur exportation et re-exportation, et celle-ci sera soumise à examen avec une "présomption de refus". Autrement dit, il s’agit du hardware comme la H100, la A100, A800, H800, RTX 4090, etc. dont l’exportation sera prochainement impossible vers des pays comme la Chine. La zone jaune englobe les puces à "performances modérées" avec un TPP de 1600 à 4800 et une densité de performance de 1,6 à 6. Dans leur cas, le vendeur devra donner un préavis au gouvernement et attendre jusqu’à 25 jours pour l’obtention de l’accord. Enfin, la zone verte est celle des produits qui peuvent être vendus sans avoir à demander une permission aux autorités, du moins, pas dans ce contexte-là. (Source : DoC, Tom’s)

Matt

Aucun commentaire

Laissez votre commentaire

En réponse à Some User