Le DGX Spark est l’interprétation par NVIDIA du mini-PC : un volume réduit, un APU diablement couillu (une superchip GB10 fusionnant 20 cœurs Arm big.LITTLE et un iGPU Blackwell à 6144 unités de calcul). Revendu et intégré par les partenaires de la firme (ASUS, MSI, GIGABYTE), le bousin est tarifé aux alentours de 3000 € et destiné aux professionnels/étudiants bossant dans l’IA, avec la promesse d’entraîner et inférer des réseaux de neurones directement sur son bureau, la consommation annoncée à 240 W de la machine aidant au (relatif) silence.

Dans la théorie, voilà qui semble alléchant, mais en pratique, des premiers rapports de bugs sortent sur les réseaux, notamment de la part de John Carmack, co-fondateur d’Id Software de son état. Voyez donc :
DGX Spark appears to be maxing out at only 100 watts power draw, less than half of the rated 240 watts, and it only seems to be delivering about half the quoted performance (assuming 1 PF sparse FP4 = 125 TF dense BF16). It gets quite hot even at this level, and I saw a report …
—John Carmack (@ID_AA_Carmack) October 27, 2025
Selon ses observations, le Spark — en tout cas, son ou ses unités — serait victime d'une limitation du TDP en n'avalant que 100 W sur les 240 promis. Résultat : des performances moitié moindres qu'espérées (ce qui semble logique, sur ce coup). Le constat serait partagé par Hannun, le développeur en charge d'App e MLX, par un microbenchmark pointant un souci dans l'implémentation de cuBLAS, qui n'est capable que de 60 TFLOPS en BF16 sur des matrices larges, au lieu des 125 théoriquement possibles (1 PFLOPS en FP4 sparse étant en théorie égal à 125 TFLOPS FP16 : un facteur deux pour la sparsité, et un facteur 4 pour l'encodage).
Fort heureusement, H&Co est également en possession d'un exemplaire de chez Gigabyte, la AI Top Atom (dont la parution du test ne sera pas immédiate afin de vous proposer une qualité convenable !), sur lequel nous avons également fait tourner quelques benchmarks légers pour voir ce qu'il en était niveau performance et consommation. Nos conclusions préliminaires pointent effectivement vers une performance en multiplication de matrices larges BF16 de 60 TFLOPS, mais pas de bridage de la consommation : en charge, nous mesurons en effet cette valeur pour une multiplication de matrices de taille 8192 x 8192 itérées 500 fois avec warm-up, conformément au script laissé par Hannun... mais d'autres benchmarks tels BERT via Torchbenchmark, couplés à une charge CPU, arrivent bien à faire cracher plus de 200 W (mesurés à la prise) à notre exemplaire.
En présence de calcul sur le CPU, la consommation de l'iGPU nous semble limitée à 50 W, là où 100 W sont observés en charge GPU seule, ce qui mène à un tirage d'un peu plus de 160 W à la prise. Ce mécanisme d'équilibrage du TDP est bien connu, qui semble dans notre cas lié à notre application de test : impossible d'en inférer avec certitude le comportement global. Rajoutez que notre DGX Spark est alimenté par 128 Gio de LPDDR5x, bien moins puissante que la GDDR ou la HBM utilisée sur GPU et serveurs. Ces puces, outre leur gourmandise en électron expliquant les consommations réduites CPU / GPU par rapport à la mesure à la prise, peuvent expliquer des performances inférieures aux capacités théoriques de la puce dans le cas de larges matrices. Rendez-vous à l'occasion du test complet pour en savoir plus ! (Source : Videocardz)
Cool vivement un test car les perfs ne me paraissent pas ouf.
Ça semble en tout cas être un bon réchauffe tasse.
Il y a quelques avantages : écosystème clé en main NVIDIA (mais un peu plus fermé du coup)
C'est pas mal si tu dev pour de gros déploiement sur du Grace Blackwell , c'est le même hardware en plus petit... Enfin sans infiniband et plein de petits détails qui diffèrent mais assez proche quand même.
C'est compact aussi.
Mais pour un particulier qui fait pas de dev/déploiement sur du datacenter, Strix halo (les mini pc AMD à base de ai 395 max) fait la même chose en terme en de perf pour de l'inférence pour nettement moins cher et plus ouvert. En plus là le CPU c'est de l'arm donc plutôt chiant pour plein de distro/packages ...bref pas vraiment utilisable en standalone selon moi.