Quand Jim Keller parle, on l'écoute. Le multi primé ingénieur a sauvé bien des situations désastreuses dans certaines entreprises où il est passé, la plus spectaculaire étant AMD, par deux fois déjà. Depuis quelque temps, il est devenu le ponte de la société Tenstorrent, spécialisée dans le hardware orienté IA. Et comme il se sentait seul, il a su capter Raja Koduri, qui est loin d'être un néophyte. Les deux avaient déjà bossé ensemble chez Intel et notre Nicolas national avait pu converser avec les deux lors de l'Intel Architecture Day de 2018.
En matière d'IA, on ne peut pas enlever à NVIDIA le sens de l'orientation. Ce dernier sait vite surfer sur les vagues, laissant les larmes aux autres. Le caméléon a su plaire, avec ses GPU orientés IA, à commencer par la Chine et ses gros biftons. Mais Tenstorrent ne compte pas rester planté là, en victime expiatoire. Cela nous permet de rappeler que Neovision, en France, est aussi sur ce créneau.
Selon Jim Keller, ses solutions hardware sont meilleures que celles de NVIDIA. C'est le CEO qui parle, forcément il ne peut déontologiquement pas dire le contraire. Mais il s'explique. D'après ses immenses connaissances sur le sujet, les GPU NVIDIA ont besoin d'avoir des accès aux processeurs et à la mémoire, ce qui constitue un goulot d'étranglement pas optimal : ça ne carbure pas à fond et ça consomme forcément. Avec ses solutions dédiées basées sur un CPU RISC-V, ce goulot disparait et la consommation est réduite sur un seul CPU.
L'environnement matériel, c'est bien, mais sans environnement logiciel, ça ne vaut rien. Si NVIDIA est très fort sur ce point avec un écosystème cohérent et riche, Jim Keller sait que sa solution marchera. D'ordinaire, les développeurs bossent sur des frameworks Python comme PyTorch ou Tensorflow. Ici, ce sera à BUDA, d'assurer la compatibilité avec ces langages, tout en proposant une interface bas niveau à base de C++.
Jim va plus loin. Il a tenu à montrer l'évolution de son hardware. En 2021, il sortait Grayskull, gravé en 12 nm pour 276 TFLOP. En 2022, Wormhole gravé en 12 nm offrait 328 TFLOP. En 2023, il lancera Black Hole, gravé en 6 nm, et donc SiFive RISC-V X280, ce sera une architecture hétérogène. Mais moins que Quasar et Grendel qui, en 2024, fonctionneront via association de chiplets, pour des performances accrues, des coûts maitrisés et des consommations qui le seront tout autant. En 2024, le bousin se paluchera Grace / Hopper des verts, qui continueront de bénéficier de l'expertise NVIDIA dans le domaine. La question qui nous terrorise finalement, c'est de savoir qu'est ce qu'on va faire de toute cette IA ? Quelle place va-t-on lui donner dans nos vies et nos appareils connectés ? En tout cas, il faut légiférer l'usage avant que certains ne franchissent la ligne jaune, comme vous l'expliquait Adrien l'autre jour.
Très bien ... la concurrence ça fait toujours du bien, Nvidia se sent intouchable, il faut que ça change un peu.