Phénomène mis en évidence il y a 3 jours seulement, beaucoup d’informations ont déjà circulé entre-temps. Comme souvent, internet oblige, ça part un peu dans tous les sens et chacun tend à y aller de sa théorie (du complot), parfois en fonction de ses affinités avec les différentes marques, ce qui n’est pas vraiment la recette idéale pour former un avis objectif, d’autant plus que le problème semble a priori revêtir un aspect technique assez complexe et peu accessible dans l’immédiat à la majorité d’entre-nous. Toujours est-il que les fabricants — eh oui, parce qu’il n’y a pas qu’ASUS de concerné dans cette histoire — n’ont pas trop attendu pour réagir, preuve qu’il y a(vait) bien un problème avéré !
Clairement la marque la plus en première ligne, au moins durant les premières heures, ASUS avait rapidement fait disparaître les vieux BIOS pour les remplacer par de nouvelles versions pour toutes ses cartes mères AM5. En parallèle, MSI en a fait de même, explicitement pour bloquer toute possibilité d’augmenter le voltage d’un Ryzen 7000X3D, via BIOS ou logiciel sous Windows ; GIGABYTE n’a encore rien publié, mais a supprimé tous les BIOS antérieurs à ceux ayant introduit le support des Ryzen 7000X3D pour l’ensemble de ses mobales AM5 ; ASRock a publié de nouveaux BIOS bêta avec l’AGESA 1.0.0.6 le 20 avril pour toutes ses références AM5, difficile d’y voir une coïncidence avec les problèmes rapportés. En somme, quelle que soit votre carte mère, la mise à jour du BIOS semble inévitable et est certainement recommandée.
Quid des victimes ? Initialement, il était surtout question des Ryzen 7000X3D, mais il s’avère que des Ryzen 7000 ont également été touchés. Par exemple, Der8auer a trouvé des traces sur un groupe de pins de son 7900X, mais celui-ci est heureusement toujours fonctionnel. Il a aussi constaté un voltage CPU SoC trop élevé à son gout via HWinfo après application du profil EXPO. À propos de pins, Igor d’Igor’s Lab a déterminé que les traces relevées sur un Ryzen 7000X3D victime se trouvent au niveau d’un groupe de pins juste en dessous du die du CPU. Puis, après y avoir transposé un diagramme qu’il a dû lui-même composer (AMD n’en fournissant aucun étant complet), a pu découvrir que les contacts affectés sont liés au VDDCR (CPU Core Power Supply), mais dont seulement une partie semble toutefois avoir été touché. À savoir que les traces sur le 7900X de Der8auer se trouvent précisément aussi à cet endroit. Pourquoi celui-ci en particulier ? Ça, personne ne le sait encore. Sur d’autres CPU, par exemple un 7700X décédé sur une carte mère ASRock, le problème était plutôt localisé au centre, avec des traces et même un PCB gonflé à cet endroit. Bien que les dégâts — typiques dans le cas du Ryzen 7 d’une grosse surchauffe sur une longue période — se trouvent ici au niveau de la puce I/O, les pins concernés sont encore une fois liés au VDDCR.
Achtung, celle-ci est uniquement en allemand.
Il se pourrait donc qu’il s’agisse d’une faiblesse généralisée à l’ensemble de la génération, mais dont l’origine exacte reste encore à déterminer. Dans un premier temps, Der8auer et Igor ont chacun écarté la possibilité d’un batch de socket défectueux. Le point commun relevé pour la plupart des scénarios de décès est qu’il n’y avait pas d’overclocking du CPU, sauf pour l’activation d’un profil XMP/EXPO, lequel implique des voltages plus élevés pour la mémoire et le SoC du CPU. Un détail important, puisque c’est précisément dans cette direction que pointe aussi un communiqué d’ASUS, qui a affirmé « travailler avec AMD pour définir de nouvelles règles pour le voltage du SoC et EXPO », tout confirmant au passage avoir également retiré la possibilité d’un ajustement manuel du Vcore avec les nouveaux BIOS. Par ailleurs, Der8auer spécule aussi qu’une des origines du problème pourrait être liée à un mauvais fonctionnement ou carrément au non-fonctionnement des protections et/ou des capteurs de température internes au CPU, laissant alors celui-ci atteindre des températures fatales à cause d’une carte mère continuant à l’alimenter comme si de rien n’était. Assez pour causer sa mort ou encore dessouder l’IHS ?
Alors, qui blâmer ? EXPO ? Les CPU ? Les constructeurs ? AMD ? C’est encore trop tôt pour le dire, mais quoi qu’il arrive, on va certainement encore beaucoup en entendre parler. Attendons aussi de voir ce que Steve de Gamer’s Nexus va pouvoir y contribuer de son côté. Enfin, toute cette affaire pourrait éventuellement également relancer quelques débats autour de l’overclocking, puisqu’il faut rappeler que EXPO, XMP, PBO et tous ces trucs toujours très mis en avant par les marques dans leur marketing restent ni plus ni moins des overclockings, et dont les résultats obtenus sont par conséquent absolument hors spécifications et parfaitement non garantis (pas plus que les éventuels dégâts).
Pour finir, sachez que c’est toujours silence radio du côté d’AMD, mais le bruit court que la marque est bel et bien active derrière les rideaux et cherche hâtivement à introduire une limite de voltage ou un verrouillage du micrologiciel afin d’empêcher EXPO, mais aussi l’utilisateur de dépasser une certaine limite, notamment pour le SoC — pour lequel 1,25 V est le maximum généralement recommandé. AMD pourrait cependant ne pas complètement empêcher les manipulations du voltage du SoC par les constructeurs, étant donné que son niveau est aussi dicté par les VRM de la carte mère, et on sait bien que les constructeurs ont parfois du mal à s’empêcher à ne pas contourner certaines recommandations. Au grand dam des overclockeurs, une telle limitation pourrait potentiellement réduire le plafond de vitesse pour la DDR5, mais sans que cela remette en question le fameux « sweet spot » à 6000 MHz. (Source : Tom’s)
L’analyse d’Igor’s Lab, avec diagramme et superposition des dégâts des pins avec l’intérieur du CPU (en anglais).