Corsair Mp700 Cooling Teasing

On le sait, les SSD PCIe 5.0 consomment et chauffent beaucoup, mais les premiers avec un contrôleur Phison E26 ont de surcroît un souci avéré de throttling.

En marge des des premiers tests des premiers SSD NVMe PCIe 5.0, certains ont fini par mettre en évidence un souci de chauffe secondé d’un problème de throttling, un mécanisme apparemment inopérant ou trop conservateur. C’est avec le Corsair MP700, l’un des rares modèles déjà sur le marché, que cela a été découvert par TechPowerUP et Phoronix, qui avaient aussi entrepris de tester le SSD sans refroidissement (tel qu’il est d’ailleurs vendu) pour voir son comportement. Résultat des courses, le premier a vu son exemplaire s’éteindre et disparaître du gestionnaire sous Windows après 86 secondes de lecture ou 55 secondes d’écritures. Dans les deux cas, il fallait redémarrer le PC pour retrouver le SSD. À noter que ce dernier n’avait souffert d’aucune perte de donnée dans ces situations.

De son côté, Phoronix a joué avec du benchmark sous une installation Ubuntu fraîche et découvert dans les logs que le SSD — plus spécifiquement, son contrôleur PS5026-E26 — dysfonctionnait après 3 minutes et avec une température relevée de 87 °C, tandis que des erreurs de systèmes avaient même déjà commencé à être générées pendant l’installation. Le point commun aux deux tests c’est que le SSD se trouvait au moment de sa « panne » à plus de 85 °C et était donc clairement en état de surchauffe, en sachant que Corsair indique pour son MP700 une plage de fonctionnement de 0 à 70 °C (et accessoirement une température de stockage de -40 à +85 °C). Sa consommation en fonctionnement est par ailleurs de 10W, ce qui entre toujours dans la limite des 11,55 W de la spécification JEDEC de consommation maximale pour le slot M.2.

Néanmoins, en dépit de la chauffe avérée, le comportement observé n’est pas du tout celui attendu. Un SSD doit en principe ajuster son fonctionnement selon une courbe de thermal throttling dès lors qu’il commence à avoir trop chaud, ce qui occasionne des pertes de performances, mais permet d’éviter les crashs ou les erreurs. En fait, il se trouve que le coupable n’est pas le MP700 de Corsair, mais bien son contrôleur PS5026-E26 de chez Phison, une puce utilisée par la grande majorité des premiers SSD PCIe 5.0. Phison a déjà réagi suivant la publication des premiers tests et la mise en évidence du problème, et le constructeur a admis qu’il y a effectivement un problème avec son firmware. Heureusement, ses équipes ont déjà trouvé ce qui n’allait pas et effectué les ajustements nécessaires. La mise à jour du micrologiciel sera distribuée dès lors qu’elle aura été validée. Tant mieux, mais on est quand même en droit de s’interroger pourquoi et comment ce défaut pourtant assez évident est passé entre les mailles du soi-disant « processus de validation très strict » de Phison...

Corsair Mp700 Cooling Teasing

Le MP700 de Corsair fut initialement présenté ainsi, puis avec un gros radiateur passif. En fin de compte, Corsair a opté pour le vendre uniquement tout nu et de conseiller aux acheteurs de prendre un refroidissement aftermarket ou d'utiliser celui de la carte mère.

Dans son communiqué officiel, Phison en a aussi profité de rappeler qu’un SSD PCIe 5.0 même vendu sans radiateur est prévu pour être utilisé avec un refroidissement et que l’option « nu » existe seulement pour permettre aux clients d’utiliser une solution de refroidissement existante, par exemple celle généralement présente sur leur carte mère, dont la plupart étant compatible PCIe 5.0 possède généralement un gros radiateur conçu spécialement pour la nouvelle génération de SSD. De toute façon, on était prévenu depuis longtemps. En mars 2022, le CTO de Phison avait déjà clairement affirmé qu’un refroidissement, idéalement actif, serait nécessaire pour les SSD PCIe 5.0. Ce n’est pas pour rien que Phison avait livré avec son engineering sample de SSD à base de E26 avec un radiateur ventilé. À défaut et en pratique, un gros radiateur complété d’une tour bien ventilée fait en principe aussi l’affaire. (Source : Tom’s)

Matt


  • Ils sont gravés avec quelle finesse les ssd pcie 5? Chauffer autant, qu'est-ce que ça va être pour les futurs ssd pcie6,7 et 8? Faudra des ventirad triple slots comme les CGs ?

    • C'est du 12 nm de chez TSMC. La consommation de la puce seule n'est pas encore mentionnée sur la fiche technique chez Phison. Pour l'anecdote, PS5016-E16 (PCIe 4.0, conso 2,6 W) et PS5012-E12 (PCIe 3.0, conso 2,1 W) sont en 28 nm, PS5018-E18 (PCIe 4.0, conso 3,0 W) est déjà en 12 nm.

      En soi, la chauffe est déjà un problème avec les SSD PCIe 3.0 et 4.0, même s'il leur en faut quand même un peu plus pour arriver au point de throttling.

      Je suppose que la prochaine étape sera de passer à un procédé 10 nm ou de catégorie 7 nm.

      Mais avant de les coiffer de ventirads triple slot, je pense qu'on pourra d'abord commencer par des trucs comme ça ! 😄

      • Quand on voit la chaleur produite, ils auraient du commencer à les produire en 10 ou 7 nm. Cela couterait certes plus chère (et encore vu les marges qu'ils doivent se faire, ne pas augmenter les prix les rendraient encore surement rentable) mais au moins, ça chaufferait surement beaucoup moins.

      • Le seul intérêt de produire en 10 ou 7 nm du point de vu fabricant, sera d'augmenter la densité. Par pour conserver la même densité et réduire la chauffe. 

      • Pourquoi chercheraient-ils à augmenter la densité? Pour réduire la taille des chip? Pour caser plus de transistors?

        On parle du contrôleur, pas de la NAND. Et c'est là un contrôleur pour une tâche bien réglé, pas un CPU ou un GPU, qui doit sans cesse intégrer plus de cœurs ou plus de cache pour gagner des perfs. Intégrer plus de transistors sur ce genre de chip n'a aucun intérêt, si on ne sait pas quoi en faire.

        Et si réduire la taille d'un chip permettrait d'en caser plus sur un wafer et donc de baisser les coûts, le prix des galette augmente fortement avec un node plus avancé. Donc pas sûr que l'opération soit gagnante au bout du compte.

         

        Par contre, les nodes plus avancés permettent effectivement de baisser la conso et d'augmenter les fréquences. Et là, on en voit bien l'utilité, au vu de la surchauffe de ces chips, alors qu'ils sont pourtant encore assez loin des 16 Go/s qu'on leur demandera de tenir, à terme, sur 4 lignes.

  • Je ne comprends pas trop le rapport entre finesse de gravure et chauffe, sans refroidissement c'est plutôt l'inverse en fait ?

    Plus la puce est gravée finement, moins elle a de la surface pour évacuer la chaleur ?

    Le plafond / palier de la loi de Moore atteint par le P4, c'est justement lié à la difficulté à évacuer plus de chaleur (115W sur un Prescott) à cause de la finesse de gravure / densité. Au lieu de mettre toujours plus de transistors / étage de pipeline prédiction de branchements, Intel a fait plus simple, et le core M consommait 4x moins pour des perf pas si dégueux en comparaison.

7 commentaires

Laissez votre commentaire

En réponse à Some User