Nvidia RTX 5090

Usage créatif / productif

Un GPU ne sert pas uniquement au jeu, surtout pour une référence telle que la RTX 5090. Que peut-on donc attendre de la génération Blackwell dans ce domaine, en comparaison de leurs devancières ? Pour donner une petite idée des capacités à ce niveau, nous avons préparé un échantillon de tests, couvrant une (petite) partie des usages possibles avec un GPU en dehors du jeu.

Blender

Premier logiciel utilisé pour nos tests, Blender et son moteur de rendu Cycle, capable d’utiliser les GPU au travers d’Optix (GeForce), HIP (Radeon) et oneAPI (Intel Arc). Nous utilisons le benchmark qui va rendre 3 scènes différentes afin d'avoir une idée concrète des forces en présence.

Blender - RTX 5090 FE

1Samples par minute - Le plus élevé est le meilleur Titre Couleur Blender - Monster Blender - Junkshop Blender - Classroom \nTitre Court Monster Junkshop Classroom \nSous-titre 4.3.0 - Optix / HIP / oneAPI 4.3.0 - Optix / HIP / oneAPI 4.3.0 - Optix / HIP / oneAPI \nRadeon RX 6900 XT MBA #ED1C24 1266 789 667 \nRadeon RX 7900 XT MBA #ED1C24 1804 966 825 \nRadeon RX 7900 XTX MBA #ED1C24 2073 1144 966 \nGeForce RTX 3090 FE #76B900 2481 1562 1388 \nGeForce RTX 4080 SUPER FE #76B900 4270 2067 2152 \nGeForce RTX 4090 FE #76B900 5457 2676 2781 \n**GeForce RTX 5090 FE** #76B900 7290 3839 3638

Quelle que soit la scène retenue, les GeForce écrasent la concurrence, dans ce qui est indubitablement un point fort des verts, à savoir son support des applications professionnelles via son écosystème logiciel particulièrement développé à ce niveau. Qui plus est, ces rendus faisant appel au Path Tracing, la supériorité architecturale des verts pour ce type de tâches, contribue fortement à cette hiérarchie à sens unique. La nouvelle née des verts apporte entre 31 % et 43 % de mieux que la RTX 4090 selon les scènes, soit des gains relativement similaires à ceux constatés en jeu. Elle enfonce donc le clou face à la concurrence. 

Cinebench 2024

Second logiciel de notre échantillon de test, Cinebench est le benchmark issu du logiciel Cinema 4D de Maxon utilisant son propre moteur de rendu Redshift. Nous utilisons la dernière version en date qui propose à présent les tests des GPU, à l'exception des Intel ARC (peut-être à l'avenir via une mise à jour ?).

Cinebench 2024 - RTX 5090 FE

1Points - Le plus élevé est le meilleur Titre Couleur Cinebench 2024 \nTitre Court Cinebench \nSous-titre 2024.1.0 - CUDA / HIP \nRadeon RX 6900 XT MBA #ED1C24 7191 \nRadeon RX 7900 XT MBA #ED1C24 14043 \nRadeon RX 7900 XTX MBA #ED1C24 15505 \nGeForce RTX 3090 FE #76B900 18768 \nGeForce RTX 4080 SUPER FE #76B900 26849 \nGeForce RTX 4090 FE #76B900 33571 \n**GeForce RTX 5090 FE** #76B900 Non applicable

Malheureusement, la RTX 5090 n'est pas encore supportée. Nous avons tout de même conservé ce test pour leur mettre à jour dès que ce sera le cas.

DaVinci Resolve

Poursuivons ces tests en utilisant DaVinci Resolve Studio, une référence pour le traitement des vidéos. Dans un premier temps, nous réalisons un projet à partir de rushs ProRES en UHD. Nous appliquons ensuite divers effets (flou gaussien, effets de style, etc.) et encodons le tout en H.264 pour un usage Vimeo 2160P, dans un conteneur "MOV". Nous utilisons ensuite pour les tests suivants, un fichier brut ProRES en 8K (44 s pour limiter la taille déjà gigantesque), que nous allons exporter en 8K dans un conteneur "MP4", via un encodage H.265 puis AV1 (pour les cartes qui en sont capables), afin de solliciter les encodeurs de nos GPU.

DaVinci Resolve - RTX 5090 FE

1Secondes - Le plus faible est le meilleur Titre Couleur DaVinci Resolve - Projet 4K H.264 DaVinci Resolve - Encodage 8K H.265 DaVinci Resolve - Encodage 8K AV1 \nTitre Court Projet 4K H.264 Encodage 8K H.265 Encodage 8K AV1 \nSous-titre 19.1.2.003 - Profil Vimeo 4K 19.1.2.003 - Profil "le plus rapide" 19.1.2.003 - Profil "le plus rapide" \nRadeon RX 6900 XT MBA #ED1C24 42 125 Non applicable \nRadeon RX 7900 XT MBA #ED1C24 36 73 63 \nRadeon RX 7900 XTX MBA #ED1C24 33 72 63 \nGeForce RTX 3090 FE #76B900 30 118 Non applicable \nGeForce RTX 4080 SUPER FE #76B900 26 45 42 \nGeForce RTX 4090 FE #76B900 19 46 43 \n**GeForce RTX 5090 FE** #76B900 14 39 39

Notez que nous mesurons ici le temps d’export, mais pour une comparaison équitable, il ne faut pas se contenter de ce paramètre, mais aussi de la qualité obtenue. Cette opération aussi longue que fastidieuse n’est pas réalisable lors d’un tel dossier, mais il nous paraît important de le rappeler. Pour les tâches d’encodage pur, la RTX 5090 propose entre 10 % et 18 % de mieux que sa devancière, du fait de la présence d'un troisième encodeur activé (GB202 semble en contenir 4). Notre projet Vimeo ayant recours en sus aux unités de calcul pour appliquer les différents effets suivis d'un encodage H.264 dont le traitement a été accéléré au niveau des NVENC de 9e génération, la RTX 5090 porte à 36 % son avantage sur son aînée.

DxO PhotoLab

Poursuivons ces tests en utilisant DxO PhotoLab, une référence pour le traitement des photos. Nous exportons au format DNG 88 fichiers RAW issus de différents APN, en appliquant le filtre de débruitage XD2s, la compensation du flux optique et la correction des aberrations chromatiques. Nous activons pour cela l'accélération DeepPrime pour chaque GPU.

DxO PhotoLab - RTX 5090 FE

1Secondes - Le plus faible est le meilleur Titre Couleur DxO PhotoLab \nTitre Court PhotoLab \nSous-titre 8.2.1.487 - Export de 88 photos + débruitage XD2s \nRadeon RX 6900 XT MBA #ED1C24 190 \nRadeon RX 7900 XT MBA #ED1C24 126 \nRadeon RX 7900 XTX MBA #ED1C24 114 \nGeForce RTX 3090 FE #76B900 150 \nGeForce RTX 4080 SUPER FE #76B900 113 \nGeForce RTX 4090 FE #76B900 100 \n**GeForce RTX 5090 FE** #76B900 87

Les Radeon semblent apprécier grandement, puisque pour une fois lors d'un test sur cette page, la RX 7900 XTX tient son rang face à la RTX 4080 SUPER. Et la nouvelle née des verts ? Son avantage n'est ici "que" de 15 % sur la RTX 4090, même si c'est toujours ça de pris.

IA : génération d'images

Poursuivons ces tests en utilisant Procyon, afin de mesurer les performances en IA (inférence ici). Ce logiciel permet ainsi de générer une image à partir d'une description en langage courant de cette dernière. Pour la mise en œuvre locale des opérations d'inférences sous Windows, nous utilisons le logiciel Procyon d'UL, simplifiant grandement notre précédente utilisation via Automatic1111 WebUI. En effet, il est très complexe de faire fonctionner sur une même configuration sans interférences, de nombreuses versions de Python, Pytorch et autres. Le modèle utilisé est SD1.5 avec une inférence réalisée en FP16, utilisant DDIM et 100 étapes. 16 images sont générées par batch de 4 et nous réalisons 3 fois le bench en conservant la meilleure performance. La série 50 proposant également une prise en charge native du format FP4, nous avons également ajouté la génération d'images via FLUX1 de Blak Forest Labs, dont la version de développement tire parti par une adaptation du modèle T5xxl CLIP, originellement fonctionnant en FP16. Nous réalisons la génération de 4 images en FP4, mais aussi FP8, utilisant EULER et 30 étapes avec une taille de lot à 1. 

IA : génération d'images - RTX 5090 FE

1Images par minute - Le plus élevé est le meilleur Titre Couleur Procyon : génération d'images Procyon : génération d'images Procyon : génération d'images \nTitre Court Stable Diffusion (Procyon) Black Forest Labs FLUX.1 (FP4) Black Forest Labs FLUX.1 (FP8) \nSous-titre 1.1.172 - SD-v1-5 - 512 x 512 - FP16 - DDIM - 100 steps - Batch = 4 1.1.177 - FLUX.1-dev - 1024 x 1024 - FP4 - EULER - 30 steps - Batch = 1 1.1.177 - FLUX.1-dev - 1024 x 1024 - FP8 - EULER - 30 steps - Batch = 1 \nRadeon RX 6900 XT MBA #ED1C24 3.9 Non applicable Non applicable \nRadeon RX 7900 XT MBA #ED1C24 16.5 Non applicable Non applicable \nRadeon RX 7900 XTX MBA #ED1C24 18.6 Non applicable Non applicable \nGeForce RTX 3090 FE #76B900 28.1 Non applicable Non applicable \nGeForce RTX 4080 SUPER FE #76B900 41.0 2.0 3.6 \nGeForce RTX 4090 FE #76B900 57.4 3.4 6.5 \n**GeForce RTX 5090 FE** #76B900 72.3 15.3 9.1

Le résultat obtenu est un score en points, mais nous préférons exprimer ce dernier en images par minute pour faciliter sa compréhension. La RTX 5090 devance de 26 % la RTX 4090 avec Stable Diffusion en FP16. L'avance passe à 40 % via Flux1 en FP8, puis 450 % lorsque l'on utilise cette fois la précision FP4 pour l'inférence des images.

IA : génération de texte

Poursuivons ces tests en utilisant toujours Procyon, afin de mesurer cette fois les performances en génération de texte par IA. Le logiciel propose 4 tests utilisant chacun un modèle différent (Phi3.1, Mistral 7-B, Llama 3.1 et Llama 2). Cela permet de tester différentes tailles de modèles. Ils fonctionnent ici via le runtime ONNX de Microsoft s'appuyant sur DirectML permettant une comparaison interconstructeur. 2 points sont importants dans le cadre d'un LLM (Large Language Models), le taux de génération (exprimé en tokens par seconde) et le temps moyen pour le premier token. Pour éviter de créer 2 graphiques séparés, nous utilisons le score calculé par UL qui intègre ces deux paramètres dans son calcul.

IA : génération de texte - RTX 5090 FE

1Points - Le plus élevé est le meilleur Titre Couleur Procyon : LLM (génération de texte) Procyon : LLM (génération de texte) Procyon : LLM (génération de texte) Procyon : LLM (génération de texte) \nTitre Court PHI 3.5 Mistral 7B Llama 3.1 Llama 2 \nSous-titre 1.0.74 - PHI 3.5 - ONNX 1.0.74 - Mistral 7B - ONNX 1.0.74 - Llama 3.1 - ONNX 1.0.74 - Llama 2 - ONNX \nRadeon RX 6900 XT MBA #ED1C24 1375 1162 1066 1195 \nRadeon RX 7900 XT MBA #ED1C24 2080 2184 2018 2288 \nRadeon RX 7900 XTX MBA #ED1C24 2285 2395 2234 2485 \nGeForce RTX 3090 FE #76B900 3799 3672 3553 3450 \nGeForce RTX 4080 SUPER FE #76B900 4278 4034 3797 3915 \nGeForce RTX 4090 FE #76B900 5135 5153 4915 5035 \n**GeForce RTX 5090 FE** #76B900 5999 6617 6540 6739

Malgré l'usage d'ONNX (Nvidia ne peut s'appuyer sur TensorRT pour ce test), les GeForce dominent toujours largement les Radeon. Si on s'intéresse aux apports de la RTX 5090, elle propose des gains compris en 17 % et 34 % selon le LLM par rapport à la RTX4090.

Consommation & efficacité énergétique

Mais bon, consommer plus c'est une chose, mais si les tâches sont exécutées plus rapidement, alors la quantité d'énergie totale nécessaire pour l'exécution de ces dernières peut finalement être moindre. C'est pour cela qu'il est intéressant de mesurer ce paramètre au travers de l'efficience de nos cartes.

Consommation électrique en création/production - RTX 5090 FE

1Watts - Le plus faible est préférable Titre Couleur Consommation électrique en charge Consommation électrique en charge Consommation électrique en charge Consommation électrique en charge Consommation électrique en charge Consommation électrique en charge Consommation électrique en charge Consommation électrique en charge \nTitre Court Blender Cinebench DaVinci Resolve (H.264 Project) DaVinci Resolve (Encodage H.265) DaVinci Resolve (Encodage AV1) PhotoLab Stable Diffusion LLM \nSous-titre Blender - carte graphique uniquement Cinebench - carte graphique uniquement DaVinci Resolve (H.264 Project) - carte graphique uniquement DaVinci Resolve (Encodage H.265) - carte graphique uniquement DaVinci Resolve (Encodage AV1) - carte graphique uniquement PhotoLab - carte graphique uniquement Stable Diffusion - carte graphique uniquement LLM (Mistral 7B) - carte graphique uniquement \nRadeon RX 6900 XT MBA #ED1C24 285 208 290 84 Non applicable 282 289 284 \nRadeon RX 7900 XT MBA #ED1C24 300 274 303 136 143 301 303 294 \nRadeon RX 7900 XTX MBA #ED1C24 338 316 340 157 164 327 341 330 \nGeForce RTX 3090 FE #76B900 350 316 351 160 Non applicable 344 361 350 \nGeForce RTX 4080 SUPER FE #76B900 215 185 225 104 112 259 303 273 \nGeForce RTX 4090 FE #76B900 278 244 283 124 127 294 380 337 \n**GeForce RTX 5090 FE** #76B900 403 Non applicable 415 163 163 368 553 463

En définitive, la nouvelle venue va donc s'avérer plus efficiente que la RTX 3090 ou les Radeon, elle régresse malgré tout par rapport aux cartes Ada Lovelace. Nous n'avons pas inclus l'efficacité énergétique sur la génération d'images en FP4, puisque ce test se limite à 3 cartes en tout et pour tout, par contre l'efficacité énergétique serait là en faveur de la dernière née des verts.

Efficacité énergétique en création/production - RTX 5090 FE

1Le plus élevé est le meilleur Titre Couleur Efficacité énergétique en charge Efficacité énergétique en charge Efficacité énergétique en charge Efficacité énergétique en charge Efficacité énergétique en charge Efficacité énergétique en charge Efficacité énergétique en charge Efficacité énergétique en charge \nTitre Court Blender Cinebench DaVinci Resolve (H.264 Project) DaVinci Resolve (Encodage H.265) DaVinci Resolve (Encodage AV1) PhotoLab Stable Diffusion LLM \nSous-titre Blender - carte graphique uniquement Cinebench - carte graphique uniquement DaVinci Resolve (H.264 Project) - carte graphique uniquement DaVinci Resolve (Encodage H.265) - carte graphique uniquement DaVinci Resolve (Encodage AV1) - carte graphique uniquement PhotoLab - carte graphique uniquement Stable Diffusion - carte graphique uniquement LLM (Mistral 7B) - carte graphique uniquement \nRadeon RX 6900 XT MBA #ED1C24 2.3 34.6 8.2 9.5 Non applicable 1.9 1.3 4.1 \nRadeon RX 7900 XT MBA #ED1C24 2.8 51.3 9.2 10.1 11.1 2.6 5.5 7.4 \nRadeon RX 7900 XTX MBA #ED1C24 2.9 49.1 8.9 8.8 9.7 2.7 5.5 7.3 \nGeForce RTX 3090 FE #76B900 4.0 59.4 9.5 5.3 Non applicable 1.9 7.8 10.5 \nGeForce RTX 4080 SUPER FE #76B900 10.0 145.1 17.1 21.4 21.3 3.4 13.5 14.8 \nGeForce RTX 4090 FE #76B900 10.0 137.6 18.6 17.5 18.3 3.4 15.1 15.3 \n**GeForce RTX 5090 FE** #76B900 9.0 Non applicable 17.2 15.7 15.7 3.1 13.1 14.3

Voilà pour les prestations en "production", place au verdict page suivante.

Eric


  • Merci beaucoup pour le test, très complet!

    Alors certes elle a de la patate et est à l'aise en upscale + FG, mais voilà la conso (et la température des puces mémoire, aouch)!

  • Merci Hardware & Co pour cet article de qualité (et les petites touches de cultures).

    Bonne journée.

  • Quelques points à signaler vu l'ampleur du dossier et le temps imparti pour le réaliser :

    • Il y a probablement encore beaucoup de fautes qui vont être corrigées au cour des jours à venir (vous pouvez utiliser le bouton signaler pour nous avertir si vous en voyez et que vous le souhaitez)
    • La partie architecturale a été en grande partie rédigée par Nicolas faute de temps de mon côté (c'est ça la force d'une vraie équipe)
    • La partie DLSS 4 / visuelle va être enrichie
    • La partie verdict va également être affinée car elle aussi "rushée"

    Merci pour votre compréhension

    • Quelques points à signaler vu l'ampleur du dossier et le temps imparti pour le réaliser :

      • Il y a probablement encore beaucoup de fautes qui vont être corrigées au cour des jours à venir (vous pouvez utiliser le bouton signaler pour nous avertir si vous en voyez)
      • La partie architecturale a été en grande partie rédigée par Nicolas faute de temps de mon côté (c'est ça la force d'une vraie équipe)
      • La partie DLSS 4 / visuelle va être enrichie
      • La partie verdict va également être affinée car elle aussi "rushée"

      Merci pour votre compréhension

      Cool le test merci

      rajouter une passe en UHD RT mais sans DLSS? Parce que le DLSS ca fonctionne mais on le sait depuis les premières RTX!

      • 30 heures de boulot mini, désolé je peux pas. Il fallait que je case quelque part l'apport du DLSS 4. Sur 4 def/réglages, il y en a 3 sans DLSS/FSR et c'est en UHD RT qu'il fait plus sens.

Laissez votre commentaire

En réponse à Some User