Usage créatif / productif
Un GPU ne sert pas uniquement au jeu, surtout pour une référence telle que la RTX 5090. Que peut-on donc attendre de la génération Blackwell dans ce domaine, en comparaison de leurs devancières ? Pour donner une petite idée des capacités à ce niveau, nous avons préparé un échantillon de tests, couvrant une (petite) partie des usages possibles avec un GPU en dehors du jeu.
Blender
Premier logiciel utilisé pour nos tests, Blender et son moteur de rendu Cycle, capable d’utiliser les GPU au travers d’Optix (GeForce), HIP (Radeon) et oneAPI (Intel Arc). Nous utilisons le benchmark qui va rendre 3 scènes différentes afin d'avoir une idée concrète des forces en présence.
Blender - RTX 5090 FE
Quelle que soit la scène retenue, les GeForce écrasent la concurrence, dans ce qui est indubitablement un point fort des verts, à savoir son support des applications professionnelles via son écosystème logiciel particulièrement développé à ce niveau. Qui plus est, ces rendus faisant appel au Path Tracing, la supériorité architecturale des verts pour ce type de tâches, contribue fortement à cette hiérarchie à sens unique. La nouvelle née des verts apporte entre 31 % et 43 % de mieux que la RTX 4090 selon les scènes, soit des gains relativement similaires à ceux constatés en jeu. Elle enfonce donc le clou face à la concurrence.
Cinebench 2024
Second logiciel de notre échantillon de test, Cinebench est le benchmark issu du logiciel Cinema 4D de Maxon utilisant son propre moteur de rendu Redshift. Nous utilisons la dernière version en date qui propose à présent les tests des GPU, à l'exception des Intel ARC (peut-être à l'avenir via une mise à jour ?).
Cinebench 2024 - RTX 5090 FE
Malheureusement, la RTX 5090 n'est pas encore supportée. Nous avons tout de même conservé ce test pour leur mettre à jour dès que ce sera le cas.
DaVinci Resolve
Poursuivons ces tests en utilisant DaVinci Resolve Studio, une référence pour le traitement des vidéos. Dans un premier temps, nous réalisons un projet à partir de rushs ProRES en UHD. Nous appliquons ensuite divers effets (flou gaussien, effets de style, etc.) et encodons le tout en H.264 pour un usage Vimeo 2160P, dans un conteneur "MOV". Nous utilisons ensuite pour les tests suivants, un fichier brut ProRES en 8K (44 s pour limiter la taille déjà gigantesque), que nous allons exporter en 8K dans un conteneur "MP4", via un encodage H.265 puis AV1 (pour les cartes qui en sont capables), afin de solliciter les encodeurs de nos GPU.
DaVinci Resolve - RTX 5090 FE
Notez que nous mesurons ici le temps d’export, mais pour une comparaison équitable, il ne faut pas se contenter de ce paramètre, mais aussi de la qualité obtenue. Cette opération aussi longue que fastidieuse n’est pas réalisable lors d’un tel dossier, mais il nous paraît important de le rappeler. Pour les tâches d’encodage pur, la RTX 5090 propose entre 10 % et 18 % de mieux que sa devancière, du fait de la présence d'un troisième encodeur activé (GB202 semble en contenir 4). Notre projet Vimeo ayant recours en sus aux unités de calcul pour appliquer les différents effets suivis d'un encodage H.264 dont le traitement a été accéléré au niveau des NVENC de 9e génération, la RTX 5090 porte à 36 % son avantage sur son aînée.
DxO PhotoLab
Poursuivons ces tests en utilisant DxO PhotoLab, une référence pour le traitement des photos. Nous exportons au format DNG 88 fichiers RAW issus de différents APN, en appliquant le filtre de débruitage XD2s, la compensation du flux optique et la correction des aberrations chromatiques. Nous activons pour cela l'accélération DeepPrime pour chaque GPU.
DxO PhotoLab - RTX 5090 FE
Les Radeon semblent apprécier grandement, puisque pour une fois lors d'un test sur cette page, la RX 7900 XTX tient son rang face à la RTX 4080 SUPER. Et la nouvelle née des verts ? Son avantage n'est ici "que" de 15 % sur la RTX 4090, même si c'est toujours ça de pris.
IA : génération d'images
Poursuivons ces tests en utilisant Procyon, afin de mesurer les performances en IA (inférence ici). Ce logiciel permet ainsi de générer une image à partir d'une description en langage courant de cette dernière. Pour la mise en œuvre locale des opérations d'inférences sous Windows, nous utilisons le logiciel Procyon d'UL, simplifiant grandement notre précédente utilisation via Automatic1111 WebUI. En effet, il est très complexe de faire fonctionner sur une même configuration sans interférences, de nombreuses versions de Python, Pytorch et autres. Le modèle utilisé est SD1.5 avec une inférence réalisée en FP16, utilisant DDIM et 100 étapes. 16 images sont générées par batch de 4 et nous réalisons 3 fois le bench en conservant la meilleure performance. La série 50 proposant également une prise en charge native du format FP4, nous avons également ajouté la génération d'images via FLUX1 de Blak Forest Labs, dont la version de développement tire parti par une adaptation du modèle T5xxl CLIP, originellement fonctionnant en FP16. Nous réalisons la génération de 4 images en FP4, mais aussi FP8, utilisant EULER et 30 étapes avec une taille de lot à 1.
IA : génération d'images - RTX 5090 FE
Le résultat obtenu est un score en points, mais nous préférons exprimer ce dernier en images par minute pour faciliter sa compréhension. La RTX 5090 devance de 26 % la RTX 4090 avec Stable Diffusion en FP16. L'avance passe à 40 % via Flux1 en FP8, puis 450 % lorsque l'on utilise cette fois la précision FP4 pour l'inférence des images.
IA : génération de texte
Poursuivons ces tests en utilisant toujours Procyon, afin de mesurer cette fois les performances en génération de texte par IA. Le logiciel propose 4 tests utilisant chacun un modèle différent (Phi3.1, Mistral 7-B, Llama 3.1 et Llama 2). Cela permet de tester différentes tailles de modèles. Ils fonctionnent ici via le runtime ONNX de Microsoft s'appuyant sur DirectML permettant une comparaison interconstructeur. 2 points sont importants dans le cadre d'un LLM (Large Language Models), le taux de génération (exprimé en tokens par seconde) et le temps moyen pour le premier token. Pour éviter de créer 2 graphiques séparés, nous utilisons le score calculé par UL qui intègre ces deux paramètres dans son calcul.
IA : génération de texte - RTX 5090 FE
Malgré l'usage d'ONNX (Nvidia ne peut s'appuyer sur TensorRT pour ce test), les GeForce dominent toujours largement les Radeon. Si on s'intéresse aux apports de la RTX 5090, elle propose des gains compris en 17 % et 34 % selon le LLM par rapport à la RTX4090.
Consommation & efficacité énergétique
Mais bon, consommer plus c'est une chose, mais si les tâches sont exécutées plus rapidement, alors la quantité d'énergie totale nécessaire pour l'exécution de ces dernières peut finalement être moindre. C'est pour cela qu'il est intéressant de mesurer ce paramètre au travers de l'efficience de nos cartes.
Consommation électrique en création/production - RTX 5090 FE
En définitive, la nouvelle venue va donc s'avérer plus efficiente que la RTX 3090 ou les Radeon, elle régresse malgré tout par rapport aux cartes Ada Lovelace. Nous n'avons pas inclus l'efficacité énergétique sur la génération d'images en FP4, puisque ce test se limite à 3 cartes en tout et pour tout, par contre l'efficacité énergétique serait là en faveur de la dernière née des verts.
Efficacité énergétique en création/production - RTX 5090 FE
Voilà pour les prestations en "production", place au verdict page suivante.
C'est parti pour un peu de lecture, merci d'avance pour votre test !!
🙏
Merci pour le test les copains ! 💯
🙏
Merci beaucoup pour le test, très complet!
Alors certes elle a de la patate et est à l'aise en upscale + FG, mais voilà la conso (et la température des puces mémoire, aouch)!
🙏
Merci Hardware & Co pour cet article de qualité (et les petites touches de cultures).
Bonne journée.
Quelques points à signaler vu l'ampleur du dossier et le temps imparti pour le réaliser :
Merci pour votre compréhension
Cool le test merci
rajouter une passe en UHD RT mais sans DLSS? Parce que le DLSS ca fonctionne mais on le sait depuis les premières RTX!
30 heures de boulot mini, désolé je peux pas. Il fallait que je case quelque part l'apport du DLSS 4. Sur 4 def/réglages, il y en a 3 sans DLSS/FSR et c'est en UHD RT qu'il fait plus sens.