Usage créatif / productif
Un GPU ne sert pas uniquement au jeu. Que peut-on donc attendre de cette nouvelle génération de cartes dans ce domaine, en comparaison de leurs devancières ? Pour donner une petite idée des capacités à ce niveau, nous avons préparé un échantillon de tests, couvrant une (petite) partie des usages possibles avec un GPU en dehors du jeu.
Blender
Premier logiciel utilisé pour nos tests, Blender et son moteur de rendu Cycle, capable d’utiliser les GPU au travers d’Optix (GeForce), HIP (Radeon) et oneAPI (Intel Arc). Nous utilisons le benchmark qui va rendre 3 scènes différentes afin d'avoir une idée concrète des forces en présence.
Blender - Intel Arc B580
Quel que soit la scène retenue, les GeForce RTX 40 écrasent la concurrence, dans ce qui est indubitablement un point fort des verts, à savoir son support des applications professionnelles via son écosystème logiciel particulièrement développé à ce niveau. Qui plus est, ces rendus faisant appel au Path Tracing, la supériorité architecturale des verts pour ce type de tâches, contribue fortement à cette hiérarchie à sens unique. Les cartes Intel se défendent bien et la B580, certes derrières les A750/770, devance tout de même significativement sa concurrente rouge.
DaVinci Resolve Studio
Poursuivons ces tests en utilisant DaVinci Resolve Studio, une référence pour le traitement des vidéos. Dans un premier temps, nous réalisons un projet à partir de rushs ProRES en UHD. Nous appliquons ensuite divers effets (flou gaussien, effets de style, etc.) et encodons le tout en H.264 pour un usage Vimeo 2160P, dans un conteneur "MOV". Nous utilisons ensuite pour les tests suivants, un fichier brut ProRES en 8K (44 s pour limiter la taille déjà gigantesque), que nous allons exporter en 8K dans un conteneur "MP4", via un encodage H.265 puis AV1 (pour les cartes qui en sont capables), afin de solliciter les encodeurs de nos GPU.
DaVinci Resolve - Intel Arc B580
Notez que nous mesurons ici le temps d’export, mais pour une comparaison équitable, il ne faut pas se contenter de ce paramètre, mais aussi de la qualité obtenue. Cette opération aussi longue que fastidieuse n’est pas réalisable lors d’un tel dossier, mais il nous paraît important de le rappeler. Pour les tâches d’encodage pur, la B580 devance d'une dizaine de pourcents les Arc 700, mais aussi les GeForce et RX 7000 (hors RX 7700 XT). Le GPU intégrant un double MFX (comprenant chacun à la fois un encodeur et un décodeur) comme son prédécesseur, les gains proviennent probablement ici de la fréquence de fonctionnement en hausse. L’exécution de notre projet Vimeo ayant recours en sus aux unités de calcul pour appliquer les différents effets, la B580 doit cette fois s'incliner face aux Arc A700, plus richement dotées à ce niveau.
PhotoLab
Poursuivons ces tests en utilisant DxO PhotoLab, une référence pour le traitement des photos. Nous exportons au format DNG 88 fichiers RAW issus de différents APN, en appliquant le filtre de débruitage XD2s, la compensation du flux optique et la correction des aberrations chromatiques. Nous activons pour cela l'accélération DeepPrime pour chaque GPU.
DxO PhotoLab - Intel Arc B580
Les Radeon semblent apprécier grandement, mais les RTX ne sont pas bien loin. Par contre, c'est bien moins bon côté Arc, en particulier la B580 avec un résultat catastrophique. Nous avons remonté le souci à Intel qui nous indique avoir réussi à reproduire ce comportement et travailler à un correctif. Affaire à suivre donc.
Stable diffusion
Finissons ces tests en utilisant Stable Diffusion, afin de mesurer les performances en IA (inférence ici). Ce logiciel permet ainsi de générer une image à partir d'une description en langage courant de cette dernière. Pour la mise en œuvre locale des opérations d'inférences sous Windows, nous utilisons le logiciel Procyon d'UL, simplifiant grandement notre précédente utilisation via Automatic1111 WebUI. En effet, il est très complexe de faire fonctionner sur une même configuration sans interférences, de nombreuses versions de Python et autres. Le modèle utilisé est SD1.5 avec une inférence réalisée en FP16, utilisant DDIM et 100 étapes. 16 images sont générées par batch de 4 et nous réalisons 3 fois le bench en conservant la meilleure performance.
Procyon génération d'images
Le résultat obtenu est un score en points, mais nous préférons exprimer ce dernier en images par minute pour faciliter sa compréhension. Petite surprise ici, puisque l'Arc B580 devance la RTX 4060. Nul doute que les verts ne vont pas apprécier des masses de se voir ainsi relégués en seconde position dans leur domaine de prédilection. Les unités XMX de seconde génération doublent leur débit par rapport aux versions originelles, permettant ainsi à l'Arc B580 de devancer également les A700 malgré un nombre embarqué moindre au sein du nouveau GPU.
Consommation & efficacité énergétique
Quid des puissances électriques absorbées lors de l’exécution de ces logiciels ? L'Arc B580 se montre généralement bien moins gourmande que la génération précédente, avec toutefois une exception pour Stable Diffusion, mais avec des performances en net progrès expliquant cela. À noter aussi que la très faible consommation sous PhotoLab s'explique probablement par une sous utilisation du GPU, conduisant aux performances calamiteuses mesurées.
Consommation électrique en création/production
Les progrès en efficacité énergétique sont appréciables avec la B580, de quoi devancer les RX 7000 (hormis pour PhotoLab avec les réserves précédentes à ce sujet). Malgré tout, les RTX 40 restent à un autre niveau dans ce domaine, la RTX 4060 lavant quelque peu son honneur sous Stable Diffusion.
Efficacité énergétique en création/production - Intel Arc B580
Voilà pour les prestations en "production", place au verdict page suivante.
tout n'est pas parfait mais son avantage de vram lui donne beaucoup d'intérêt dans cette gamme de prix
très bon test comme d'habitude
le fonctionnement du mode turbo est spéciale je suis sur que la carte pourrait grapiller des mhz avec un fonctionnement plus comme amd/nvidia
Par contre j'ai fini vraiment à l'arrache, donc désolé s'il y a des fautes/typos/coquille, on va corriger une bonne partie de cela dans les heures qui viennent.
je dis ça pas parce que Eric est un ami, mais ses tests sont une tuerie complète et tellement riches d'enseignements, ils servent de base dans mes connaissances 😊
je viens de lire plus en detail l'article si on écoute le descriptif on croit que la b580 a un die complet et le b570 un die castré
de se que j'ai compris la b580 a aussi un die castré mais je me trompe peut être
Intel ne l'a pas précisé, mais si tu regardes bien la représentation du die en page 2, tu distingues facilement les 5 Render Slice (20 Xe Engine) et 6 contrôleurs mémoire, pas un de plus. Donc il semble bien que le die soit complet.
J'avais vu passer que les 5 render slice c'était bizarre et que du coup il y en aurait 6 mais ton explication tient la route
Mais du coup le côté faible densité en prend un coup j'ai cru que le die avait réellement un bus 256 bits
Ils ont pour moi en tout cas chier dans la colle sur ça
Après ont sait que avec les unités xmx prennent beaucoup (trop ?) de place et qu'il faut un plus gros die pour être équivalent à amd/nvdia mais la c'est peu abusé
J'ai aucune certitude, mais c'est ce qui me semble le plus probable. De toute façon lorsque tu poses la question à Intel (ou aux deux autres) la réponse est toujours la même : "nous ne communiquons jamais sur des produits ou fonctionnalités non annoncées" donc il y a toujours un doute.
L ia chez intel sert à quoi à par le xess ? Pas grand chose il me semble
Il faut des unités ia mais je trouve ça surdimentionné
Les arcs ne sont même pas décliné en secteur pro il me semble
Il ne faut pas oublier aussi que la densité est très étroitement liée à la maîtrise / expérience du procédé de gravure... ce qui passe par l'expertises des outils de conception. Avec Intel qui débarque tout juste chez TSMC - qui plus est avec des GPU qui ne sont pas sa spécialité -, face à un NVIDIA et AMD rompu à la tâche car fabless, c'est compliqué. Il est aussi possible que Intel avait des buts plus agressifs en matière de fréquence, et a initialement designé la puce avec des transistors moins denses mais plus susceptibles de monter en cadence.
Merci pour le test, c'est encourageant pour intel, mais ça arrive beaucoup trop tard et trop cher chez nous.