En août à SIGGRAPH, NVIDIA a annoncé une toute nouvelle architecture graphique, Turing, ainsi que de nouveaux GPU Quadro RTX. Parmi les nombreux nouveaux GPU annoncés à l'époque, nous examinerons aujourd'hui spécifiquement le GPU NVIDIA Quadro RTX 5000. Considéré comme le premier GPU de lancer de rayons qui utilise également l'apprentissage en profondeur et l'ombrage avancé. Le RTX 5000 est conçu pour les charges de travail de nouvelle génération avec le potentiel de rendre des scènes photoréalistes en temps réel, une aubaine pour les éditeurs vidéo ainsi que pour les concepteurs automobiles et architecturaux.
En août à SIGGRAPH, NVIDIA a annoncé une toute nouvelle architecture graphique, Turing, ainsi que de nouveaux GPU Quadro RTX. Parmi les nombreux nouveaux GPU annoncés à l'époque, nous examinerons aujourd'hui spécifiquement le GPU NVIDIA Quadro RTX 5000. Considéré comme le premier GPU de lancer de rayons qui utilise également l'apprentissage en profondeur et l'ombrage avancé. Le RTX 5000 est conçu pour les charges de travail de nouvelle génération avec le potentiel de rendre des scènes photoréalistes en temps réel, une aubaine pour les éditeurs vidéo ainsi que pour les concepteurs automobiles et architecturaux.
La force motrice derrière la nouvelle vague de GPU est la nouvelle architecture NVIDIA Turing. La société est vénérée pour son leadership en matière de GPU et s'est appuyée sur cela avec sa nouvelle architecture GPU de base. Le sujet de l'architecture est un peu trop profond pour être abordé ici, mais pour résumer : Turing utilise plusieurs avancées matérielles pour obtenir de nouveaux résultats impressionnants. Pour le lancer de rayons, l'architecture exploite des processeurs appelés cœurs RT qui accélèrent le calcul de la façon dont la lumière et le son se déplacent dans des environnements 3D jusqu'à 10 Giga Rayons par seconde. Un multiprocesseur de streaming améliore les performances raster et ajoute un pipeline graphique amélioré et de nouvelles technologies d'ombrage programmables. Turing est livré avec de nouveaux Tensor Cores qui fournissent 500 billions d'opérations de tenseur par seconde. Et Turing permet aux utilisateurs de tirer parti de plus de cœurs CUDA pour prendre en charge jusqu'à 16 16 milliards d'opérations en virgule flottante en parallèle avec XNUMX XNUMX milliards d'opérations entières par seconde.
La NVIDIA Quadro RTX 5000 est conçue pour les professionnels de la création qui ont besoin de travailler rapidement et efficacement sur des projets complexes. Le GPU possède 3,072 384 cœurs CUDA, 48 cœurs Tensor, 16 cœurs RT et 6 Go de mémoire GDDR5000. Cette quantité impressionnante de matériel est capable de rendre des modèles et des scènes complexes avec des ombres, des réflexions et des réfractions physiquement précises. Le RTX 5000 prend en charge NVIDIA NVLink, ce qui permet aux utilisateurs de faire évoluer leur mémoire et leurs performances avec plusieurs configurations GPU. En supposant qu'il y ait de la place sur leur poste de travail, les utilisateurs peuvent connecter deux GPU Quadro RTX 50 pour jusqu'à 32 Go/s de bande passante et une combinaison de 6 Go de mémoire GDDRXNUMX. Le GPU est également livré avec VirtualLink fournissant une connectivité à la prochaine génération d'écrans montés sur la tête VR haute résolution.
Spécifications NVIDIA Quadro RTX 5000
Architecture | NVIDIA Turing |
Mémoire GPU | 16GB GDDR6 |
Interface de mémoire | 256-bits |
Bande passante mémoire | Jusqu'à 448 Go/s |
ECC | Oui |
Cœurs NVIDIA CUDA | 3,072 |
Noyaux Tensor NVIDIA | 384 |
Cœurs NVIDIA RT | 48 |
Performances en simple précision | 11.2 TFLOPS |
Performance du tenseur | 89.2 TFLOPS |
Lien NVIDIA NV | Connecte 2 GPU Quadro RTX 5000 |
Bande passante NVIDIA NVLink | 50 Go/s (bidirectionnel) |
System Interface | PCI Express 3.0x16 |
Consommation d'énergie | Puissance totale de la carte : 265 W Puissance graphique totale : 230 W Solution Thermique Actif |
Facteur de forme | 4.4 "H x 10.5" L, double fente, pleine hauteur |
Connecteurs d'affichage | 4xDP 1.4, 1x USB-C |
Affichages simultanés maximum | 4x 4096×2160 à 120 Hz 4x 5120×2880 à 60 Hz 2x 7680×4320 à 60Hz |
Moteurs d'encodage/décodage | Encodage 1X, décodage 2X |
VR Prêt | Oui |
API graphiques | DirectX 12.0 Modèle Shader 5.1 OpenGL 4.5 Vulkan 1.0 API de calcul CUDA DirectCompute OpenCL |
Performances
Afin de tester les performances de la nouvelle architecture du GPU NVIDIA Quadro RTX 5000, nous l'avons installée sur notre station de travail Lenovo ThinkSystem P920 exécutant Windows 10. Pour un aperçu complet des performances de chaque carte, nous avons tiré parti de plusieurs références de l'industrie et de l'accélération GPU. logiciel capable de tirer pleinement parti de la carte testée. Non seulement nous le comparerons au NVIDIA Quadro RTX 4000, qui partage l'architecture Turning, mais nous le comparerons également à la précédente gamme Pascal Quadro, y compris le P6000, un P5000ainsi que, P4000. C'est moins, ce qui est mieux, et plus à quoi s'attendre avec le GPU choisi.
Afin d'avoir une meilleure idée de la façon dont ces GPU ont évolué à partir de différentes architectures, nous avons inclus le tableau suivant qui résume la famille RTX telle qu'elle se présente aujourd'hui. Le RTX 5000 se trouve dans un emplacement intermédiaire, un cran au-dessus du RTX 4000 d'entrée et en dessous des deux frères et sœurs RTX 6000 et RTX 8000 plus puissants.
GPU NVIDIA Quadro | ||||
---|---|---|---|---|
RTX 4000 | RTX 5000 | RTX 6000 | RTX 8000 | |
Mémoire GPU | 8GB GDDR6 | 16GB GDDR6 | 24GB GDDR6 | 48GB GDDR6 |
Interface de mémoire | 256-bits | 256-bits | 384-bits | 384-bits |
Bande passante mémoire | JUSQU'À 416 Go/s | Jusqu'à 448 Go/s | Jusqu'à 672 Go/s | Jusqu'à 672 Go/s |
Cœurs NVIDIA CUDA | 2,304 | 3,072 | 4,608 | 4,608 |
Noyaux Tensor NVIDIA | 288 | 384 | 576 | 576 |
Cœurs NVIDIA RT | 36 | 48 | 72 | 72 |
Performances en simple précision | 7.1 TFLOPS | 11.2 TFLOPS | 16.3 TFLOPS | 16.3 TFLOPS |
Performance du tenseur | 57.0 TFLOPS | 89.2 TFLOPS | 130.5 TFLOPS | 130.5 TFLOPS |
Notre premier benchmark est l'outil de benchmark OpenCL multiplateforme LuxMark. LuxMark est basé sur l'API LuxCore et est proposé en tant que composant promotionnel de la suite LuxCoreRender. Il utilise un nouveau traceur de chemin OpenCL basé sur un micro-noyau comme rendu plus pour son benchmark, offrant un moyen unique de stresser le GPU installé sur un poste de travail donné.
LuxMark | |
---|---|
GPU | Résultats |
P4000 | 15,303 |
P5000 | 13,170 |
P6000 | 21,297 |
RTX 4000 | 28,338 |
RTX 5000 | 29,404 |
Alors que les GPU Pascal sont sortis du LuxMark avec de bons résultats, il y a un saut évident dans les performances en regardant les GPU Turning. Le RTX 5000 a été le plus performant sans surprise avec un score de 29,404 XNUMX.
Vient ensuite Arion, un outil d'analyse comparative CUDA, développé par RandomControl qui permet aux postes de travail de stresser les CPU ou les GPU dans une application de rendu. ArionBench est un outil logiciel basé sur la technologie Arion 2 qui soumet les processeurs/GPU à de fortes contraintes en simulant le flux de lumière dans une scène 3D.
Arion | |
---|---|
GPU | Résultats |
P4000 | 1,865 |
P5000 | 2,738 |
P6000 | 3,731 |
RTX 4000 | 4,484 |
RTX 5000 | 6,193 |
Un autre bond important dans les scores allant de Pascal à Turing avec le RTX 5000 en avance sur les autres, nettement plus rapide que le P6000.
Notre prochain benchmark s'appuie sur SolidWorks 2019 et quatre modèles 3D couvrant une Audi R8, une pelle de construction, un moteur à réaction ainsi qu'une voiture de rallye. Solidworks est une application de modélisation CAO 3D accélérée par GPU à la pointe de l'industrie qui fonctionne sur des systèmes Windows. SolidWorks est développé par Dassault Systèmes et est utilisé par plus de deux millions d'ingénieurs et plus de 165,000 2019 entreprises dans le monde. À des fins d'analyse comparative, nous exploitons la nouvelle fonctionnalité de « pipeline de performances » de SolidWorks 4.5. Cette architecture fournit un affichage en temps réel plus réactif, en particulier pour les grands modèles. Il tire parti de l'OpenGL moderne (XNUMX) et du rendu accéléré par le matériel pour maintenir un niveau élevé de détails et de fréquence d'images lorsque vous effectuez un panoramique, un zoom ou une rotation de grands modèles.
Une fois chaque modèle rendu, notre script fait pivoter chaque modèle cinq fois et mesure le temps nécessaire pour accomplir cette tâche. Il divise ensuite cela par le nombre d'images rendues et calcule le score moyen d'images par section (FPS).
SolidWorks | |
---|---|
Solidworks R8 | FPS moyen |
P4000 | 198.0232 |
P5000 | 214.9254 |
P6000 | 217.9745 |
RTX 4000 | 211.1824 |
RTX 5000 | 208.8849 |
Excavateur Solidworks | FPS moyen |
P4000 | 186.4832 |
P5000 | 211.9595 |
P6000 | 230.9774 |
RTX 4000 | 259.6056 |
RTX 5000 | 294.2529 |
Moteur à réaction Solidworks | FPS moyen |
P4000 | 163.0573 |
P5000 | 198.5351 |
P6000 | 210.411 |
RTX 4000 | 220.6897 |
RTX 5000 | 283.2206 |
Voiture de rallye Solidworks | FPS moyen |
P4000 | 205.6225 |
P5000 | 219.0114 |
P6000 | 218.4922 |
RTX 4000 | 214.4253 |
RTX 5000 | 217.256 |
Il est intéressant de voir une légère baisse des performances des GPU Turing dans Solidworks R8 et Rally Car par rapport au Pascal, bien que ces fichiers puissent ne pas tirer pleinement parti des nouveaux GPU. Le RTX 5000 a fourni des performances supérieures dans Digger et Jet Engine, surpassant largement les autres. Avec notre Solidworks, nous utilisions le mode d'affichage bêta qui peut être la cause de la mise à l'échelle inhabituelle observée sur les assemblages Audi R8 et RallyCar.
La prochaine étape est la référence de l'Environmental Systems Research Institute (Esri). Esri est un fournisseur de logiciels de système d'information géographique (SIG). L'équipe de performance d'Esri a conçu ses scripts de complément PerfTool pour lancer automatiquement ArcGIS Pro. Cette application utilise une fonction "ZoomToBookmarks" pour parcourir divers signets prédéfinis et créer un fichier journal avec tous les points de données clés nécessaires pour prédire l'expérience utilisateur. Le script boucle automatiquement les signets trois fois pour tenir compte de la mise en cache (mémoire et cache disque). En d'autres termes, ce benchmark simule une utilisation graphique intensive que l'on pourrait voir via le logiciel ArcGIS Pro 2.3 d'Esri.
Les tests consistent en trois ensembles de données principaux. Deux sont des vues 3D de la ville de Philadelphie, PA et de Montréal, QC. Ces vues de ville contiennent des bâtiments multipatch 3D texturés drapés sur un modèle de terrain et des images aériennes drapées. Le troisième ensemble de données est une vue cartographique 2D de la région de Portland, OR. Ces données contiennent des informations détaillées sur les routes, les parcelles d'utilisation du sol, les parcs et les écoles, les rivières, les lacs et les terrains ombragés.
En ce qui concerne le temps de tirage du modèle de Montréal, le NVIDIA Quadro RTX 5000 a montré un temps de tirage moyen de 00: 01: 31.067, tandis que le FPS moyen et minimum affichait respectivement 527.636 et 190.775.
ESRI ArcGIS Pro 2.3 Montréal | |
---|---|
Heure du tirage | Normale |
Quadro P4000 | 00:01:31.084 |
Quadro P5000 | 00: 01: 31: 082 |
Quadro P6000 | 00:01:31.081 |
Quadro RTX 4000 | 00:01:31.284 |
Quadro RTX 5000 | 00:01:31.067 |
FPS moyen | Normale |
Quadro P4000 | 432.327 |
Quadro P5000 | 489.889 |
Quadro P6000 | 521.551 |
Quadro RTX 4000 | 502.395 |
Quadro RTX 5000 | 527.636 |
FPS minimal | Normale |
Quadro P4000 | 164.546 |
Quadro P5000 | 194.218 |
Quadro P6000 | 190.336 |
Quadro RTX 4000 | 180.699 |
Quadro RTX 5000 | 190.775 |
Ensuite, notre modèle Philly, où le RTX 5000 a montré un temps de tirage moyen de 00:01:01.111, tandis que les FPS moyens et minimum ont montré 531.315 et 224.341, respectivement.
ESRI ArcGIS Pro 2.3 Philadelphie | |
---|---|
Heure du tirage | Normale |
Quadro P4000 | 00:02:53.928 |
Quadro P5000 | 00:01:01.109 |
Quadro P6000 | 00:01:01.245 |
Quadro RTX 4000 | 00:01:00.231 |
Quadro RTX 5000 | 00:01:01.111 |
FPS moyen | Normale |
Quadro P4000 | 304.340 |
Quadro P5000 | 451.826 |
Quadro P6000 | 469.879 |
Quadro RTX 4000 | 434.170 |
Quadro RTX 5000 | 531.315 |
FPS minimal | Normale |
Quadro P4000 | 160.152 |
Quadro P5000 | 212.910 |
Quadro P6000 | 207.879 |
Quadro RTX 4000 | 196.825 |
Quadro RTX 5000 | 224.341 |
Notre dernier modèle est de Portland. Ici, le RTX 5000 avait un temps de tirage moyen de 00:00:32.541. Le FPS moyen a montré 2,783.547 1,007.309 tandis que le FPS minimum a montré XNUMX XNUMX.
ESRI ArcGIS Pro 2.3 Portland | |
---|---|
Heure du tirage | Normale |
Quadro P4000 | 00:00:32.426 |
Quadro P5000 | 00:00:32.310 |
Quadro P6000 | 00:00:32.552 |
Quadro RTX 4000 | 00:00:32.646 |
Quadro RTX 5000 | 00:00:32.541 |
FPS moyen | Normale |
Quadro P4000 | 2,051.053 |
Quadro P5000 | 2,057.395 |
Quadro P6000 | 2,343.948 |
Quadro RTX 4000 | 2,821.928 |
Quadro RTX 5000 | 2,783.547 |
FPS minimal | Normale |
Quadro P4000 | 1,179.974 |
Quadro P5000 | 1,189.524 |
Quadro P6000 | 1,282.045 |
Quadro RTX 4000 | 1,083.260 |
Quadro RTX 5000 | 1,007.309 |
Conclusion
Le NVIDIA Quadro RTX 5000 est l'un des nouveaux GPU de la société basé sur son architecture Turing. Turing devrait être une toute nouvelle approche de l'architecture GPU, car NVIDIA cherche à la fois à changer les choses maintenant en gardant un œil sur les développements futurs. Destiné aux professionnels de la création qui ont des projets complexes nécessitant un travail efficace et rapide, le RTX 5000 dispose d'un matériel impressionnant sous son capot, notamment 3,072 384 cœurs CUDA, 48 cœurs Tensor, 16 cœurs RT et 6 Go de mémoire GDDRXNUMX. Pour ceux qui ont besoin d'encore plus de performances GPU, le RTX peut évoluer avec un deuxième GPU via NVIDIA NVLink.
Pour tous ses composants qui devraient conduire à des performances supérieures, nous l'avons soumis à un barrage de tests, nouveaux et anciens, juste pour voir ce qu'il peut faire. Une surprise pour personne, la NVIDIA Quadro RTX 5000 a été la plus performante dans la plupart de nos tests. Chez LuxMark et Arion, le RTX 5000 a plus que doublé les scores du P5000. Le RTX 5000 a obtenu de bonnes performances dans les benchmarks Solidworks Digger et Jet Engine. Il faut garder à l'esprit que le RTX 5000, aussi puissant soit-il, n'est pas le haut de gamme des GPU Turing.
Si un professionnel de la création recherche un saut de performance plus important dans la plupart des domaines, le NVIDIA Quadro RTX 5000 conviendra à cette facture. Nos résultats de performances ci-dessus mettent en évidence les domaines dans lesquels le RTX 5000 brille et quelques endroits où un GPU basé sur Pascal fonctionne assez bien. Dans l'ensemble, avec la famille RTX, NVIDIA a fait un excellent travail en continuant à repousser les limites de ce qui est disponible pour les créatifs sur un ordinateur de bureau. De son côté, la RTX 5000 remplit bien l'offre milieu de gamme, offrant un bon équilibre entre performances et prix.
Inscrivez-vous à la newsletter StorageReview