La Quadro RTX 4000, annoncée en novembre de l'année dernière, fait partie de la famille de GPU professionnels de NVIDIA. Le RTX 4000 est spécialement conçu pour les professionnels du logiciel de CAO, offrant un réalisme intense et une interaction immersive avec leurs conceptions. Par conséquent, cela leur permet d'exécuter des simulations et des analyses avancées sur leur poste de travail local.
La Quadro RTX 4000, annoncée en novembre de l'année dernière, fait partie de la famille de GPU professionnels de NVIDIA. Le RTX 4000 est spécialement conçu pour les professionnels du logiciel de CAO, offrant un réalisme intense et une interaction immersive avec leurs conceptions. Par conséquent, cela leur permet d'exécuter des simulations et des analyses avancées sur leur poste de travail local.
Contrairement aux autres GPU NVIDIA, le RTX 4000 utilise les solutions visuelles évolutives NVIDIA Quadro (SVS). En conséquence, chaque carte RTX 4000 individuelle peut prendre en charge jusqu'à quatre moniteurs 5K à 60 Hz ou deux écrans 8K. Lors de l'utilisation de deux cartes Quadro Sync II, un système peut prendre en charge jusqu'à huit GPU RTX 4000, synchronisant 32 écrans distincts. NVIDIA revendique également une amélioration de 40 % de la bande passante par rapport à la génération précédente Quadro P4000, en partie grâce à 8 Go de mémoire graphique GDDR6.
Le RTX 4000 arbore un facteur de forme à fente unique de 4.4 "H x 9.5" L, permettant au GPU de s'adapter à une variété de châssis de station de travail. Dans ce facteur de forme mince, NVIDIA a pu installer 2304 cœurs CUDA, 288 cœurs Tensor, 36 cœurs RT et 8 Go de mémoire GDDR6. Ce matériel est conçu pour les charges de travail AEC, DCC, AI, VR et graphiques intenses. Le RTX 4000 est livré avec VirtualLink pour simplifier la connectivité aux visiocasques VR haute résolution de nouvelle génération.
Spécifications du Quadro RTX 4000
Architecture | NVIDIA Turing |
Mémoire GPU | 8GB GDDR6 |
Interface de mémoire | 256-bits |
Bande passante mémoire | Jusqu'à 416 Go/s |
Cœurs NVIDIA CUDA | 2,304 |
Noyaux Tensor NVIDIA | 288 |
Cœurs NVIDIA RT | 36 |
Performances en simple précision | 7.1 TFLOPS |
Performance du tenseur | 57.0 TFLOPS |
System Interface | PCI Express 3.0x16 |
Consommation d'énergie | Puissance totale de la carte : 160 W Puissance graphique totale : 125 W Solution Thermique Actif |
Facteur de forme | 4.4 "H x 9.5" L, fente simple |
Affichages simultanés maximum | 4x 3840×2160 à 120 Hz 4x 5120×2880 à 60 Hz 2x 7680×4320 à 60Hz |
VR Prêt | Oui |
API graphiques | Modèle Shader 5.1 OpenGL 4.5 DirectX 12.0 Vulkan 1.0 |
API de calcul | CUDA DirectCompute OpenCL |
Performance
Afin de tester les performances de la nouvelle architecture du GPU NVIDIA Quadro RTX 4000, nous l'avons installée sur notre station de travail Lenovo ThinkSystem P920 exécutant Windows 10. Pour un aperçu complet des performances de chaque carte, nous avons tiré parti de plusieurs références de l'industrie et de l'accélération GPU. logiciel capable de tirer pleinement parti de la carte testée. Non seulement nous le comparerons au NVIDIA Quadro RTX 5000, qui partage l'architecture Turning, mais nous le comparerons également à la précédente gamme Pascal Quadro, y compris le P6000, un P5000ainsi que, P4000. C'est moins, ce qui est mieux, et plus à quoi s'attendre avec le GPU choisi.
Afin d'avoir une meilleure idée de la façon dont ces GPU ont évolué à partir de différentes architectures, nous avons inclus le tableau suivant pour le RTX tel qu'il est aujourd'hui. Le RTX 4000 est clairement la carte d'entrée de gamme de la famille, là où les cartes de la série P ont commencé avec le P1000. Bien sûr, la famille RTX évolue jusqu'au RTX 8000, apportant plus de mémoire graphique, de bande passante et de cœurs en cours de route.
GPU NVIDIA Quadro | ||||
---|---|---|---|---|
RTX 4000 | RTX 5000 | RTX 6000 | RTX 8000 | |
Mémoire GPU | 8GB GDDR6 | 16GB GDDR6 | 24GB GDDR6 | 48GB GDDR6 |
Interface de mémoire | 256-bits | 256-bits | 384-bits | 384-bits |
Bande passante mémoire | JUSQU'À 416 Go/s | Jusqu'à 448 Go/s | Jusqu'à 672 Go/s | Jusqu'à 672 Go/s |
Cœurs NVIDIA CUDA | 2,304 | 3,072 | 4,608 | 4,608 |
Noyaux Tensor NVIDIA | 288 | 384 | 576 | 576 |
Cœurs NVIDIA RT | 36 | 48 | 72 | 72 |
Performances en simple précision | 7.1 TFLOPS | 11.2 TFLOPS | 16.3 TFLOPS | 16.3 TFLOPS |
Performance du tenseur | 57.0 TFLOPS | 89.2 TFLOPS | 130.5 TFLOPS | 130.5 TFLOPS |
Notre premier benchmark est l'outil de benchmark OpenCL multiplateforme LuxMark. LuxMark est basé sur l'API LuxCore et est proposé en tant que composant promotionnel de la suite LuxCoreRender. Il utilise un nouveau traceur de chemin OpenCL basé sur un micro-noyau comme rendu plus pour son benchmark, offrant un moyen unique de stresser le GPU installé sur un poste de travail donné.
LuxMark | |
---|---|
GPU | Résultats |
P4000 | 15,303 |
P5000 | 13,170 |
P6000 | 21,297 |
RTX 4000 | 28,338 |
RTX 5000 | 29,404 |
Alors que les GPU Pascal sont sortis du LuxMark avec de bons résultats, il y a un saut évident dans les performances en regardant les GPU Turning. Le RTX 4000 est arrivé deuxième derrière le RTX 5000 avec un score de 28,338 XNUMX.
Vient ensuite Arion, un outil d'analyse comparative CUDA, développé par RandomControl qui permet aux postes de travail de stresser les CPU ou les GPU dans une application de rendu. ArionBench est un outil logiciel basé sur la technologie Arion 2 qui soumet les processeurs/GPU à de fortes contraintes en simulant le flux de lumière dans une scène 3D.
Arion | |
---|---|
GPU | Résultats |
P4000 | 1,865 |
P5000 | 2,738 |
P6000 | 3,731 |
RTX 4000 | 4,484 |
RTX 5000 | 6,193 |
Un autre grand saut dans les scores allant de Pascal à Turing avec le RTX 4000 faisant un saut assez important par rapport au P6000.
Notre prochain benchmark s'appuie sur SolidWorks 2019 et quatre modèles 3D couvrant une Audi R8, une pelle de construction, un moteur à réaction ainsi qu'une voiture de rallye. Solidworks est une application de modélisation CAO 3D accélérée par GPU à la pointe de l'industrie qui fonctionne sur des systèmes Windows. SolidWorks est développé par Dassault Systèmes et est utilisé par plus de deux millions d'ingénieurs et plus de 165,000 2019 entreprises dans le monde. À des fins d'analyse comparative, nous exploitons la nouvelle fonctionnalité de « pipeline de performances » de SolidWorks 4.5. Cette architecture fournit un affichage en temps réel plus réactif, en particulier pour les grands modèles. Il tire parti de l'OpenGL moderne (XNUMX) et du rendu accéléré par le matériel pour maintenir un niveau élevé de détails et de fréquence d'images lorsque vous effectuez un panoramique, un zoom ou une rotation de grands modèles.
Une fois chaque modèle rendu, notre script fait pivoter chaque modèle cinq fois et mesure le temps nécessaire pour accomplir cette tâche. Il divise ensuite cela par le nombre d'images rendues et calcule le score moyen d'images par section (FPS).
SolidWorks | |
---|---|
Solidworks R8 | Normale |
P4000 | 198.0232 |
P5000 | 214.9254 |
P6000 | 217.9745 |
RTX 4000 | 211.1824 |
RTX 5000 | 208.8849 |
Excavateur Solidworks | Normale |
P4000 | 186.4832 |
P5000 | 211.9595 |
P6000 | 230.9774 |
RTX 4000 | 259.6056 |
RTX 5000 | 294.2529 |
Moteur à réaction Solidworks | Normale |
P4000 | 163.0573 |
P5000 | 198.5351 |
P6000 | 210.411 |
RTX 4000 | 220.6897 |
RTX 5000 | 283.2206 |
Voiture de rallye Solidworks | Normale |
P4000 | 205.6225 |
P5000 | 219.0114 |
P6000 | 218.4922 |
RTX 4000 | 214.4253 |
RTX 5000 | 217.256 |
Avec Solidworks R8 et Rally Car, il y a une légère baisse de performances pour les modèles Turing, mais il y a un grand saut dans Digger et Jet Engine. Avec nos tests Solidworks, nous utilisions le mode d'affichage bêta qui peut être la cause de la mise à l'échelle inhabituelle observée sur les assemblages Audi R8 et RallyCar.
La prochaine étape est la référence de l'Environmental Systems Research Institute (Esri). Esri est un fournisseur de logiciels de système d'information géographique (SIG). L'équipe de performance d'Esri a conçu ses scripts de complément PerfTool pour lancer automatiquement ArcGIS Pro. Cette application utilise une fonction "ZoomToBookmarks" pour parcourir divers signets prédéfinis et créer un fichier journal avec tous les points de données clés nécessaires pour prédire l'expérience utilisateur. Le script boucle automatiquement les signets trois fois pour tenir compte de la mise en cache (mémoire et cache disque). En d'autres termes, ce benchmark simule une utilisation graphique intensive que l'on pourrait voir via le logiciel ArcGIS Pro 2.3 d'Esri.
Les tests consistent en trois ensembles de données principaux. Deux sont des vues 3D de la ville de Philadelphie, PA et de Montréal, QC. Ces vues de ville contiennent des bâtiments multipatch 3D texturés drapés sur un modèle de terrain et des images aériennes drapées. Le troisième ensemble de données est une vue cartographique 2D de la région de Portland, OR. Ces données contiennent des informations détaillées sur les routes, les parcelles d'utilisation du sol, les parcs et les écoles, les rivières, les lacs et les terrains ombragés.
En regardant le temps de tirage du modèle de Montréal, le NVIDIA Quadro RTX 4000 a montré un temps de tirage moyen de 00:01:31.284, tandis que le FPS moyen et minimum a montré 502.395 et 180.699, respectivement.
ESRI ArcGIS Pro 2.3 Montréal | |
---|---|
Heure du tirage | Normale |
Quadro P4000 | 00:01:31.084 |
Quadro P5000 | 00: 01: 31: 082 |
Quadro P6000 | 00:01:31.081 |
Quadro RTX 4000 | 00:01:31.284 |
Quadro RTX 5000 | 00:01:31.067 |
FPS moyen | Normale |
Quadro P4000 | 432.327 |
Quadro P5000 | 489.889 |
Quadro P6000 | 521.551 |
Quadro RTX 4000 | 502.395 |
Quadro RTX 5000 | 527.636 |
FPS minimal | Normale |
Quadro P4000 | 164.546 |
Quadro P5000 | 194.218 |
Quadro P6000 | 190.336 |
Quadro RTX 4000 | 180.699 |
Quadro RTX 5000 | 190.775 |
Ensuite, notre modèle Philly, où le RTX 4000 a montré un temps de tirage moyen de 00:01:00.231, tandis que les FPS moyens et minimum ont montré 434.170 et 196.825, respectivement.
ESRI ArcGIS Pro 2.3 Philadelphie | |
---|---|
Heure du tirage | Normale |
Quadro P4000 | 00:02:53.928 |
Quadro P5000 | 00:01:01.109 |
Quadro P6000 | 00:01:01.245 |
Quadro RTX 4000 | 00:01:00.231 |
Quadro RTX 5000 | 00:01:01.111 |
FPS moyen | Normale |
Quadro P4000 | 304.340 |
Quadro P5000 | 451.826 |
Quadro P6000 | 469.879 |
Quadro RTX 4000 | 434.170 |
Quadro RTX 5000 | 531.315 |
FPS minimal | Normale |
Quadro P4000 | 160.152 |
Quadro P5000 | 212.910 |
Quadro P6000 | 207.879 |
Quadro RTX 4000 | 196.825 |
Quadro RTX 5000 | 224.341 |
Notre dernier modèle est de Portland. Ici, le RTX 4000 avait un temps de tirage moyen de 00:00:32.646. Le FPS moyen a montré 2,821.928 1,083.260 tandis que le FPS minimum a montré XNUMX XNUMX.
ESRI ArcGIS Pro 2.3 Portland | |
---|---|
Heure du tirage | Normale |
Quadro P4000 | 00:00:32.426 |
Quadro P5000 | 00:00:32.310 |
Quadro P6000 | 00:00:32.552 |
Quadro RTX 4000 | 00:00:32.646 |
Quadro RTX 5000 | 00:00:32.541 |
FPS moyen | Normale |
Quadro P4000 | 2,051.053 |
Quadro P5000 | 2,057.395 |
Quadro P6000 | 2,343.948 |
Quadro RTX 4000 | 2,821.928 |
Quadro RTX 5000 | 2,783.547 |
FPS minimal | Normale |
Quadro P4000 | 1,179.974 |
Quadro P5000 | 1,189.524 |
Quadro P6000 | 1,282.045 |
Quadro RTX 4000 | 1,083.260 |
Quadro RTX 5000 | 1,007.309 |
Conclusion
Le NVIDIA Quadro RTX 4000 est le GPU de l'architecture Turing de niveau inférieur, mais cela ne signifie pas qu'il n'est pas puissant. Le RTX 4000 est équipé de 2304 cœurs CUDA et d'un GPU GDDR8 de 6 Go. Comme tous les Quadro RTX, le 4000 est capable de fournir un traçage de rayons accéléré, un apprentissage en profondeur et un ombrage avancé dans son facteur de forme accessible à un seul emplacement. Cela peut donner aux professionnels de la création un temps d'analyse plus rapide tout en leur permettant d'accélérer leurs efforts créatifs. Le RTX 4000 est également livré avec VirtualLink qui simplifie la connectivité aux visiocasques VR haute résolution de nouvelle génération.
En termes de performances, le RTX 4000 s'est très bien comporté, d'autant plus qu'il se situe dans la partie inférieure des nouveaux GPU. Dans notre benchmark LuxMark, il a presque doublé son homologue Pascal et a même dépassé le P6000. Dans Arion, le RTX 4000 a plus que doublé le P4000 et a de nouveau facilement dépassé le P6000. Dans nos benchmarks Solidworks, le RTX 4000 a facilement dépassé le P4000 et a brillé plus fort dans le benchmark Digger and Jet Engine. Dans ESRi, le RTX 4000 avait de bien meilleures performances que le P4000 (et le P5000 dans certains cas), mais il existe des charges de travail où le P6000 était le plus performant. Il convient de garder à l'esprit que le RTX 4000 se situe au bas de l'architecture Turing et que le P6000 se situe au plus haut de l'architecture Pascal.
Dans l'ensemble, le Quadro RTX 4000 est un ajout très apprécié à la vaste gamme de GPU impressionnants de NVIDIA et offre des performances très impressionnantes pour la carte d'entrée de gamme tout en portant un prix d'environ 900 $ seulement.
Inscrivez-vous à la newsletter StorageReview