Home ConsumentAccessoires voor klanten NVIDIA Quadro RTX 4000 recensie

NVIDIA Quadro RTX 4000 recensie

De Quadro RTX 4000, aangekondigd in november vorig jaar, maakt deel uit van NVIDIA's professionele GPU-familie. De RTX 4000 is speciaal ontworpen voor de CAD-softwareprofessional en biedt intens realisme en meeslepende interactie met hun ontwerpen. Hierdoor kunnen ze geavanceerde simulaties en analyses uitvoeren op hun lokale werkstation.


De Quadro RTX 4000, aangekondigd in november vorig jaar, maakt deel uit van NVIDIA's professionele GPU-familie. De RTX 4000 is speciaal ontworpen voor de CAD-softwareprofessional en biedt intens realisme en meeslepende interactie met hun ontwerpen. Hierdoor kunnen ze geavanceerde simulaties en analyses uitvoeren op hun lokale werkstation.

In tegenstelling tot andere NVIDIA GPU's, maakt de RTX 4000 gebruik van NVIDIA Quadro Scalable Visual Solutions (SVS). Als gevolg hiervan kan elke afzonderlijke RTX 4000-kaart maximaal vier 5K-monitoren bij 60 Hz of dubbele 8K-schermen ondersteunen. Bij gebruik van twee Quadro Sync II-kaarten kan één systeem maximaal acht RTX 4000 GPU's ondersteunen, waarbij 32 afzonderlijke beeldschermen worden gesynchroniseerd. NVIDIA claimt ook een verbetering van 40% in bandbreedte dan de vorige generatie Quadro P4000, mede dankzij 8 GB GDDR6 grafisch geheugen.

De RTX 4000 heeft een vormfactor van 4.4 inch H x 9.5 inch L met één sleuf, waardoor de GPU op verschillende werkstationchassis past. In deze slanke vormfactor kon NVIDIA 2304 CUDA-kernen, 288 Tensor-kernen, 36 RT-kernen en 8 GB GDDR6-geheugen plaatsen. Deze hardware is ontworpen voor intense AEC-, DCC-, AI-, VR- en grafische workloads. De RTX 4000 wordt geleverd met VirtualLink om de connectiviteit met de volgende generatie VR-schermen met hoge resolutie op het hoofd te vereenvoudigen.

Quadro RTX 4000-specificaties

Architectuur NVIDIA Turing
GPU-geheugen 8GB GDDR6
Geheugeninterface 256-bit
Geheugenbandbreedte Tot 416 GB/s
NVIDIA CUDA-kernen 2,304
NVIDIA Tensor-kernen 288
NVIDIA RT-kernen 36
Prestaties met enkele precisie 7.1 TFLOPS
Tensorprestaties 57.0 TFLOPS
Systeeminterface PCI Express 3.0 x 16
Energieverbruik Totaal bordvermogen: 160W
Totaal grafisch vermogen: 125 W
Thermische oplossing Actief
Form Factor 4.4 "H x 9.5" L, enkele sleuf
Maximale gelijktijdige weergaven 4x 3840 × 2160 bij 120 Hz
4x 5120 × 2880 bij 60 Hz
​2x 7680×4320 bij 60 Hz
VR Ready Ja
Grafische API's Shader Model 5.1
OpenGL 4.5
DirectX 12.0
Vulkan 1.0
Compute-API's CUDA
DirectCompute
OpenCL

Prestatie

Om de prestaties van de nieuwe architectuur in de NVIDIA Quadro RTX 4000 GPU te testen, hebben we deze geïnstalleerd in ons Lenovo ThinkSystem P920-werkstation met Windows 10. Voor een uitgebreid overzicht van hoe elke kaart presteert, hebben we gebruik gemaakt van meerdere branchebenchmarks en GPU-versnelde software die volledig kan profiteren van de kaart die wordt getest. We zullen het niet alleen vergelijken met de NVIDIA Quadro RTX 5000, die de Turning-architectuur deelt, we zullen het ook vergelijken met de vorige Pascal Quadro-lijn inclusief de P6000  P5000En P4000. Dit is minder van, wat beter is, en meer van wat u kunt verwachten met de gekozen GPU.

Om een ​​beter idee te krijgen van hoe deze GPU's zijn geschaald vanuit verschillende architecturen, hebben we de volgende tabel opgenomen voor de RTX zoals die nu is. De RTX 4000 is duidelijk de instapkaart in de familie, waar de kaarten uit de P-serie begonnen met de P1000. Natuurlijk schaalt de RTX-familie helemaal op tot de RTX 8000, met onderweg meer grafisch geheugen, bandbreedte en kernen.

NVIDIA Quadro GPU's
RTX 4000 RTX 5000 RTX 6000 RTX 8000
GPU-geheugen 8GB GDDR6 16GB GDDR6 24GB GDDR6 48GB GDDR6
Geheugeninterface 256-bit 256-bit 384-bit 384-bit
Geheugenbandbreedte Tot 416 GB/sec Tot 448 GB/s Tot 672 GB/s Tot 672 GB/s
NVIDIA CUDA-kernen 2,304 3,072 4,608 4,608
NVIDIA Tensor-kernen 288 384 576 576
NVIDIA RT-kernen 36 48 72 72
Prestaties met enkele precisie 7.1 TFLOPS 11.2 TFLOPS 16.3 TFLOPS 16.3 TFLOPS
Tensorprestaties 57.0 TFLOPS  89.2 TFLOPS 130.5 TFLOPS 130.5 TFLOPS

Onze eerste benchmark is de platformonafhankelijke OpenCL-benchmarktool van LuxMark. LuxMark is gebaseerd op de LuxCore API en wordt aangeboden als een promotioneel onderdeel van de LuxCoreRender-suite. Het gebruikt een nieuwe op micro-kernel gebaseerde OpenCL-padtracer als weergave voor zijn benchmark, en biedt een unieke manier om de GPU die in een bepaald werkstation is geïnstalleerd, te benadrukken.

LuxMark
GPU's Resultaten
P4000 15,303
P5000 13,170
P6000 21,297
RTX 4000 28,338
RTX 5000 29,404

Terwijl de Pascal GPU's met goede resultaten van de LuxMark kwamen, is er een duidelijke prestatiesprong als we naar de Turning GPU's kijken. De RTX 4000 werd tweede na de RTX 5000 met een score van 28,338.

De volgende is Arion, een CUDA-benchmarktool, ontwikkeld door RandomControl waarmee werkstations CPU's of GPU's in een rendering-applicatie kunnen belasten. ArionBench is een softwaretool gebaseerd op Arion 2-technologie die de CPU/GPU's zwaar belast door de taak van het simuleren van de lichtstroom in een 3D-scène.

Arion
GPU's Resultaten
P4000 1,865
P5000 2,738
P6000 3,731
RTX 4000 4,484
RTX 5000 6,193

Nog een grote sprong in scores, gaande van Pascal naar Turing, waarbij de RTX 4000 een vrij grote sprong maakte ten opzichte van de P6000.

Onze volgende benchmark maakt gebruik van SolidWorks 2019 en vier 3D-modellen van een Audi R8, een bouwgraafmachine, een straalmotor en een rallyauto. Solidworks is een toonaangevende GPU-versnelde 3D CAD-modelleringstoepassing die werkt op Windows-gebaseerde systemen. SolidWorks is ontwikkeld door Dassault Systèmes en wordt gebruikt door meer dan twee miljoen ingenieurs en meer dan 165,000 bedrijven wereldwijd. Voor benchmarkdoeleinden maken we gebruik van de nieuwe "performance pipeline"-functie in SolidWorks 2019. Deze architectuur zorgt voor een meer responsieve, real-time weergave, vooral voor grote modellen. Het maakt gebruik van moderne OpenGL (4.5) en hardwareversnelde weergave om een ​​hoog detailniveau en framesnelheid te behouden bij het pannen, zoomen of roteren van grote modellen.

Nadat elk model is gerenderd, roteert ons script elk model vijf keer en meet het de tijd die nodig is om deze taak te voltooien. Vervolgens wordt dat gedeeld door het aantal weergegeven frames en wordt de gemiddelde score voor frames per sectie (FPS) berekend.

SolidWorks
Solidworks R8 Gemiddelde
P4000 198.0232
P5000 214.9254
P6000 217.9745
RTX 4000 211.1824
RTX 5000 208.8849
Solidworks graafmachine Gemiddelde
P4000 186.4832
P5000 211.9595
P6000 230.9774
RTX 4000 259.6056
RTX 5000 294.2529
Solidworks straalmotor Gemiddelde
P4000 163.0573
P5000 198.5351
P6000 210.411
RTX 4000 220.6897
RTX 5000 283.2206
Solidworks rallyauto Gemiddelde
P4000 205.6225
P5000 219.0114
P6000 218.4922
RTX 4000 214.4253
RTX 5000 217.256

Met Solidworks R8 en Rally Car is dat een kleine prestatiedip voor de Turing-modellen, maar er is een grote sprong in Digger en Jet Engine. Bij onze Solidworks-tests gebruikten we de bètaweergavemodus die mogelijk de oorzaak is van de ongebruikelijke schaalvergroting die te zien is op de Audi R8- en RallyCar-assemblages.

De volgende is de benchmark van het Environmental Systems Research Institute (Esri). Esri is een leverancier van Geografisch Informatie Systeem (GIS) software. Esri's Performance Team heeft hun PerfTool add-in scripts ontworpen om ArcGIS Pro automatisch te starten. Deze applicatie gebruikt een functie "ZoomToBookmarks" om door verschillende vooraf gedefinieerde bladwijzers te bladeren en een logbestand aan te maken met alle belangrijke gegevenspunten die nodig zijn om de gebruikerservaring te voorspellen. Het script herhaalt de bladwijzers automatisch drie keer om rekening te houden met caching (geheugen en schijfcache). Met andere woorden, deze benchmark simuleert zwaar grafisch gebruik dat men zou kunnen tegenkomen bij Esri's ArcGIS Pro 2.3-software.

De tests bestaan ​​uit drie hoofddatasets. Twee zijn 3D-stadsgezichten van Philadelphia, PA en Montreal, QC. Deze stadsgezichten bevatten getextureerde 3D multipatch-gebouwen gedrapeerd op een terreinmodel en gedrapeerde luchtfoto's. De derde dataset is een 2D-kaartweergave van de regio Portland, OR. Deze gegevens bevatten gedetailleerde informatie over wegen, landgebruikspercelen, parken en scholen, rivieren, meren en schaduwrijk terrein.

Kijkend naar de tekentijd van het Montreal-model, vertoonde de NVIDIA Quadro RTX 4000 een gemiddelde tekentijd van 00:01:31.284, terwijl de gemiddelde en minimale FPS respectievelijk 502.395 en 180.699 lieten zien.

ESRI ArcGIS Pro 2.3 Montreal
Trektijd Gemiddelde
Quadro P4000 00:01:31.084
Quadro P5000 00: 01: 31: 082
Quadro P6000 00:01:31.081
Quadro RTX 4000 00:01:31.284
Quadro RTX 5000 00:01:31.067
Gemiddelde FPS Gemiddelde
Quadro P4000 432.327
Quadro P5000 489.889
Quadro P6000 521.551
Quadro RTX 4000 502.395
Quadro RTX 5000 527.636
Minimale FPS Gemiddelde
Quadro P4000 164.546
Quadro P5000 194.218
Quadro P6000 190.336
Quadro RTX 4000 180.699
Quadro RTX 5000 190.775

Het volgende is ons Philly-model, waar de RTX 4000 een gemiddelde tekentijd van 00:01:00.231 liet zien, terwijl de gemiddelde en minimale FPS respectievelijk 434.170 en 196.825 lieten zien.

ESRI ArcGIS Pro 2.3 Philly
Trektijd Gemiddelde
Quadro P4000 00:02:53.928
Quadro P5000 00:01:01.109
Quadro P6000 00:01:01.245
Quadro RTX 4000 00:01:00.231
Quadro RTX 5000 00:01:01.111
Gemiddelde FPS Gemiddelde
Quadro P4000 304.340
Quadro P5000 451.826
Quadro P6000 469.879
Quadro RTX 4000 434.170
Quadro RTX 5000 531.315
Minimale FPS Gemiddelde
Quadro P4000 160.152
Quadro P5000 212.910
Quadro P6000 207.879
Quadro RTX 4000 196.825
Quadro RTX 5000 224.341

Ons laatste model is van Portland. Hier had de RTX 4000 een gemiddelde tekentijd van 00:00:32.646. De gemiddelde FPS toonde 2,821.928 terwijl de minimale FPS 1,083.260 liet zien.

ESRI ArcGIS Pro 2.3 Portland
Trektijd Gemiddelde
Quadro P4000 00:00:32.426
Quadro P5000 00:00:32.310
Quadro P6000 00:00:32.552
Quadro RTX 4000 00:00:32.646
Quadro RTX 5000 00:00:32.541
Gemiddelde FPS Gemiddelde
Quadro P4000 2,051.053
Quadro P5000 2,057.395
Quadro P6000 2,343.948
Quadro RTX 4000 2,821.928
Quadro RTX 5000 2,783.547
Minimale FPS Gemiddelde
Quadro P4000 1,179.974
Quadro P5000 1,189.524
Quadro P6000 1,282.045
Quadro RTX 4000 1,083.260
Quadro RTX 5000 1,007.309

Conclusie

De NVIDIA Quadro RTX 4000 is de GPU van het lagere niveau met Turing-architectuur, maar dat betekent niet dat hij niet krachtig is. De RTX 4000 is uitgerust met 2304 CUDA-cores en 8 GB GDDR6 GPU. Zoals alle Quadro RTX, kan de 4000 versnelde ray tracing, deep learning en geavanceerde shading leveren in zijn toegankelijke vormfactor met één slot. Dit kan creatieve professionals sneller inzicht geven, terwijl ze hun creatieve inspanningen kunnen versnellen. De RTX 4000 wordt ook geleverd met VirtualLink, dat de connectiviteit vereenvoudigt met de volgende generatie VR-schermen met hoge resolutie op het hoofd.

Qua prestaties presteerde de RTX 4000 erg goed, vooral gezien het feit dat hij zich aan de onderkant van de nieuwe GPU's bevindt. In onze LuxMark-benchmark verdubbelde het bijna zijn Pascal-tegenhanger en overtrof het zelfs de P6000. In Arion verdubbelde de RTX 4000 meer dan de P4000 en overtrof opnieuw gemakkelijk de P6000. In onze Solidworks-benchmarks overtrof de RTX 4000 gemakkelijk de P4000 en schitterde hij helderder in de Digger- en Jet Engine-benchmark. In ESRi presteerde de RTX 4000 veel beter dan de P4000 (en P5000 in sommige gevallen), maar er zijn werklasten waarbij de P6000 beter presteerde. Houd er rekening mee dat de RTX 4000 zich aan de onderkant van de Turing-architectuur bevindt en de P6000 aan de bovenkant van de Pascal-architectuur.

Al met al is de Quadro RTX 4000 een zeer welkome toevoeging aan NVIDIA's grote reeks indrukwekkende GPU's en biedt hij zeer indrukwekkende prestatiecijfers voor de instapkaart, terwijl hij een prijskaartje heeft van slechts ongeveer $ 900.

Quadro RTX 4000 op Amazon

Quadro RTX 4000-productpagina

Bespreek deze recensie

Meld u aan voor de StorageReview-nieuwsbrief